AI同时看多个Minecraft玩家的视角,太炸裂了!
你有没有想过,AI能同时从好几个玩家的眼睛看Minecraft世界?现在,研究者们搞定了,这玩意儿真牛。
之前没人注意的难题
过去那些AI预测游戏下一步的系统,只能盯着一个玩家的视角。视野窄得像管子。
现实里呢?俩人扔球玩,你看到球飞出去,对方看到球砸过来,路人看到它划过天空。每个视角都得对得上。这叫“多代理一致性”,AI学起来超难。
Solaris登场:多视角神AI
研究团队搞出个叫Solaris的系统,能在Minecraft里同时模拟多个玩家的视角。效果神奇得像魔法。
牛在哪儿?俩玩家面对面站着,A玩家放个方块。Solaris不光在A的视角里显示方块,还得在B的视角里,从完全不同的角度,带上光影、遮挡,全都完美一致。
为什么选Minecraft,太合适了
他们挑Minecraft测试,聪明!
画面超复杂。 3D世界,视角一转,物体挡住别人,得懂空间逻辑,脑子都转不过来。
变化不停。 玩家挖挖建建到处跑,AI得从每个角度实时跟上。
超级随机。 怪物刷出来,天变脸,环境乱动。AI得分清玩家干的还是游戏自己搞的。
关键武器:海量数据工厂
训练这种AI,得有巨量多人游戏录像。可惜之前没人自动收集。
他们自建SolarisEngine:一群AI机器人进Minecraft,挖矿、盖房、打架、探险。吐出1200万帧多人视频——好几小时同步多视角素材。
最爽的是,这系统24小时不停,转起来就是源源不断的新数据。像AI玩家日夜肝游戏,只为喂其他AI。
幕后黑科技,简单说说
Solaris用“视频扩散模型”。从一堆噪点开始,逐步变清晰视频,还得管好多个视角。
他们还加了“Checkpointed Self Forcing”——省内存的招,让AI记长序列的关键点,不用全塞脑子里。
这东西为啥重要
你说,AI玩Minecraft关我屁事?别急,影响大着呢。
机器人。 多机器人协作,得懂彼此视角和动作。
自动驾驶。 车子得知道自己动作在别人眼里啥样,包括行人。
虚拟训练。 模拟环境训练急救员、医生啥的,都能翻天。
更大的格局
Solaris最让我激动的是,全开源!数据系统、模型、测试框架,全免费拿。
这像打开新大门。从单视角AI,进化到懂多人环境的AI。
现在还是像素方块,但每个牛逼AI都从小处起步。Solaris肯定是关键一步。
AI未来不是单兵作战,而是懂我们复杂多视角世界的家伙。离这目标,又近了点。
来源:https://arxiv.org/pdf/2602.22208