AI som ser genom flera spelares ögon i Minecraft samtidigt – helt galet imponerande
Tänk dig en AI som kan följa med i ett spel ur flera spelares synvinklar på en gång. Forskare har nu gjort det verklighet. Resultatet är svindlande.
Ett dolt problem i AI-världen
De flesta AI-system som förutsäger vad som händer i spel klarar bara en vy i taget. De är som blindställda för allt annat.
I verkligheten påverkar dina handlingar alla runt omkring. Om du kastar en boll ser kompisen den komma emot sig, åskådare ser den svänga genom luften. Alla vyer måste stämma ihop. Det kallas multi-agent-konsistens. Och det är en rejäl nöt att knäcka för AI.
Solaris löser pusslet
Forskare har byggt Solaris – en AI som hanterar flera spelares perspektiv i Minecraft samtidigt. Effekten är magisk.
Två spelare står mittemot varandra. Den ena placerar en block. Solaris visar den inte bara i den första spelarens vy. Den dyker upp korrekt i den andras också – från helt annan vinkel, med rätt ljus, skuggor och dolda delar. Allt hänger ihop perfekt.
Varför just Minecraft?
Valet av Minecraft är klockrent. Så här:
Väldigt visuellt krävande. 3D-världen tvingar AI:n att jonglera perspektiv, objekt som skymmer varandra och rumslig logik.
Konstant förändring. Spelare bygger, river, rör sig. AI:n måste hålla koll på allt från varje håll.
Oförutsägbart kaos. Mobs dyker upp slumpmässigt, väder skiftar, händelser inträffar. AI:n skiljer spelarnas handlingar från spelets egna tricks.
Datamaskinen bakom: SolarisEngine
Nyckeln är massiv data från flerpersonsspel. Inget sådant fanns tidigare i bra skick.
Forskarnas lösning: SolarisEngine. AI-bots spelar ihop – bryter malm, bygger, slåss, utforskar. De spottade ut över 12 miljoner synkade bildrutor från multiplayer-sessioner.
Maskinen körs dygnet runt och skapar ny data non-stop. Som en armé av AI-spelare som farmar material åt andra AI:er.
Tekniken i korthet
Solaris bygger på en videodiffusionsmodell. AI:n tar brus och förvandlar det stegvis till skarpa bildrutor – men synkar flera vyer samtidigt.
De la till "Checkpointed Self Forcing". Ett smart sätt att hantera långa sekvenser utan att datorn kraschar av minnesbrist. AI:n sparar nyckelmoment utan att bära hela historien i huvudet.
Varför det här är stort
"Och vadå, Minecraft-AI?" tänker du kanske. Men tekniken sträcker sig långt utanför spel.
Robotar: De kan samarbeta och se varandras handlingar från rätt vinkel.
Självkörande bilar: Förstå hur man syns för andra fordon och fotgängare.
Simuleringar: Bättre träning för räddningspersonal eller kirurger i virtuella miljöer.
Framtiden öppnas upp
Det bästa? Allt är open source. Datainsamlaren, modellerna, utvärderingsverktygen – fritt för alla.
Det här känns som ett vägskäl. AI går från ensamögon till att greppa hela multi-agent-världen.
Vi börjar med pixliga block. Men stora genombrott startar enkelt. Solaris blir nog ett sådant steg vi minns.
AI-framtiden handlar inte om enskilda hjältar. Den handlar om att simulera vår mångsidiga verklighet. Nu kom vi ett steg närmare.
Källa: https://arxiv.org/pdf/2602.22208