Gisteren onthulde Microsoft WHAMM, een generatief AI-model voor realtime gaming, zoals aangetoond in de demo met de 28-jarige klassieker Quake II. De interactieve demo reageert op gebruikersinvoer via controller of toetsenbord, hoewel de framesnelheid nauwelijks in de lage tot midden tientallen hangt. Voordat u uw hooivorken grijpt, benadrukt Microsoft dat de focus moet liggen op het analyseren van de eigenaardigheden van het model en het niet als een spelervaring beoordeelt.
WHAMM, dat staat voor World and Human Action MaskGit-model, is een update van het originele WHAM-1.6B-model dat in februari wordt gelanceerd. Het dient als een realtime speelbare extensie met snellere visuele output. WHAM gebruikt een autoregressief model waarbij elk token achtereenvolgens wordt voorspeld, net als LLMS. Om de ervaring realtime en naadloos te maken, ging Microsoft over naar een opstelling in MaskGit-stijl waarbij alle tokens voor de afbeelding parallel kunnen worden gegenereerd, afnemende afhankelijkheid en het aantal vereiste voorwaartse passages.
Whamm werd getraind Quake II Met iets meer dan een week gegevens, een dramatische vermindering van de zeven jaar die nodig is voor WHAM-1.6B. Evenzo is de resolutie gestoten van een pixelachtige 300 x 180 tot een iets minder Pixel-achtige 640 x 360. Je kunt de demo zelf uitproberen bij Copilot Labs.
Het vermogen van het model om de bestaande omgeving bij te houden, afgezien van de incidentele grafische afwijking, terwijl het zich tegelijkertijd aanpast aan gebruikersinputs, is indrukwekkend, ongeacht de gruwelijke slechte inputlag. Je kunt schieten, bewegen, springen, hurken, rondkijken en zelfs vijanden schieten, maar uiteindelijk is het niet meer dan een chique showcase en kan het nooit de oorspronkelijke ervaring vervangen.
Zoals verwacht, is het model niet perfect. Vijandelijke interacties worden beschreven als fuzzy, de contextlengte is beperkt, de game slaat onjuist vitale statistieken op zoals gezondheid en schade, en het is beperkt tot een enkel niveau.
Deze aankondiging volgt op de nieuwste Ghibli -trend van Openai, die veel negatieve aandacht heeft gekregen. Hoewel ik geen kunstenaar ben, is er een bepaald menselijk element voor elk stuk creatief werk dat AI niet echt kan herscheppen. Maar met AI’s huidige ontwikkelingspercentage zien we misschien dat volledig door AI gegenereerde games en films de komende jaren een realiteit kunnen zijn, en dat is waar dingen naartoe gaan.
De sweet spot ligt in AI die creatief werkt, niet vervangen, zoals de ACE -technologie van Nvidia, die levensechte NPC’s kan voeden. Delen van deze technologie zijn al geïntegreerd in het Life Simulation Game inzoi. Vanuit een technologisch oogpunt vertegenwoordigt WHAMM nog steeds een stapje verder van eerdere pogingen, die vaak chaotisch, onsamenhangend waren en kringen van hallucinaties.