Onderzoekers van de University of California, Irvine, hebben een systeem voor kunstmatige intelligentie ontwikkeld dat een Rubik’s Cube in gemiddeld 1,2 seconden en in ongeveer 20 zetten kan oplossen. Dat is twee seconden sneller dan het huidige menselijke wereldrecord van 3,47 seconden, terwijl mensen die de puzzel snel af kunnen maken dat meestal in ongeveer 50 seconden doen. UC Irvine’s DeepCubeA heeft echter niet het record voor het geautomatiseerd oplossen van Rubik’s Cube. Vorig jaar bouwden onderzoekers een robot die de puzzel in 0,38 seconden kon voltooien. Het min2phase-algoritme van het Massachusetts Institute of Technology, dat geen AI-systeem is, loste het drie keer sneller op dan DeepCubeA. Terwijl andere methoden specifiek waren ontworpen om de kubus op te lossen, moest DeepCubeA zijn eigen weg banen. Vreemd genoeg weten de onderzoekers niet precies hoe DeepCubeA erachter kwam hoe ze ervoor konden zorgen dat de Rubik’s Cube een solide kleurblok had op elk van de zes zijden. Er zijn miljarden mogelijke combinaties voor de kubus, maar slechts één voltooide staat. Terwijl de wetenschappers de AI lieten zien hoe het eindresultaat eruit zag, moest DeepCubeA uitzoeken hoe ze daar konden komen en ze hebben nog geen volledig begrip van hoe het zijn strategieën heeft ontwikkeld. De onderzoekers begonnen met een gesimuleerde versie van een voltooide Rubik’s Cube en vervormden deze vervolgens. DeepCubeA trainde zichzelf vervolgens om de puzzel op te lossen gedurende twee dagen, waarbij ze zijn vaardigheid verbeterde terwijl het steeds moeilijkere combinaties probeerde. Volgens een artikel dat in Nature is gepubliceerd, gaven onderzoekers DeepCubeA 10 miljard combinaties en drongen ze erop aan om de puzzels in 30 of minder zetten op te lossen. De AI werd vervolgens op duizend combinaties op de proef gesteld. Het kraakte elke keer de puzzel, en deed dat met het minimum aantal zetten in ongeveer 60 procent van de pogingen. Het algoritme kan ook oplossingen vinden voor andere spellen, waaronder de schuifpuzzel, Lights Out en Sokoban. DeepCubeA gebruikt een neuraal netwerk (dat aapt hoe de menselijke geest informatie verwerkt) samen met machine learning-technieken, waarin een AI-systeem leert door patronen te detecteren en te theoretiseren met weinig menselijke input. Het past een versterkende leerbenadering toe, waardoor het leerde “hoe steeds moeilijkere toestanden omgekeerd van de doeltoestand kunnen worden opgelost zonder enige specifieke domeinkennis.” De onderzoekers publiceerden eerder een paper over een andere benadering van de puzzel, approximate Policy Iteration. Hoewel dat ook elke keer de Rubik’s Cube oploste, deed het dat meestal in 30 zetten met een mediane oplostijd van 10 minuten. Omdat DeepCubeA niet specifiek was ontworpen voor het oplossen van gekmakende plastic puzzelblokjes uit de jaren ’70, zou het algoritme enkele bredere implicaties kunnen hebben. “Hoe creëren we geavanceerde AI die slimmer, robuuster en in staat is om te redeneren, te begrijpen en te plannen?” hoogleraar computerwetenschappen en senior auteur Pierre Baldi zei in een verklaring. “Dit werk is een stap in de richting van dit forse doel.”
|
https://breinbrekers.be |