Budućnost je tu

Umjetna inteligencija ruši rekorde u video igrama prisjećajući se prošlih rezultata

Umjetna inteligencija koja se može sjetiti svojih prethodnih uspjeha i pomoću njih stvarati nove strategije, rušila je rekorde u nekim od najtežih videoigara na klasičnim Atari konzolama.

Sci-Tech / Tehnologija | 27. 02. 2021. u 07:17 Bljesak.info

Tekst članka se nastavlja ispod banera

Mnogi sustavi umjetne inteligencije koriste podržano učenje (reinforcement learning), u kojem algoritam dobiva pozitivne ili negativne povratne informacije o svom napretku prema određenom cilju nakon svakog koraka, potičući ga prema određenom rješenju. Ovu tehniku koristila je i AI tvrtka DeepMind za trening AlphaGoa koji je 2016. pobijedio svjetskog prvaka u Go igrama.

Istraživački tim koji predvodi Adrien Ecoffet iz Uber AI Labsa i OpenAI-a pretpostavio je da takvi algoritmi često naiđu na potencijalne odgovore, ali ubrzo napuste trag u potrazi za nečim boljim te tako zanemare neka dobra rješenja. Njihova zapažanja objavljena su u časopisu Nature, prenosi Bug.

"Što radite kad o svom zadatku ne znate ništa? Ako samo mašete rukama, malo je vjerojatno da ćete ikad skuhati kavu", kaže Ecoffet.

AI smashes video game high scores by remembering its past success
https://t.co/W0aSA5ODzP pic.twitter.com/J5SCTzh1h5
— QNewsHub (@qnewshub) February 24, 2021

Kako bi riješio ovaj problem, tim je stvorio algoritam koji pamti sve isprobane pristupe i stalno se vraća na najbolje trenutke; oni služe kao polazišna točka za nova istraživanja.

Softver pohranjuje snimke zaslona iz igre kako bi se prisjetio onoga što je pokušao. Slične slike grupiraju se kako bi se identificiralo točke u igri koje će im poslužiti kao "odskočna daska". Algoritmu je cilj maksimizirati rezultat i ažurirati zapis o početnoj točki nekog dijela igre.

Atari igre obično ne dopuštaju igračima da se vraćaju da odigrane dijelove igre. Zato su istraživači koristili emulator, softver koji oponaša Atari sustav, s dodanom sposobnošću spremanja statističkih podataka i ponovnog učitavanja prikupljenih informacija u bilo kojem trenutku. To znači da algoritam može započeti od bilo koje točke, a da pritom ne mora igrati igru od početka.

“First return, then explore”, has been published in Nature! Working on Go-Explore with my co-first author @Joost_Huizinga as well as @joelbot3000, @kenneth0stanley and @jeffclune has been an amazing adventure and I am thrilled that we got to this point! https://t.co/3WTwle2Vwt pic.twitter.com/Ugf7e8wV7D
— Adrien Ecoffet (@AdrienLE) February 24, 2021

Algoritam su primijenili na 55 Atarijevih igara i pobijedili u 85,5 posto slučajeva. U Montezuminoj osveti algoritam je čak nadmašio prethodne rekorde, ljudske i softverske.

Istraživači su uvježbali neuronsku mrežu da replicira strategiju i odigra igru na isti način, bez potrebe za emulatorom. Pokazalo se da je ovaj alternativni pristup računalno intenzivniji, jer je neuronskom mreža stvorila milijarde prizora tijekom rješavanja svake igre.

No, znanstvenici gledaju dalje i tvrde kako bi se ova dobitna kombinacija podržanog učenja i arhive sjećanja ubuduće mogla koristiti i za rješavanje puno složenijih problema, javlja New Scientist.

Kopirati

Budućnost je tu

Umjetna inteligencija ruši rekorde u video igrama prisjećajući se prošlih rezultata

Umjetna inteligencija već hara

Hoće li umjetna inteligencija uzeti naše poslove?

Umjetna inteligencija otkrila 50 novih planeta u starim podacima