Yann LeCun, cijenjeni znanstvenik nagrađen Turingovom nagradom i dugogodišnji vodeći strateg za umjetnu inteligenciju u tvrtki Meta, nedavno je osigurao značajna sredstva za svoj novi pothvat. Njegova tvrtka, Advanced Machine Intelligence (AMI), uspješno je zatvorila jednu od najvećih početnih rundi financiranja u povijesti europskog tehnološkog sektora, prikupivši nešto više od milijarde američkih dolara. Cilj AMI-ja je razviti umjetnu inteligenciju koja uči na način sličan djetetu – predviđajući kako se objekti, sile i akteri ponašaju u fizičkom svijetu.
Ovo izdašno financiranje, predvođeno suverenim fondom iz Ujedinjenih Arapskih Emirata i konzorcijem europskih osiguravatelja, predstavlja izravan izazov dominantnoj filozofiji „što veće, to bolje“ koja je zavladala Silicijskom dolinom od pojave ChatGPT-ja. Umjesto da se usredotočuje na obuku sve većih jezičnih modela na ogromnim količinama internetskog teksta, AMI će se posvetiti onome što LeCun naziva „modelima svijeta“. Ti modeli predstavljaju sustave koji neprestano ažuriraju svoju unutarnju simulaciju stvarnosti kako bi mogli planirati, rasuđivati i prilagođavati se.
Zašto LeCun smatra da su veliki jezični modeli dosegli svoje granice
Veliki jezični modeli (LLM) izvanredni su u predviđanju sljedeće riječi u nizu, no LeCun ih opisuje kao „strance s interneta“. „Mogu pisati sonete u stilu Shakespearea o gravitaciji, a da pritom ne znaju da će kamen ispušten iz ruke pasti na tlo“, objasnio je LeCun novinarima u prostranom sjedištu AMI-ja u Parizu. Njegova kritika naglašava temeljni nedostatak LLM-ova: nedostatak razumijevanja fizičkih zakona i uzročno-posljedičnih veza koje upravljaju našim stvarnim svijetom.
Ova skepsa nije nova, LeCun je slične argumente iznosio još od 2019. godine. Međutim, do sada je nedostajalo financijske potpore za provedbu alternativnog pristupa. Sada, s milijardom dolara na raspolaganju, AMI može priuštiti potrebnu računalnu snagu, talentirane stručnjake i opsežne kampanje prikupljanja podataka koje su oduvijek bile nužne za istraživanje modela svijeta. Empirijska istraživanja potvrđuju LeCunove sumnje. U jednom često citiranom eksperimentu, napredni model poput GPT-5 i dalje griješi u oko 38% fizikalnih zadataka koje prosječno 11-godišnje dijete intuitivno riješi. Primjerice, hoće li se hrpa neravnomjerno složenih knjiga prevrnuti lijevo ili desno, ili za koliko će se stupnjeva bicikl nagnuti ako vozač pomakne svoju težinu? Ti nedostaci postaju posebno kritični kada se od umjetne inteligencije očekuje upravljanje robotima, autonomnim vozilima ili složenim sustavima poput elektroenergetskih mreža.
Unutar AMI-jevog plana za razvoj „zdravorazumske“ umjetne inteligencije
Tehnički prospekt AMI-ja, opsežan dokument od 120 stranica koji je bio selektivno dostupan investitorima, detaljno opisuje četverostupanjski pristup razvoju njihovih modela svijeta. Ovaj pristup naglašava postupno usavršavanje sposobnosti AI sustava, počevši od temeljnih percepcijskih sposobnosti pa sve do složenog planiranja i zaključivanja.
Prva faza, nazvana „Perceptualna apstrakcija“, usredotočuje se na pretvaranje podataka iz senzora visoke dimenzionalnosti u smislenije, apstraktne reprezentacije. To znači da AI sustav uči prepoznavati ključne značajke objekata i okoline, ne samo kao sirove podatke, već kao koncepte. Na primjer, umjesto da vidi samo piksele, sustav bi trebao prepoznati „stol“, „čašu“ ili „pokret“.
Druga faza, „Modeliranje interakcija“, bavi se učenjem o tome kako različiti objekti i akteri međusobno djeluju. To uključuje razumijevanje fizikalnih principa kao što su gravitacija, trenje, elastičnost, ali i socijalnih interakcija ako je riječ o AI koja treba surađivati s ljudima ili drugim AI agentima. Cilj je stvoriti prediktivne modele koji