Posljednjih desetak godina, svijet umjetne inteligencije (AI) bio je gotovo u potpunosti usmjeren na pisani jezik. Veliki jezični modeli (LLM-ovi), poput onih koje razvijaju vodeće tehnološke tvrtke, postali su mjerilo za procjenu računalne inteligencije. Oni funkcioniraju kao napredni digitalni knjižničari, sposobni analizirati i sažeti ogromne količine ljudskog znanja pohranjenog u milijardama stranica teksta. Međutim, svjedočimo značajnom zaokretu u istraživačkim laboratorijima diljem svijeta. Inovatori poput tvrtke Runway sve se više klade na to da sljedeći veliki iskorak u razvoju AI neće doći iz daljnjeg usavršavanja rada s tekstom, već iz analize i razumijevanja video sadržaja. Cilj je pomaknuti granice od ‘jezičnih modela’ prema ‘modelima svijeta’ – sustavima koji temeljne fizikalne zakone i mehaniku naše stvarnosti uče izravnim promatranjem, a ne samo na temelju uputa.
Promjena paradigme: Od riječi do razumijevanja svijeta
Tradicionalni pristup u razvoju AI, koji se uglavnom oslanjao na analizu pisanog sadržaja, pokazao se učinkovitim u generiranju odgovora i obradi informacija. Međutim, takvi modeli često neizbježno odražavaju ljudske pristranosti, kulturne nijanse i retoričke obrasce prisutne u tekstu. S druge strane, videozapisi nude neposredan uvid u stvarnost. Oni prikazuju uzročno-posljedične veze, postojanost objekata (objekt permanence) i djelovanje fizikalnih sila poput gravitacije na način koji ne zahtijeva ljudsku interpretaciju. Učenje iz video podataka omogućuje AI sustavima da izravno opažaju kako se stvari u fizičkom svijetu doista događaju, što je ključno za razvoj dubljeg i robusnijeg razumijevanja.
Tvrtka Runway, čija se vrijednost procjenjuje na otprilike 5,3 milijarde dolara, nalazi se u središtu ove transformacije. Umjesto da svoje modele treniraju na tekstualnim podacima koje su selektirali ljudi, Runway koristi goleme količine video podataka. Na taj način nastoji izgraditi umjetnu inteligenciju koja razumije osnovne principe funkcioniranja svijeta. Ovaj pristup predstavlja temeljnu promjenu u načinu na koji strojevi uče – prelazi se sa sustava koji samo reflektira ljudske karakteristike na sustav koji izravno promatra i uči iz svemira oko sebe. Posljedice ovakvog razvoja su dalekosežne i protežu se kroz razne industrije, od filmske produkcije do robotike, signalizirajući budućnost u kojoj AI nije samo napredni sugovornik, već i digitalni znanstvenik.
Strateški uspon modela svijeta
Prijelaz s generativnog videa, koji se fokusira na stvaranje video isječaka na temelju zadanih uputa, na razvoj prediktivnih modela svijeta predstavlja ključni element trenutne strategije tvrtke Runway. Iako je tvrtka prvotno stekla popularnost nudeći kreativne alate filmskim studijima i marketinškim agencijama, njezine ambicije značajno su se proširile. Krajem 2026. godine, Runway je predstavio svoj prvi namjenski model svijeta, a naknadna izdanja dodatno su usavršila sposobnost modela da razumije fizičku stvarnost. Ovaj razvoj nije samo tehnički pothvat; riječ je o iznimno uspješnom poslu. Runway je nedavno izvijestio o povećanju godišnjih ponovljivih prihoda (ARR) za 40 milijuna dolara u samo jednom kvartalu, što jasno pokazuje tržišnu potražnju i potencijal ove tehnologije.
Google, još jedan tehnološki div, također prepoznaje važnost ovog pomaka. Njihova istraživanja usmjerena su na stvaranje AI sustava koji mogu razumjeti i predvidjeti fizičke interakcije u stvarnom svijetu. To uključuje sposobnost predviđanja kako će se objekti ponašati kada se sudare, kako će tekućine teći ili kako će se složeni mehanizmi pokretati. Takvi modeli svijeta mogli bi imati revolucionaran utjecaj na:
- Robotiku: Roboti bi mogli učiti izravno iz interakcije s okolinom, postajući sigurniji i učinkovitiji u složenim zadacima.
- Dizajn i simulacije: Omogućili bi realističnije simulacije fizičkih procesa, od dizajna novih materijala do predviđanja ponašanja složenih sustava.
- Filmsku i gaming industriju: