U posljednjih osamnaest mjeseci Mira Murati je ostala u pozadini, a sada se ponovno pojavljuje s ambicioznim planom koji bi mogao promijeniti pravac cijele industrije umjetne inteligencije. Njena nova tvrtka, Thinking Machines Lab, ne želi samo izgraditi još jedan veliki model; cilj je preoblikovati način na koji ljudi komuniciraju s AI‑jem, prelazeći od statičnih tekstualnih odgovora na interakciju u stvarnom vremenu.
Od skale do interakcije
Do sada je natjecanje u području umjetne inteligencije temeljilo na povećanju broja parametara, proširenju kontekstnih prozora i prikupljanju ogromnih skupova podataka. Iako je to rezultiralo izvanrednim sposobnostima razmišljanja, korisničko iskustvo ostaje ograničeno na model „pošalji‑i‑čekaj“. Murati tvrdi da je industrija stigla do točke opadanja povrata na takav pristup.
Thinking Machines Lab vjeruje da je sljedeća granica u AI‑u ne samo što model zna, već kako se uklapa u brz i nepredvidiv svijet ljudi. Fokusiranjem na latenciju razmišljanja, laboratorij nastoji razviti sustave koji mogu pratiti živu konverzaciju, vizualne signale i kontekstualne uvjete. To je korak prema onome što se naziva živoj ko‑procesuiranju, čime AI postaje aktivni sudionik, a ne pasivni spremnik upita.
Tehnička inovacija: prag od 200 milisekundi
Ključna inovacija Thinking Machines Lab‑a leži u načinu obrade podataka. Trenutni veliki jezični modeli obično tretiraju audio i video kao zasebne tokove koje je potrebno tokenizirati i prevesti u tekst prije nego što se započne razmišljanje. Taj proces je inherentno spor i često gubi suptilne nijanse ljudske komunikacije, poput tona, kolika ili neverbalnih znakova.
Tim pod Muratom razvija arhitekturu koja izbjegava pretvaranje zvuka i slike u tekst. Umjesto toga, model direktno obrađuje višedimenzionalne signale, čime se smanjuje kašnjenje na manje od 200 milisekundi – što je ključni prag za prirodnu, neprekidnu interakciju. Ovaj pristup omogućuje AI‑u da reagira u realnom vremenu, čime se otvaraju nove mogućnosti u područjima poput edukacije, zdravstvene skrbi i zabave.
Praktične primjene i izazovi
Kako bi se ova tehnologija uvela u svakodnevni život, potrebno je riješiti nekoliko izazova:
- Privatnost i sigurnost: Prikupljanje i obrada podataka u stvarnom vremenu zahtijeva stroge mjere zaštite informacija.
- Etika i odgovornost: Automatizirani odgovori u realnom vremenu moraju biti transparentni i izbjegavati pristranost.
- Infrastrukturna podrška: Potrebna je pouzdana mrežna povezanost i računalna snaga kako bi se održao nizak prag latencije.
Unatoč tim izazovima, potencijal za revoluciju u načinu na koji komuniciramo s tehnologijom je ogroman. Od asistenta koji odmah reagira na glasovne upite u kući, do medicinskog dijagnostičkog sustava koji u stvarnom vremenu analizira snimke pacijenta – mogućnosti su gotovo beskonačne.
Zaključak
Mira Murati i njen tim u Thinking Machines Lab pokazuju da je budućnost umjetne inteligencije u interakciji, a ne samo u znanju. Ako se uspije prevladati tehničke i etičke prepreke, AI u stvarnom vremenu mogao bi postati neizostavan partner u svakodnevnom životu, čineći komunikaciju bržom, prirodnijom i učinkovitijom.
FAQ
- Što znači „live co-processing“? To je koncept u kojem AI aktivno sudjeluje u kontekstu u stvarnom vremenu, reagirajući na zvuk, vizualne signale i druge podatke bez potrebe za pretvorbom u tekst.
- Zašto je prag od 200 milisekundi važan? Taj prag je dovoljno nizak da korisnici ne osjete kašnjenje, čime se postiže prirodna konverzacija.
- Koje su glavne primjene ove tehnologije? Primjene obuhvaćaju edukaciju, zdravstvenu skrb, zabavu, industrijsku automatizaciju i mnoge druge.