7. studenoga 2025. Ali Behrouz, Student Istraživač, i Vahab Mirrokni, VD i Google Fellow, Google Istraživanje
Predstavljamo Ugniježdeno Učenje, novi pristup mašinskom učenju koji modela tretira kao skup manjih, ugniježđenih optimizacijskih problema, svaki s vlastitim unutarnjim radnim tokom, kako bi se smanjili ili čak potpuno izbjegli problem “katastrofalnog zaborava”, gdje učenje novih zadataka žrtvuje vještinu u starijim zadacima.
Brzi linkovi
Članak ×
Posljednjih deset godina vidjeli smo nevjerojatne napredke u mašinskom učenju (ML), prvenstveno potaknute moćnim arhitekturama neuronskih mreža i algoritmima koji se koriste za njihovo treniranje. Iako su velike jezikovne modele (LLM) postigli izvanredne rezultate, još uvijek postoje nekoliko fundamentalnih izazova, posebno u vezi s nastavnim učenjem, sposobnosti modela da aktivno stječe novo znanje i vještine tijekom vremena bez zaborava starih.
Kada je riječ o nastavnom učenju i samopoboljšanju, ljudski mozak je zlatni standard. On se prilagođava kroz neuroplastičnost – izvanrednu sposobnost mijenjanja svoje strukture u odgovoru na nove iskustve, sjećanja i učenje. Bez ove sposobnosti, osoba je ograničena na trenutni kontekst (kao npr. amnezija). Sličnu ograničenost vidimo i u trenutačnim LLM-ovima: njihovo znanje je ograničeno na ili na trenutni kontekst unosa ili na statičnu informaciju koju uče tijekom pretprocesiranja.
Jednostavni pristup, kontinuirano ažuriranje parametara modela s novim podacima, često dovodi do “katastrofalnog zaborava” (CF), gdje učenje novih zadataka žrtvuje vještinu u starijim zadacima. Istraživači tradicionalno borbe protiv CF-a kroz arhitektonske prilagodbe ili bolje optimizacijske pravila. Međutim, predugo smo modelovu arhitekturu (strukturu mreže) i optimizacijski algoritam (pravilo treniranja) tretirali kao dvije zasebne stvari, što sprečava stvaranje ujedinjenog, efikasnog učenog sustava.
U našem članku “Ugniježdeno Učenje: Iluzija dubokih arhitektura učenja”, objavljenom na NeurIPS 2025, predstavljamo Ugniježdeno Učenje, koje popunjava tu prazninu. Ugniježdeno Učenje tretira jedan ML model ne kao jedan kontinuirani proces, već kao sustav međusobno povezanih, multi-nivo učenih problema koji se optimiziraju istovremeno. Tvrdimo da je modelova arhitektura i pravila koja se koriste za njeno treniranje fundamentalno isti koncepti; oni su samo različiti “nivoi” optimizacije, svaki s vlastitim unutarnjim tokom informacija (“kontekstni tok”) i brzinom ažuriranja. Prepoznavanjem ove unutarnje strukture, Ugniježdeno Učenje pruža novi, dotad nevidljivi dimenziju za dizajniranje sposobnijeg AI-a, omogućujući izgradnju učenih komponenti s većom računalnom dubinom, što na kraju pomaže riješiti probleme poput katastrofalnog zaborava.
Testirali smo i potvrdili Ugniježdeno Učenje kroz dokaz koncepta, samopromjenjivačku arhitekturu koju zovemo “Nada”, koja postiže nadmoćne rezultate u modeliranju jezika i pokazuje bolju upravljanje dugotrajnim kontekstom sjećanja od postojećih modela na vrhu.
Paradigma Ugniježdenog Učenja
Ugniježdeno Učenje otkriva da je složeni ML model zapravo skup koherentnih, međusobno povezanih optimizacijskih problema ugniježđenih unutar sebe ili koji rade paralelno. Svaki od ovih unutarnjih problema ima svoj kontekstni tok – svoj vlastiti skup informacija iz kojih pokušava naučiti. Ovaj pogled implicira da postojeće metode dubokog učenja rade esencijalno kompresijom njihovih unutarnjih kontekstnih tokova. Važnije je, Ugniježdeno Učenje otkriva novi dimenziju za dizajniranje modela, omogućujući izgradnju učenih komponenti s većom računalnom dubinom.
Asocijativna Memorija
Kao ilustraciju ovog paradigma, pogledajmo koncept asocijativne memorije – sposobnost mapiranja i ponovnog pozivanja jednoga na drugoga (kao npr. ponovni poziv imena kada vidite lice). Pokazali smo da se proces treniranja, posebno proces povratnog širenja, može modelirati kao asocijativna memorija. Model uči mapirati određeni podatak na vrijednost njegovog lokalnog greškog, koja služi kao mjera koliko je “iznenađujuće” ili neočekivano taj podatak bio. Slično, prateći prethodna istraživanja (npr. Miras), ključni arhitektonski komponeneti, kao mehanizam pažnje u transformatorima, također se mogu formalizirati kao jednostavni moduli asocijativne memorije koji uče mapiranje između tokena u sekvenci.
Više-vremenski Skalni Ažuriranja
Jednolična i ponovljiva struktura, kao i viševremenski skalni ažuriranja u mozgu, ključni su komponeneti nastavnog učenja kod ljudi. Ugniježdeno Učenje omogućuje viševremenska ažuriranja za svaki komponentu mozga, dok pokazuje da dobro poznate arhitekture kao što su transformatori i moduli memorije zapravo su linearni slojevi s različitim frekvencijama ažuriranja. Definirajući frekvenciju ažuriranja, tj. koliko često se ažuriraju težine svakog komponeneta, možemo poredati ova međusobno povezana optimizacijska problema u “nivoe”. Ovaj uređeni skup čini srce Ugniježdenog Učenja.
Dokaz Koncepta: “Nada”
Kao dokaz koncepta, razvili smo samopromjenjivačku arhitekturu koju zovemo “Nada”. “Nada” postiže nadmoćne rezultate u modeliranju jezika i pokazuje bolju upravljanje dugotrajnim kontekstom sjećanja od postojećih modela na vrhu. Ova arhitektura ilustrira kako Ugniježdeno Učenje može biti implementirano u praksi, pružajući realan primjer kako se ovaj novi paradigma može primijeniti u stvarnim scenarijima.
Zaključak
Ugniježdeno Učenje predstavlja revoluciju u načinu na koji razmišljamo o dizajnu i optimizaciji mašinskih učenih modela. Otkriva da su arhitektura modela i optimizacijski algoritmi nešto više od samo različitih “nivoa” optimizacije; oni su u stvari međusobno povezani, multi-nivo optimizacijski problemi koji se optimiziraju istovremeno. Ovo otkriće otvara nove mogućnosti za dizajniranje modela s većom računalnom dubinom i sposobnostima, koje na kraju pomažu riješiti izazove poput katastrofalnog zaborava.
Česta Pitanja
Kako Ugniježdeno Učenje rješava problem katastrofalnog zaborava?
Ugniježdeno Učenje rješava problem katastrofalnog zaborava tretiranjem modela kao sistema međusobno povezanih, multi-nivo optimizacijskih problema. Svaki od ovih problema ima svoj vlastiti kontekstni tok i brzinu ažuriranja, što omogućava modelu da istovremeno uči nove zadatke bez žrtvovanja vještine u starijim zadacima.
Koliko je efikasno Ugniježdeno Učenje u praksi?
Ugniježdeno Učenje je pokazalo izvanredne rezultate u modeliranju jezika i upravljanju dugotrajnim kontekstom sjećanja. Naš dokaz koncepta, arhitektura “Nada”, postiže nadmoćne rezultate u odnosu na postojeće modele na vrhu, što ukazuje na njegovu veliku efikasnost u praksi.
Može li Ugniježdeno Učenje biti primijenjeno na druge domene mašinskog učenja?
Da, Ugniježdeno Učenje ima potencijal za primjenu na širok spektar domena mašinskog učenja. Njegova sposobnost da tretira model kao sistem međusobno povezanih optimizacijskih problema može biti korisna u mnogim aplikacijama, od vizualnog učenja do prirodnog jezika obrade.
Kako se Ugniježdeno Učenje razlikuje od postojećih metoda dubokog učenja?
Ugniježdeno Učenje se razlikuje od postojećih metoda dubokog učenja po tome što tretira model kao sistem međusobno povezanih, multi-nivo optimizacijskih problema, umjesto kao jedan kontinuirani proces. Ovo novo gledište omogućava izgradnju učenih komponenti s većom računalnom dubinom i sposobnostima.
Koji su budući smjerovi razvoja za Ugniježdeno Učenje?
Budući smjerovi razvoja za Ugniježdeno Učenje uključuju istraživanje novih arhitektura i optimizacijskih algoritama koji bi se mogli koristiti za implementaciju ovog paradigma. Također, istraživanje primjena Ugniježdenog Učenja na različite domene mašinskog učenja može donijeti nove i zanimljive rezultate.





![ChatGPT 5 je stigao: brži, pametniji i dostupan svima [Besplatno] 6 chatgpt5](https://umjetnai.com/wp-content/uploads/2025/08/chatgpt5-360x180.webp)








