Manji jezični modeli rješavaju složene zadatke zaključivanja: Revolucionarni pristup

13.12.2025.

202

Sve je veća popularnost umjetne inteligencije, a posebice velikih jezičnih modela (LLM), dovela je do fascinantnih napredaka u područjima poput generiranja slika, odgovaranja na trivijalna pitanja, pa čak i u rješavanju jednostavnih matematičkih problema. Ipak, unatoč ovim impresivnim postignućima, čini se da ljudsko rezoniranje i sposobnost rješavanja složenih problema ostaju nedostižni. Postavlja se pitanje: mogu li manji, ali učinkovitiji jezični modeli, uz pravilno usmjeravanje, premostiti taj jaz? Istraživači s MIT-ovog Laboratorija za računalnu znanost i umjetnu inteligenciju (CSAIL) predstavili su inovativni pristup nazvan DisCIPL (Distributional Constraints by Inference Programming with Language Models), koji upravo to nastoji postići. Ovaj pristup omogućuje manjim jezičnim modelima da preciznije i efikasnije rješavaju složene zadatke, nudeći uzbudljivu alternativu dominantnim, ali često sporijim i energetski zahtjevnijim velikim modelima.

Što su jezični modeli i zašto im je teško s kompleksnim zadacima?

Jezični modeli su računalni sustavi obučeni na golemim količinama tekstualnih podataka, što im omogućuje razumijevanje, generiranje i manipuliranje ljudskim jezikom. Njihova sposobnost da prepoznaju uzorke, predvide sljedeću riječ u nizu, pa čak i da pišu koherentne tekstove, dovela je do revolucije u nizu industrija. Međutim, kada se suoče sa zadacima koji zahtijevaju duboko logičko zaključivanje, planiranje na više razina, pridržavanje strogih pravila i istovremeno razmatranje brojnih varijabli, njihove performanse često opadaju.

Zamislite igru poput Sudokua. Iako AI može prepoznati je li ispunjen ispravno, samostalno rješavanje zagonetke, popunjavanje svake od 81 ćelije brojevima od 1 do 9, uz istovremeno poštivanje pravila o jedinstvenosti u svakom retku, stupcu i bloku, predstavlja značajan izazov. AI se može mučiti sa samim procesom popunjavanja ili to činiti neefikasno. Slično tome, u zadacima poput dizajniranja novih molekula, pisanja matematičkih dokaza ili kreiranja složenih planova putovanja s budžetskim ograničenjima, ovi modeli nailaze na poteškoće.

Glavni razlog leži u prirodi otvorenih (open-ended) upita koji često nemaju jednoznačno rješenje i zahtijevaju precizno pridržavanje zadanih ograničenja. Zahtjevaju od modela da istovremeno drži u fokusu širok spektar mogućnosti i rješenja, filtrirajući ih prema postavljenim pravilima. Dok veći modeli ponekad mogu postići uspjeh, osobito ako su fino podešeni za zadatke zaključivanja, oni to čine sporije i uz značajnu potrošnju računalne snage. Manji modeli, iako inherentno efikasniji i brži, jednostavno nemaju kapacitet da samostalno obrade ovakvu složenost.

DisCIPL: Kolaborativni pristup rješavanju problema

Upravo ova poteškoća potaknula je istraživače s MIT-a da razviju potpuno novi pristup – DisCIPL. Njihova metoda temelji se na principu suradnje: jedan veliki, moćni jezični model preuzima ulogu “direktora” ili “planera”, dok se manji, ali efikasniji modeli pretvaraju u “radnike” ili “izvršitelje”.

Proces funkcionira na sljedeći način:

Planiranje: Korisnik postavlja složeni zadatak velikom jezičnom modelu (LLM). Ovaj “šef” model analizira zahtjev, razlaže ga na manje, upravljive podzadatke i kreira detaljnu strategiju za njihovo rješavanje.
Delegiranje: LLM zatim prenosi ove upute i smjernice manjim “sljedbenik” modelima, koristeći pritom poseban programski jezik.
Izvršavanje: Svaki manji model dobiva specifičan dio zadatka na kojem radi neovisno.
Koordinacija i ispravak: Veliki model ne samo da delegira zadatke, već i nadgleda rad manjih modela. Ako jedan model generira izlaz koji nije u skladu sa zadanim pravilima ili ciljem (npr. stih koji ne odgovara tonu pjesme), veliki model može intervenirati, zatražiti ponovno generiranje ili čak odabrati bolje rješenje ponuđeno od drugog malog modela.

Ovaj sustav omogućuje da se prednosti oba tipa modela objedine: snaga i sposobnost planiranja velikog modela s brzinom i efikasnošću manjih modela.

LLaMPPL: Jezik za komunikaciju i kontrolu

Ključni element DisCIPL-a je programski jezik nazvan LLaMPPL (Language Model Programming Language). Razvijen od strane MIT-ovog Probabilistic Computing Projecta, LLaMPPL služi kao univerzalni “jezik” kojim veliki model komunicira s manjim modelima. On omogućuje programerima da ugrade specifična pravila i ograničenja izravno u upute koje dobivaju jezični modeli.

Na primjer, ako želimo da model napiše pjesmu od osam stihova, pri čemu svaki stih mora imati točno osam riječi, ta se pravila mogu kodirati u LLaMPPL. Manji modeli tada dobivaju precizne upute o tome kako pristupiti zadatku, potencijalno radeći na različitim stihovima paralelno. LLaMPPL ne samo da olakšava upravljanje zadacima s ograničenjima, već također omogućuje i generiranje kodova bez grešaka, jer se inherentna pravila programskog jezika mogu ugraditi u proces generiranja.

Primjeri upotrebe LLaMPPL-a i DisCIPL-a:

Kreiranje tekstualnih objava (blurbova): LLM može osmisliti nacrt kratkog reklamnog teksta, a manji modeli mogu generirati različite verzije, svaka s naglaskom na drugačiju prodajnu točku ili stil, dok ih LLM usmjerava prema konačnom, optimalnom obliku.
Sastavljanje popisa za kupnju s budžetom: Korisnik postavlja zahtjev za popis namirnica s ograničenim budžetom. LLM planira potrebne kategorije i količine, a manji modeli pronalaze najpovoljnije opcije unutar zadanog okvira.
Planiranje putnih itinerara: LLM kreira osnovni plan putovanja, uzimajući u obzir trajanje, lokacije i ključne atrakcije. Manji modeli zatim detaljiziraju smještaj, prijevoz i aktivnosti, pazeći na vremenska i financijska ograničenja.
Generiranje matematičkih dokaza: LLM može definirati korake i logički slijed, dok manji modeli mogu pomoći u popunjavanju pojedinačnih koraka ili provjeri valjanosti pojedinih tvrdnji, slijedeći stroga matematička pravila kodirana u LLaMPPL-u.

Prednosti ovog kolaborativnog pristupa su višestruke:

Povećana točnost: Integracija preciznih pravila i nadzor velikog modela smanjuje vjerojatnost pogrešaka kod manjih modela.
Veća efikasnost: Paralelna obrada zadataka od strane više manjih modela značajno ubrzava proces u usporedbi s jednim velikim modelom koji sve radi sekvencijalno.
Smanjena potrošnja energije: Manji modeli zahtijevaju znatno manje računalnih resursa i energije za rad, što ih čini ekološki prihvatljivijom i ekonomičnijom opcijom.
Veća kontrola: LLaMPPL pruža programerima i korisnicima izravan način za definiranje i nametanje pravila, što povećava transparentnost i upravljivost AI sustava.

Gabriel Grand, vodeći autor studije i doktorand na MIT-u, naglašava važnost ovog rada za budućnost jezičnih modela: “Radimo na poboljšanju efikasnosti zaključivanja kod jezičnih modela, posebno u brojnim modernim aplikacijama koje uključuju generiranje izlaza pod određenim ograničenjima. Kako upotreba AI modela raste, tako raste i potrošnja energije, stoga su nam potrebni modeli koji mogu pružiti točne odgovore uz minimalnu računalnu snagu.”

Prednosti i mane DisCIPL pristupa

Kao i svaka nova tehnologija, DisCIPL donosi niz prednosti, ali i potencijalne izazove.

Prednosti:

Snažne performanse s manjim modelima: Omogućuje manjim, efikasnijim modelima postizanje razine točnosti koja je inače rezervirana za daleko veće i skuplje sustave.
Ubrzanje procesa (Niska latencija): Paralelna obrada značajno smanjuje vrijeme od postavljanja upita do dobivanja odgovora, što je ključno za interaktivne aplikacije u stvarnom vremenu.
Smanjena potreba za parametrima: Manji modeli inherentno imaju manje parametara, što znači da su lakši za treniranje, pohranjivanje i korištenje, te manje skloni “halucinacijama” ili generiranju netočnih informacija.
Veća kontrola i transparentnost: Korištenje LLaMPPL-a daje programerima fino podešavanje nad procesom generiranja, omogućujući bolju kontrolu nad konačnim rezultatom i lakše otklanjanje grešaka.
Energetska učinkovitost i ekološki otisak: Značajno smanjuje potrošnju energije u usporedbi s tradicionalnim pristupima koji se oslanjaju isključivo na masivne LLM-ove. Ovo je kritično važno u kontekstu sve veće zabrinutosti oko ekološkog utjecaja AI.
Modularnost i proširivost: Sustav je dizajniran tako da se lako mogu dodavati novi manji modeli ili prilagođavati postojeći za specifične zadatke, čineći ga fleksibilnim i skalabilnim.

Potencijalne mane i izazovi:

Složenost implementacije: Postavljanje i upravljanje sustavom koji uključuje više modela i poseban programski jezik može biti složenije od korištenja jednog samostalnog LLM-a. Zahtijeva stručnost u programiranju i razumijevanje arhitekture sustava.
Potreba za kvalitetnim planiranjem: Efikasnost DisCIPL-a uvelike ovisi o kvaliteti planiranja koje provodi veliki “šef” model. Loše planiranje može dovesti do neefikasnog delegiranja i pogrešnih rezultata, unatoč naporima manjih modela.
Komunikacijski overhead: Iako LLaMPPL pojednostavljuje komunikaciju, sam proces slanja uputa, primanja rezultata i koordinacije između više modela može unijeti određeni “overhead” koji bi u nekim jednostavnijim scenarijima mogao produžiti vrijeme obrade u usporedbi sa savršeno optimiziranim, jedinstvenim modelom.
Nadzor i ispravak grešaka: Iako veliki model vrši nadzor, proces ispravljanja grešaka može postati kompleksan ako se radi o višestrukim, međusobno povezanim greškama u izlazima više manjih modela.
Ovisnost o kvaliteti malih modela: Performanse sustava neizbježno ovise o kvaliteti i sposobnostima pojedinačnih malih modela koji obavljaju izvršne zadatke. Ako su oni sami po sebi nedovoljno sposobni, čak ni najbolji planiranje neće pomoći.

Alane Suhr, izvanredna profesorica na Sveučilištu Kalifornija u Berkeleyu, koja nije bila uključena u istraživanje, ističe važnost ovakvih pristupa: “Zaista je uzbudljivo vidjeti nove alternative standardnom zaključivanju jezičnih modela. Ovaj rad otvara vrata novim pristupima modeliranju jezika i LLM-ovima koji značajno smanjuju latenciju zaključivanja putem paralelizacije, zahtijevaju znatno manje parametara od trenutnih LLM-ova, pa čak i poboljšavaju performanse zadataka u usporedbi sa standardnim serijaliziranim zaključivanjem. Rad također pruža prilike za istraživanje transparentnosti, interpretibilnosti i upravljivosti izlaza modela, što je i dalje ogroman otvoreni problem u implementaciji ovih tehnologija.”

Budućnost je kolaborativna: Mala AI radi velike stvari

Pristup poput DisCIPL-a predstavlja povratak osnovnom principu učinkovitosti i suradnje. Umjesto da gradimo sve veće i veće modele, fokus se prebacuje na inteligentno orkestriranje postojećih resursa. Ovo “priča o autsajderu” u svijetu AI sugerira da manji, specijalizirani modeli, kada se pametno povežu i usmjere, mogu nadmašiti svoje veće kolege u određenim, zahtjevnim zadacima.

Ovo otvara vrata cijelom nizu novih mogućnosti:

Personalizirani AI asistent: Manji modeli bi mogli biti trenirani za specifične osobne potrebe korisnika (npr. praćenje rasporeda, upravljanje zdravljem), dok bi veći model služio kao centralna točka za složenije upite.
Efikasniji alati za programere: AI bi mogao pomoći u generiranju, otklanjanju grešaka i optimizaciji koda, pri čemu bi manji modeli radili na specifičnim sintaktičkim ili semantičkim provjerama, pod nadzorom većeg modela koji razumije arhitekturu cijelog projekta.
AI u znanstvenim istraživanjima: Složeni problemi poput analize velikih datasetova, modeliranja simulacija ili generiranja hipoteza mogli bi se ubrzati i učiniti preciznijim ovakvim kolaborativnim pristupom.
Financijsko modeliranje i analiza rizika: Tvrtke bi mogle koristiti DisCIPL za analizu tržišta, predviđanje trendova ili upravljanje portfeljima, gdje bi brzi izračuni manjih modela bili koordinirani s dubljim strateškim analizama većih sustava.

Naravno, pred nama je još puno posla. Potrebna su daljnja istraživanja kako bi se usavršio LLaMPPL, poboljšale metode planiranja i optimizirala komunikacija između modela. Ključno je pronaći pravu ravnotežu između veličine i broja uključenih modela za svaki pojedini zadatak.

Međutim, pravac je jasan: budućnost umjetne inteligencije vjerojatno neće biti obilježena samo rastom, već i inteligencijom, suradnjom i efikasnošću. DisCIPL i slični pristupi pokazuju nam put prema AI sustavima koji su ne samo moćni, već i pristupačniji, ekološki prihvatljiviji i lakši za upravljanje. Dok veći modeli nastavljaju istraživati granice onoga što je moguće, manji modeli, vođeni pametnim planiranjem, postat će neizostavan dio našeg AI ekosustava, omogućujući nam da složene probleme rješavamo s novootkrivenom preciznošću i brzinom.

Često postavljana pitanja (FAQ)

Što je glavni problem koji DisCIPL pokušava riješiti?
DisCIPL nastoji riješiti problem efikasnog rješavanja složenih zadataka od strane jezičnih modela. Veliki modeli su dobri u planiranju, ali spori i energetski zahtjevni, dok su manji modeli brzi i efikasni, ali im nedostaje kapacitet za složeno rezoniranje. DisCIPL kombinira prednosti oba pristupa.

Kako točno funkcionira DisCIPL?
Veliki jezični model (LLM) djeluje kao “šef” koji planira zadatak. Zatim koristi programski jezik LLaMPPL kako bi delegirao podzadatke manjim, efikasnijim “sljedbenik” modelima. Veliki model također nadgleda i ispravlja rad manjih modela kako bi osigurao točnost i pridržavanje pravila.

Što je LLaMPPL i zašto je važan?
LLaMPPL (Language Model Programming Language) je programski jezik razvijen na MIT-u koji služi kao alat za komunikaciju i kontrolu između velikog i malih jezičnih modela. Omogućuje precizno kodiranje pravila i ograničenja, što je ključno za uspješno rješavanje zadataka s definiranim kriterijima.

Mogu li mali jezični modeli doista riješiti složene zadatke poput Sudokua ili matematičkih dokaza?
Samostalno, manji modeli često ne mogu. Međutim, kada ih veliki model planira i usmjerava kroz LLaMPPL, uz mogućnost paralelne obrade i ispravka grešaka, oni mogu postići visoku razinu točnosti u ovakvim zadacima, često usporedivu s vodećim sustavima.

Koje su glavne prednosti DisCIPL-a u usporedbi s korištenjem samo jednog velikog jezičnog modela?
Glavne prednosti uključuju znatno veću brzinu (nižu latenciju), značajno smanjenu potrošnju računalne snage i energije, te bolju kontrolu nad procesom generiranja. Također omogućuje postizanje visoke točnosti sa sustavima koji koriste manje parametara.

Koje su potencijalne mane ili izazovi DisCIPL pristupa?
Implementacija može biti složenija, zahtijeva kvalitetno planiranje od strane velikog modela, a postoji i potencijalni komunikacijski “overhead” između modela. Također, performanse ovise o kvaliteti uključenih manjih modela.

Što znači “kolaborativni pristup” u kontekstu AI?
To znači da umjesto jednog, velikog i svemoćnog AI modela, koristimo tim manjih, specijaliziranih AI modela koji rade zajedno. Jedan model koordinira i planira, dok drugi izvršavaju specifične dijelove zadatka, slično timu stručnjaka koji rade na zajedničkom projektu.

Hoće li ovaj pristup učiniti AI dostupnijim?
Da, efikasnost i manja potreba za resursima kod manjih modela čini ih potencijalno dostupnijima za širok spektar aplikacija, uključujući i one na uređajima s ograničenim mogućnostima.