Google Ads drastično smanjuje potrebu za podacima pri treniranju umjetne inteligencije

Izrada sustava umjetne inteligencije (UI) često je usporavana i poskupljivana zbog potrebe za velikom količinom kvalitetnih, označenih podataka. Posebno je to izraženo kod prilagodbe velikih jezičnih modela (LLM-ova), koji zahtijevaju goleme količine podataka za postizanje optimalnih rezultata. Proces prikupljanja i označavanja tih podataka dugotrajan je, skup i zahtijeva značajne resurse, što ograničava učinkovitost i skalabilnost UI sustava. Istraživači iz Google Adsa razvili su inovativnu metodu aktivnog učenja koja značajno smanjuje potrebu za podacima za treniranje, zadržavajući pritom visoku preciznost. Ovaj pristup, nazvan ‘Postizanje 10.000 puta smanjenja podataka za treniranje s oznakama visoke vjernosti’, ima dalekosežne implikacije za razvoj i primjenu UI sustava.

Problematična priroda podataka za treniranje

Klasificiranje neprimjerenog sadržaja oglasa izvrstan je primjer složenog zadatka koji zahtijeva duboko kontekstualno i kulturološko razumijevanje. Dok se tradicionalni sustavi strojnoga učenja muče s takvim zadacima, veliki jezični modeli pokazali su izniman potencijal u prepoznavanju sadržaja koji krši pravila. Međutim, prilagodba LLM-ova za takve zadatke zahtijeva visokokvalitetne podatke za treniranje, čije je prikupljanje i označavanje istodobno teško i skupo. Standardni pristupi koji se oslanjaju na velike količine podataka uključuju prikupljanje i označavanje ogromnih količina podataka, samo da bi se otkrilo da se model mora ponovno trenirati od početka kada se pravila o sigurnosti promijene ili se pojave nove vrste neprimjerenog sadržaja oglasa. To predstavlja značajan izazov, jer je potreba za kvalitetnim podacima za treniranje postala glavna prepreka u razvoju UI sustava.

Novi pristup prikupljanju podataka

Kako bi riješili ovaj problem, istraživači iz Google Adsa razvili su skalabilan proces prikupljanja za aktivno učenje koji može drastično smanjiti količinu podataka potrebnih za prilagodbu LLM-ova. Ovaj pristup uključuje sljedeće korake:

Početni model: Proces započinje s početnim modelom koji koristi nultu ili malu količinu primjera (LLM-0), kojem se daje uputa koja opisuje sadržaj od interesa.
Procjena nesigurnosti: Model svakom primjerku dodjeljuje procjenu vjerojatnosti pogreške. Primjeri s visokom razinom nesigurnosti automatski se označavaju kao kandidati za daljnje označavanje.
Ciljana ljudska intervencija: Ljudski analitičari usredotočuju se isključivo na označavanje tih kandidatskih primjera, umjesto na cjelokupnu masivnu bazu podataka. To drastično smanjuje vrijeme i troškove označavanja.
Iterativno poboljšanje: Označeni primjeri dodaju se skupu za treniranje, a ciklus se ponavlja. Model postaje sve precizniji, a istovremeno se smanjuje broj novih podataka potrebnih za daljnje poboljšanje.

Ovaj spiralni proces poboljšanja omogućuje da se model, nakon samo nekoliko ciklusa, postigne visoka razina točnosti uz korištenje samo djelića uobičajene količine podataka. U praksi, to znači da se potreba za podacima može smanjiti i do 10.000 puta.

Prednosti i implikacije nove metode

Ova inovativna metoda donosi višestruke prednosti. Prije svega, značajno smanjuje troškove razvoja softvera jer se drastično smanjuje potreba za skupim ručnim označavanjem podataka. Drugo, omogućuje bržu prilagodbu modela promjenjivim pravilima i pojavom novih vrsta sadržaja, što je ključno u dinamičnim okruženjima poput oglašavanja. Umjesto potpunog ponovnog treniranja, dovoljna je prilagodba s malim brojem novih, relevantnih primjera.

Nadalje, ova metoda doprinosi i održivosti smanjenjem računalnih resursa potrebnih za treniranje modela, čime se smanjuje i ekološki otisak. Posebno je vrijedna za specijalizirane domene gdje su označeni podaci rijetki, skupi ili podliježu strogim propisima, kao što su medicinske transkripcije, pravni dokumenti ili financijski izvještaji.

Google Ads drastično smanjuje potrebu za podacima pri treniranju umjetne inteligencije

Problematična priroda podataka za treniranje

Novi pristup prikupljanju podataka

Prednosti i implikacije nove metode

Odgovori Otkaži odgovor