Osnaživanje personaliziranih preporuka putem prirodnog jezika

01.02.2026.

194

Krishna Sayana, inženjer softvera, i Hubert Pham, znanstvenik istraživač, Google Research 27. Velike jezničke modele (LLMs) preobražavaju način na koji sustavi preporuke komuniciraju s korisnicima. Tradicionalni preporučni sustavi se fokusiraju na predviđanje sljedećeg predmeta koji bi korisniku mogao biti draž.

Krishna Sayana, inženjer softvera, i Hubert Pham, znanstvenik istraživač, Google Research
27. lipnja 2025.

Velike jezničke modele (LLMs) preobražavaju način na koji sustavi preporuke komuniciraju s korisnicima. Tradicionalni preporučni sustavi se fokusiraju na predviđanje sljedećeg predmeta koji bi korisniku mogao biti draž. No, pravi cilj ide dalje: želimo sustave koji komuniciraju s korisnicima, razumiju njihove potrebe, prilagođavaju se putem prirodnog jezika i objašnjavaju zašto preporuka ima smisla. Međutim, ne postoje skupovi podataka koji bi istraživali ove nove mogućnosti. Stoga smo razvili Reviews Enhanced with GEnerative Narratives (REGEN), novi skup podataka koji uključuje preporuke predmeta, prirodne jezničke značajke sastavljene od sintetičkih kritika korisnika, te personalizirane priče koje objašnjavaju razloge kupnje i preporuke proizvoda.

Osnaživanje personaliziranih preporuka putem prirodnog jezika

Uvod u REGEN skup podataka

Postoji nekoliko razloga zašto je REGEN skup podataka važan. Prvo, postojeći skupovi podataka za treniranje konverzacijskih preporučnih sustava često ne uspijevaju uhvatiti nuanse stvarnih razgovora. Možda se fokusiraju na sekvencijalno predviđanje predmeta, kratke fragmente dijaloga ili nemaju eksplicitne korisničke povratne informacije. Izabrali smo skup podataka Amazon Product Reviews zbog njegove specifične korisnosti za velike vokabulare, što može biti nepoznato LLMs. REGEN obogaćuje skup podataka Amazon Reviews s dva ključna komponenta: kritike i priče.

Kritike

Kritike su ključni dio konverzacijske preporuke, omogućujući korisnicima da izražavaju svoje preferencije i voditi sustav. U REGEN-u kritike se generiraju kako bi vodili preporučni sustav od trenutnog predmeta do sličnog, željenog predmeta. Na primjer, korisnik može kritizirati “crnu kuglu za pisanje” rečima: “Želio bih crnu”. Da bismo osigurali relevantnost kritika, generirali smo ih samo za susjedne parove predmeta koji su dovoljno slični, koristeći hijerarhijske kategorije predmeta koje pruža Amazon Reviews kao proxy za sličnost. Model Gemini 1.5 Flash generira nekoliko opcija kritika za svaki par, od kojih izabiremo jednu nasumično za uključivanje u skup podataka.

Priče

Priče pružaju bogato kontekstualno informiranje o preporučenim predmetima, poboljšavajući korisničko iskustvo. REGEN uključuje raznovrsne priče, kao što su: razlozi kupnje, objašnjenja zašto bi predmet mogao biti pogodan za korisnika, preporuke proizvoda, opisivanje prednosti i značajki predmeta, te sažetci korisničkih preferencija i povijesti kupnje. Ove priče variraju u kontekstualizaciji i duljini, pružajući bogat skup podataka za treniranje konverzacijskih preporučnih sustava.

Eksperimenti

Da bismo učinkovito evaluirali REGEN, ne samo da smo testirali ako modeli mogu preporučiti pravilan predmet, već smo htjeli vidjeti ako mogu komunicirati svoje razmišljanje, prilagoditi se povratnoj informaciji i generirati jezik koji se čini prilagođen korisniku. Stoga smo okvirili novi tip zadatka: konverzacijska preporuka koja je zajednički generativna. Ideja je jednostavna ali moćna – dajući povijest kupnje i opcionalno prirodni jezik kritike (npr. “Trebam nešto s više memorije”), model mora preporučiti sljedeći predmet i generirati kontekstualnu priču o njemu. Ovaj zadatak odražava kako korisnici prirodno komuniciraju s preporučnim sustavima kada im je omogućeno izražavati svoje preferencije vlastitim riječima. Također se udaljava od diskontinuiranog modeliranja, gdje se preporuka i generiranje jezika rukuju zasebno. Umjesto toga, tretiramo oba kao dio jedinog, krajnjeg cilja.

Arhitekture

Da bismo istražili različite pristupe modeliranja, razvili smo i implementirali dvije osnovne arhitekture. Prva je hibridni sustav, gdje sekvencijalni preporučni sustav (FLARE) predviđa sljedeći predmet na temelju kolaborativnog filtriranja i signala sadržaja. Taj izlaz zatim se unosi u lagani LLM (Gemma 2B), koji je odgovoran za generiranje priče. Ovaj postavljanje odražava čest arhitektonski pristup u proizvodnim sustavima, gdje se različiti komponente specijaliziraju za različite faze cjevovoda. Druga arhitektura je LUMEN (LLM-based Unified Multi-task Model with Critiques, Recommendation).

Zaključak

REGEN skup podataka predstavlja važan korak prema osnaživanju personaliziranih preporuka putem prirodnog jezika. Obogaćuje postojeće skupove podataka s bogatim kontekstualnim informiranjem i omogućuje istraživanje novih arhitektura preporuka. Naš rad pokazuje da LLMs trenirani na ovom skupu podataka učinkovito generiraju preporuke i kontekstualne priče, postižući performanse usporedive s najnovijim preporučnim sustavima i jezničkim modelima.

Česta pitanja

Zašto je REGEN skup podataka važan?

REGEN skup podataka je važan jer obogaćuje postojeće skupove podataka s bogatim kontekstualnim informiranjem, omogućujući istraživanje novih arhitektura preporuka. Također omogućuje LLMs da generiraju preporuke i kontekstualne priče, postižući performanse usporedive s najnovijim preporučnim sustavima i jezničkim modelima.

Kako je REGEN skup podataka razvijen?

REGEN skup podataka je razvijen tako što smo obogatili Amazon Product Reviews skup podataka s kritikama i pričama. Kritike su generirane kako bi vodile preporučni sustav od trenutnog predmeta do sličnog, željenog predmeta. Priče pružaju bogato kontekstualno informiranje o preporučenim predmetima, poboljšavajući korisničko iskustvo.

Koji su eksperimenti provedeni s REGEN skupom podataka?

S REGEN skupom podataka provedeni su eksperimenti koji su testirali ako modeli mogu preporučiti pravilan predmet, komunicirati svoje razmišljanje, prilagoditi se povratnoj informaciji i generirati jezik koji se čini prilagođen korisniku. Ovi eksperimenti pokazali su da LLMs trenirani na ovom skupu podataka učinkovito generiraju preporuke i kontekstualne priče.

Koji su rezultati eksperimenata s REGEN skupom podataka?

Rezultati eksperimenata s REGEN skupom podataka pokazali su da LLMs trenirani na ovom skupu podataka učinkovito generiraju preporuke i kontekstualne priče, postižući performanse usporedive s najnovijim preporučnim sustavima i jezničkim modelima.