Modeli velikog jezika (LLM) postali su svakodnevni alati za stotine milijuna korisnika. Od sastavljanja e‑mailova i pisanja koda, preko planiranja putovanja do kreiranja jelovnika u kafićima, AI chatbotovi su postali sastavni dio našeg digitalnog života. Za upravitelje platformi ključno je razumjeti na koji način ljudi koriste ove alate, kako bi unaprijedili usluge, oblikovali sigurnosne politike i javnosti pružili uvid u utjecaj umjetne inteligencije na svakodnevicu. Međutim, razgovori koji se koriste za takve analize često sadrže osobne ili osjetljive podatke, što postavlja pitanje: kako izvući vrijedne obrasce korištenja bez ugrožavanja privatnosti korisnika?
Zašto su postojeći pristupi nedovoljni
Jedan od najčešće citiranih pokušaja očuvanja privatnosti je CLIO okvir, koji traži od modela velikog jezika da sažme razgovore, a pritom ukloni osobno identificirajuće podatke (PII). Iako CLIO predstavlja solidan prvi korak, njegova zaštita privatnosti temelji se na heuristikama. Zaštita ovisi o tome hoće li model ispravno prepoznati i izbrisati svaki osjetljivi podatak – jamstvo koje je teško formalizirati, teško auditirati i ranjivo na buduće ažuriranje modela ili napade koji se temelje na manipulaciji upita.
Ove ograničenja potaknula su nas da se zapitamo može li se postići stroži, matematički provjerljiv model privatnosti koji bi pružio sličnu ili čak veću korisnost. Odgovor leži u diferencijalnoj privatnosti (DP), okviru koji ograničava utjecaj podataka pojedinog korisnika na izlaz algoritma. Ugradnjom DP izravno u analitički proces, možemo ponuditi krajnje garancije privatnosti koje su neovisne o sposobnosti modela da ukloni sadržaj.
Naš rješenje: Urania okvir
U radovima Urania: Diferencijalno privatni uvidi u upotrebu AI, predstavljenom na konferenciji COLM 2025, uvodimo trostadijski proces koji generira visoko razinu sažetke korisničkih razgovora s AI chatbotima, uz stroge garancije DP. Proces se sastoji od:
- Diferencijalno privatno gradište: Razgovori se prevoje u gustočićne vektorske sadržaje. Diferencijalno privatni algoritam za gradište zatim gradi slične sadržaje, osiguravajući da nijedan pojedinačni korisnik ne utječe na izlaz algoritma.
- DP agregacija: Gradište se zatim agregira u jedinstveni vektorski sadržaj, koji sadrži informacije o korisničkim razgovorima.
- DP analiza: Agregirani vektorski sadržaj se zatim analizira koristeći diferencijalno privatni algoritam, koji pruža visoko razinu sažetke korisničkih razgovora.
Vrijednosti našeg rješenja
Naš Urania okvir nudi nekoliko korisnih prednosti u odnosu na postojeće pristupe:
- Stroge garancije privatnosti: Urania okvir pruža krajnje garancije privatnosti koje su neovisne o sposobnosti modela da ukloni sadržaj.
- Visoka razinu sažetke: Urania okvir generira visoko razinu sažetke korisničkih razgovora, što je korisno za upravitelje platformi koji žele razumjeti na koji način ljudi koriste AI chatbotove.
- Skalabilnost: Urania okvir je dizajniran za skalabilnost i može se lako integrirati u postojeće analitičke procese.