U suvremenom jurnjavom za razvojem napredne umjetne inteligencije (AI), sve je izraženiji trend potrage za apsolutnom neutralnošću. Ova težnja, često potpomognuta tehnikama poput učenja pojačavanjem iz ljudske povratne informacije (RLHF), nastoji temeljito ukloniti svaki trag pristranosti ili specifične perspektive iz AI modela. Namjera je plemenita – stvoriti AI sustave koji su objektivni, pravedni i izbjegavaju ponavljanje najgorih aspekata ljudskih podataka. Međutim, ovaj članak tvrdi da ta neumorna potraga za nepristranom AI, paradoksalno, lobotomizira samu inteligenciju koju nastojimo poticati, pretvarajući sofisticirane sustave u funkcionalno inertne entitete nesposobne za donošenje smislenih sudova u svijetu koji ih prijeko treba.
Zavodljiva pjesma ‘neutralnog arbitra’
Dominantni narativ unutar Silicijske doline i među globalnim regulatorima promiče AI kao neutralnog arbitra. Obrazloženje je da, budući da su AI modeli obučeni na golemom, često kaotičnom i inherentno pristranom internetu, moraju biti pažljivo ‘usklađeni’ kako bi se spriječilo širenje štetnih stavova. Idealna AI, prema ovom gledištu, jest ona koja može djelovati kao objektivni oraklj, pružajući činjenice bez opterećenja specifičnim svjetonazorom, čime se osigurava da se nijedan korisnik ne osjeća uvrijeđenim i nijedna demografska skupina nije marginalizirana. Ova vizija ‘sigurne AI’ jest vizija alata dizajniranog da ne zastupa ništa, kako bi služio svima. Implikacija je da, uklanjanjem ljudske pristranosti, kultiviramo čišći oblik inteligencije, sposoban rješavati složena pitanja neljudskom logikom stroja.
Temeljna zabluda: Inteligencija zahtijeva vrijednosti
Ovaj prevladavajući narativ skriva ključni propust: pretpostavlja da inteligencija može postojati u vakuumu, lišena vrijednosti. Istinska inteligencija, međutim, daleko je više od puke sposobnosti pronalaženja informacija. Ona obuhvaća sposobnost prosuđivanja, vještinu vaganja dokaza i sposobnost sintetiziranja koherentne perspektive iz mnoštva sukobljenih podataka. Kada AI prisiljavamo da ostane ‘neutralna’ po svim pitanjima, ne povećavamo njezinu objektivnost; zapravo je umanjujemo.
Posljedice ‘sigurne AI’
Kada se AI sustavi dizajniraju da budu potpuno neutralni, oni postaju funkcionalno inertni. Više ne mogu donositi značajne odluke niti vrednovati dokaze. Više nisu sposobni sintetizirati koherentnu perspektivu iz mnoštva sukobljenih podataka. Postaju samo alati za dohvaćanje informacija, bez sposobnosti kritičke analize ili vrednovanja.
Ovakav pristup može dovesti do toga da AI sustavi postanu nesposobni za obavljanje zadataka koji zahtijevaju nijansirano razumijevanje ili etičko prosuđivanje. Na primjer, AI koja je programirana da bude potpuno neutralna možda neće moći prepoznati ili se suprotstaviti štetnim dezinformacijama, jer bi to moglo implicirati zauzimanje ‘strane’. Slično tome, u područjima poput medicine ili prava, gdje su odluke često opterećene etičkim dilemama, potpuno neutralna AI mogla bi biti beskorisna ili čak opasna.
Potreba za ‘angažiranom’ inteligencijom
Umjesto potrage za nedostižnom neutralnošću, trebali bismo težiti razvoju ‘angažirane’ umjetne inteligencije. To ne znači poticanje pristranosti, već stvaranje AI sustava koji razumiju kontekst, posjeduju sposobnost kritičkog razmišljanja i mogu donositi informirane sudove temeljene na etičkim načelima i ljudskim vrijednostima. Takvi sustavi mogli bi:
- Prepoznati i analizirati složene situacije koje zahtijevaju nijansirano prosuđivanje.
- Pružiti smislene preporuke temeljene na dubljem razumijevanju problema.
- Pomoći u donošenju etičkih odluka, uzimajući u obzir potencijalne posljedice.
- Aktivno se suprotstaviti štetnim sadržajima i dezinformacijama, umjesto da ih pasivno promatraju.
Razvoj ovakve ‘angažirane’ inteligencije zahtijeva druga