TehnologijaVijestiZnanost

OpenAI predstavlja GPT 5.2: Radni konj za agente, kodiranje i analitičke zadatke

2 modela osmišljenu za zahtjevne radne tokove, dugotrajni kontekst i inteligentne agente. 2 pomiče granice umjetne inteligencije (AI), donosi značajna poboljšanja u brzini i točnosti, te kakve koristi donosi u programiranju, analitičkom radu, pa čak i u znanosti i inženjeringu.

OpenAI je u proljeće 2024. lansirao GPT 5.2, novu generaciju GPT 5.2 modela osmišljenu za zahtjevne radne tokove, dugotrajni kontekst i inteligentne agente. U ovom članku istražujemo kako GPT 5.2 pomiče granice umjetne inteligencije (AI), donosi značajna poboljšanja u brzini i točnosti, te kakve koristi donosi u programiranju, analitičkom radu, pa čak i u znanosti i inženjeringu.

Što je GPT 5.2?

GPT 5.2 označava seriju modela temeljenih na arhitekturi velikih jezičnih modela (LLM) koju je razvila kompanija OpenAI. Riječ je o nasljedniku GPT 5.1, s ključnim poboljšanjima u obradi iznimno dugih kontekstualnih nizova, učinkovitijoj integraciji alata i većom skalabilnošću za profesionalne zadatke.

Tri varijante unutar GPT 5.2 obitelji

Modeli u GPT 5.2 obitelji podijeljeni su na tri glavne varijante, prilagođene različitim potrebama korisnika:

  • GPT 5.2 Instant – dizajniran za svakodnevnu pomoć, brzo generiranje ideja i učenje.
  • GPT 5.2 Thinking – glavni radni konj za višestupanjske procese i agente koji rade duže radne tokove.
  • GPT 5.2 Pro – verzija sa više računalnih resursa, idealna za složene analitičke i tehničke zadatke.

Integracija s ChatGPT i API-jem

Korisnici ChatGPT-a odmah vide nove opcije imenovane ChatGPT-5.2 Instant, Thinking i Pro, dok su u API-ju to modeli gpt-5.2-chat-latest, gpt-5.2 i gpt-5.2-pro. Ova fleksibilnost omogućuje razvoj širokog spektra AI rješenja – od jednostavnih chatbotova do složenih agenata koji autonomno upravljaju projektima.

Benchmark performanse GPT 5.2

Benchmark testovi otkrivaju koliko je GPT 5.2 superiorniji u odnosu na prethodnike i ljudske stručnjake:

Benchmark GDPval: Usporedba s profesionalcima

Na GDPval evaluaciji, koja obuhvaća 44 specifična zadatka u 9 industrija (financije, marketing, pravni sektor i dr.), GPT 5.2 Thinking postiže rezultate bolje ili jednako dobre kao vrhunski stručnjaci u 70,9% slučajeva. Usto, generira izlaze 11 puta brže i troši ispod 1% procijenjenih troškova ljudskog rada.

“Za inženjerske timove, to znači da GPT 5.2 može pouzdano kreirati prezentacije, proračunske tablice, rasporede i dijagrame prema struktuiranim uputama.”

Financijski modeli i investicijsko bankarstvo

U internom testu modeliranja proračunskih tablica za mlađe investicijske bankare, ocjena modela raste s 59,1% kod GPT 5.1 na 68,4% kod GPT 5.2 Thinking i 71,7% kod GPT 5.2 Pro. Ti zadaci uključuju trostruke financijske izvještaje (balance sheet, profit & loss, cash flow) i leveraged buyout modele s točnim formatiranjem i citatima – što je tipično za mnoge korporativne radne tokove.

SWE-Bench: Kode i inženjering

U području softverskog inženjeringa, GPT 5.2 Thinking ostvaruje 55,6% na SWE-Bench Pro (generiranje ispravaka na razini repozitorija u više programskih jezika) i 80,0% na SWE-Bench Verified (usmjereno na Python). Radi usporedbe, GPT 5.1 je bio oko 45–50% u tim istim testovima.

Dugotrajni kontekst i agentični radni tokovi

Jedna od glavnih odrednica za razvoj GPT 5.2 bila je sposobnost održavanja i procesuiranja udaljenog, „dugotrajno” rasprostranjenog konteksta.

MRCRv2: Pronalazak igle u sjenu dijaloga

Na OpenAI benchmarku MRCRv2, koji testira reproduciranje identičnih „iglenih” pitanja ubačenih unutar velikih količina teksta (do 256k tokena), GPT 5.2 Thinking gotovo savršeno (≈100%) pronalazi i ispravno odgovara na četiri kontekstualna pitanja razbacana unutar razgovora. To je prvi model s takvom razinom točnosti pri 256k tokena.

Proširenje radne memorije s /compact endpointom

Za scenarije koji premašuju i tu impresivnu granicu, GPT 5.2 Thinking koristi /compact endpoint za kompakciju konteksta. Ova metoda optimizira dulji dijalog ili složene agentne iteracije, zadržavajući ključne informacije iz dalekih koraka radnog tijeka i omogućujući alatima da rade besprijekorno kroz stotine ili tisuće koraka.

Agentične integracije i upravljanje alatima

Na primjeru Tau2-bench Telecom testa (multi-turn korisnička podrška), GPT 5.2 Thinking postiže 98,7% točnosti u orkestraciji poziva alata. U službenom priopćenju, OpenAI prikazuje turističkog agenta koji:

  • riješava kašnjenje leta,
  • preusmjerava veze,
  • prijavljuje izgubljenu prtljagu,
  • organizira medicinsku asistenciju,
  • provodi nadoknade i refundacije.

GPT 5.1 je ostavio neke korake nedovršenima, dok GPT 5.2 Thinking vodi cijeli proces dosljedno i automatizirano.

Vizija, znanost i matematika

Pored jezičnih i programerskih sposobnosti, GPT 5.2 značajno napreduje u razumijevanju vizualnog i znanstvenom rezoniranju.

Računalni vid i razumijevanje sučelja

GPT 5.2 Thinking otklanja otprilike 50% pogrešaka u zadacima poput interpretacije grafikona (CharXiv Reasoning) i prepoznavanja UI komponenti (ScreenSpot Pro), osobito kada je omogućen Python alat za analizu slike. Preciznije locira dijelove slike – primjerice uz usku granicu okreće više područja na ploči matične ploče nego prethodnik GPT 5.1.

Scientific benchmarks: GPQA i FrontierMath

Za znanstvene izazove, GPT 5.2 Pro postiže 93,2% na GPQA Diamond, a GPT 5.2 Thinking 92,4%. To su zadaci s prilično visokim zahtjevima iz fizike, kemije i biologije na diplomskom nivou. U FrontierMath testovima Tier 1–3 (napredni matematički problemi) s omogućenim Python alatima, GPT 5.2 Thinking rješava 40,3% zadataka – značajna prekretnica u AI matematičkom rezoniranju. OpenAI navodi rani slučaj upotrebe gdje je GPT 5.2 Pro pomogao u dokazu iz teorije statističkog učenja pod ljudskim nadzorom.

Prednosti i nedostaci korištenja GPT 5.2

Prije nego zaključimo, sažmimo ključne prednosti i izazove implementacije GPT 5.2:

Prednosti

  • Visoka točnost: Bolji rezultati od vrhunskih stručnjaka u 70,9% slučajeva na GDPval.
  • Brzina: do 11× brže generiranje sadržaja u odnosu na GPT 5.1.
  • Ekonomičnost: ispod 1% procijenjene cijene ljudskog rada.
  • Dugotrajni kontekst: do 256k tokena, gratirao integracijom /compact endpointa.
  • Svestrana primjena: programiranje, financije, znanost, korisnička podrška.

Nedostaci

  • Kost računalnih resursa: Pro varijanta zahtijeva znatnu infrastrukturu.
  • Složena integracija: Upravljanje dugim radnim tokovima i kompaktiranjem konteksta može biti izazovno za početnike.
  • Etika i nadzor: Automatizacija osjetljivih zadataka (pravni dokumenti, medicinski savjeti) treba ljudsku provjeru.

Zaključak

OpenAI GPT 5.2 predstavlja značajan iskorak za profesionalnu upotrebu umjetne inteligencije. Kombinacija visokih performansi na benchmark testovima, mogućnosti obrade iznimno dugih kontekstualnih nizova te integracija alata i agenata čini ga izvrsnim izborom za tvrtke, istraživačke centre i inženjerske timove. Iako implementacija zahtijeva kvalitetnu računalnu infrastrukturu i stručan nadzor, prednosti u brzini, točnosti i ekonomičnosti opravdavaju ulaganje, posebno u domenama gdje vremenski i financijski resursi igraju ključnu ulogu.

Česta pitanja (FAQ)

1. Koja je razlika između GPT 5.2 Instant, Thinking i Pro?

GPT 5.2 Instant optimiziran je za brzo generiranje i asistenciju u općim zadacima, Thinking je namijenjen složenim višestupanjskim procesima i dugotrajnom kontekstu, dok Pro dodaje još više računalnih resursa za zahtjevne tehničke i analitičke zadatke.

2. Do koje duljine konteksta GPT 5.2 može raditi?

GPT 5.2 Thinking podržava do 256.000 tokena izvornih podataka, a uz /compact endpoint moguće je učinkovito raditi i s radnim tokovima koji daleko prelaze tu granicu.

3. Kako se GPT 5.2 uspoređuje s ljudskim stručnjacima?

Na benchmarku GDPval, GPT 5.2 Thinking postiže performanse bolje ili jednake stručnjacima u 70,9% slučajeva, ali je u prosjeku 11 puta brži i znatno jeftiniji s troškovne strane.

4. Koje su tipične primjene za GPT 5.2 u poslovnom okruženju?

Primjene uključuju automatizaciju korisničke podrške, generiranje financijskih modela, pisanje tehničke dokumentacije, razvoj softvera, analizu podataka, pa čak i znanstvenu suradnju u istraživačkim radovima.

5. Postoje li etički izazovi pri korištenju GPT 5.2?

Apsolutno. Automatizacija pravnih, medicinskih ili drugih osjetljivih dokumenata nalaže ljudski nadzor kako bi se izbjegle pristranosti, netočne preporuke ili neprikladna interpretacija podataka.

U nastavku pratite najnovije vijesti, tutoriale i savjete na umjetnAI.com – vašem centru za sve o umjetnoj inteligenciji!

Povezano

Odgovori

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena sa * (obavezno)