Google Gemini AI alati Vijesti i novosti

Google predstavio Gemini 3: novi multimodalni AI model za tekst, slike, video i zvuk

19.11.2025.

259

Google je 18. studenog 2025. službeno predstavio Gemini 3, novu generaciju svog AI modela koji nasljeđuje Gemini 2.5 Pro. Riječ je o modelu koji pokušava riješiti najveće probleme dosadašnjih chatbotova: bolje razumijevanje zadatka, manje izmišljanja činjenica i rad s više vrsta podataka u isto vrijeme.

Za korisnike u Hrvatskoj i regiji ovo nije samo još jedna tehnička najava. Gemini 3 već stiže u proizvode koje mnogi svakodnevno koriste: Gemini aplikaciju, Google AI Studio i Vertex AI za tvrtke. Novi Search AI Mode, koji ugrađuje AI odgovore izravno u Google pretraživanje, zasad je ograničen na SAD, ali je jasan smjer u kojem Google ide.

U sljedećim odlomcima saznat ćeš što je točno Gemini 3, koje su glavne novosti, kako se razlikuje od starijih verzija, te što sve to znači za posao, školu i svakodnevni rad s AI alatima.

Što je Googleov Gemini 3 i kada je predstavljen

Photo by Markus Winkler

Gemini 3 je nova generacija Googleovog velikog AI modela, predstavljena 18. studenog 2025. Radi se o takozvanom multimodalnom modelu koji u jednoj arhitekturi obrađuje tekst, slike, video, zvuk i čak programski kod.

Umjesto da Google ima odvojene modele za tekst, slike ili prijevod, Gemini 3 te sposobnosti objedinjuje u jedan sustav. To je važno jer model može razumjeti kontekst iz više izvora odjednom, na primjer iz dokumenta i priložene fotografije, ili iz transkripta i samog audio zapisa.

U obitelji Gemini modela, Gemini 3 je pozicioniran kao najnapredniji i najtočniji model do sada. Google ga opisuje kao svoj najviše “faktualan” model, što znači da je bolje istreniran da razlikuje činjenice od nagađanja. Na testu SimpleQA Verified, koji mjeri faktičnu točnost odgovora, postigao je rezultat od 72,1 %. U praksi to znači da rjeđe izmišlja podatke i češće se drži provjerenih izvora.

Za prosječnog korisnika to se prevodi u vrlo jednostavno iskustvo: manje “uvjerljivih, ali netočnih” odgovora, i više sadržaja koji se može stvarno koristiti u radu, učenju ili donošenju odluka.

Multimodalni AI: tekst, slike, video i zvuk u jednom modelu

Multimodalni AI znači da model može obrađivati više vrsta podataka istodobno i u međusobnom odnosu. Umjesto da razgovaraš samo tekstom, možeš u istom chatu poslati:

kratki opis zadatka,
fotografiju proizvoda,
isječak videa,
dio koda ili tablicu.

Gemini 3 razumije kako se ti elementi povezuju. Na primjer:

učenik može poslati fotografiju zadatka iz udžbenika, uz svoj tekstualni komentar, i dobiti objašnjenje korak po korak,
kreator sadržaja može poslati storyboard za video, nekoliko referentnih fotografija i opis ciljne publike, te dobiti prijedlog scenarija i kadrova,
developer može dati screenshot pogreške, logove i dio koda, pa tražiti prijedlog popravka.

Za poslovne korisnike, multimodalnost znači da jedan alat može obraditi prezentaciju, priloženi video sastanka i Excel tablicu, te iz svega izvući sažetak, ključne brojke i prijedlog idućih koraka.

Ovakvi modeli već su temelj mnogih AI alata o kojima se govori u Hrvatskoj, bilo da je riječ o chatbotovima, generatorima slika ili analitičkim alatima. Ako želiš šire razumjeti kako veliki jezični modeli rade i koje su im granice, korisno je proučiti vodiče i analize na specijaliziranim portalima, poput onih na Umjetnai.com, gdje se već prate učinci AI tehnologija na pretraživanje i online vidljivost.

“Kontekst” je sada veći od milijun tokena: što to znači u praksi

Da bi se razumjelo koliko je Gemini 3 napredovao, treba objasniti pojmove Context “kontekstno okno” i “token”.

Token je mali dio teksta, najčešće riječ ili dio riječi.
Kontekst ili Kontekstno okno je količina teksta koju AI može “držati u glavi” u jednom razgovoru ili upitu.

Ako model ima malo kontekstno okno, brže zaboravlja što si ranije napisao ili moraš dijeliti zadatak na manje dijelove. Gemini 3 podržava kontekst veći od milijun tokena. To je razina na kojoj model može obraditi tekst ekvivalentan cijeloj knjizi, većem projektu dokumentacije ili većem broju znanstvenih članaka odjednom.

U praksi to otvara nove scenarije:

odvjetnici i pravnici mogu dati cijeli ugovor ili set ugovora, pa tražiti analizu, usporedbu klauzula ili potencijalne rizike,
studenti mogu ubaciti cijelu skriptu, bilješke s predavanja i nekoliko članaka, pa tražiti jasan sažetak ili prijedlog plana učenja,
IT tim može dati veću kodnu bazu i dokumentaciju, te tražiti pregled arhitekture, potencijalne bugove ili prijedloge refaktoriranja,
novinari mogu prebaciti više dokumenata, transkripte intervjua i stare članke, pa dobiti prijedlog strukture za novi istraživački tekst.

Ako želiš bolje razumjeti osnove LLM modela, kako rade tokeni, kontekst i treniranje, isplati se pročitati uvodne vodiče na portalu Umjetnai.com, gdje su slične teme već obrađene kroz primjere vezane uz ChatGPT-5 i multimodalni AI.

Ključne novosti u Google Gemini 3 modelu koje vrijedi znati

Gemini 3 ne donosi samo “veći broj” verzije. U pitanju su jasno vidljiva poboljšanja u ponašanju modela i u načinu na koji se integrira u alate.

Glavne novosti:

bolje logičko razmišljanje i zaključivanje,
Deep Think modus, koji daje kvalitetnije odgovore kod složenih zadataka,
novo generativno sučelje, gdje AI sam izrađuje interaktivne alate,
jači rezultati na testovima za slike, video i multimodalno razumijevanje (MMMU-Pro, Video-MMMU).

Umjesto da se fokusiramo samo na brojke, pogledajmo što sve to znači u praksi.

Deep Think modus: sporiji, ali puno pametniji odgovori

Deep Think je poseban način rada Gemini 3 modela. Kada je uključen, model si “uzima više vremena” za razmišljanje. Interno, razmatra više mogućih rješenja, uspoređuje ih i bira ono koje je logičnije i konzistentnije.

S korisničke strane to izgleda ovako:

odgovor stiže nešto sporije,
često je strukturiraniji,
rjeđe sadrži očite logičke greške ili promašene korake.

Ovaj način rada ima smisla za zadatke gdje brzina nije najvažnija, na primjer:

strateške analize tržišta i konkurencije,
kompleksni tehnički problemi i debugiranje,
planiranje projekata (budžeti, rokovi, ovisnosti),
priprema ozbiljnijih poslovnih dokumenata, prijedloga i analiza.

Deep Think troši više računalnih resursa, pa je realno očekivati da će takav modus postojati prije svega u plaćenim planovima i premium paketima, bilo za krajnje korisnike ili za tvrtke kroz Google Cloud.

Za hrvatske firme i freelancere, dobar pristup je:

testirati Deep Think na manjim projektima ili probnim zadacima,
usporediti ga s “brzim” modom na istom problemu,
dokumentirati razliku u kvaliteti i uštedama vremena,
koristiti rezultate kao argument pri odluci vrijedi li plaćati naprednije opcije.

Najgore što se može napraviti je prebaciti cijelu produkciju na novi modus bez pilota i bez jasne slike o stvarnim koristima.

Generativno korisničko sučelje: AI koji sam gradi alate

Jedna od zanimljivijih novosti u Gemini 3 modelu je koncept generativnog korisničkog sučelja. Ideja je da AI više ne vraća samo tekst, nego da sam stvara mini alate i prikaze koji pomažu u rješavanju zadatka.

Primjer iz putovanja:

Umjesto da dobiješ listu savjeta “što vidjeti u Rimu”, korisničko sučelje ti može prikazati:

interaktivnu kartu s označenim lokacijama,
procjenu troškova puta po danima,
okvirni raspored obilazaka,
informacije o radnom vremenu muzeja,

sve to unutar istog “odgovora”. Ti onda možeš mijenjati parametre, dodavati dane, filtrirati po budžetu.

Još nekoliko primjera:

Za posao: AI može iz tvog Excela i inputa klijenata izgraditi jednostavan pregled ponuda, s mogućnošću filtriranja po cijeni, roka isporuke ili tipu usluge.
Za prodaju: može napraviti mini CRM tablu, gdje vidiš fazu svakog lead-a, zadnje aktivnosti i prioritet.
Za školu: učenik može dobiti planer učenja, raspoređen po danima, s podsjetnicima što treba ponoviti i linkovima na materijale.

Ovo se približava ideji “AI agenta”: umjesto da ti daje savjet, AI zapravo odrađuje dio posla, gradi alat i strukturira informacije.

Kako se ovakve stvari budu širile, isplatit će se pratiti specijalizirane AI portale poput Umjetnai.com, gdje će se pojavljivati detaljni vodiči, tutoriali i stvarni primjeri korištenja generativnih sučelja u poslovanju i obrazovanju.

Bolje logičko razmišljanje i rezultati na testovima

Gemini 3 je postigao skok u rezultatima na više standardiziranih testova:

SimpleQA Verified: 72,1 % faktične točnosti,
MMMU-Pro: test za multimodalno razumijevanje stručnih zadataka,
Video-MMMU: test za razumijevanje i analiziranje video sadržaja.

Za većinu korisnika sama imena testova nisu važna. Bitno je što iz toga slijedi:

model daje preciznije odgovore,
rjeđe izmišlja podatke kada nema dovoljno informacija,
bolje kombinira više izvora, na primjer tekst i sliku, u jedan zaključak.

U usporedbi s Gemini 2.5 Pro:

stara verzija bila je snažna u brzini i niskoj latenciji, dobra za kratke i brze odgovore,
Gemini 3 se više fokusira na dublje razmišljanje, dulji kontekst i zadatke u kojima AI mora samostalnije razraditi rješenje.

Za novinare, učenike, znanstvenike i poslovne korisnike faktična točnost je ključna. Ako AI izmišlja citate, krive brojke ili nepostojeće reference, to direktno narušava povjerenje i može dovesti do stvarne štete. Novi rezultati ne znače da model više nikad ne griješi, nego da je korak bliže razini pouzdanosti na koju se možeš barem djelomično osloniti, uz obveznu ljudsku provjeru.

Gdje je Gemini 3 dostupan i kako će utjecati na svakodnevni rad

Gemini 3 neće postojati samo kao “laboratorijski model”. Google ga već ugrađuje u svoje proizvode i platforme.

Danas je prisutan ili najavljen u:

Gemini aplikaciji (nasljednik Google Chatbota),
Google Search AI Modeu,
Google AI Studio okruženju za developere,
Vertex AI uslugama za poslovne korisnike i korporacije.

Za korisnike iz Hrvatske važno je pitanje gdje će ga realno prvi put osjetiti, bez VPN-a i zaobilaženja ograničenja.

Najizgledniji kanali:

Gemini aplikacija: kao zasebna aplikacija ili dio Android sustava, gdje se model koristi za chat, pomoć pri pisanju, analizu sadržaja i multimodalne zadatke.
Google Workspace integracije: Gemini 3 u Gmailu, Dokumentima, Tablicama i Prezentacijama, kao pomoć pri pisanju, sažimanju i generiranju.
Alati trećih strana: SaaS alati, CRM-ovi, analitički i kreativni alati koji u pozadini koriste Googleove modele.

Rezultat za svakodnevni rad:

više rutinskih zadataka može se automatizirati (pisanje skica mailova, prve verzije izvještaja, sažeci sastanaka),
istraživački zadaci, od seminara do tržišnih analiza, traju kraće, jer AI radi prvi prolaz,
raste važnost “promptinga”, odnosno vještine postavljanja jasnih i preciznih upita.

Gemini 3 u Google proizvodima: Search, Workspace, AI Studio i Vertex AI

Google Search AI Mode kombinira klasične rezultate pretraživanja i generativne AI odgovore. Umjesto popisa linkova na vrhu se pojavljuje strukturiran odgovor, često sa sažetkom, ključnim informacijama i prijedlozima što dalje pitati.

U Searchu, Gemini 3 znači:

brži put do odgovora za jednostavne i srednje složene upite,
manju potrebu da se klikne na više rezultata,
veći dio informacija ostaje unutar Google sučelja.

Za vlasnike web stranica i SEO stručnjake to je velika promjena. Analize već pokazuju da utjecaj Google AI Pregleda na pad organskog CTR-a nije zanemariv, jer korisnici češće dobiju odgovor bez klika na web. Gemini 3 će taj trend dodatno ojačati.

U Workspaceu, Gemini 3 se koristi kao “asistent u uredskim alatima”:

u Gmailu predlaže odgovore i sažetke dugih niti,
u Dokumentima pomaže kod strukture teksta, preformuliranja i provjere tona,
u Tablicama pomaže interpretirati brojke i predlaže grafikone,
u Prezentacijama pomaže stvarati nacrte slajdova iz teksta ili tablica.

Google AI Studio je okruženje za developere koji žele raditi prototipove i aplikacije na vrhu Gemini 3 modela, dok je Vertex AI enterprise rješenje za integraciju modela u poslovne sustave, s naglaskom na sigurnost, privatnost podataka i prilagodbu specifičnim potrebama organizacije.

Za SEO i content stručnjake, ovo znači:

više naglaska na sadržaj koji stvarno dodaje vrijednost i koji se može koristiti kao referenca za AI odgovore,
potrebu da se razumije kako AI bira izvore,
veći fokus na brand, autoritet i specijalizirane teme, gdje još postoji potreba da korisnik otvori izvorni članak.

Što znači za korisnike u Hrvatskoj: jezik, dostupnost i cijena

Korisnike u Hrvatskoj obično zanimaju tri pitanja: podrška za hrvatski jezik, kada ćemo dobiti nove funkcije i koliko će sve to koštati.

Jezik: Google postupno širi jezičku podršku u Gemini modelima. Hrvatski je već prisutan u prijašnjim verzijama, ali kvaliteta može varirati po temi. Gemini 3 bi trebao bolje raditi s manjim jezicima, ali se i dalje isplati važne zadatke raditi uz dodatnu provjeru i, po potrebi, kombinirati s engleskim upitima.
Dostupnost: Search AI Mode je trenutno ograničen na SAD. Iskustvo s prijašnjim novostima govori da će se tijekom sljedećih mjeseci i godina polako širiti i na EU države. Gemini aplikacija i Workspace integracije vjerojatno će biti dostupne brže, jer već prate postojeće tržište Google proizvoda.
Cijena: osnovne mogućnosti obično su besplatne ili uključene u postojeće proizvode, ali naprednije funkcije, poput Deep Think moda, većeg konteksta ili prilagođenih modela, bit će vezane uz pretplate i poslovne licence.

Kako se pripremiti:

nauči pisati jasne i konkretne upite, posebno kad radiš složene zadatke,
navikni se provjeravati činjenice, barem za važne tvrdnje, brojke i citate,
upoznaj ograničenja modela, na primjer sklonost uvjerljivim, ali netočnim formulacijama.

Kratko se vrijedi osvrnuti i na etička pitanja:

privatnost: ne treba slati osjetljive osobne podatke, povjerljive ugovore ili poslovne tajne u AI alat bez jasnog razumijevanja pravila pohrane i obrade podataka,
pogrešni odgovori: iako je Gemini 3 točniji, i dalje može griješiti, pa u domenama kao što su zdravstvo, pravo ili financije AI ne smije biti jedini izvor odluke,
ljudski nadzor: AI treba tretirati kao napredan alat, ne kao zamjenu za kompetentnu osobu koja potpisuje dokument, članak ili projektni plan.

Zaključak

Gemini 3 donosi nekoliko važnih iskoraka: veće kontekstno okno, bolje logičko razmišljanje, generativno sučelje i Deep Think modus za zahtjevnije zadatke. Zajedno, ti elementi model čine bližim ideji “pametnog asistenta” koji ne daje samo savjete, nego i stvarno odrađuje dio posla.

Dio funkcija, poput Search AI Modea, zasad je ograničen geografski, ali smjer je jasan. Korisnici u Hrvatskoj sve će češće raditi s ovakvim modelima, bilo izravno kroz Gemini aplikaciju i Workspace, bilo neizravno kroz razne SaaS alate koji u pozadini koriste Googleove modele.

Ovo je dobar trenutak da naučiš pisati kvalitetne upite, da razmisliš kako možeš kombinirati vlastite podatke s AI modelima i da razviješ naviku kritičkog provjeravanja odgovora. Oni koji to naprave na vrijeme imat će jasnu prednost u poslu, školi i svakodnevnom radu.

Prati razvoj Gemini 3 i drugih modela te koristi domaće resurse i portale poput Umjetnai.com kada želiš bolje razumjeti praktičnu primjenu umjetne inteligencije u svom radu i učenju.