Skaliranje sustava agenata: Kada i zašto agenatni sustavi rade

01.02.2026.

202

Januar 28, 2026 Yubin Kim, Praktikant za istraživanje, i Xin Liu, Senior istraživač, Google IstraživanjeU ovom članku, istražujemo kako se skaliraju agenatni sustavi i kada su najefikasniji. Kroz kontroliranu evaluaciju od 180 konfiguracija agenata, izvodimo prve kvantitativne principe skaliranja za AI agenatne sustave, otkrivajući da multi-agentna koordinacija dramatično poboljšava performanse na paraleliziranim zadacima, ali ih ometi na sekvencijalnim.

Januar 28, 2026 Yubin Kim, Praktikant za istraživanje, i Xin Liu, Senior istraživač, Google Istraživanje

U ovom članku, istražujemo kako se skaliraju agenatni sustavi i kada su najefikasniji. Kroz kontroliranu evaluaciju od 180 konfiguracija agenata, izvodimo prve kvantitativne principe skaliranja za AI agenatne sustave, otkrivajući da multi-agentna koordinacija dramatično poboljšava performanse na paraleliziranim zadacima, ali ih ometi na sekvencijalnim. Također uvodi prediktivni model koji identificira optimalnu arhitekturu za 87% neviđenih zadataka.

Što su AI agenatni sustavi?

AI agenatni sustavi su sustavi koji su sposobni razmišljati, planirati i djelovati. Oni su postali uobičajeni paradigma za stvarne svijet aplikacije AI-a. Od pomoćnika za kodiranje do osobnih trenera za zdravlje, industrija se pomiče od jednog koraka pitanja odgovora na održane, višestruke interakcije. Dok su istraživači dugo koristili utvrđene mjere za optimizaciju točnosti tradicionalnih modela strojnog učenja, agenati uvode novi sloj složenosti. Za razliku od izoliranih predviđanja, agenati moraju navigirati održanim, višestrukim interakcijama gdje se jedna greška može kaskadno proširiti kroz radni tok. Ovaj pomak nas prisiljava gledati dalje od standardne točnosti i pitati: Kako zapravo dizajnirati ove sustave za optimalnu performansu?

Heuristike i mitovi o agenatima

Praktičari često se oslanjaju na heuristike, kao što je pretpostavka da “više agenata je bolje”, vjerujući da će dodavanje specijaliziranih agenata konzistentno poboljšati rezultate. Na primjer, “Više agenata je sve što trebate” je istraživanje koje je pokazalo da performanse LLM-a raste s brojem agenata, dok je istraživanje o kolaborativnom skaliranju pronašlo da multi-agentna kolaboracija “često nadmašuje svaki pojedinačni putem kolektivnog razmišljanja.” U našoj novoj papiri, “Skaliranje agenatnih sustava”, izazovamo ovu pretpostavku. Kroz veliku kontroliranu evaluaciju od 180 konfiguracija agenata, izvodimo prve kvantitativne principe skaliranja za agenatne sustave, otkrivajući da “više agenata” pristup često dosegne krov i može čak ometati performanse ako nije u skladu s specifičnim svojstvima zadatka.

Definiranje “agentičnog” evaluiranja

Da bismo razumjeli kako se agenati skaliraju, prvo smo definirali što čini zadatak “agentičnim”. Tradicionalni statični benchmarki mjere znanje modela, ali ne uhvaćaju složenosti implementacije. Mi tvrdimo da agentični zadaci zahtijevaju tri specifična svojstva: Održane višestruke interakcije s vanjskom sredinom. Iterativno prikupljanje informacija pod djelomičnom opažajnošću. Adaptivno usavršavanje strategije na temelju povratne informacije o okruženju. Evaluirali smo pet kanonskih arhitektura: jedan single-agent sustav (SAS) i četiri multi-agent varijante (nezavisne, centralizirane, decentralizirane i hibridne) preko četiri raznovrsna benchmarka, uključujući Finance-Agent (financijsko razmišljanje), BrowseComp-Plus (web navigacija), PlanCraft (planiranje) i Workbench (korištenje alata).

Arhitekture agenata

Arhitekture agenata su definirane sljedećim načinom:

– Single-Agent (SAS): Samostalni agent koji izvršava sva razmišljanja i radnje sekvencijalno s jedinstvenim memorijskim tokom.
– Nezavisne: Više agenata koji rade paralelno na podzadacima bez komunikacije, agregirajući rezultate samo na kraju.
– Centralizirane: Model “hub-and-spoke” gdje centralni orkestar delegira zadatke radnicima i sintetizira njihove izlaze.
– Decentralizirane: Mreža peer-to-peer gdje agenati komuniciraju direktno s drugima da dijele informacije i dosegnu konsenzus.
– Hibridne: Kombinacija hijerarhijskog nadzora i peer-to-peer koordinacije da se balansira centralna kontrola s fleksibilnim izvršavanjem.

Rezultati: Mit o “više agenata”

Da bismo kvantificirali utjecaj sposobnosti modela na performansu agenata, evaluirali smo naše arhitekture preko tri vodeće obitelji modela: OpenAI GPT, Google Gemini i Anthropic Claude. Rezultati otkrivaju složenu vezu između sposobnosti modela i strategije koordinacije. Dok se performanse općenito trendeju prema gore s više sposobnim modelima, multi-agentni sustavi nisu univerzalno rješenje – oni mogu značajno poboljšati ili neočekivano ometati performanse ovisno o specifičnoj konfiguraciji.

Zaključak

U ovom članku, istražili smo kako se skaliraju agenatni sustavi i kada su najefikasniji. Naš rad pokazuje da multi-agentna koordinacija može dramatično poboljšati performanse na paraleliziranim zadacima, ali ih može ometati na sekvencijalnim. Također smo predstavili prediktivni model koji identificira optimalnu arhitekturu za 87% neviđenih zadataka. Ovi nalazi imaju važna praktična i teorijska implikacija za dizajniranje i implementaciju agenatnih sustava.

Česta pitanja

1. Koji su najčešći mitovi o agenatnim sustavima?

Najčešći mitovi uključuju pretpostavku da “više agenata je bolje” i da multi-agentna kolaboracija uvijek poboljšava performanse.

2. Koje su ključne osobine agentičnih zadataka?

Agentični zadaci zahtijevaju održane višestruke interakcije s vanjskom sredinom, iterativno prikupljanje informacija pod djelomičnom opažajnošću i adaptivno usavršavanje strategije na temelju povratne informacije o okruženju.

3. Kako se performanse agenata mijenjaju s više sposobnim modelima?

Performanse agenata se općenito poboljšavaju s više sposobnim modelima, ali multi-agentni sustavi nisu univerzalno rješenje. Oni mogu značajno poboljšati ili neočekivano ometati performanse ovisno o specifičnoj konfiguraciji.

4. Koje su najefikasnije arhitekture za agenatne sustave?

Efikasnost arhitekture ovisi o specifičnim svojstvima zadatka. Single-agent sustavi mogu biti najefikasniji za sekvencijalne zadatke, dok multi-agentni sustavi mogu biti najefikasniji za paralelizirane zadatke. Hibridne arhitekture mogu pružiti balans između centralne kontrole i fleksibilnog izvršavanja.