U ranoj fazi ožujka 2026. godine, laboratorij Tongyi iz kompanije Alibaba objavio je cijelu seriju Qwen3.5 modela, dovršavajući postupni uvod koji je započeo sredinom veljače. Ova linija modela obuhvaća od kompaktnih, pod milijun parametara, do impresivnih 397 milijardi parametara, čime se otvara mogućnost odabira točnog kompromisa između točnosti i troškova. Svi modeli su otvoreni, licencirani pod Apache 2.0, i dizajnirani su za proizvodnju, a ne samo za istraživanje. Inženjeri sada mogu izabrati preciznu točku na krivulji točnost‑trošak umjesto da prihvate tradicionalni „veće je uvijek bolje“ princip.
Različite razine modela
Qwen3.5 se dijeli na tri logičke skupine:
- Male gusto povezane modele: 0,8 B, 2 B, 4 B i 9 B parametara. Sve se uklapaju u jednu potrošačku grafičku karticu ili napredni mobilni SoC, a dijele nativnu multimodalnu strukturu i prozor od 262 144 tokena.
- Srednje veličine MoE: 35 B ukupno / 3 B aktivnih parametara. Raspoloživost sparsity smanjuje troškove izvođenja, a dodatni ukupni parametri podižu maksimalne performanse za višejezične ili agentne radne opterećenja.
- Velike MoE flagships: 122 B ukupno / 10 B aktivnih i 397 B ukupno / 17 B aktivnih. Ovi modeli postižu vrhunske rezultate na STEM testovima, konkurentnom kodiranju i vizualnom rezoniranju uz razlomak izračuna koji bi je zahtijevao ekvivalentni gusto povezani model.
Multimodalni dizajn od samog početka
Umjesto da se na već istrenirani jezični model dodaje enkoder slike, Qwen3.5 započinje s treniranjem u ranoj fuziji: tokeni slike i teksta dijele istu latentnu prostor od prvog koraka predtreniranja. Jedinstveni transformator stoga obrađuje fotografije, grafikone, zaslonske prikaze, prezentacije i PDF rasporede bez zasebnih OCR ili layout pipelinea. Evaluacije na podudarnim zadacima pokazuju dvostranice poboljšanja u zadac