Umjetna inteligencija danas razvija modele koji su sve složeniji i zahtjevniji. Kako rastu u veličini i moći, dolazi do tehničkih ograničenja koja prije nisu bila toliko izražena — jedno od najvećih je tzv. zid memorije. Ovaj problem sve više ometa napredak, jer čak i najmoćniji procesori ne mogu raditi u punom kapacitetu ako im nedostaje brzi pristup podacima. Upravo u tom trenutku dolazi do izražaja inovacija koja bi mogla temeljito promijeniti način na koji gradimo računalne sustave za umjetnu inteligenciju. Riječ je o tehnologiji po imenu OmniXtend, koju razvija južnokorejski Institut za elektroniku i telekomunikacije (ETRI), a koja omogućuje zajedničko korištenje memorije preko standardnih Ethernet mreža.
Što je zid memorije i zašto ometa razvoj AI-a?
Kada govorimo o zidu memorije, mislimo na situaciju u kojoj procesor, najčešće grafička kartica (GPU), ima više računske snage nego što može iskoristiti jer mu nedostaje dovoljno brze memorije. U sustavima za umjetnu inteligenciju, posebno kod velikih jezičnih modela, procesorima trebaju ogromne količine podataka u svakom trenutku. Ako ti podaci nisu dostupni brzo, dolazi do kašnjenja — procesor čeka, a vrijeme i energija se troše uzalud.
Do sada je rješenje bilo jednostavno: dodaj više memorije direktno u svaki poslužitelj. No to ima granice. Fizički prostor u poslužiteljskom ormaru ograničen je, a dodavanje dodatne memorije čini sustav skupljim i težim za održavanjem. Još gore, često se dešava da jedan dio sustava ima višak memorije, dok drugi nju očajnički nedostaje — ali ne može je preuzeti jer su memorije međusobno odvojene, izolirane. To je kao da u zgradi jedan stan ima tri hladnjaka puna hrane, a susjedni stan gladuje — a nema pristupa.
Takva izolacija stvara ozbiljnu prepreku za razvoj sve većih AI modela. Umjesto da se slobodni resursi iskoriste, gube se. Potrebno je novo rješenje koje će omogućiti slobodniji tok podataka između uređaja.
OmniXtend: memorija kao zajednički resurs
Ovdje ulazi u igru OmniXtend, tehnologija koja mijenja način na koji poslužitelji pristupaju memoriji. Umjesto da svaki uređaj ima vlastitu, ograničenu količinu memorije, OmniXtend omogućuje da se memorija na mreži ponaša kao jedinstveni, zajednički resurs. Kako? Korištenjem standardne Ethernet mreže — one koja već postoji u gotovo svakom podatkovnom centru.
Dok su ranije tehnologije za povezivanje uređaja, poput PCIe, bile brze ali kratkog dosega i skupocene za proširivanje, Ethernet je jeftin, pouzdan i lako dostupan. ETRI-jevi istraživači pronašli su način da se preko njega prenose zahtjevi za pristup memoriji, tako da jedan poslužitelj može privremeno „posuditi“ memoriju s drugog uređaja bez velikih gubitaka u brzini.
Ovaj pristup donosi nekoliko ključnih prednosti:
- Ve