LifestyleTehnologijaVijesti

Rješavanje problema virtualnih strojeva: Kako AI optimizira oblačno…

Pratik Worah, istraživač nauke, Google Research, i Martin Maas, istraživač nauke, Google DeepMindPredstavljamo vam LAVA, novi algoritam za rasporedivanje koji kontinuirano ponovo predviđa i prilagođava stvarnim životnim vijekovima virtualnih strojeva kako bi optimizirao učinkovitost resursa u velikim oblačnim centarima podataka.

Objavljeno: 17. listopada 2025. Pratik Worah, istraživač nauke, Google Research, i Martin Maas, istraživač nauke, Google DeepMind

Predstavljamo vam LAVA, novi algoritam za rasporedivanje koji kontinuirano ponovo predviđa i prilagođava stvarnim životnim vijekovima virtualnih strojeva kako bi optimizirao učinkovitost resursa u velikim oblačnim centarima podataka. Brzi linkovi Paper ×

Zamislite igru poput Tetrisa u kojoj se komadi brzo spuštaju na stog. Neki se savršeno uklapaju, a drugi ne. Cilj je pakirati blokove što je moguće čvršće i učinkovitije. Ova igra je slaba analogija na izazov koji oblačni centri podataka svake sekunde moraju riješiti prilikom raspoređivanja poslovnih zadataka (nazvanih virtualnim strojevima ili VM-ovima) što je moguće učinkovitije. Ali u ovom slučaju, “komadi” (ili VM-ovi) se pojavljuju i nestaju, neki samo nekoliko minuta, a drugi danima. Iako su početni životni vijekovi VM-ova nepoznati, ipak želimo što više fizičkih poslužitelja popuniti ovim VM-ovima radi učinkovitosti. Ako bismo znali približnu trajanje posla, mogli bismo jasno bolje raspodijeliti resurse. Na razini velikih centara podataka, učinkovita upotreba resursa je posebno kritična iz ekonomskih i ekoloških razloga. Loše raspoređivanje VM-ova može dovesti do “stranding” resursa, gdje preostali resursi poslužitelja nisu dovoljni ili su neizbalansirani za hostiranje novih VM-ova, efektivno otpadajući kapacitet. Loše raspoređivanje VM-ova također smanjuje broj “praznih gostitelja”, koji su bitni za zadatke kao što su ažuriranja sustava i provizija velikih, resursno zahtjevnih VM-ova. Ovaj klasični problem pakiranja binova je još složeniji zbog nekompletne informacije o ponašanju VM-ova. AI može pomoći s ovim problemom koristeći naučene modele za predviđanje životnih vijekova VM-ova. Međutim, ovo često ovisi o jednoj predviđanju pri stvaranju VM-a. Problem s ovim pristupom je što jedna pogrešna predviđanja može zauzeti cijeli gostitelj duže vrijeme, degradirajući učinkovitost. U “LAVA: Lifetime-Aware VM Allocation with Learned Distributions and Adaptation to Mispredictions”, predstavljamo trojicu algoritama – non-invasive lifetime aware scoring (NILAS), lifetime-aware VM allocation (LAVA) i lifetime-aware rescheduling (LARS) – koji su dizajnirani za rješavanje problema pakiranja binova učinkoviteg postavljanja VM-ova na fizičke poslužitelje. Ovaj sustav koristi proces koji nazivamo “kontinuirano ponovnu predviđanje”, što znači da se ne oslanja na početni, jednom putni pogled na životni vijek VM-a koji se radi pri njegovom stvaranju. Umjesto toga, model stalno i automatski ažurira svoju predviđanje o očekivanom preostalom životnom vijeku VM-a dok VM nastavlja raditi. Tajanstveni život VM-ova: Ponovne predviđanja i vjerojatnostni rasporedi

Jedna od ključnih uvidova koji vođe ovim istraživanjem je prepoznavanje da su životni vijekovi VM-ova često nepredvidivi i slijede dugotrajnu raspodjelu. Na primjer, dok je ogromna većina VM-ova (88%) živjela manje od sata, ovi kratkotrajni VM-ovi potroše samo malu frakciju (2%) ukupnih resursa. To znači da je postavljanje malog broja dugoročnih VM-ova imalo neproporcionalno veliko utjecaj na ukupnu učinkovitost resursa. Raspodjela životnih vijekova VM-ova rasporedjenih VM-ova (lijevo) vs. njihova potrošnja resursa (desno). Zanimljivo je da najkraći poslovi (0-10 min, tamno plavo), koji čine 53% po broju, uzimaju zanemarivu frakciju resursa. U kontrastu, najduže pokrenuti poslovi (>30 dana, narančasto), koji uzimaju znatne resurse (18%), čine zanemarivu frakciju po broju. Umjesto pokušaja predviđanja jednog, prosječnog životnog vijeka, što može biti zabludan za VM-ove s dvomodalnim ili vrlo varijabilnim životnim vijekovima, dizajnirali smo ML model koji predviđa raspodjelu vjerojatnosti životnog vijeka VM-a. Ovaj pristup, inspiriran analizom preživljavanja, omogućuje modelu da uhvatiti neizbježnu neodređenost ponašanja VM-a. Važnije je, naš sustav koristi ovu raspodjelu za kontinuirano ažuriranje svojih predviđanja. Pitamo, “Ako je VM već radio pet dana, koliko mu je očekivani preostali životni vijek?” Dok VM nastavlja raditi, sustav dobiva više informacija i njegova predviđanja o životnom vijeku postaje točnije. Naši algoritmi su specifično ko-dizajnirani da iskoriste ove ponovne predviđanja, aktivno reagirajući na pogrešne predviđanja i poboljšavajući točnost s vremenom. Raspodjela životnih vijekova VM-ova. Kada je VM rasporedjen, očekivani (prosječni) životni vijek je 0,2 dana. Nakon što je pokrenut 1 dan, očekivani preostali životni vijek je 4 dana. Nakon 7 dana, očekivani preostali životni vijek je 10 dana. Nova klasa algoritama za rasporedivanje

S ovim novim, robustnijim modelom predviđanja, razvili smo tri nova algoritma za poboljšanje raspoređivanja VM-ova.

1. Non-Invasive Lifetime Aware Scheduling (NILAS)

NILAS je neinvazivni algoritam koji uklapa predviđanja životnih vijekova u postojeću funkciju ocjenjivanja. Ocjenjuje potencijalne gostitelje za novi VM uzimajući u obzir ponovo predviđene vrijeme izlaska svih postojećih VM-ova na tom gostitelju. Prioritetizira hoste koji imaju VM-ove s kraćim preostalim životnim vijekovima, što omogućuje bolje iskorištenje resursa. NILAS je dizajniran da se ne utječe na postojeće VM-ove, čineći ga idealnim za integraciju u postojeće sustave rasporedivanja.

2. Lifetime-Aware VM Allocation (LAVA)

LAVA je algoritam koji aktivno koristi predviđanja životnih vijekova VM-ova za optimizaciju raspoređivanja. Kada se pokrene novi VM, LAVA koristi svoje predviđanja o životnim vijekovima da odabere najoptimalniji gostitelj. Ovaj algoritam je dizajniran da minimizira vjerojatnost “stranding” resursa, što rezultira boljom ukupnom učinkovitosti sustava. LAVA je posebno koristan za raspoređivanje velikih, resursno zahtjevnih VM-ova, jer može predvidjeti i prilagoditi se njihovim dugoročnim potrebama.

3. Lifetime-Aware Rescheduling (LARS)

LARS je algoritam koji kontinuirano ponovo rasporedjuje VM-ove na temelju njihovih predviđenih životnih vijekova. Kada se VM približi svom predviđenom kraju života, LARS ga premješta na novi gostitelj s više resursa, što sprječava “stranding” resursa i poboljšava ukupnu učinkovitost sustava. Ovaj algoritam je posebno koristan za raspoređivanje VM-ova s nepredvidivim životnim vijekovima, jer može brzo reagirati na promjene u ponašanju VM-ova.

Zaključak

LAVA predstavlja revolucionarni pristup rasporedivanju VM-ova u oblačnim centarima podataka. Korištenjem kontinuiranog ponovnog predviđanja i adaptacije na pogrešne predviđanja, ovi algoritmi mogu značajno poboljšati učinkovitost resursa i smanjiti otpad kapaciteta. U budućnosti, očekujemo da će se ovi algoritmi još više razvijati i prilagođavati, pružajući još veće prednosti u optimizaciji oblačnog računanja.

Česta pitanja

Q: Kako LAVA algoritmi rade s VM-ovima s nepredvidivim životnim vijekovima?

A: LAVA algoritmi su dizajnirani da rade s VM-ovima s nepredvidivim životnim vijekovima. Oni koriste raspodjele vjerojatnosti za predviđanje životnih vijekova VM-ova i kontinuirano ažuriraju svoje predviđanja dok VM nastavlja raditi. Ovo omogućuje algoritmima da brzo reagiraju na promjene u ponašanju VM-ova i optimiziraju raspoređivanje resursa.

Q: Može li LAVA biti integrira u postojeće sustave rasporedivanja?

A: Da, LAVA algoritmi su dizajnirani da se ne utječu na postojeće VM-ove, čineći ih idealnim za integraciju u postojeće sustave rasporedivanja. NILAS, na primjer, je neinvazivni algoritam koji uklapa predviđanja životnih vijekova u postojeću funkciju ocjenjivanja.

Q: Kako LAVA algoritmi poboljšavaju učinkovitost resursa?

A: LAVA algoritmi poboljšavaju učinkovitost resursa minimizirajući vjerojatnost “stranding” resursa i poboljšavajući iskorištenost praznih gostitelja. Oni također mogu predvidjeti i prilagoditi se dugoročnim potrebama velikih, resursno zahtjevnih VM-ova, što rezultira boljom ukupnom učinkovitosti sustava.

Q: Koji su glavni prednosti LAVA algoritama?

A: Glavni prednosti LAVA algoritama uključuju poboljšanu učinkovitost resursa, smanjenje otpada kapaciteta, brzu adaptaciju na promjene u ponašanju VM-ova i mogućnost integracije u postojeće sustave rasporedivanja. Ovi algoritmi također mogu predvidjeti i prilagoditi se dugoročnim potrebama velikih, resursno zahtjevnih VM-ova.

Povezano

1 of 253

Odgovori

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena sa * (obavezno)