TehnologijaVijestiZdravlje

Naučnici s MIT-a Predstavljaju Generativni AI Model koji Mogu…

Više od 300 ljudi iz akademije i industrije napunilo je auditorij na BoltzGen seminaru četvrtkom, 30. listopada, koji je organizirala Abdul Latif Jameel Klinika za strojno učenje u zdravstvu (MIT Jameel Klinika).

Više od 300 ljudi iz akademije i industrije napunilo je auditorij na BoltzGen seminaru četvrtkom, 30. listopada, koji je organizirala Abdul Latif Jameel Klinika za strojno učenje u zdravstvu (MIT Jameel Klinika). Na čelu događaja bio je Hannes Stärk, MIT PhD student i prvi autor BoltzGen-a, koji je model objavio samo nekoliko dana prije.

Nadogradivši open-source biomolecularnu model za predviđanje strukture proteina koji je privukao pažnju ljeti, BoltzGen (službeno objavljen 26. listopada) je prvi model koji generira nove proteine koji se vežu na brane i spremni su za ulazak u cjevovod otkrića lijekova.

Tri ključna inovacije omogućuju ovo: prvo, BoltzGenova sposobnost izvršavanja različitih zadataka, ujedinjujući dizajn proteina i predviđanje strukture dok zadržava vrhunske performanse. Drugo, BoltzGenove ugrađene ograničenja dizajnirana su s povratnom informacijom od suradnika iz laboratorija kako bi se osiguralo da model stvara funkcionalne proteine koji ne krše zakone fizike ili kemije. Posljednje, strogi evaluacijski proces testira model na “nepribliživim” bolestima, testirajući granice BoltzGenove sposobnosti generiranja veznika.

Većina modela koji se koriste u industriji ili akademiji sposobna je samo predviđanja strukture ili dizajna proteina. Također su ograničeni na generiranje određenih vrsta proteina koji uspješno vežu na “lakše” ciljeve. Slično kao studenti koji odgovaraju na pitanje testiranja koje izgleda kao njihovo domaće zadaće, modeli često rade dobro ako se podaci za učenje sličaju cilju tijekom dizajna veznika. Međutim, postojeće metode gotovo uvijek se procjenjuju na ciljevima za koje već postoje strukture s veznicima, a ponekad se ne uspiju kada se koriste na izazovnijim ciljevima.

“Postojali su modeli koji su pokušavali riješiti dizajn veznika, ali problem je bio da su ti modeli specifični za modalitet,” ističe Stärk. “Opći model ne znači samo da možemo riješiti više zadataka. Također dobivamo bolji model za pojedinačni zadatak jer se fizika emulira po primjeru, a s općim shemom učenja dobivamo više takvih primjera koji sadrže generalizirajuće fizičke uzorke.”

Istraživači BoltzGen-a testirali su model na 26 ciljeva, od kojih su neki bili terapijski relevantni, a neki su izričito odabrani zbog svoje neobičnosti u odnosu na podatke za učenje.

Ovaj sveobuhvatni proces validacije, koji se odvio u osam laboratorija u akademiji i industriji, demonstrira širinu modela i njegov potencijal za prekretnice u razvoju lijekova.

Parabilis Medicines, jedan od suradnika iz industrije koji je testirao BoltzGen u laboratorijskom okruženju, pohvalio je potencijal BoltzGen-a: “Osjećamo da će uvođenje BoltzGen-a u naše postojeće Helicon peptide računalne platforme za mogućnosti ubrzati naš napredak u dostavi transformacijskih lijekova protiv velikih ljudskih bolesti.”

Dok su open-source objave Boltz-1, Boltz-2 i sada BoltzGen (koji je prikazan na 7. MOLC-u 22. listopada) donijele nove prilike i transparentnost u razvoju lijekova, također signaliziraju da bi biotehnološka i farmaceutska industrija mogla trebati preocijeniti svoje ponude.

U buci oko BoltzGen-a na platformi X, Justin Grace, glavni strojnog učenja znanstvenik u LabGeniusu, postavio je pitanje. “Vremenski razmak između privatnog i otvorenog performansa za chat AI sustave je [sedam] mjeseci i pada,” napisao je u postu. “Čini se da je i u prostoru proteina kraći. Kako će tvrtke za veznike usluge moći [vrati] investiciju kada možemo samo pričekati nekoliko mjeseci za besplatnu verziju?”

Za one u akademiji, BoltzGen predstavlja proširenje i ubrzanje znanstvenih mogućnosti. “Pitanje koje moji studenti često postavljaju je, ‘gdje može AI promijeniti igru u terapiji?’” kaže senior co-author i MIT profesor Regina Barzilay, voditelj AI akademije za Jameel Kliniku i suradnik Laboratorija za računarstvo i umjetnu inteligenciju (CSAIL). “Ako ne identificiramo nepribližive ciljeve i predložimo rješenje, nećemo promijeniti igru,” dodaje. “Naglasak je na neriješenim problemima, što razlikuje Hannesov rad od ostalih u polju.”

Senior co-author Tommi Jaakkola, Thomas Siebel profesor za elektrotehniku i računarstvo, koji je suradnik u Odjelu za elektrotehniku i računarstvo, istakao je da je BoltzGen “revolucija u dizajnu proteina”.

Kako BoltzGen Radi

BoltzGen koristi kombinaciju strojnog učenja i bioloških znanja kako bi generirao nove proteine koji se vežu na brane. Model se trenira na velikom skupu podataka o proteinima i njihovim strukturama, a zatim se koristi za generiranje novih sekvenci aminokiselina koje imaju visoku vjerovatnoću da će se veza na ciljni protein.

BoltzGen koristi i generativne modele jezika, kao što su transformeri, koji su postali popularni u zadnjih nekoliko godina. Ovi modeli su trenirani na velikim tekstualnim korpusima i mogu generirati realistične tekstove na temelju ulaznih podataka.

BoltzGen također koristi evolucijske algoritme koji simuliraju prirodni odabir kako bi optimizirali generirane sekvence. Ovi algoritmi počinju s nasumičnim sekvencama i iterativno ih mijenjaju kako bi poboljšali njihovu sposobnost vezivanja na ciljni protein.

Prednosti BoltzGen-a

Jedna od glavnih prednosti BoltzGen-a je njegova sposobnost generiranja novih proteina koji se vežu na brane, čak i za ciljeve koji su do sada smatrani nepribliživima. Ovo je moguće zahvaljujući njegovoj sposobnosti učenja generalizirajućih fizičkih uzoraka iz velikog skupa podataka.

Drugi je njegovu sposobnost izvršavanja različitih zadataka, što ga čini fleksibilnijim od većine postojećih modela. BoltzGen može biti korišten za dizajn proteina, predviđanje strukture proteina, kao i za druge zadatke povezane s proteinima.

Treća prednost je njegova sposobnost generiranja funkcionalnih proteina koji ne krše zakone fizike ili kemije. Ovo je moguće zahvaljujući njegovim ugrađenim ograničenjima koja su dizajnirana s povratnom informacijom od suradnika iz laboratorija.

Nedostaci BoltzGen-a

Jedna od glavnih nedostataka BoltzGen-a je njegova ovisnost o velikom skupu podataka o proteinima i njihovim strukturama. Ako nema dovoljno podataka, model neće biti u stanju generirati realistične sekvence aminokiselina.

Drugi nedostatak je njegova ovisnost o računalnim resursima. Treniranje i korištenje modela zahtijeva veliku količinu računalnih resursa, što može biti ograničenje za neke korisnike.

Treći nedostatak je njegova ovisnost o suradnji s biološkim laboratorijima. BoltzGenove ugrađene ograničenja dizajnirana su s povratnom informacijom od suradnika iz laboratorija, što znači da je potrebna suradnja kako bi se osiguralo da model stvara funkcionalne proteine.

Zaključak

BoltzGen predstavlja revolucionarni korak u dizajnu proteina i predviđanju njihovih struktura. Njegova sposobnost generiranja novih proteina koji se vežu na brane, čak i za ciljeve koji su do sada smatrani nepribliživima, čini ga potencijalnim alatom za razvoj novih lijekova. Međutim, njegova ovisnost o velikom skupu podataka i računalnim resursima može biti ograničenje za neke korisnike, a njegova ovisnost o suradnji s biološkim laboratorijima može biti prepreka za neke korisnike.

U budućnosti, nadamo se da će BoltzGen i slični modeli postati još fleksibilniji i efikasniji, što će ih činiti još korisnijim za razvoj novih lijekova i terapija.

Česta Pitanja

Koji su glavni ciljevi BoltzGen-a?

Glavni ciljevi BoltzGen-a su generiranje novih proteina koji se vežu na brane i predviđanje njihovih struktura. Model je treniran na velikom skupu podataka o proteinima i njihovim strukturama, a zatim se koristi za generiranje novih sekvenci aminokiselina koje imaju visoku vjerovatnoću da će se veza na ciljni protein.

Kako BoltzGen koristi generativne modele jezika?

BoltzGen koristi generativne modele jezika, kao što su transformeri, koji su postali popularni u zadnjih nekoliko godina. Ovi modeli su trenirani na velikim tekstualnim korpusima i mogu generirati realistične tekstove na temelju ulaznih podataka.

Kako BoltzGen koristi evolucijske algoritme?

BoltzGen koristi evolucijske algoritme koji simuliraju prirodni odabir kako bi optimizirali generirane sekvence. Ovi algoritmi počinju s nasumičnim sekvencama i iterativno ih mijenjaju kako bi poboljšali njihovu sposobnost vezivanja na ciljni protein.

Koji su glavni nedostaci BoltzGen-a?

Glavni nedostaci BoltzGen-a uključuju njegovu ovisnost o velikom skupu podataka o proteinima i njihovim strukturama, ovisnost o računalnim resursima i ovisnost o suradnji s biološkim laboratorijima.

Kako se BoltzGen može koristiti za razvoj novih lijekova?

BoltzGen se može koristiti za razvoj novih lijekova generirajući nove proteine koji se vežu na brane, čak i za ciljeve koji su do sada smatrani nepribliživima. Ovo je moguće zahvaljujući njegovoj sposobnosti učenja generalizirajućih fizičkih uzoraka iz velikog skupa podataka.

Povezano

1 of 257

Odgovori

Vaša adresa e-pošte neće biti objavljena. Obavezna polja su označena sa * (obavezno)