MedGemma: Otvoreni alati za brži razvoj zdravstvene umjetne inteligencije

Zdravstvo se sve više oslanja na umjetnu inteligenciju kako bi smanjilo administrativno opterećenje, ubrzalo postavljanje dijagnoza i poboljšalo komunikaciju s pacijentima. Ipak, veliki izazov ostaje izgradnja modela koji istovremeno pružaju visoku točnost, zaštitu privatnih podataka i brzinu rada. Upravo tu nastupa MedGemma – skupina laganih, javno dostupnih modela stvorenih za potrebe medicinskih istraživanja i razvoja aplikacija.

Što čini MedGemma kolekciju?

MedGemma nije jedan model, već obitelj alata prilagođenih različitim zdravstvenim zadacima. Najnovija verzija uključuje tri ključna člana: MedGemma 4B, MedGemma 27B Multimodal i MedSigLIP. Svaki od njih ima specifičnu svrhu, a zajednički im je cilj – omogućiti programerima i znanstvenicima da brzo izgrade vlastite medicinske aplikacije bez potrebe za skupim licencama ili složenim API-ovima.

Modeli su objavljeni u otvorenom obliku, što znači da ih je moguće besplatno preuzeti, pregledati i prilagoditi vlastitim potrebama. Time se izbjegavaju ograničenja koja često prate komercijalne servise: nedostatak prilagodbe, ovisnost o vanjskoj infrastrukturi i rizik od prekida usluge.

Koje mogućnosti nude pojedinačni modeli?

MedGemma 4B – tekstualni stručnjak

Četveromilijardski parametarski model najbolje se pokazao u zadacima koji uključuju čitanje i pisanje: generiranje izvještaja iz laboratorijskih nalaza, sažimanje povijesti bolesti ili odgovaranje na pitanja iz medicinskih tekstova. Zahvaljujući kompaktnim dimenzijama, može se pokretati i na grafičkim karticama s 16 GB memorije, što ga čini dostupnim većini istraživačkih timova.

MedGemma 27B Multimodal – spoj teksta i slike

Ovaj veći model prima i tekstualne i vizualne ulaze, pa je sposoban raditi sljedeće:

opisivanje rendgenskih, CT ili MR snimaka na prirodan način;
pretraživanje longitudinalnih elektroničkih zdravstvenih kartona i isticanje važnih promjena;
odgovaranje na pitanja tipa „Što se vidi na ovoj slici?“ ili „Koje su moguće dijagnoze?“.

Izuzetno je korisno u situacijama gdje liječnik želi brzu drugu procjenu ili kada je potrebno automatizirati rutinsku kontrolu velikog broja slika.

MedSigLIP – most između slike i teksta

MedSigLIP je lagani enkoder koji medicinske slike prevodi u brojčane vektore koji se mogu uspoređivati s tekstualnim opisima. Primjenjuje se za:

Klasifikaciju slika bez dodatnog treniranja – model već ugrađeno razlikuje više od 30 vrsta stanja na snimcima prsnog koša.
Zero-shot prepoznavanje – dovoljno je navesti opis („pneumotoraks“) i model će pronaći odgovarajuće snimke.
Semantičko pretraživanje – omogućuje pronalaženje sličnih slika iz arhive na temelju tekstualnog upita.

Kombinacijom MedSigLIP-a s bilo kojim jezikom modelom moguće je izgraditi sustav koji razumije upite poput „Prikaži mi sve snimke na kojima postoji sumnja na frakturu rebara“.