Zdravstvo se sve više oslanja na umjetnu inteligenciju kako bi smanjilo administrativno opterećenje, ubrzalo postavljanje dijagnoza i poboljšalo komunikaciju s pacijentima. Ipak, veliki izazov ostaje izgradnja modela koji istovremeno pružaju visoku točnost, zaštitu privatnih podataka i brzinu rada. Upravo tu nastupa MedGemma – skupina laganih, javno dostupnih modela stvorenih za potrebe medicinskih istraživanja i razvoja aplikacija.
Što čini MedGemma kolekciju?
MedGemma nije jedan model, već obitelj alata prilagođenih različitim zdravstvenim zadacima. Najnovija verzija uključuje tri ključna člana: MedGemma 4B, MedGemma 27B Multimodal i MedSigLIP. Svaki od njih ima specifičnu svrhu, a zajednički im je cilj – omogućiti programerima i znanstvenicima da brzo izgrade vlastite medicinske aplikacije bez potrebe za skupim licencama ili složenim API-ovima.
Modeli su objavljeni u otvorenom obliku, što znači da ih je moguće besplatno preuzeti, pregledati i prilagoditi vlastitim potrebama. Time se izbjegavaju ograničenja koja često prate komercijalne servise: nedostatak prilagodbe, ovisnost o vanjskoj infrastrukturi i rizik od prekida usluge.
Koje mogućnosti nude pojedinačni modeli?
MedGemma 4B – tekstualni stručnjak
Četveromilijardski parametarski model najbolje se pokazao u zadacima koji uključuju čitanje i pisanje: generiranje izvještaja iz laboratorijskih nalaza, sažimanje povijesti bolesti ili odgovaranje na pitanja iz medicinskih tekstova. Zahvaljujući kompaktnim dimenzijama, može se pokretati i na grafičkim karticama s 16 GB memorije, što ga čini dostupnim većini istraživačkih timova.
MedGemma 27B Multimodal – spoj teksta i slike
Ovaj veći model prima i tekstualne i vizualne ulaze, pa je sposoban raditi sljedeće:
- opisivanje rendgenskih, CT ili MR snimaka na prirodan način;
- pretraživanje longitudinalnih elektroničkih zdravstvenih kartona i isticanje važnih promjena;
- odgovaranje na pitanja tipa „Što se vidi na ovoj slici?“ ili „Koje su moguće dijagnoze?“.
Izuzetno je korisno u situacijama gdje liječnik želi brzu drugu procjenu ili kada je potrebno automatizirati rutinsku kontrolu velikog broja slika.
MedSigLIP – most između slike i teksta
MedSigLIP je lagani enkoder koji medicinske slike prevodi u brojčane vektore koji se mogu uspoređivati s tekstualnim opisima. Primjenjuje se za:
- Klasifikaciju slika bez dodatnog treniranja – model već ugrađeno razlikuje više od 30 vrsta stanja na snimcima prsnog koša.
- Zero-shot prepoznavanje – dovoljno je navesti opis („pneumotoraks“) i model će pronaći odgovarajuće snimke.
- Semantičko pretraživanje – omogućuje pronalaženje sličnih slika iz arhive na temelju tekstualnog upita.
Kombinacijom MedSigLIP-a s bilo kojim jezikom modelom moguće je izgraditi sustav koji razumije upite poput „Prikaži mi sve snimke na kojima postoji sumnja na frakturu rebara“.