U posljednjih nekoliko desetljeća znanstvenici se bave tajnom visoko‑temperaturnog superprovodnika (HTS) – materijalima koji, na temperaturama daleko iznad onih tradicionalnih superprovodnika, mogu voditi električnu struju bez otpora. Ova svojstva otvaraju mogućnosti za revolucionarne energetske mreže, magnetno levitiranje i kvantne uređaje, ali i dalje ostaju nejasna. Nedavno je istraživački tim iz Googlea, u suradnji s Cornellom i Harvardom, testirao šest najnaprednijih jezičnih modela kako bi utvrdio mogu li odgovoriti na stručna pitanja o HTS na razini humanih stručnjaka. Rezultati, objavljeni u Proceedings of the National Academy of Sciences, otvaraju nova vrata u korištenju umjetne inteligencije u znanstvenom istraživanju.
Što je visoko‑temperaturni superprovodnik?
Otkriven 1987. godine, kupratni spojevi koji postaju superprovodnici pri temperaturama iznad 30 K (–243 °C) izazvali su nevjerojatnu pažnju fizike. Za razliku od klasičnih superprovodnika, HTS‑ovi ne zahtijevaju ekstremno niske temperature, što bi značilo praktičniju primjenu u svakodnevnim tehnologijama. Međutim, mehanizam koji stoji iza njihovog ponašanja ostaje predmet intenzivnih rasprava. Postoji više teorija – od kooperativnih parova elektron‑hole do kompleksnih kvantnih fluktuacija – a svaka od njih ima svoje prednosti i slabosti.
Zašto je HTS izazov za umjetnu inteligenciju?
Znanstvena literatura o HTS‑ovima je ogromna: tisuće eksperimentalnih i teorijskih radova, često s proturječnim zaključcima. Za novog istraživača ovo je poput prolaska kroz labirint bez karte, a za iskusnog znanstvenika stalno ažuriranje znanja postaje nužnost. AI bi, u idealnom slučaju, mogao služiti kao objektivni tutorijal – pružajući pregled najrelevantnijih radova, izbjegavajući pristranost prema određenoj teoriji i stalno ažurirajući informacije.
Kako je provedeno istraživanje?
Tim je izabrao šest modela – GPT‑4o, Perplexity, Claude 3.5, Gemini Advanced Pro 1.5, Google NotebookLM i prilagođeni RAG sustav – i postavio im 67 pitanja koja su osmislili 12 vodećih stručnjaka iz područja HTS. Pitanja su obuhvatila sve od osnovnih definicija do najnovijih eksperimentalnih otkrića. Svaki model je obučen na pažljivo odabranom skupu recenziranih radova, a zatim je ocijenjen prema točnosti, dubini analize i sposobnosti citiranja relevantne literature.
Ključni nalazi
Rezultati su iznenađujući: neki modeli, posebno RAG sustav, postigli su razinu stručnosti koja je na mnogim područjima izjednačena s ljudskim stručnjacima. GPT‑4o i Claude 3.5 također su pokazali izvanredne sposobnosti u razumijevanju složenih koncepta, ali su ponekad zaboravljali citirati izvore. RAG sustav, koji kombinira generiranje teksta s pretraživanjem relevantne literature, bio je najkvalitetniji u pružanju citiranih i ažuriranih informacija.
- RAG sustav: 92 % točnosti, 100 % citiranja relevantnih radova.
- GPT‑4o: 88 % točnosti, 80 % citiranja.
- Claude 3.5: 85 %