A Google nemrég mutatta be a MedGemma 27B nevű orvosi nyelvi modelljét, amelyet kifejezetten egészségügyi szövegek és képek feldolgozására fejlesztettek ki. A bemutató során többek között egy szimulált páciensfelvételi beszélgetést láthatunk, amelynek keretében az AI részletesen, valós időben frissíti a páciens adatait, és összetett, indokolt válaszokat ad.
Egyedülálló funkcióként a MedGemma képes multimodális, azaz szöveges és képi adatokat egyszerre értelmezni. Az előadó különböző orvosi eseteket tesztel a modellel, legyen szó szöveges diagnosztikai feladatról vagy például egy röntgenkép, szemészeti vagy dermatológiai kép elemzéséről.
Az installálási folyamat is részletesen bemutatásra kerül, beleértve a szükséges hardveres és szoftveres követelményeket. Kiemelt figyelmet kap, hogy az ilyen modellek nem helyettesítik a szakorvosi véleményt, hanem elsősorban szakemberek munkáját segítik.
A részletek között szó esik arról is, hogyan használható a modell helyileg, milyen futtatási környezetre van szükség, valamint bemutatásra kerülnek további orvosi AI modellek és az ezekkel kapcsolatos fejlesztési lehetőségek.