Lékaři se často spoléhají na lékařské snímky spolu s vyšetřeními, laboratorními testy a anamnézou pacientů, které jim pomáhají diagnostikovat pacienty. Ale i ty nejlepší modely jazyka vidění určené k interpretaci těchto obrazů dělají chyby. Někdy mají halucinace. K vyřešení tohoto problému vyvinuli výzkumníci MBZUAI nový přístup nazvaný MOTOR, který je krokem k zpřesnění nástrojů umělé inteligence v klinickém prostředí. Kombinuje rešeršní rozšířenou generaci (RAG) s algoritmem zvaným optimální transport pro získání klinicky relevantních obrázků a textu, jejich seřazení a vložení do modelu jazyka vidění ke zpracování. Výzkum, který vedla doktorandka Mai A. Shaaban, byl prezentován na #MICCAI2025. Přečtěte si více o MOTOR zde: