Microsoft crea IA que diagnostica hasta 85% de los casos clínicos complejos mejor que médicos expertos, según casos reales del NEJM.
El equipo de inteligencia artificial de Microsoft presentó un sistema llamado MAI-DxO (Microsoft AI Diagnostic Orchestrator) que logró diagnosticar correctamente hasta el 85% de los casos clínicos complejos publicados por el New England Journal of Medicine (NEJM).
Esta cifra representa una tasa más de cuatro veces superior a la alcanzada por médicos experimentados evaluados con los mismos casos.
La información fue revelada por Microsoft a través de una publicación oficial, acompañada por un artículo titulado El camino hacia la superinteligencia médica, donde detalla su nuevo enfoque para aprovechar la IA generativa en escenarios clínicos reales.
Mientras otras pruebas con IA en medicina se han limitado a simulaciones tipo USMLE (Examen de Licencia Médica de Estados Unidos), basadas en opción múltiple, Microsoft diseñó un desafío más complejo: el punto de referencia de diagnóstico secuencial (SD Bench).
Este benchmark transforma 304 casos reales del NEJM en procesos clínicos interactivos donde tanto la IA como médicos humanos deben solicitar pruebas diagnósticas y actualizar hipótesis iterativamente. El objetivo: simular la forma en que los médicos abordan problemas clínicos en hospitales.