¡Un modelo IA puede predecir el riesgo de enfermedades a lo largo de la vida!
Por: Laszlo Beke – BekeSantos.
Nuestra dedicación es principalmente al uso de la IA en el mundo empresarial, pero es importante ver avances en otros sectores, ya que muchas veces inspiran ideas para nosotros o nuestras empresas. En la medicina, gran parte del arte consiste en determinar, mediante un interrogatorio detallado y un examen físico, qué enfermedad ha contraído un paciente. Mucho más difícil, pero no menos deseable, sería identificar qué enfermedades podría desarrollar un paciente en el futuro. Esto es lo que afirma hacer el equipo responsable de Delphi-2M, el cual puede predecir cuál de más de 1.000 enfermedades podría padecer una persona a lo largo de su vida, con un nuevo modelo de inteligencia artificial (IA), cuyos detalles se publicaron en Nature el 17 de septiembre 2025.
Aunque Delphi-2M, aún no está listo todavía para su implementación en hospitales, sus creadores esperan que en el futuro permita a los médicos predecir la probabilidad de que sus pacientes padezcan alguna de más de 1.000 enfermedades diferentes, como el Alzheimer, el cáncer y los infartos, que afectan a millones de personas cada año. Además de ayudar a identificar a los pacientes de alto riesgo, también podría ayudar a las autoridades sanitarias a asignar presupuestos para áreas de enfermedades que podrían necesitar fondos adicionales en el futuro.
El modelo fue desarrollado por equipos del Laboratorio Europeo de Biología Molecular (EMBL) en Cambridge y el Centro Alemán de Investigación del Cáncer en Heidelberg. Se inspira en los grandes modelos lingüísticos (LLM), como GPT-5, que impulsa ChatGPT, capaces de producir prosa fluida. Los LLM están entrenados para detectar patrones en enormes cantidades de texto extraído de internet, lo que les permite seleccionar la palabra con mayor probabilidad de aparecer a continuación en una oración. Los creadores de Delphi-2M razonaron que un modelo de IA alimentado con grandes cantidades de datos de salud humana podría tener un poder predictivo similar.
En muchos aspectos, el diseño de los LLM establecidos era adecuado para la tarea. Sin embargo, un ajuste importante que se necesitaba era enseñar a dicho modelo a tener en cuenta el tiempo transcurrido entre eventos en la vida de un paciente. En el texto escrito, las palabras consecutivas se suceden inmediatamente; No ocurre lo mismo con los diagnósticos en el historial de un paciente. Por ejemplo, la hipertensión arterial tras una prueba de embarazo positiva requiere interpretaciones diferentes según si ambos diagnósticos están separados por semanas (en cuyo caso el embarazo puede verse afectado) o años. Este ajuste se realizó sustituyendo la parte de un LLM que codifica la posición de una palabra por otra que codifica la edad de la persona. (No estuvo exento de contratiempos: en una versión inicial del modelo, a veces se predecían nuevos diagnósticos tras el fallecimiento de una persona).
Delphi-2M se entrenó posteriormente con datos de 400.000 personas del Biobanco del Reino Unido, una base de datos que contiene posiblemente el conjunto de datos biológicos humanos más completo del mundo. Se le asignaron al modelo la sincronización y la secuencia de los códigos CIE-10, la abreviatura médica internacional que utilizan los médicos para registrar los diagnósticos oficialmente reconocidos, que representan las 1.256 enfermedades diferentes que aparecían en el conjunto de datos del Biobanco. El modelo se validó posteriormente con datos de las 100.000 personas restantes del Biobanco antes de probarse en mayor profundidad en los historiales médicos daneses, conocidos por su larga duración y exhaustividad. En este caso, el equipo utilizó datos de 1,9 millones de daneses desde 1978, lo que garantizó una muestra mucho más diversa y representativa que la que podía proporcionar el Biobanco del Reino Unido.
Para implementar las aplicaciones en el mundo real todavía falta un buen trecho. Delphi-2M primero deberá superar un período de prueba mucho más riguroso que brinde a los médicos la oportunidad de explorar si produce mejores resultados para sus pacientes. Este proceso podría llevar muchos años. Por impresionante que parezca Delphi-2M, no es el único pronosticador artificial de salud disponible. Por ejemplo, un modelo de IA llamado Foresight, desarrollado originalmente en el King’s College de Londres en 2024, también utiliza los historiales médicos de los pacientes para predecir futuros eventos de salud. (Una versión más grande del proyecto se suspendió en junio debido a preocupaciones de que NHS England no había buscado las aprobaciones adecuadas cuando le dio al equipo de Foresight acceso a los datos). El modelo ETHOS, que se está desarrollando en la Universidad de Harvard, también tiene objetivos similares.
Se hace referencia a A new AI model can forecast a person’s risk of diseases across their life. La imagen es cortesía de Microsoft Copilot.