Antes de que se hicieran públicos los primeros casos del virus de Wuhan, la Inteligencia Artificial ya lo sabía. El 31 de diciembre, un algoritmo desarrollado por una startup canadiense especializada en monitorear la dispersión de enfermedades infecciosas ya había descubierto el brote y avisado de la noticia a sus clientes.
Ese mismo día, China había comunicado la existencia de 27 casos a la Organización Mundial de la Salud (OMS), aunque el organismo no anunció la existencia del brote hasta diez días después. El virus, que provoca síntomas parecidos a la neumonía, se originó posiblemente por la exposición de los vendedores a animales vivos en el mercado de mariscos de Huanan.
Una de las habilidades más extendidas de la IA es su capacidad para analizar cantidades ingentes de datos y encontrar patrones y eso es, precisamente, lo que hace el sistema propuesto por BlueDot, la startup que ha desarrollado el algoritmo y que se dedica a hacer informes para distintos organismos oficiales en Estados Unidos de forma sistemática hace años.
Su estrategia para hacer una predicción sobre la dispersión del virus se basa en recopilar y analizar información de noticias publicadas en sitios informativos y periódicos en más de 30 idiomas diferentes.
A través del procesamiento del lenguaje natural, que permite a la Inteligencia Artificial entender y producir textos, el algoritmo lee noticias publicadas en medios locales donde se mencionan casos de gripe, muertes sin una explicación aparente y síntomas que no se ubican en un diagnóstico concreto, tanto en humanos como en animales.
Básicamente, consiste en un sistema que sigue las noticias de internet sobre los casos coincidentes que van surgiendo. La dificultad reside en que estos algoritmos sean igual de eficientes en diferentes idiomas. Sin embargo, existen sistemas de traducción basados en machine learning que son muy eficientes.
Otra fuente de datos clave para anticiparse a la dispersión de la enfermedad por todo el mundo son los boletos de avión. Si se puede analizar cuántos vuelos diarios hay desde la ciudad de origen del virus al resto de las ciudades del mundo, si son directos o no y cuántos viajeros los toman, puede saberse en qué otras zonas pueden darse los siguientes casos.
Esta información, a la que BlueDot tiene acceso, permite saber cuándo y hacia dónde se dirigirán los residentes infectados. En este caso, el sistema de IA pronosticó correctamente que el virus saltaría de Wuhan a Bangkok, Seúl, Taipei y Tokio en los días posteriores a su aparición inicial.
Posteriormente, una vez que la IA ha hecho su trabajo y se completa este filtro automatizado de datos, los epidemiólogos verifican que las conclusiones tengan sentido desde un punto de vista científico y envían un informe a funcionarios de salud pública en una docena de países, aerolíneas y hospitales de primera línea donde pueden terminar los pacientes infectados, según explica Kamran Khan, fundador y CEO de BlueDot.
Este mismo sistema ya ha demostrado ser eficiente en brotes anteriores. A BlueDot le funcionó hace unos años durante la epidemia del virus del Zika. En esa ocasión, su modelo utilizaba itinerarios de vuelo, mapas de temperatura, densidades de población y rangos de mosquitos transmisores del virus como fuente de información.
Por ejemplo, su mapa de registros mostró que Florida recibía enormes volúmenes de viajeros de Brasil y tenía el clima y los mosquitos adecuados para la transmisión de la enfermedad. Sus predicciones, que resultaron acertadas, fueron publicadas por la revista médica The Lancet.
Por otro lado, la aplicación del Big Data para la detección de enfermedades también ha demostrado sus limitaciones. En 2014, Google cerró Google Flu Trends, que había lanzado en 2009 a bombo y platillo para predecir la incidencia de la gripe en cada región.
La página pasó de calcular con exactitud los casos de gripe en Estados Unidos, gracias a las consultas del buscador, a fallar en todos su pronósticos. La revista Nature publicó entonces un artículo ironizado sobre la “arrogancia” de este tipo de herramientas, basadas en una acumulación masiva de datos.
Con información de El País