Del Big Data al Good Data: Los datos y la tecnología como arma contra el COVID- 19
Cuando se tiene una pandemia como la del COVID-19 es necesario atacar en todos los frentes, y la humanidad está reaccionando de esa manera frente a este enemigo. La primera línea de defensa son los medicamentos y el personal de salud. En segunda instancia, los laboratorios están luchando contra reloj para entender la complejidad del virus y desarrollar tratamientos o vacunas. Pero existe otro frente contra el coronavirus no menos importante: el Big Data y su procesamiento a través de la inteligencia artificial (IA) y los sistemas de aprendizaje autonómico, estos han demostrado ser un arma esencial en la batalla contra el virus. Veremos aquí algunos ejemplos de esto.
Mejorando los modelos epidemiológicos
Desde 1854 los modelos matemáticos han sido una herramienta indispensable para vigilar y predecir la evolución de las epidemias; John Snow fue un inglés que trazó un mapa de Londres y utilizó la estadística para señalar un brote de cólera proveniente de una bomba de agua pública. Sin embargo, los epidemiólogos insisten en que los modelos matemáticos no son bolas de cristal que predicen el futuro, realmente lo que ofrece es una comparación entre rangos de resultados probables según los diferentes valores de las variables que se introducen como inputs. No obstante, estos modelos son fundamentales, pues orientan las políticas que se deben adoptar en el ámbito.
Modelos más clásicos son los denominados modelos SIR (Susceptible-Infectious-Recovered) o SEIR (adding the category of Exposed). Los sistemas computacionales han permitido el desarrollo de otros modelos más sofisticados llamados modelos basados en agentes, que pueden simular las interacciones de millones de personas. Pero incluso con los modelos más complejos, existen aún muchas incógnitas respecto al nuevo virus. La pandemia ha puesto a los modelos matemáticos en el centro del debate científico, por lo que algunos expertos han solicitado que código informático de todos estos modelos sea publicado en código abierto en repositorio digitales. Son ya varias las instituciones que lo han hecho, esto ayudará a la comunidad científica a mejorar dichos modelos.
Apps para el rastreo del coronavirus
Los primeros éxitos en la contención inicial de la pandemia se han logrado en lugares donde se llevó a cabo un seguimiento tecnológico selectivo de las personas infectadas y el rastreo de sus movimientos y contactos utilizando datos de teléfonos celulares, tarjetas de crédito y cámaras de seguridad, en lugar de imponer medidas drásticas de confinamiento a toda la población. Por ejemplo, en Corea del Sur un país que a diferencia de otros, tenía un plan reciente y actualizado contra las epidemias, dicho plan se generó tras el brote del síndrome respiratorio de Oriente medio (MERS) en 2015.
Si bien la estrategia en Corea del Sur fue elogiada, también se generó una controversia debido las preocupaciones asociadas a la privacidad de las personas. Sin embargo, sin minimizar el debate ético, ha comenzado a surgir iniciativas en el resto del mundo que busca aprovechar este potencial tecnológico. Ya están en marcha enfoques de este tipo. En abril de 2020, los gigantes tecnológicos Apple y Google anunciaron la creación conjunta de un sistema que funcionará en iOS y Android a través de Bluetooth. Aunque estas nuevas aplicaciones son menos invasivas que la opción coreana, al ser anónimas, voluntarias y no estar diseñadas para reportar a las autoridades, los posibles problemas de privacidad aún están siendo tema de debate. Además, los expertos se preguntan si estas tecnologías contribuirán a dar falsas alarmas.
Inteligencia artificial para ayudar a los investigadores a encontrar estudios relevantes
La gravedad de la pandemia ha provocado un crecimiento exponencial de las investigaciones científicas sobre el virus y su enfermedad asociada. Según la revista Science, se han publicado más de 23.000 artículos de enero a mayo de 2020, cifra que se duplica cada 20 días. El conjunto de datos CORD-19 promovido por el instututo Allen para la inteligencia artificial en colaboración con otras instituciones, es un intento de reunir todo lo que sea publicado; no obstante, con más de 63.000 registros, la avalancha de material sería completamente y inmanejable para los científicos. Por esa razón, CORD-19 tiene un sistema de búsqueda basado en inteligencia artificial personalizado para que cada científico pueda encontrar la investigación más relevante que sea de su interés. Otras plataformas como COVIDScholar tienen objetivos similares, y Scite-ai ayuda a los científicos a establecer si los hallazgos han sido reafirmados o refutados por estudios posteriores.
Máquinas que buscan tratamientos
Dado que los posibles nuevos medicamentos para el COVID-19 tendrán que esperar años para aprobación, muchos investigadores están trabajando en líneas más inmediatas, por ejemplo, el reposicionamiento de los medicamentos existentes ya aprobados para otras indicaciones que pueda mostrar cierta eficacia contra el COVID-19. El Remdesivir, es el único medicamento que hasta el momento de esta publicación a mostrado alguna promesa real, originalmente fue creado contra otro virus, el ébola, por lo que ha sido considerado un claro candidato. Otros tipos de investigación están probando posibles tratamientos basados en sus mecanismos de acción conocidos o en sus interacciones con las proteínas del virus. Pero ¿cómo podemos identificar otras posibilidades de tratamiento prometedoras cuando no se conoce nada sobre estos compuestos que sugiera alguna posible eficacia contra el virus? Científicos están empleando redes neuronales para identificar posibles interacciones entre las proteínas del virus y los medicamentos existentes. Están utilizando sistemas como AlphaFold de DeepMind, qué se basa en redes neuronales y predice la estructura tridimensional de las proteínas del COVID-19. A partir de estos modelos se puede hacer un acoplamiento virtual que es una predicción de la interacción física de la proteína con los medicamentos. Esto no dice nada sobre los posibles efectos beneficiosos con respecto a los tratamientos; estas interacciones virtuales deben ser confirmadas en el laboratorio y luego debe estudiarse sus efectos sobre la biología del virus y el propio organismo. Pero estas pistas ya han identificado una serie de potenciales compuestos candidatos en los que varios investigadores están trabajando actualmente.
Datos para predecir el comportamiento del virus o sus efectos
La inmensa cantidad de datos científicos que se están recogiendo en todo el mundo es un tesoro de información inestimable para desvelar los secretos del virus y su enfermedad. El COVID Human Genetic Effort, consorcio internacional en el que participan docenas de centros de investigación de todo el mundo, reúne datos genéticos de pacientes en un intento de identificar mediante análisis informáticos qué variantes genéticas podrían estar asociadas con un curso más grave de la enfermedad o, por el contrario, con una infección asintomática. La iniciativa de genética del COVID-19 Host Genetics Initiative busca algo similar.
Por otra parte, investigadores de la Universidad de Toronto en Canadá han analizado datos sobre más de 375.000 casos confirmados de COVID-19 de 144 regiones diferentes del mundo para determinar si existen diferencias en el comportamiento del virus en función de la latitud, la temperatura y la humedad ambiental, grandes incógnitas de la pandemia. Estas investigaciones indican sólo una posible sensibilidad del virus a la humedad.
Por Javier Yanes
Traducción: Dr. Gustavo Campos
Director de investigaciones
Facultad de Matemáticas e Ingenierías