martes, 29 de septiembre de 2020

Las matemáticas avanzadas condensan la complejidad de COVID-19

 


Los científicos están corriendo para mantenerse al día con COVID-19, creando nuevas herramientas para descubrir cómo funciona el nuevo coronavirus.

Para los investigadores del Laboratorio Nacional del Noroeste del Pacífico (PNNL), comprender la infección viral es una cuestión de matemáticas en lugar de un análisis puramente molecular. Están utilizando una herramienta matemática avanzada llamada hipergráficos para identificar cómo las células humanas responden a la infección viral, incluido el nuevo coronavirus. Las proteínas clave que participan en esa respuesta podrían ser objetivos para el desarrollo de medicamentos para tratar COVID-19.

La matemática de PNNL Emilie Purvine y el biólogo computacional Jason McDermott presentaron recientemente su trabajo virtualmente en el SIGKDD (Special Interest Group on Knowledge Discovery and Data Mining) de la Association for Computing Machinery, una conferencia anual para minería de datos, ciencia de datos y análisis.

Hipergrafías para infección viral

En un paso clave, el equipo probó el nuevo enfoque con datos de un virus similar, el coronavirus que causa el síndrome respiratorio agudo severo, o SARS. Ese virus infectó a más de 8.000 personas mientras se extendía por todo el mundo en 2003.

El equipo de PNNL descubrió que los resultados del nuevo método coincidían con los datos recopilados previamente sobre ese virus. Usando hipergrafías, el equipo identificó y clasificó la actividad de varios genes que ahora se sabe que son importantes para la actividad del virus que causó el brote de SARS-1.

"Nuestro trabajo identificó de forma independiente los mismos genes que se sabe que son importantes para la actividad del SARS. Este fue un paso importante antes de aplicar nuestro trabajo al virus que causa COVID-19", dijo McDermott.

Ahora, el equipo de PNNL está aplicando la nueva tecnología al virus actual, utilizando hipergráficos para clasificar y clasificar la importancia de muchos de los cientos de genes activos en COVID-19.

Purvine y McDermott han estado usando hipergráficos para explorar cómo las células humanas responden a las infecciones virales durante los últimos dos años. Han trabajado con datos recopilados por la bióloga de PNNL Katrina Waters, quien ha estado rastreando la expresión génica, la expresión de proteínas y los cambios moleculares en células humanas infectadas con virus que incluyen influenza, Zika, Ébola y coronavirus durante aproximadamente una década. 

Para aplicar hipergráficos a este gran conjunto de datos, los investigadores primero tuvieron que descubrir cómo identificar grupos de proteínas de una manera que los preparara para construir un hipergráfico significativo. El equipo estaba abordando ese desafío a principios de este año, al mismo tiempo que golpeó la pandemia de coronavirus.

De gráficos a hipergráficos

La colaboración con Purvine ofrece una nueva herramienta para McDermott, quien ha estado utilizando técnicas matemáticas basadas en gráficos para analizar las conexiones entre genes, proteínas y moléculas de señalización en las células durante años.

Él y sus colegas identifican relaciones entre dos moléculas a la vez. Luego clasifican las conexiones entre muchas interacciones separadas. Esas conexiones se enredan rápidamente en gráficos complejos que representan redes moleculares que mantienen las células en funcionamiento.

Los investigadores analizan la estructura y la forma de esos gráficos, buscando patrones significativos que indiquen componentes moleculares con roles clave. La centralidad, o cuando una molécula tiene muchas conexiones con otras, es un tipo de patrón.

La estructura completa de un gráfico es otro patrón significativo. Algunas conexiones centrales actúan como puentes para mantener el flujo de información entre las diferentes partes de la red. Es probable que los genes o proteínas involucrados en estas conexiones de "intermediación" mantengan una célula completa funcionando correctamente.

Los hipergrafos representan un posible salto adelante. En lugar de representar conexiones entre componentes individuales, los hipergráficos muestran relaciones entre grupos de cosas. Dado que las redes biológicas operan a través de grupos moleculares, los científicos creen que los hipergráficos podrían representar su estructura de manera más realista que los gráficos estándar.

Los científicos han utilizado hipergráficos para representar grupos sociales e infraestructura de redes informáticas, pero su complejidad computacional los convierte en una técnica poco común para estudiar redes biológicas a gran escala que surgen de datos experimentales.

Una herramienta de software de hipergráfico de código abierto llamada HyperNetX, desarrollada en PNNL, hace que este análisis sea más accesible para los investigadores de diversas disciplinas. Pero aplicar la técnica a datos de una variedad de campos aún requiere algunos retoques.

"Dado que hay tantas formas de construir hipergráficos a partir de datos biológicos, los biólogos probablemente necesiten involucrar a un matemático computacional para hacer esto, por ahora", dijo Purvine.

No hay comentarios:

Publicar un comentario