Investigadores en la PUCP construyen herramienta computacional que aprende a inferir la interacción génica

19/05/2017

Los datos de la herramienta computacional se podrán emplear para ayudar a desarrollar remedios y terapias contra el cáncer y otras patologías con origen en la disfunción génica.

*Foto: Posible pantalla de lo que sería la herramienta que se pretende desarrollar en la PUCP. 

Gracias al Programa de Repatriación de Investigadores peruanos que administra Innóvate Perú del Ministerio de Producción, el Dr. Edwin Villanueva, experto en bioinformática, regresó al país desde Brasil y se incorporó a la PUCP como investigador principal.

Su misión es, junto a su equipo de investigación, construir la herramienta computacional que permitirá determinar las relaciones de causalidad en datos genómicos. En la herramienta se podrán realizar intervenciones virtuales en genes específicos y visualizar los genes que se ven afectados por tales intervenciones.

La herramienta permitirá identificar las relaciones génicas que no funcionan correctamente y que originan enfermedades como el cáncer. A partir de esos datos, se puede crear una droga o un fármaco, que estimule determinados genes que no funcionan con normalidad y que afectan a otros genes. El objetivo es que los datos sean los más precisos posibles.

Al conocer la interacción y las relaciones funcionales que existen entre los genes, los investigadores en medicina, biología y farmacología genómica podrán acelerar la investigación en terapias contra el cáncer y otras enfermedades originadas por la disfunción génica. Además, podrán determinar la relación entre las características físicas de cada persona con la aparición de determinadas enfermedades.

Equipo_Investigadores_PUCP

De izquierda a derecha: César Beltrán Castañón, líder del Grupo de Reconocimiento de Patrones e Inteligencia Artificial Aplicada (GRPIAA); Dra. Soledad Espezua, consultora de investigación, y Dr. Edwin Villanueva Talavera, investigador principal del proyecto.

El análisis de la causalidad casi siempre ha sido abordado desde el punto de vista estadístico, explica la Dra. Soledad Espezua, consultora de investigación del proyecto. Lo que ahora están planteando usar son técnicas de aprendizaje de máquina para el análisis de causalidad, que es una perspectiva distinta.

Este enfoque nuevo consiste en que, a partir de una cantidad pequeña de intervenciones en el sistema, la herramienta puede aprender si hay causalidad o no entre cualquier par de genes, es decir, prácticamente aprenderá a inferir causalidad como lo haría un ser humano.

La idea del proyecto

La idea de crear la herramienta surgió a mediados del 2015 cuando el Dr. Edwin Villanueva y la Dra. Soledad Espezua, consultora de investigación del proyecto, culminaban un postdoctorado en el área de bioinformática en la Universidad de Regensburg de Alemania donde estudiaban técnicas computacionales para ayudar a entender la genómica funcional del cáncer.

Ambos recuerdan que la mayoría de personas con las que trabajaban en Alemania eran especialistas en biología. Cuando querían saber si determinados genes interactúan o no, acudían al laboratorio y después de horas haciendo experimentos y analizando datos recién determinaban qué otros genes eran afectados. Cada vez que querían saber sobre un nuevo gen, tenían que repetir el proceso.

Al vivir esa experiencia, al Dr. Villanueva y a la Dra. Espezua se les ocurrió construir una herramienta que haga simulaciones virtuales de las experimentaciones antes de ir al laboratorio como a ciegas. La idea es que antes de experimentar, los científicos puedan ver en una pantalla la relación de genes con la mayor probabilidad de activarse o desactivarse debido a una inhibición virtual. Y claro, luego tendrían que hacer una verificación biológica.

Los científicos no saben aún con exactitud qué genes influyen en los diferentes tipos de cáncer. Sin embargo, durante años el grupo de Alemania ha estado produciendo datos para tratar de descubrir las interacciones entre genes, pero nunca se habían propuesto construir una herramienta que se encargue de predecir interacciones con los datos genómicos que ya tenían.

Entonces, el Dr. Villanueva y la Dra. Espezua se preguntaron, si tenemos los datos a disposición, ¿por qué no aprender de estos para inferir la interacción genómica? Y ese es justamente el proyecto que están desarrollando ahora en la PUCP.

Investigadores repatriados

El Dr. Edwin Villanueva y la Dra. Soledad Espezua estudiaron Ingeniería Electrónica e Ingeniería de Sistemas respectivamente en la Universidad Nacional de San Agustín de Arequipa. Pero en el posgrado -primero en Brasil y luego en Alemania- se especializaron en la investigación en bioinformática.

Entre el 2006 y el 2013 hicieron juntos la maestría, el doctorado y el primer postdoctorado en la Universidad de Sao Paulo en Brasil. Luego, en 2014 empezaron su segundo postdoctorado en el Instituto de Genómica Funcional de la Universidad de Regensburg en Alemania.

A mediados del 2015 regresaron a Brasil a trabajar en un nuevo proyecto de meta-aprendizaje hasta que surgió la oportunidad de regresar al Perú a través del Programa de repatriación de científicos peruanos de Innóvate Perú.

Brasil1(Reunion de trabajao) (1)

La Dra. Espezua y el Dr. Villanueva en una reunión de trabajo con el equipo de su laboratorio en Brasil.

El Dr. Villanueva se contactó con el Dr. César Beltrán -a quien conocieron el 2006 en Brasil cuando empezaban el primer año de maestría y él cursaba su último año de doctorado- para ver la posibilidad de presentar un proyecto para la convocatoria de becas de Innóvate Perú.

El Dr. Beltrán, junto al Dr. Andrés Melgar Sasieta, fundaron el Grupo de Reconocimiento de Patrones e Inteligencia Artificial Aplicada en la Sección de Ingeniería Informática en junio del 2013. Desde entonces el grupo comenzó a ganar renombre constituyéndose en líder nacional en el área de Ciencia de la Computación. El último mes ha conseguido dos logros importantes: Tercer mejor grupo de investigación de la PUCP, resultado de la última evaluación de grupos de investigación realizada por el Vicerrectorado de Investigación y el reconocimiento como Centro de I+D en Ciencias de la Computación por parte de Concytec.

Fue así que gracias a la buena disposición del Dr. Beltrán para incentivar su regreso al país, a la fortaleza del grupo que dirige, al prestigio de la PUCP y al programa de repatriación de Innóvate Perú, hoy están en nuestra Universidad. Ellos tienen el anhelo de que la herramienta en la que están trabajando será un aporte importante para el desarrollo de la ciencia en el país.

El equipo de investigación

El equipo del proyecto está conformado básicamente por el Dr. Edwin Villanueva, quien es el investigador principal, y la Dra. Soledad Espezua, consultora de investigación. Los próximos días se irán incorporando alumnos tesistas de la universidad que han mostrado interés en participar en el proyecto. Además, se tiene planeado sumar a un biólogo.

Alumnos_Investigadores_PUCP

El Dr. Villanueva y la Dra. Espezua con un grupo de alumnos tras la exposición del proyecto en la PUCP.

La participación de los alumnos es clave porque uno de los objetivos del programa de Innóvate Perú es también involucrar a tesistas en proyectos para que aprendan y ganen experiencia en investigación y luego tengan mayores oportunidades de insertarse en redes de investigación internacional.

Fases del proyecto

El proyecto tiene varias fases. La primera fase consiste en la revisión de bibliografía. Luego viene el análisis de secuencias y las señales temporales que serán usadas para aprender a inferir causalidad. Después tienen que ver lo que se ha hecho desde el punto de vista estadístico y desde el lado computacional para encontrar relaciones génicas.

Se ha planeado ocho meses para la implementación de la idea. Se calcula que para fin de año ya deberían de tener un prototipo de la herramienta. Y ya para el 2018 se realizará la validación computacional y biológica. La última etapa es la publicación de los resultados del proyecto en general.

Proyectos futuros

El primer objetivo del equipo es construir la herramienta y que sea acogida por los investigadores. Luego, a partir de allí adaptarla a otros problemas de interés de causalidad como el estudio del funcionamiento de los circuitos del cerebro ante determinadas enfermedades como la epilepsia y el autismo.

El Dr. Villanueva señala que le gustaría buscar, con la herramienta ya implementada, colaboradores en el área de neurociencia. Ver si tienen datos y averiguar si se pueden aplicar la herramienta en ese campo.

Otro de los grandes problemas del Perú que les interesaría abordar es el cambio climático, ver qué se puede deducir a partir de variables climáticas y de ahí verificar si las relaciones que deduce son plausibles o no. ¿Lo que pasa en un año a nivel de clima es un predictor de lo que va a suceder en unos años?

EL EQUIPO

INVESTIGADOR PRINCIPAL
Edwin Villanueva Talavera

Graduado en Ingeniería Electrónica por la Universidad Nacional de San Agustín de Arequipa (2000). Realizó estudios de posgrado en la Universidad de São Paulo – Brasil, obteniendo el grado de magister en Ingeniería Eléctrica en 2007 y doctor en ciencias en 2012. Realizó pos-doctorados en la Universidad de Sao Paulo – Brasil y en la Universität Regensburg – Alemania. Actualmente trabaja como investigador en la PUCP. Sus líneas de investigación son: aprendizaje de máquina, reconocimiento de patrones, modelos gráficos probabilísticos, procesamiento de señales y bioinformática.

CONSULTORA DE INVESTIGACIÓN
Soledad Espezua Llerena

Graduada en Ingeniería de Sistemas (2001) por la Universidad Nacional de San Agustín de Arequipa. Obtuvo el grado magíster en Ingeniería Eléctrica (2008) en la Universidad de São Paulo – Brasil y doctora en Ciencias (2013) en la Universidad de São Paulo – Brasil. Realizó trabajos de pos-doctorado en el Instituto de Ciencias Matemáticas y de Computación de la Universidad de São Paulo – Brasil y en la Universitat Regensburg – Alemania. Trabaja principalmente en las siguientes líneas de investigación: Aprendizaje de máquina, Minería de datos; Procesamiento de Señales; Reducción dimensional y Aplicaciones en Bioinformática.