Grupo de Bioinformática: detrás del genoma humano

Un Grupo de Bioinformática de la Escuela de Ingeniería de Sistemas y Computación de la Facultad de Ingeniería acaba de publicar un artículo trabajo de investigación sobre un tema de avanzada. Se trata de un modelo no lineal e integrativo que explica algunos de los aspectos funcionales y estructurales de los genomas. Un enfoque novedoso no reportado en la literatura. De acuerdo con el profesor Pedro Moreno Tovar el modelo es aplicable al estudio de cualquier genoma, como el genoma humano, artículo que ha sido uno de los más vistos últimamente.
El resultado ha sido una publicación que posiciona al grupo de bioinformática de la EISC de la Universidad del Valle y a Colombia a la vanguardia de estudios bioinformáticos, aplicando el Análisis Multifractal al estudio del genoma humano y lo que su estudio representa para el entendimiento del desarrollo humano, medicina, fisiología y filogenia. Por otro lado, el trabajo se constituye en un ejemplo, de cómo los ingenieros de sistemas y computación especializados en bioinformática llevan a cabo trabajos científicos de excelente calidad de manera interdisciplinaria junto con matemáticos, físicos y científicos de las ciencias de la vida (llámense médicos, químicos y/o biólogos). El profesor Moreno le contó a Ingeniería Informa sobre este logro del Grupo de Bioinformática. 


¿En qué consiste la investigación que condujo a la publicación de este artículo?Se trata del análisis multifractal del genoma humano (The human genome: a multifractal analysis). Publicado en la revista: BMC Genomics 2011, 12:506. Esta es una revista categoría A1, considerada una de las mejores en el estudio de todos los aspectos relacionados con el análisis a escala de genoma, genómica funcional y proteómica. La investigación es la culminación de un proyecto Colciencias llamado: “Análisis multifractal del genoma humano”, donde se aplican herramientas de bioinformática y de Geometría Fractal para el estudio de secuencias de ADN (Acido DesoxirriboNucleico) a fin de medir el contenido de información y correlacionarlo con algún parámetro molecular que caracteriza la vida o los fenómenos biológicos. 


¿Qué es el análisis multifractal? El formalismo multifractal proviene de la Geometría Fractal. El principio subyace en dos conceptos básicos que van de la mano: 1) la teoría de la información y 2) las leyes de potencia. En el primero, la información es tratada como una magnitud física que caracteriza la información de una secuencia de símbolos, en este caso, los nucleótidos que componen una secuencia de ADN o un genoma. Y en el segundo, las leyes de potencia son expresiones matemáticas que permite medir el grado de escalamiento, auto-similaridad, irregularidad y contenido de información de un sistema, estructura o proceso. En consecuencia, un sistema multifractal es una generalización de un sistema fractal en el cual un simple exponente (la dimensión fractal) no es suficiente para describir su dinámica; en su lugar, se necesita de un espectro continuo de exponentes (el llamado espectro de singularidad). Este espectro permite medir toda la estructura de correlación, tanto escasa, como abundante a lo largo de una secuencia de nucleótidos. Si el espectro es angosto, la secuencia de símbolos tiene poca información, tiende a ser periódica y es poco estable. Por el contrario, si el espectro es amplio, la secuencia contiene mucha información, tiende a ser muy aperiódica y estable.


¿Qué es el genoma humano? Es la supra-molécula más compleja que existe en la naturaleza. Tiene una longitud de 6000 millones de nucleótidos distribuidos en 46 cromosomas: 23 de mamá y 23 de papá y confinados en una sola célula. El genoma humano está compuesto de una serie alternante de regiones codificantes (2%, aprox. 23000 genes) y no codificantes (98%), creando así una regionalización o “fragmentación” de la información genética y de ahí que el enfoque multifractal sea una metodología apropiada para su estudio. 


¿Cuáles son las aplicaciones prácticas de este desarrollo? El modelo no lineal tiene profundas implicaciones en explicar, como el contenido de información genética del genoma se encuentra organizado y cómo este interactúa con el medio ambiente. En términos prácticos, el modelo se constituye en un marco conceptual de referencia que permite evaluar, la regulación del gen, el origen de las enfermedades genéticas, la diversidad genética humana, la adaptación y el análisis filogenético. ¿Quienes integran el equipo de investigación? 11 investigadores: 5 de la Universidad del Valle, 4 de la Universidad del Cauca, uno de la Universidad de Cantabria, España y uno de la India. Ellos son Pedro Moreno, Irene Tischer, Luis Garreta, Fabián Tovar, Felipe García de la Universidad del Valle, Patricia Vélez y Ember Martínez, Néstor Díaz, Siler Amador de la Universidad del Cauca, José Gutiérrez del Instituto de Física de Cantabria, Universidad de Cantabria-CSIC, España y Ashwinikumar K Naik del Vaatsalya HealthCare Solutions Pvt Ltd, Bangalore, India. 


¿Cuáles son los aportes de estos hallazgos publicados en el artículo al avance del conocimiento en este campo específico? En primer lugar, el estudio hace aportes totalmente originales que explican la organización no-lineal del genoma. Esto significa que en el genoma humano existen regiones que se alejan del equilibrio y otras que no lo hacen, lo que a su vez determina como estas son susceptibles (o no) de interactuar con el medio ambiente. En segundo lugar, el modelo explica varios de los hallazgos encontrados por otros autores de manera dispersa, constituyéndose así en una teoría integradora que explica la estructura y la función del genoma, como un todo y la cual podría constituirse en un punto de referencia y citación para estudios posteriores. 


¿Cuáles son los principales hallazgos de esté estudio aplicando análisis multifractal? Son varios los hallazgos. 
 1) Se descubrió que el contenido de información genética y su variación estructural se puede cuantificar (dicho en palabras sencillas, se matematizó el genoma humano). 
 2) Estas cuantificaciones permite descubrir en el genoma humano cuales son las regiones más ricas y más pobres en información genética y por ende, las regiones más estables e inestables del genoma. 
 3) Todas estas regiones fueron encontradas fuertemente correlacionadas con el contenido de secuencias Alu, un tipo específico de secuencias, cuya función es propuesta proteger la información genética más relevante del genoma, los genes. 
 4) A su vez, estas cuantificaciones permite identificar regiones altamente susceptibles de ser blancos de daños ambientales o alteraciones cromosómicas existentes, amén de explicar otros escenarios genómicos particulares. 
 5) Todo esto configura un modelo no lineal y una teoría integradora para entender la organización del genoma humano y crea un “paradigma” conceptual y matemático para poner a prueba nuevas hipótesis de trabajo.

Comentarios

  1. Es muy importante que se compartan los trabajos de investigacion de estos dos grupos, tanto de la Universidad del VAlle como de la Universidad del Cauca, ambos han trabajando durante casi una decada pra lograr estos buenos resultados. felicitaciones

    ResponderEliminar

Publicar un comentario