La Bioinformática una disciplina en auge en el mundo
La Bioinformática es un área interdisciplinaria en la que convergen
las tecnologías de la información y las comunicaciones con las ciencias
de la vida, donde los recursos computacionales y humanos asisten al
análisis de cantidades enormes de datos biológicos, para extraer de
ellos información valiosa y obtener resultados con impactos beneficiosos
en la salud humana o animal (González Hernández D., 2007).
Desde la segunda mitad del siglo XX, la biología ha tenido una
relación creciente con las ciencias de la información. Su relación se
inicia debido al constante impulso del hombre por saber de qué estamos
hechos, y fue por allá de 1956 con la secuenciación de la primera
proteína por Margaret O. Dayhoff. A partir de entonces, con la constante
producción de información biológica, la cual crecía a un ritmo lento
comparado con el actual volumen de generación de datos, se creó la
necesidad de recopilar y organizar toda la información generada a partir
de dichos proyectos de secuenciación, surgiendo así, la primera base de
datos con información biológica llamada Protein Data Bank (PDB) (Benítez Páez A, Cárdenas Brino S, 2010).
Esa relación incipiente de las ciencias de la vida con las ciencias
de la computación ha dado origen a una disciplina que ha cobrado vida en
los últimos años: la bioinformática.
Los mayores avances en la bioinformática acontecieron en años
posteriores a la creación de la primera base de datos, y fue con la
generación de algoritmos matemáticos para el análisis de secuencias, así
como también, la creación y el impuso dado a las bases de datos y
herramientas para el análisis de secuencias con un impacto a nivel
global.
Además, con la creación del consorcio para la ejecución del proyecto
de secuenciación del genoma humano (Human Genome, HUGO), en 1993, se
inició la era genómica. Siendo la decodificación del genoma humano un
proyecto tan ambicioso, que otros consorcios se crearon con el fin de
secuenciar los primeros genomas no virales. En 1996, S. cerevisiae fue
el primer genoma eucariota secuenciado. En 1995 y 1997, respectivamente,
los genomas de Haemophilus influenzae y Escherichia coli fueron los
primeros genomas bacterianos publicados. Entre los años 1998 y 2000, se
tuvieron los genomas secuenciados de Caenorhabditis elegans, Pseudomonas
aeruginosa, Drosophila melanogaster y Arabidopsis thaliana. En el año
2003, se finalizó la secuencia definitiva del genoma humano y, este
hecho se logró gracias a la proyección y explotación del potencial de la
industria biotecnológica.
Como consecuencia, todos los avances tecnológicos destinados al campo
de la genómica lograron proyectar a la comunidad científica hacia la
secuenciación del genoma de cualquier organismo de interés científico o
económico. Hoy en día, existen más de 12,574 genomas de bacterias
completamente secuenciados y más de 65,142 proyectos en curso (GOLD
Database, https://gold.jgi.doe.gov/index release v.6).
La gran cantidad de información generada a partir de los múltiples
proyectos de secuenciación hizo que las bases de datos crecieran a un
ritmo acelerado y casi insostenible. Al mismo tiempo, el enorme volumen
de datos conlleva a que el número de herramientas de análisis y
algoritmos computacionales surjan al mismo ritmo para poder extraer un
conocimiento tangible que permita dar un significado a la diversidad
biológica de nuestro ecosistema.