Upload
claudia-poblete-herrero
View
213
Download
0
Embed Size (px)
Citation preview
© Copyright Ebiointel,SL 2006
BioinformáticaLa investigación Biomédica
in silico
Introducción a la Bioinformática
© Copyright Ebiointel,SL 2006
Puntos a tratar:Puntos a tratar:
Bioinformática: Bioinformática: síntesis de la revolución de la biología molecular y de la informática
El análisis computacional de secuencias
Retos de la bioinformática: la integración de los diferentes niveles de complejidad de los sistemas biológicos
Introducción a la Bioinformática
© Copyright Ebiointel,SL 2006
15 y 16 de Febrero 2001: Publicación secuencia borrador del genoma humano
Introducción a la Bioinformática
© Copyright Ebiointel,SL 2006
GATTGCCTCTCATTTTCTCTCCCATATTATAGGGTGAAATATGATCGCGTATGCGAGAGTAGTGCCAACATATTGTGATCTTCGATTTTTTGGCAACCCAAAATGGAGGCGGACGAACGAGATGATAATGATAAGATGATTCAAAAAGACAATGCACGACAGAGAGAGCAGAAAAGATAATTAAATTGCCCCTCATTTTCTCTGGCAAATTGTAGGGTGAATTATGATCGCGTATGCGAGAGTGGTGCCAACATATTGTGCTCTTCGATTTTTTGGCAACCCAAAATGGAGGCGGATGAACGAGATGATAATATTTTCAAGTTGCCGCTAATCAAAAATAAATTCCTTGCAACATAAAATAAAGCACAAAATGCCCGCTCAAAAAAAGGCATGAATATATAAGCTCGAACATAGAACATAGGCTTGAACATATAATGACTGCCTTTCATTCTCTATCTTATATTACCGCAAACACAAAATGACAATGCACGACATAGAGAGAAAGAGAGATATTCAGATTGCCTCTCATTGTCTCACCCATATTATGGGAACCAAATATGAGCACGTATGCGAGAGGAGTGCCAACATATTGTGCTCTACGATTTTTTTGCAACCCAAAATGGCGGCGTACGAACGAGATGATAATATATTCAAATTGCCGCTAATCAGAAGCAAGTTTATTGCAATGTTCAGTGCAGCGCAAAATGGCCGCTCAAGAAAAGGCTCGAATATATATTGCCTGCCTCTCATTCACTCTCTTTTATTACCGCAAGACCAAAATGACAATGTACAACAGAGAGAGCAAGAGAGATATTTAGATTGCCTCTCCTTGTCTCTCCCATATTATAGAGACCGAAAATGATTGCGTATGCGAGAAGAGTGCCATTGTATTGAGCTCCTCGACCCAAAATAGCGTCGGACGAACGAGATTATATATTTAAAATGCCGATCATTTTCTCATCCATATAAATACTACCGAAAATGACTGTCTAAAGGTACTCATCGACTATATTTAAATCTGTGTATTTCTGTGAATAGATTGACCTTTGCAATTTTTAACGGCATTGTCTATTAAATTAATATAATTTTCTTTTTTGATGAATATTTAACCGAACATTTACTTGAAATTAAATTATAAAATTGGTTAAATAATGTTGAAATCTTACTTTCAGCTAAATGGGGCTATTTTGCAAGGGTTCCATCATGACATTGGTAAATAATTTTTAAAGAATTAATTGTAAGTTCCAATAGACTGGAAATTATTTTGCAATATCATTCTTATCCCTATTTCCAAAAGCGAATTATTAGTTGCGTGAAAATCAGAAGGAAAATTATTTAACGTGTTATGCCACGCCAAATAGCCGCGCAATAGGAAGCTAGACTATATAATGACTGCAACGAAAATTGTAAATTCCAATTAAAAGGATATTATTGTGCGATTTCACTTTAATTCTTATTTCAAAAAAGTTAATTATTAGTTGACGGAAATCAGAACGAATTTCACCGCAACGTCTTATGCAGCACAAAATGGCGGCGCAAAAGGATGGTTGCATATACAATAACTTCATCTCATTCAATCTCTCCTATATTACCGCAAACTCGAAAGCCAAAACACGAATGATGAAGAGGGATAGATTTTATTGGGACAAAAATGATAGGTCACGCGAGAGGAGTGGTCTAAATTTTACTCTCACAAAAATGTTGGCAATACAAAATGGCGGCGGAATGAAGAGGTGAAAATATATTAAAATTGCCGCTCATTTTCTTCGCGGTAGAATTAGGACTGAACGTTGCCGGGTATAGGATCTCTATTGATGGCCTTTACTTATAAAGTGTATTTCTACAGATCAAATTACTTTTTACTCTTTATCAATATTTAAATATTATAAATTGATTTAGTTAAAATACAATTCGAACAATCTTTTCTCCAAATAATAATAATGTTTAATACCTATTTGCGCATATGCGTTTATTTTTGGGATTTAATTTTAACATTTTTCAACAAAACCGTTACAAATGTAATTTTAAATCAGGAAACGACTTTGGTATGAAAATATGTTTTTTTGTGCGCTTTTAAACATGTAACTGCTCTTTTGTGCTGTTTTATTGAATGCTATCACAGCGTAAAATTTTAGTTTTAATACCAATACATTGGGAATAATTTGCGATTTCATTCTATTCTTATGCCCAAATAAGGAAATAGTTTCCGGCAAAAAATCAGAATTTAGCTTTTACAAAAACTAGAGAGGAGAGGACAATATTATAATTGTAGACCGTTTTAAACACTTTAAAATGTTTAACCATTTATCAATTATTCTACTAAATGTAGGTGATTTTATTTATTAGAATACGAATTCTTTATCTGAATCGAACTAAGTAAGCCTAAGCGCTTAGGAAAAATACATACTTGACGAGTAGAGTGAAATAATTACAAATATTAGACATATCCATTGCTACTCGCATGTAGAGATTTCCACTTATGTTTTCTCTACTTTCAGCAACCGAGAAGAGAACCCACGTTTGAACAAGTATCGGCGTGTGGACAACAGCTATCCCCGCTTCATAACGAATGAGGCTGCCGAGGACCTGATTTACAAGAAGTCCATGGGCGAGCGGGATCAGCCACAGAGCTCAGAGCGGATCTCAATATTTAATCCGCCAGTATACACGCAGCACCAGGTGCGCAATGAAGCCCCCTACATACCCACCACATTTGACCTCCTCTCAGACGATGAGGAGTCGTCACAGAGAGTTGCCAACGCCGGGCCATCTTTCAGGCCCTTGACTTACTCGGATGCTGTGCGTCTAAGCCAGAATGGCTTCGCCAACTCCCGCGTAAGTGGGCACTCCAGCTATACGGTGCGCAGACCACCGGCACTAGTTGACAGAAGCATTCTATCCCAGGAAATGGAGCGCATGGACCAAGAGCAGTATATCTACCTTATCCGTACCGCAGCCCAAAGTAATTCCGTGGGCAGTCACTACGCCGAACCGGTTACTGATAACTCGGAGGTCAAGAAAGTCAGTGAAACCAACAAAAGGTAAATAAATTTTTTATATCCATCCATATCCGAATCAGTGGCAATAATGCAAAATGCTGATTTTATCACCAATTAGTGACGCACCACAGCCGTTAACCCCTCAACCTACCAGACTCACCAGAACAGAATCCTTGCACCGTCGTTTTGCCAGCTGCGTCAACTTAAATGATGACTTCGCCAGCAATTTAAAGCAAGAGCGGCGGACTGTGAAGAGAAATCCAAA
© Copyright Ebiointel,SL 2006
GENOMAS
Introducción a la Bioinformática
© Copyright Ebiointel,SL 2006
Sistemas vivos: información digital cuaternaria (A,T,G,C) en secuencias unidimensionales de monómeros
Ordenadores: información digital binaria en ristras de 0 y 1
Codificación de la información
© Copyright Ebiointel,SL 2006
Bioinformática: síntesis de la revolución de la biología molecular y de la informática
Definición:
La disciplina científica que engloba todos los aspectos de la adquisición, procesamiento, distribución, análisis, interpretación e integración de la información biológica
Biología molecularFundamentos ordenadores y programaciónFundamentos de redesBases de datosAplicaciones bioinformáticas
Bioinformática
© Copyright Ebiointel,SL 2006
Aproximación que cruza la arena tanto experimental como teórica: experimentos realizados “in silico”
Nueva disciplina Curriculum:
Licenciado en Ciencias de la Vida Máster en computación Doctor en análisis de secuencias
Nueva disciplina
Bioinformática: síntesis de la revolución de la biología molecular y de la informática
Bioinformática
© Copyright Ebiointel,SL 2006
Hitos de la
Bioinformática
Primera proteína secuenciada
Secuenciación del DNA
GenBank, EMBL, DDBJ
Secuenciación automatizada de DNA
Algoritmos FASTA y BLAST
WWW
Primer genoma completo
Primer cromosoma humano
Borrador Genoma Humano
Genoma Humano completo
HapMap, Genoma chimpancé, 387 genomas
1951
1977
1982
1986
1990
1991
1995
2000
2001
2003
2005
1951
1977
1982
1986
1990
1991
1995
2000
2001
2003
2005
1953 Estructura del DNA1953 Estructura del DNA
Bioinformática
© Copyright Ebiointel,SL 2006
El problema
René MagritteClarividencia
DNA
Fenotipo
© Copyright Ebiointel,SL 2006
Propiedades de la información biológica
Existe una relación entre estructura molecular y función en el sentido más amplio:
DNA --> Fenotipo (todos los niveles)
La complejidad de los datos biológicos
El crecimiento explosivo de los datos biológicos
Existe una relación entre estructura molecular y función en el sentido más amplio:
DNA --> Fenotipo (todos los niveles)
La complejidad de los datos biológicos
El crecimiento explosivo de los datos biológicos
La información biológica
Bioinformática
© Copyright Ebiointel,SL 2006
El crecimiento explosivo de datos
Hace ... Antes Ahora
Nucleótidos 26 años (1982)
680338 pb (GenBank)
> Miles de millones
Proteínas 26 años 1500 300.000
DNA continuo
16 años 73 kb > 270 Mbases
SNPs 16 años centenares 11 millones
Genomas 11 años 0microorganis
mos
387Organismos
Expresión 10 años Limitado pocos genes
Torrente de datos (microchips)
© Copyright Ebiointel,SL 2006
Nú
mero
de p
ares
de b
ase
s (x
10
9)
Crecimiento explosivo de secuencias
Crecto bases datos
Nú
mer
o d
esec
ue
nc
ias
(x m
illó
n)
Ver la estima de hoy
Estima de Abril 2006: 130,989,342,565 bases
Bioinformática
© Copyright Ebiointel,SL 2006
El crecimiento explosivo de datos
Hace ... Antes Ahora
Nucleótidos 26 años (1982)
680338 pb (GenBank)
> Miles de millones
Proteínas 26 años 1500 300.000
DNA continuo
16 años 73 kb > 270 Mbases
SNPs 16 años centenares 11 millones
Genomas 11 años 0microorganis
mos
387Organismos
Expresión 10 años Limitado pocos genes
Torrente de datos (microchips)
© Copyright Ebiointel,SL 2006
La avalancha de datos
La Bioinformàtica es crucial para tranformar el torrente de datos brutos en conocimiento biológico
David B. Searls
© Copyright Ebiointel,SL 2006
Bio
logi
a C
ompu
taci
onal
Los métodos computacionales se han convertido en algo intrínseco de la investigación biológica moderna, y su importancia sólo puede incrementar conforme aumenta la importacia de los métodos a gran escala de generación de datos, la complejidad de los datos y la sofisticación de nuestras preguntas
Francis S. Collins
Bioinformática
© Copyright Ebiointel,SL 2006
Tres vertientes del análisis bioinformático:
Manejo de volúmenes masivos de datos
Análisis e interpretación de resultados experimentales
Modelo de sistemas biológicos
© Copyright Ebiointel,SL 2006
DB
Bases de datos
http://www.ncbi.nlm.nih.gov/gquery/gquery.fcgi
© Copyright Ebiointel,SL 2006
Potencia de cálculo
Ordenador Compaq de 800 procesadores Alfa EV6 y EV7 con una arquitectura de 64 bits y más de 80 terabytes de memoria (5 veces la biblioteca del congreso)
Secuenciación del genoma (Aproximación aleatoria, Celera)
© Copyright Ebiointel,SL 2006
Translation
DatabaseSimilaritysearrch²
Proteome
All-against-allComparison
WithinProteome 1,3
ProteinComparison
BetweenProteomes 1,4
Proteome Proteome Proteome1
SearchOf
Clusters 5
SwissProtPDBsequences
TranslatedESTs
Proteome2
Proteome
Proteomedatabase
Database ofProteome 1
Database ofProteome 2
ClusterDatabase
.....OrProteome
Análisis de genomas
Genome sequence
Predicted genes
© Copyright Ebiointel,SL 2006
Genoma ratón 14% menor genoma humano (2,5 Gb vs 2,9 Gb) 90% ambos genomas presentan sintenia A nivel nucleotídico 40% GH se alinea con GR Tasa substitución neutra 0,5 por sitio. Doble ratón que humanos % genoma sometido a selec purificadora >5% Evolución no uniforme del genoma Ambos ~ mismo número genes, 30.000. 80% único ortólogo, sin
homología <1%
Genómica comparativaMetodología con una sensibilidad y precisión comparable o superior al
análisis experimental
© Copyright Ebiointel,SL 2006
Genómica comparativa
Chimpancé vs Homo sapiens
¿Qué cambios genéticos nos
hacen humanos??
© Copyright Ebiointel,SL 2006
Análisis filogenéticos Genómica evolutiva
Bioinformática
© Copyright Ebiointel,SL 2006
Base genética de la individualidad humana
SNPsA G A G T T C T G C T C G
A G G G T T A T G C G C G
A G A G T T C T G C T C GA G G G T T A T G C G C G
A G A G T T C T G C T C GA G G G T T A T G C G C G
Single Nucleotide Polymorphism
© Copyright Ebiointel,SL 2006
Base genética de la individualidad humana
International HapMap Project (http://www.hapmap.org)
© Copyright Ebiointel,SL 2006
Expresión (DNA microarrays: Molecular portraits)
© Copyright Ebiointel,SL 2006
Redes de interacción de
proteínas
(Gavin et al. Nature 2002)
Redes de interacción
Máquina multiproteínas 232 máquinas de 12 proteínas promedio
Proteómica
© Copyright Ebiointel,SL 2006
MAKING CONNECTIONS This network graph shows causal connections among 30,512 genes, 31,459 proteins, and 5,824 small molecules in Genstruct's model, which contains 136,362 causal connections that can be evaluated to explain the molecular state changes observed in large-scale systems biology experiments.
The red connections represent inhibitions; green, activation; light blue, reaction; dark blue, a product; yellow, catalysis; orange, binding; and black, gene product
relations.COURTESY OF GENSTRUCT
Bioinformática
© Copyright Ebiointel,SL 2006
Modelo de sistemas biológicos
E-Cell (Masaru Tomita)
Bioinformática
© Copyright Ebiointel,SL 2006
Entendiendo la célula
Bioinformática
© Copyright Ebiointel,SL 2006
¿Qué gran panorámica emergerá del océano de datos
biológicos??
a. La complejidad no es reducibleb. Nuevos principios generales de organización de lo biológico
Bioinformática
© Copyright Ebiointel,SL 2006
Sistema biológico (Organismo)
Bloques de construcción(Genes/Moléculas)
Aproximación sintética interdisciplinar
(Bioinformática: Biólogos, médicos, matemáticos, físicos, informáticos,)
Aproximación reduccionista (Experimentos)
Bioinformática
© Copyright Ebiointel,SL 2006
Nivel de análisis Definición Estatus Método análisis
Genoma Conjunto completo de los genes de un organismo o sus organelas
Independiente del contexto Secuenciación sistemática del DNA
Transcriptoma Conjunto completo de los RNA mensajeros presentes en una célula, tejido o órgano
Dependiente del contexto (el complementos de RNAs varía según cambios en la fisiología, el desarrollo o patologías
Matrices de hibridación
SAGE
Análisis Northern a gran escala
Proteoma Conjunto completo de proteínas presentes en una célula, tejido o órgano
Dependiente del contexto Electroforesis en gel bidimensional, fingerprinting de péptidos
Análisis de dihíbridos
Metaboloma Conjunto completo de metabolitos (intermediarios de bajo peso molecular) presentes en una célula, tejido o órgano
Dependiente del contexto Espectrofotometría de infrarrojos
Espectrofotometría de masas
Espectrofotometría resonancia magnético nuclear
Bioinformática
Interactoma Interactoma
-omics-omics
© Copyright Ebiointel,SL 2006
La intersección de la genómica y bioinformática en la práctica clínica es una necesidad que debe incorporarse en la investigación médica si que quiere que la revolución genómica incida efectivamente en la medicina
Chris GunterNature 2004, 429: 439
La Bioinformática en la investigación clínica
© Copyright Ebiointel,SL 2006
El ‘guru’ JUAN ENRIQUEZEx-Director del Harvard Business School´s Life Science Project y, actualmente, es CEO de Biotechconomy
Conocer el lenguaje de los genes es dominar el futuro
Código digital cuaternario
Perspectivas de la Biotecnología
© Copyright Ebiointel,SL 2006
La Bioinformática hoy
Datos Conocimiento Herramientas
bioinformáticas
© Copyright Ebiointel,SL 2006
Conclusiones
• El tratamiento y análisis masivo de información es parte de la práctica de la investigación biomédica actual
• El disponer de recursos bioinformático integrados y de gran capacidad para el tratamiento y análisis de información biomédica es hoy una necesidad primaria de la investigación biomédica
• Los investigadores precisan conocimientos y capacidades para el análisis e interpretación bioinformático mediante programas de formación
• Desarrollo de análisis de sistemas dinámicos complejos
• Colaboración multidisciplinar
• Estilo de vida en la red
En la era postgenómica de la investigación Biomédica
Bioinformática
Are you ready?