Upload
valora
View
44
Download
0
Embed Size (px)
DESCRIPTION
Tema 6: Secuenciación y análisis bioinformático de secuencias. http://mendel.uab.es/doctorat/genomica/. Puntos a tratar en este Tema :. Métodos de secuenciación del DNA Secuenciación ordenada (clon a clon) STS y ETS Secuenciación aleatoria (Shotgun) Mapas de expresión Bancos de datos - PowerPoint PPT Presentation
Citation preview
Tema 6: Secuenciación y
análisis bioinformático de
secuencias
Tema 6: Secuenciación y
análisis bioinformático de
secuencias
http://mendel.uab.es/doctorat/genomica/
Puntos a tratar en este Tema :Puntos a tratar en este Tema :Puntos a tratar en este Tema :Puntos a tratar en este Tema :
•Métodos de secuenciación del DNA•Secuenciación ordenada (clon a clon)•STS y ETS•Secuenciación aleatoria (Shotgun)•Mapas de expresión•Bancos de datos •Análisis bioinfomático•Paquetes de programas
•Métodos de secuenciación del DNA•Secuenciación ordenada (clon a clon)•STS y ETS•Secuenciación aleatoria (Shotgun)•Mapas de expresión•Bancos de datos •Análisis bioinfomático•Paquetes de programas
http://mendel.uab.es/doctorat/genomica/
Mapas genéticosMapas genéticos (de ligamiento o recombinación): basados en distancias o frecuencias de recombinación
Mapas genéticosMapas genéticos (de ligamiento o recombinación): basados en distancias o frecuencias de recombinación
Xg Proteína grupo sanguíneo
Ictiosis (un efermedad de la piel)
Albinismo ocular
Angioqueratoma (crecto celular)
Centrómero
Fosfoglicerato-quinasa
Alfa-galactosidasaXm
Deutan (ceguera color rojo-verde)
G6PD
Protano (ceguera color rojo-verde)
Hemofilía A
Mapas físicos y genéticosMapas físicos y genéticos
Mapa de ligamiento parcial
del cromosoma X de la especie humana
Mapa genético del
Cromosoma 1 Homo
sapiens.
Mapas físicos y genéticosMapas físicos y genéticos
Mapas físicosMapas físicos: la distancia entre marcadores es una distancia física real, basada en bp, Posición citológica en los cromosomas, o fragmentos de cromosomas.
Mapas físicosMapas físicos: la distancia entre marcadores es una distancia física real, basada en bp, Posición citológica en los cromosomas, o fragmentos de cromosomas.
Secuenciación automatizada del DNASecuenciación automatizada del DNA
Secuenciación basada en la terminación de cadena
Vector de clonación
Vector plasmídico
Vector bacteriófago M13
Fagémido
Vector de clonación
Vector plasmídico
Vector bacteriófago M13
Fagémido
Interpretación de un cromatograma con ChromaInterpretación de un cromatograma con Chroma
Limitaciones de la aproximación clásica1/5.000.000 cada experimento
Secuenciación por capilaridad96 canales, 96 secuencias en paralelo< 2 horas/run -> 1000 secuencias/día
Pirosecuenciación Adición nucleótidos libera pirofosfatoCon enzima sulfurilasa produce flash luminiscente
DNA chips8-meros 65539 combinaciones. 256 bases legibles10-meros 1048576 combinaciones, 1kb20-meros 1012 combinaciones, 1MB
Limitaciones de la aproximación clásica1/5.000.000 cada experimento
Secuenciación por capilaridad96 canales, 96 secuencias en paralelo< 2 horas/run -> 1000 secuencias/día
Pirosecuenciación Adición nucleótidos libera pirofosfatoCon enzima sulfurilasa produce flash luminiscente
DNA chips8-meros 65539 combinaciones. 256 bases legibles10-meros 1048576 combinaciones, 1kb20-meros 1012 combinaciones, 1MB
Alternativas de secuenciaciónAlternativas de secuenciación
DNA chips (1 millón oligonucleótidos por cm2)
8-meros 65539 combinaciones. 256 bases legibles (raíz cuadrada de las posibles combinaciones)
10-meros 1048576 combinaciones, 1kb
20-meros 1012 combinaciones, 1MB
Alternativas de secuenciaciónAlternativas de secuenciación
Estrategia del perdigonazo (shotgun)
Gran éxito en microorganismos (Haemophilus influenzae)
Aproximación Clon a clon (Consorcio público)
Aproximación del perdigonazo dirigida (Celera Genomics)
Ensamblaje de secuencias de DNA contiguasEnsamblaje de secuencias de DNA contiguas
Francis S. Francis S. CollinsCollins
Proyecto Genoma humano
Consorcio público
J. Craig J. Craig VenterVenter
PE Celera Genomics
J. Craig J. Craig VenterVenter
PE Celera Genomics
Arquitectura del genoma de Haemophilus
influenzae
Arquitectura del genoma de Haemophilus
influenzae
Microorganismos Microorganismos secuenciadossecuenciados
Microorganismos Microorganismos secuenciadossecuenciados
Aproximación consorcio público:
clon a clon (jerárquica)
Aproximación consorcio público:
clon a clon (jerárquica)
Aproximación consorcio público:
clon a clon (jerárquica)
Aproximación consorcio público:
clon a clon (jerárquica)
Mapeo y Anclaje de STSsMapeo y Anclaje de STSs
STS (Sequence tagged sites): Secuencia conocida (permite ensayo con
PCR)Único
Fuentes de STSESTs (Expressed sequence tags)SSLPs (single sequence length
polymorphisms)Random genomic sequences
STS (Sequence tagged sites): Secuencia conocida (permite ensayo con
PCR)Único
Fuentes de STSESTs (Expressed sequence tags)SSLPs (single sequence length
polymorphisms)Random genomic sequences
Mapa de STSs
Integración de mapas mediante el anclaje de STSs
Mapa de Mapa de STSsSTSs
Mapa deMapa deRecombinaciónRecombinación
Mapa deMapa deRHRH
ContigsContigs
Mapa deMapa declonesclones
Estrategias de secuenciación del genoma:Clon a clon vs. Perdigonazo (shotgun)
Estrategias de secuenciación del genoma:Clon a clon vs. Perdigonazo (shotgun)
Microorganismos Microorganismos secuenciadossecuenciados
Microorganismos Microorganismos secuenciadossecuenciados
Nuestra visión del árbol de la vida debe ser modificada
Familias génicas forman un léxico de biología molecular
50% genes son URFs (unidentified reading frames)
Mínimo número de genes para sostener el tipo moderno de célula es 256
El ancestro común de Gram-positivas y negativas tenía probablemente más de 1000 genes
Gene shufflingORFs faltantes de genes existentes
Nuestra visión del árbol de la vida debe ser modificada
Familias génicas forman un léxico de biología molecular
50% genes son URFs (unidentified reading frames)
Mínimo número de genes para sostener el tipo moderno de célula es 256
El ancestro común de Gram-positivas y negativas tenía probablemente más de 1000 genes
Gene shufflingORFs faltantes de genes existentes
Cada genoma completo suministra una Cada genoma completo suministra una cornucopia de información biológicacornucopia de información biológica:
Conocimiento del número total de genes
Principios sobre la organización básica del organismo (clases funcionales,...)
Conocer funciones básicas de los genes conservados en distintas especies (léxico biología molecular)
Miramos el bosque, no el árbol
Cada genoma completo suministra una Cada genoma completo suministra una cornucopia de información biológicacornucopia de información biológica:
Conocimiento del número total de genes
Principios sobre la organización básica del organismo (clases funcionales,...)
Conocer funciones básicas de los genes conservados en distintas especies (léxico biología molecular)
Miramos el bosque, no el árbol
Organismos eucariotas Organismos eucariotas secuenciadossecuenciados
Organismos eucariotas Organismos eucariotas secuenciadossecuenciados
Saccharamyces cerevisiae (levadura del pan)
Caenorhabditis elegans (gusano nemátodo)
Drosophila melanogaster (mosca de la fruta)
Arabidopsis thaliana (mala hierba de los prados)
3000 MbH. sapiens
120 MbA. thaliana
120 Mb (180)D. melanogaster
97 MbC. elegans
12 MbS. cerevisiae
# pb# pbOrganismoOrganismo
~100.000
~25.000
~13.600
~19.000
~6.000
# genes# genes
Lista de bases de datos de biología Lista de bases de datos de biología molecular en NARmolecular en NAR
http://nar.oupjournals.org/contenthttp://nar.oupjournals.org/content/vol2/vol288/issue1//issue1/
BioinformáticaBioinformáticaBioinformáticaBioinformática
Bases de datos
•Primarias
•Compuestas
•Secundarias
Bases de datos
•Primarias
•Compuestas
•Secundarias
•European Bioinformatics Institute (EBI-UK) Home Page •SRSWWW at EMBnet/CNB
•The National Center for Biotechnology Information (GenBank)
•NCBI als EEUU: Entrez •DNA Data Bank of Japan (DDBJ) •Nucleic Acid Database •Genome Sequence Database (GSDB) •Genome Database (GDB)
Bases primarias y compuestas de DNA y Proteínas
Bases primarias y compuestas de DNA y Proteínas
•SwissProt •Protein Data Bank (at EBI) •Protein Data Bank (USA) •Protein Information Resource (PIR at Europe) •PRF HOME PAGE
SRS SRS
Entrez Entrez
Bases secundarias Bases secundarias
•Motius • SCOP Clasificació estructural de proteïnes (Univ. de Cambridge) • Prosite Diccionari de motius (Suissa) • Motif Cerques de motius proteics al Japó
•Estructura
•NRL Protein Structure Database •Swiss-Model
•REBASE •Codon Usage Database
•Bases genòmiques
•THE INSTITUTE FOR GENOMIC RESEARCH •The Sanger Centre : Projects •Microorganismes
•TIGR Microbial Database •MAGPIE GENOME SEQUENCING PROJECT LIST •MBCR home page •Pseudomonas Genome Project: Obtaining Sequences •Streptococcus pyogenes
•Genomes eucariotes
•Human Genome Mapping Project •Saccharomyces Genome Database •Drosophila •Anopheles •Caenorhabditis elegans
Eines i software de biologia molecular a la xarxa
•Software de biologia molecular: The Biocatalog
•Molecular Biology Shortcuts
•Biotools
Los 6 marcos de lectura posibles Los 6 marcos de lectura posibles obtenidos a partir de una secuencia obtenidos a partir de una secuencia
de 9 kb de un hongode 9 kb de un hongo
Los 6 marcos de lectura posibles Los 6 marcos de lectura posibles obtenidos a partir de una secuencia obtenidos a partir de una secuencia
de 9 kb de un hongode 9 kb de un hongo
Los ORFs mayores, el 2 y 5, son potenciales genes candidatos
Protocolo para localización de genes Protocolo para localización de genes a partir de la inspección de la a partir de la inspección de la
secuenciasecuencia
Protocolo para localización de genes Protocolo para localización de genes a partir de la inspección de la a partir de la inspección de la
secuenciasecuencia
Traducción conceptual de la secuenciaDetección ORFsSesgo de codonesLímites exón-intrónSecuencias de control río arribaBúsqueda de homologías
Traducción conceptual de la secuenciaDetección ORFsSesgo de codonesLímites exón-intrónSecuencias de control río arribaBúsqueda de homologías
EjercicioEjercicioEjercicioEjercicio
Observa el patrón de bandas fingerprint de una pareja y sus 5 hijos. Contesta a las siguientes cuestiones: a. ¿Qué marcadores se heredan juntos?b. ¿Qué marcadores parece ser alelos de un mismo locus?c. ¿Qué marcadores segregan independientemente?d. ¿Qué marcadores parecen estar ligados en trans?e. ¿Qué marcadores pueden estar ligados a la enfermedad P?
Cinco clones YAC de DNA humano se probaron para STSs. a. Dibuja el mapa físico de los STSs ordenadosb. Alinea los YACs en un contig
EjercicioEjercicioEjercicioEjercicio
Este es el pedigrí de una familia con fibrosis quística (en negro). El hijo mayor se ha casado con un primo segundo. Para saber si es portador ha efectuado un test molecular con tres sondas de RFLPs que se sabe están ligadas al gen de la FQ.a. ¿Es este hombre homocigoto normal o portador?b. ¿Son sus tres hermanos normales portador o normales?c. ¿De qué padre heredaron el alelo cada portador?
EjercicioEjercicioEjercicioEjercicio