SNPs asociados a patologías y SNPs asociados a patologías y modelos animalesmodelos animales
Xavier de la CruzXavier de la CruzIRBBIRBB--PCBPCB
Single Nucleotide Polymorphisms (SNPs)
Zona codificante de los genes
Mutacionespuntualesproteínas
AplicacionesAplicaciones
Clasificar los SNPs disponibles para su Clasificar los SNPs disponibles para su posterior estudio experimentalposterior estudio experimental
Extensión del modelo a las mutaciones Extensión del modelo a las mutaciones asociadas a mutaciones causantes de asociadas a mutaciones causantes de enfermedades poligénicasenfermedades poligénicas
Caracterización de SNPs no humanosCaracterización de SNPs no humanos
Aproximación bioinformáticaAproximación bioinformática
Gran cantidad datosGran cantidad datos
Herramientas Herramientas construcción modelosconstrucción modelos
Conocimientos previosConocimientos previos
La estructura de las proteínas permite La estructura de las proteínas permite comprender el efecto dañino de las mutacionescomprender el efecto dañino de las mutaciones
Reglas que relacionan el daño con la estructura:Reglas que relacionan el daño con la estructura:ruptura puentes disulfuroruptura puentes disulfuroincrementos de volumenincrementos de volumenconservación en alineamientos múltiplesconservación en alineamientos múltiplesetcetc
...VL.....AA...SN....WNV....YT..........EL....TP..
Y
Amino acid properties
EvolutionaryInformation
DatabaseAnnotations
(3.0, …….,2.0, -62.0,…......., 12.5, -5.2,…….- 2.7, 1.0,….…,1.0)
Neural network
Prediction:0: neutral mutation1: disease-associated mutation
Reliability index:0-9: from non- to highly-
reliable
Structure properties
Obtención del métodoObtención del método
Minería de datos para obtener las Minería de datos para obtener las mutaciones patológicas/neutrasmutaciones patológicas/neutras
Entrenamiento de la red neuronalEntrenamiento de la red neuronal
Evaluación de la capacidad predictivaEvaluación de la capacidad predictiva
DataminingDatamining
Búsqueda SwissProt:Búsqueda SwissProt:Palabras clave: DISEASE, Palabras clave: DISEASE,
VARIANT, HUMAN, PDBVARIANT, HUMAN, PDB
Control datosControl datos
Eliminar mutaciones con Eliminar mutaciones con
anotaciones ambiguasanotaciones ambiguas
Mutaciones neutrasMutaciones neutras
Obtienen a partir de alineamientos Obtienen a partir de alineamientos múltiples (Pfam)múltiples (Pfam)
98 %95 %
38 %
85 %
HumanoTomar
A
V
W
Y
Mutaciones neutrasMutaciones neutras
DATOS UTILIZADOSDATOS UTILIZADOS
9334 mutaciones patológicas en 811 9334 mutaciones patológicas en 811 genesgenes
11372 mutaciones neutras11372 mutaciones neutras
Sequence Profiles
0
10
20
30
40
-9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3
%
Ferrer-Costa, C., Orozco, M. & de la Cruz, X. (2002) J.Mol.Biol. 315:771-786.
Contraste del métodoContraste del método
Observed
Observed(Unknown)
Observed
Observed
Observed
Neural Network
Training
Predicted
Predicted
Predicted
Predicted
Predicted
Testing
Capacidad predictiva con Capacidad predictiva con estructuraestructura
Porcentaje total de aciertos: 87 %Porcentaje total de aciertos: 87 %
Coeficiente de Matthews: 0.73 Coeficiente de Matthews: 0.73 (en predicción de estructura secundaria: (en predicción de estructura secundaria: 0.50.5--0.6)0.6)
Ferrer-Costa, C., Orozco, M. & de la Cruz, X. En prensa, Proteins
Capacidad predictiva con Capacidad predictiva con secuenciasecuencia
Porcentaje total de aciertos : 83.5 %Porcentaje total de aciertos : 83.5 %
Coeficiente de Matthews: 0.66 Coeficiente de Matthews: 0.66
Ferrer-Costa, C., Orozco, M. & de la Cruz, X. En prensa, Proteins
¿ Qué tal lo hacemos ?¿ Qué tal lo hacemos ?
Sunyaev et al.Sunyaev et al. 73.5 73.5 0.490.49Ng & HenikoffNg & Henikoff 63.7 63.7 0.240.24Saunders & Baker 70.1Saunders & Baker 70.1 0.380.38Wang & MoultWang & Moult 87.2 87.2 0.530.53
Versión sec.Versión sec. 83.583.5 0.660.66
Ferrer-Costa, C., Orozco, M. & de la Cruz, X. En prensa, Proteins
Extensión del modelo a otros Extensión del modelo a otros organismosorganismos
Interés en anotar las mutaciones en Interés en anotar las mutaciones en modelos animales, e.g. ratónmodelos animales, e.g. ratón
Necesidad de una similitud a nivel Necesidad de una similitud a nivel molecular entre organismosmolecular entre organismos
Distribución identidad de secuencias
0
10
20
30
40
50
60
70
0 - 10 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100
Humano - ratónHumano – especie portadora
“Splicing” alternativo
Contribución variabilidad del Contribución variabilidad del proteomaproteoma
Comparación de cambios en “splicing” Comparación de cambios en “splicing” alternativo entre humanos y otras alternativo entre humanos y otras especies:especies:
Inserciones/delecionesInserciones/deleciones
SubstitucionesSubstituciones
IMPACTO DEL “SPLICING” ALTERNATIVO
0,000
0,050
0,100
0,150
0 0 ,4 0 ,8 1 ,2 1 ,6 2 2 ,4 2 ,8 3 ,2 3 ,6 4 4 ,4
Humano
Ratón
Variabilidad en el alineamiento múltiple
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,0 10,0 20,0 30,0 40,0 50,0 60,0 70,0
% Identidad en las regiones substituídas
Valenzuela A, Talavera D, Orozco M, de la Cruz X. J Mol Biol. (2004) 335:495-502.
1
2
ASPECTOS GENERALESASPECTOS GENERALES
Gran similitud entre las isoformas Gran similitud entre las isoformas mayoritarias de los diferentes modelos mayoritarias de los diferentes modelos animalesanimales
0
10
20
30
40
50
60
70
80
0 1 2
Accesibility
Popu
latio
n
0
5
10
15
20
25
30
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Hidrophobicity
Popu
latio
n
0
5
10
15
20
25
30
35
-4 -3 -2 -1 0 1 2 3
Blosum62
Popu
latio
n
0
5
10
15
20
25
30
-9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3
PSSMI
Popu
latio
n
0
5
10
15
20
25
30
35
40
-7 -6 -5 -4 -3 -2 -1 0 1 2 3
dPSSMI
Popu
latio
n
0
5
10
15
20
25
0,5 1 1,5 2 2,5 3 3,5 4 4,5
Shanon's Entropy
Popu
latio
n
Capacidad predictiva con Capacidad predictiva con secuenciasecuencia
Porcentaje total de aciertos : 85 %Porcentaje total de aciertos : 85 %
Coeficiente de Matthews: 0.52 Coeficiente de Matthews: 0.52
Ferrer-Costa, C., Orozco, M. & de la Cruz, X. Enviado, Bioinformatics
CONCLUSIONESCONCLUSIONES
Es posible identificar las mutaciones Es posible identificar las mutaciones patológicas a partir de propiedades de patológicas a partir de propiedades de secuenciasecuencia
Se puede transferir la metodología Se puede transferir la metodología desarrollada entre especies próximas (en desarrollada entre especies próximas (en identidad secuencia)identidad secuencia)
Análisis estructuralAnálisis
mutaciones
“Splicing”AlternativoEstudio modelos
animales
DavidCarles
DavidSergi
IRBB-PCBModesto Orozco
Recommended