Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM...

Preview:

Citation preview

Alberto Jorge GarcíaAlberto Jorge García

Laboratorio de QuLaboratorio de Quíímica de Protemica de Proteíínas y Protenas y Proteóómica mica CBM-SO. CSIC-UAMCBM-SO. CSIC-UAM

Curso de doctoradoCurso de doctorado““Estructura y Función de Macromoléculas”Estructura y Función de Macromoléculas”

ajorge@cbm.uam.esajorge@cbm.uam.es

TÉCNICAS DE SECUENCIACIÓN DE PROTEÍNAS

Motores de búsqueda con datos de fragmentación de péptidos.

Interpretación de resultados.

Motores de búsqueda con datos de fragmentación de péptidos.

Interpretación de resultados.

Alberto Jorge GarcíaLaboratorio de ProteómicaCentro de Biología Molecular Severo OchoaCSIC-Universidad Autónoma de Madrid

Curso Práctico De Identificación de Proteínas con Datos de Espectrometría de masas:

Herramientas Bioinformáticas

Motores con los que vamos a trabajar:

• Sequest: Se necesita licencia; desarrollado por Yates y col., comercializado por Thermo en el paquete “Bioworks”.

• Mascot: Disponible en red; desarrollado por Pappin y col., se puede comprar la licencia.

Emplean distintos algoritmos de búsqueda

Abrir BioWorks Browser

Dobleclick

SEQUEST

Fichero de datos como ejemplo : trypmyo01.raw

File Open D:/…/Siena trypmyo01.raw

Modo de trabajo más común, TRIPLE PLAY: Full ms-Zom scan-ms/ms

“Cromatograma”Análisis LC-MS

Display Configuration Settings D:\Siena\Myo1

Previamente hemos creado la carpeta donde se van a guardar los resultados

Qué información tenemos acerca de nuestra muestra?

Complejidad de la mustra

Organismo

Método de digestión

Preparación de la muestra

•Digerido de una única proteína

•Caballo

•tripsina

•No alquilación

Caso más simple: PROTEÍNA ÚNICA

Scan nº 449

Seleccionamos un espectro ms/ms con una “buena calidad”

Actions TurboSEQUEST Search

Selección de parámetros de búsqueda SEQUEST: básicos

Configuration settings

Generamos ficheros.dta a partir del/ los

ficheros .raw

Parámetros de búsqueda

Siena/myo1

449

Resultados SEQUEST

Doubleclick

Cobertura de Secuencia

Nuestro péptido

Calidad de la identificación

Dobleclick

El programa asigna los iones de las series principales en el espectro

El fragmento más intenso no se asigna!?

Conclusión: Muy buena asignación

Hay que tener en cuenta la presencia de iones doblemente cargados

• Identificación de proteínas en la muestra ‘trypmyo01’

• Búsqueda SEQUEST :- Rápida- Máxima cobertura de proteínas

Aumentamos la complejidad: IDENTIFICACIÓN DE PROTEíNAS EN NUESTRA

MUESTRA

Selección de parámetros de búsqueda SEQUEST: básicos

Seleccionamosun rango ampliodel análisis que incluye un alto nºde scans ms/ms

Tenemos la posibilidadde trabajar con DB inde

xadas.

Que supone indexar una base de datos?

Seleccionamos la base de datos (disponibles en red y en Bioworks) Conviene ir actualizando las DB Seleccionamos la proteasa (comúnmente tripsina) Seleccionamos las modificaciones: fijas y/o variables. Depende del tratamiento de la muestra Herramienta disponible en Bioworks: Tools

Trabajar con bases de datos cuyas proteínas están digeridas “insilico”

Aumenta notablemente la rapidez de la búsqueda

Selección de parámetros de búsqueda SEQUEST: advanced

dta generationPrecursor mass 1.4Group scan 1Min group count 1Min ion count 35

Tolerance for dta searchPeptide 1.5Fragment 0.35

Ion seriesa,b,y

OutputReport duplicate ref.

Resultados de la búsqueda SEQUEST

Dtas generados

Proteína conmayor puntuación

Mayor nºde péptidosasignados

Sort Resultados SEQUEST Display Options Sort

Ordenamos lospéptidos por puntuación

Filter Resultados SEQUESTDisplay Options Filter

Seleccionamos sololos péptidos con XC>2

de la proteína con mayorpuntuación

Revisión de la proteina con mayor puntuaciónCobertura de secuencia

Doubleclick

Cobertura de secuencia 89%

Cómo comprobar si un “match” es bueno o malo?Scan 341-356: no es el péptido de la proteína con mayor puntuación pero es el nº1 de los 10 mejores de su lista de SEQUEST

Dobleclick

Listado de los 10 mejores “hits” SEQUEST para #341

Note: XC values‘Ions’

1st mejor “match” por SEQUEST LFTGHPETLEK

Veredicto: asignación correctaTodos los iones mayoritarios se

asignan correctamente a las series principales b- e y”-ion

2nd mejor “match” por SEQUEST LIKEAAGKSNLK

Quedan muchos ionesmayoritarios sin asignar a

las series principales

ConclusionesEspectro

La intensidad del espectro es el primer “filtro”

La mayoría de los espectros de péptidos tienen una distribución

‘bell-shaped’

Ambas series (b- and y-ion) están presentes en el espectro

Buen “match”

Series b- e y-ion contigüas

Todos los picos intensos se corresponden con la secuencia identificada

XC “the bigger the better”

DeltaCN muestra la capacidad de Sequest de discernir entre secuencias

Sp es una puntuación preliminar, “the bigger the better”

RSp value debe ser 1

péptidos +3 en general no son tan ‘bonitos’ como +2

péptidos +1 generalmente son de secuencia corta–el valor diagnóstico es

menor

MASCOT

Trabajamos en red

Formulario a completar: Parámetros de búsqueda

Importante si la red no va bien,Podemos recibir los resultados por

correo

NCBInr: mayor nº de entradasMayor significatividad estadística

Mucho cuidado con las modificaciones:anotar solamente las que conozcamos

su presencia con seguridad

Acepta datos en distintos formatos,ya tenemos creados los ficheros .dta

No es necesario rellenar el resto de lascasillas

Importante para obtener buena tabla de resultados

Resultados de la búsqueda MASCOT

Mejor puntuación

Proteínas con puntuación fuerade la zona de incertidumbre

“Peptide Summary Report” MASCOT

Mejor puntuación a mayornº de péptidos asignados

para la misma proteína

Todas las proteínas conbuena puntuación son

proteínas muy relacionadas

Dobleclick

“Peptide View” MASCOT

Recommended