Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM...
-
Upload
alvaro-caballero-murillo -
Category
Documents
-
view
219 -
download
0
Transcript of Alberto Jorge García Laboratorio de Qu í mica de Prote í nas y Prote ó mica CBM-SO. CSIC-UAM...
Alberto Jorge GarcíaAlberto Jorge García
Laboratorio de QuLaboratorio de Quíímica de Protemica de Proteíínas y Protenas y Proteóómica mica CBM-SO. CSIC-UAMCBM-SO. CSIC-UAM
Curso de doctoradoCurso de doctorado““Estructura y Función de Macromoléculas”Estructura y Función de Macromoléculas”
[email protected]@cbm.uam.es
TÉCNICAS DE SECUENCIACIÓN DE PROTEÍNAS
Motores de búsqueda con datos de fragmentación de péptidos.
Interpretación de resultados.
Motores de búsqueda con datos de fragmentación de péptidos.
Interpretación de resultados.
Alberto Jorge GarcíaLaboratorio de ProteómicaCentro de Biología Molecular Severo OchoaCSIC-Universidad Autónoma de Madrid
Curso Práctico De Identificación de Proteínas con Datos de Espectrometría de masas:
Herramientas Bioinformáticas
Motores con los que vamos a trabajar:
• Sequest: Se necesita licencia; desarrollado por Yates y col., comercializado por Thermo en el paquete “Bioworks”.
• Mascot: Disponible en red; desarrollado por Pappin y col., se puede comprar la licencia.
Emplean distintos algoritmos de búsqueda
Abrir BioWorks Browser
Dobleclick
SEQUEST
Fichero de datos como ejemplo : trypmyo01.raw
File Open D:/…/Siena trypmyo01.raw
Modo de trabajo más común, TRIPLE PLAY: Full ms-Zom scan-ms/ms
“Cromatograma”Análisis LC-MS
Display Configuration Settings D:\Siena\Myo1
Previamente hemos creado la carpeta donde se van a guardar los resultados
Qué información tenemos acerca de nuestra muestra?
Complejidad de la mustra
Organismo
Método de digestión
Preparación de la muestra
•Digerido de una única proteína
•Caballo
•tripsina
•No alquilación
Caso más simple: PROTEÍNA ÚNICA
Scan nº 449
Seleccionamos un espectro ms/ms con una “buena calidad”
Actions TurboSEQUEST Search
Selección de parámetros de búsqueda SEQUEST: básicos
Configuration settings
Generamos ficheros.dta a partir del/ los
ficheros .raw
Parámetros de búsqueda
Siena/myo1
449
Resultados SEQUEST
Doubleclick
Cobertura de Secuencia
Nuestro péptido
Calidad de la identificación
Dobleclick
El programa asigna los iones de las series principales en el espectro
El fragmento más intenso no se asigna!?
Conclusión: Muy buena asignación
Hay que tener en cuenta la presencia de iones doblemente cargados
• Identificación de proteínas en la muestra ‘trypmyo01’
• Búsqueda SEQUEST :- Rápida- Máxima cobertura de proteínas
Aumentamos la complejidad: IDENTIFICACIÓN DE PROTEíNAS EN NUESTRA
MUESTRA
Selección de parámetros de búsqueda SEQUEST: básicos
Seleccionamosun rango ampliodel análisis que incluye un alto nºde scans ms/ms
Tenemos la posibilidadde trabajar con DB inde
xadas.
Que supone indexar una base de datos?
Seleccionamos la base de datos (disponibles en red y en Bioworks) Conviene ir actualizando las DB Seleccionamos la proteasa (comúnmente tripsina) Seleccionamos las modificaciones: fijas y/o variables. Depende del tratamiento de la muestra Herramienta disponible en Bioworks: Tools
Trabajar con bases de datos cuyas proteínas están digeridas “insilico”
Aumenta notablemente la rapidez de la búsqueda
Selección de parámetros de búsqueda SEQUEST: advanced
dta generationPrecursor mass 1.4Group scan 1Min group count 1Min ion count 35
Tolerance for dta searchPeptide 1.5Fragment 0.35
Ion seriesa,b,y
OutputReport duplicate ref.
Resultados de la búsqueda SEQUEST
Dtas generados
Proteína conmayor puntuación
Mayor nºde péptidosasignados
Sort Resultados SEQUEST Display Options Sort
Ordenamos lospéptidos por puntuación
Filter Resultados SEQUESTDisplay Options Filter
Seleccionamos sololos péptidos con XC>2
de la proteína con mayorpuntuación
Revisión de la proteina con mayor puntuaciónCobertura de secuencia
Doubleclick
Cobertura de secuencia 89%
Cómo comprobar si un “match” es bueno o malo?Scan 341-356: no es el péptido de la proteína con mayor puntuación pero es el nº1 de los 10 mejores de su lista de SEQUEST
Dobleclick
Listado de los 10 mejores “hits” SEQUEST para #341
Note: XC values‘Ions’
1st mejor “match” por SEQUEST LFTGHPETLEK
Veredicto: asignación correctaTodos los iones mayoritarios se
asignan correctamente a las series principales b- e y”-ion
2nd mejor “match” por SEQUEST LIKEAAGKSNLK
Quedan muchos ionesmayoritarios sin asignar a
las series principales
ConclusionesEspectro
La intensidad del espectro es el primer “filtro”
La mayoría de los espectros de péptidos tienen una distribución
‘bell-shaped’
Ambas series (b- and y-ion) están presentes en el espectro
Buen “match”
Series b- e y-ion contigüas
Todos los picos intensos se corresponden con la secuencia identificada
XC “the bigger the better”
DeltaCN muestra la capacidad de Sequest de discernir entre secuencias
Sp es una puntuación preliminar, “the bigger the better”
RSp value debe ser 1
péptidos +3 en general no son tan ‘bonitos’ como +2
péptidos +1 generalmente son de secuencia corta–el valor diagnóstico es
menor
MASCOT
Trabajamos en red
Formulario a completar: Parámetros de búsqueda
Importante si la red no va bien,Podemos recibir los resultados por
correo
NCBInr: mayor nº de entradasMayor significatividad estadística
Mucho cuidado con las modificaciones:anotar solamente las que conozcamos
su presencia con seguridad
Acepta datos en distintos formatos,ya tenemos creados los ficheros .dta
No es necesario rellenar el resto de lascasillas
Importante para obtener buena tabla de resultados
Resultados de la búsqueda MASCOT
Mejor puntuación
Proteínas con puntuación fuerade la zona de incertidumbre
“Peptide Summary Report” MASCOT
Mejor puntuación a mayornº de péptidos asignados
para la misma proteína
Todas las proteínas conbuena puntuación son
proteínas muy relacionadas
Dobleclick
“Peptide View” MASCOT