Bioinformatica Proteinas

34
PROTEINAS

Transcript of Bioinformatica Proteinas

Page 1: Bioinformatica Proteinas

PROTEINAS

Page 2: Bioinformatica Proteinas

Las proteínasLas proteínas son macromoléculas de masa

molecular elevada, formadas por aminoácidos unidos mediante enlaces peptídicos.

Pueden estar formadas por una o varias cadenas.

Las proteínas son biomoléculas formadas básicamente por carbono, hidrógeno, oxígeno y nitrógeno.

Suelen además contener azufre y algunas proteínas contienen además fósforo, hierro, magnesio o cobre, entre otros elementos.

Page 3: Bioinformatica Proteinas

La unión de un número pequeño de aminoácidos da lugar a un péptido.

oligopéptido: número de aminoácidos <10 polipéptido: número de aminoácidos > 10 proteína: número de aminoácidos > 50

Las proteínas, son las más abundantes de las biomoléculas, pues constituyen más del 50 por ciento del peso seco de las células.

Se forman en el ribosoma a partir de la información suministrada por los genes.

Page 4: Bioinformatica Proteinas

Estructura

Page 5: Bioinformatica Proteinas

Estructura primaria de las proteínas

Se refiere a la secuencia de aminoácidos, al orden y posición de estos.

Los aminoácidos están unidos por enlaces peptídicos (enlaces covalentes).

El orden de aminoácidos le da su especificidad y también influye en la conformación final y en su función.

Este orden es consecuencia de la información del material genético (ADN).

Page 6: Bioinformatica Proteinas

Estructura secundaria de las proteínas

Es el plegamiento que la cadena polipeptídica adopta gracias a la formación de enlaces de hidrógeno entre los átomos que forman el enlace peptídico.

Los puentes de hidrógeno se establecen entre los grupos -CO- y -NH- del enlace peptídico (el primero como aceptor de H, y el segundo como donador de H).

De esta forma, la cadena polipeptídica es capaz de adoptar conformaciones más estables, como:

a) Hélice alfa: En esta estructura la cadena polipeptídica se enrolla en espiral sobre sí misma debido a los giros producidos en torno al carbono alfa de cada aminoácido. Esta estructura se mantiene gracias a los enlaces de hidrógeno intercatenarios formados entre el grupo -NH de un enlace peptídico y el grupo -C=O del cuarto aminoácido que le sigue.

Page 7: Bioinformatica Proteinas
Page 8: Bioinformatica Proteinas

Estructura secundaria de las proteínasb) Hélice de colágeno:

Es una variedad de la estructura secundaria es la que forma el colágeno, que esta presente en tendones y tejidos conectivos, y posee una estructura rígida.

c) Beta laminas o de láminas plegadas:

La forma en beta es una conformación simple formada por dos o más cadenas polipeptídicas paralelas (que corren en el mismo sentido) o antíparalelas (que corren en direcciones opuestas) y se adosan estrechamente por medio de puentes de hidrógeno y diversos arreglos entre los radicales libres de los aminoácidos.

Esta conformación tiene una estructura laminar y plegada, a la manera de un acordeón.

Algunas proteínas conservan su estructura primaria en zigzag y se asocian entre sí estableciendo uniones mediante enlaces de hidrógeno intercatenarios.

Todos los enlaces peptídicos participan en este enlace cruzado, confiriendo así gran estabilidad a la estructura.

Page 9: Bioinformatica Proteinas

PROTEINAS

Proteínas alfa+beta Las hélices y las hebras de las láminas tienden a estar segregadas (no alternadas) en la secuencia. Las láminas tienden a ser paralelas.

Pequeñas proteínas  

Suelen tener menos de 60 aminoácidos. Son pobres en elementos de estructura secundaria. Su estructura tridimensional está frecuentemente estabilizada por puentes disulfuro o por cationes unidos .  

Page 10: Bioinformatica Proteinas

Estructura terciaria de las proteínas• Es el modo en que esa cadena polipeptídica se

pliega en el espacio, es decir, a como se arrolla una determinada proteína globular.

• Es la disposición de los dominios en el espacio.

• La estructura terciaria se dispone de manera que los aminoácidos apolares se sitúan hacia el interior y los polares hacia el exterior.

• Está estabilizada por enlaces covalentes entre Cys, puentes de hidrógeno, interacciones iónicas, interacciones hidrofóbicas y las interacciones de Van der Waals, entre cadenas laterales.

Page 11: Bioinformatica Proteinas

DOMINIOS EN LAS PROTEINASUn dominio de plegamiento es una parte de una proteína cuyos residuos forman pocos contactos con el resto.

Existen proteínas que posen un solo dominio, otras sin embargo, tienen varios.

Los dominios suelen conectarse en un solo punto.

La estructura de cada dominio puede ser cualquiera de las descritas para proteínas monodominio.

Genes que en un organismo dan lugar a varias proteínas pueden, en otro, estar fusionados y codificar una proteína multidominio.

Page 12: Bioinformatica Proteinas

DOMINIOS EN LAS PROTEINAS

Page 13: Bioinformatica Proteinas

Nivel de dominio de las proteínas

• Es una ordenación de fragmentos de estructura secundaria en una estructura terciaria y se estabiliza por enlaces de hidrógeno entre cadenas.

• Se define como una unidad compacta, de características globulares, que suele comprender entre 30-150 aminoácidos y se considera que esta conformación está determinada por la secuencia de aminoácidos.

Page 14: Bioinformatica Proteinas

ESTRUCTURA TERCIARIA DE LAS PROTEÍNAS

Se distinguen dos tipos de estructura terciaria:

• Tipo fibroso en las que una de las dimensiones es mucho mayor que las otras dos. Ejemplo: el colágeno, la queratina del cabello o la fibroína de la seda.

• En este caso, los elementos de estructura secundaria (hélices a u hojas pueden mantener su ordenamiento sin recurrir a grandes modificaciones, tan sólo introduciendo ligeras torsiones longitudinales, como en las hebras de una cuerda.

• Tipo globular, más frecuentes, en las que no existe una dimensión que predomine sobre las demás, y su forma es aproximadamente esférica.

• En este tipo de estructuras se suceden regiones con estructuras al azar, hélice a hoja b, acodamientos y estructuras supersecundarias.

Page 15: Bioinformatica Proteinas
Page 16: Bioinformatica Proteinas

Estructura cuaternaria

• Es la estructura tridimensional completa de una proteína formada por varias cadenas polipeptídicas (subunidades).

• Un ejemplo típico es la hemoglobina, que está formada por 4 subunidades de globina: alfa1, beta1, alfa2 y beta2.

• La mayor parte de la molécula tiene estructura secundaria de alfa-hélice y no hay hoja beta.

• Cada subunidad de globina tiene unido un grupo hemo (una molécula de protoporfirina IX complejada con un ion Fe2+), responsable del color rojo de la hemoglobina y de la sangre.

Page 17: Bioinformatica Proteinas

Modelo de una proteína en 3D

Page 18: Bioinformatica Proteinas

Predicción de Estructura SecundariaPredicción de Estructura Secundaria

Page 19: Bioinformatica Proteinas

Descripción :Predicción de la estructura secundaria (alpha-beta-loop) de una proteína a partir de su secuencia de aminoácidos.

La estructura secundaria se asigna generalmente de forma automática a partir de interacciones no locales, esto es en función de su perfil de puentes de hidrógeno entre los grupos carbonilos y NH del esqueleto o "backbone". 

La mayoría de métodos usan redes neuronales u otros algoritmos que se entrenan con proteínas de estructura secundaria conocida para pasar luego a la predicción. Muchos de estos métodos usan información adicional proveniente, por ejemplo, de alineamientos múltiples.

Page 20: Bioinformatica Proteinas

Métodos de 1a GeneraciónEstos son métodos estadísticos basados en la tendencia que presentan los aminoácidos a adoptar estructuras secundarias.El primero, propuesto por Chou y Fasman en 1974 empleaba estadísticas extrapoladas de las 15 estructuras de proteínas determinadas por rayos-X. Tendencias que se basaban en las propiedades estereoquímicas y fisicoquímicas de los diferentes residuos (casos especiales son glicina y prolina). Este método se ha mejorado aumentando el número de proteínas empleadas. El método presenta una fiabilidad de ~50% (cuando se emplean 62 proteínas para obtener las estadísticas).

Page 21: Bioinformatica Proteinas

Servidores disponibles:Servidores disponibles: PHDsec red neuronal que emplea alineamientos múltiples de secuencias. Fiabilidad ~70%.

Jpred2  dos redes neuronales e información evolutiva (PsiBlast). Versión 2 combina los resultados de 4 redes (JNet, NSSP, Predator, PHD)

PROF Basado en alineamientos múltiples y otras características de los residuos obtenidas de bases de datos. Fiabilidad de ~70%.

PSIpred   usa  perfiles  de  PsiBlast  (filtrando  los  resultados)  y  redes neuronales  (combina  los  resultados  de  varios métodos  de  predicción  de estructura secundaria). Acierto >76%.

SAM-T99 Una red neuronal y perfiles de alineamientos múltiples mejorados mediante el empleo de "Hidden Markov".

SSpro redes neuronales recurrentes y bidireccionales de ventanas fijas y de pequeño tamaño que permiten usar la cadena proteica completa como input.

Page 22: Bioinformatica Proteinas

Predicción de Estructura SecundariaPredicción de Estructura Secundaria

Accesibilidad al SolventeAccesibilidad al Solvente

Page 23: Bioinformatica Proteinas

Objetivo :Objetivo :

Predecir exposición de un residuo al solvente.

La accesibilidad se puede describir de varias formas.

El método mas detallado y rápido calcula la accesibilidad estimando el volumen expuesto al solvente de cada residuo embebido en una estructura (método desarrollado por Connolly y implementado posteriormente en DSSP).

Page 24: Bioinformatica Proteinas
Page 25: Bioinformatica Proteinas

Servidores disponibles:Servidores disponibles:

• PHDPHD• PROFphdPROFphd• JPred2JPred2

PHD y PROFphd (a través de PredictProtein) emplean redes neuronales PHD y PROFphd (a través de PredictProtein) emplean redes neuronales e incluyen información de los alineamientos. Estos dos servidores son e incluyen información de los alineamientos. Estos dos servidores son los únicos que predicen valores reales para la accesibilidad relativa.los únicos que predicen valores reales para la accesibilidad relativa.

JPred2 emplea perfiles de PsiBlast como input para sus redes JPred2 emplea perfiles de PsiBlast como input para sus redes neuronales y devuelve dos estados "buried/exposed".neuronales y devuelve dos estados "buried/exposed".

Page 26: Bioinformatica Proteinas

Predicción de Estructura SecundariaPredicción de Estructura Secundaria

Predicción de Proteínas TransmembranaPredicción de Proteínas Transmembrana

Page 27: Bioinformatica Proteinas

Descripción :Uno de los mayores retos de la proteómica es la determinación de la estructura de proteínas transmembrana, ya que son difíciles de cristalizar y de analizar mediante NMR. De aquí su interés.

Existen dos clases principales de proteínas de membrana : • las que introducen hélices en la bicapa lipídica y, • proteínas que forman poros constituidos por barriles de betas (tipo porínas).

Hasta el momento no existen servidores públicos para este segundo grupo debido a la falta de información experimental. La situación es muy diferente para las hélice transmembrana.

La estructura 3D se puede determinar conociendo la precisa localización de las hélices transmembrana explorando simplemente todas las conformaciones posibles. 

Page 28: Bioinformatica Proteinas
Page 29: Bioinformatica Proteinas
Page 30: Bioinformatica Proteinas

Servidores disponibles:Servidores disponibles: MEMSAT introduce  un  programa  dinámico  de  optimización  para encontrar la mejor predicción basada en preferencias estadísticas

TMAP emplea preferencias estadísticas y perfiles de alineamiento

PHD combina redes neuronales que emplean información evolutiva con programas dinámicos de optimización para mejorar la predicción

DAS optimiza el uso de perfiles hidrofóbicos

SOSUI combinación  de  preferencias  hidrofóbicas  y  anfipáticas  para predecir hélices transmembrana

TMHMM es el mas avanzado de los métodos y aparentemente el de mayor fiabilidad . Implementa la información estadística y estas reglas indicadas en los modelos matemáticos " Hidden Markov" para optimizar las predicciones y la localización y orientación de las hélices

Page 31: Bioinformatica Proteinas

Predicción de Estructura SecundariaPredicción de Estructura Secundaria

EVA : Evaluación de Servidores AutomáticosEVA : Evaluación de Servidores Automáticosde Predicción de Estructura Secundariade Predicción de Estructura Secundaria

Page 32: Bioinformatica Proteinas

EVA : ObjetivosEVA : Objetivos

Continua, automática y estadísticamente significativa evaluación de los servidores de predicción de estructura de proteínas basándose en estructuras ya conocidas.

Métodos que cubre :

Predicciones 1D (estructura secundaria, accesibilidad)

Predicciones 2D (distancias interresiduales)

Predicciones 3D (modelado por homología)

Predicciones 3D (métodos de hilvanado o “threading” restringido a buscar homologías entre secuencias)

Predicción de nuevos plegamientos

Page 33: Bioinformatica Proteinas
Page 34: Bioinformatica Proteinas