Bioinformatica 2014 ORF

37
Identificar genes en secuencias de ADN Problema Biológico

description

estudio superior de procesos bioinformaticos

Transcript of Bioinformatica 2014 ORF

  • Identificar genes en secuencias de ADN

    Problema Biolgico

  • Gramtica? y Gentica?

    El estudio de la gramtica y la preparacin de normas gramaticales han sido, desde los primeros estatutos acadmicos, un complemento imprescindible a la elaboracin de diccionarios: en el diccionario se de-finen las palabras; en la gramtica se explica la forma en que los elementos de la lengua se enlazan para formar textos y se analizan los significados de estas combinaciones.

    http://www.rae.es/obras-academicas/gramatica#sthash.msVo2Ow3.dpuf

  • Elementos de la Gramtica

    Nueva Gramtica de la Lengua Espaola (2009-2011).

    a. morfologa, analiza la estructura de las palabras, su constitucin interna y variaciones.

    b. sintaxis, forma en que se ordenan y combinan.

    c. fontica y fonologa, sonidos del habla y su organizacin lingstica.

  • Sigo sin entender . . .

    Estoy en la clase de Bioinformtica o en la clase de Lengua Espaola

    No se supone que era un electivo.

  • SECUENCIAS PALNDROMAS

  • AACGAACGACTAGCATAGATAGAGATAGACATAGACATAGCATCAGCATCAGCATAGCAGCAGCATAGCATCAGCAGCAGTCTACACAGACATAGATAGATAGCATAGATAGATGATACGATAGACTAGAGATCAGATCAGCACTAGCACTACGACTAGACTAGAGAAGAAACGACTACGAGGACTACGACAGCATCACAC

    Buscar patrones Interpretarlos biolgicamente

  • Proyecto Genoma Humano

    Se tuvo acceso al as letras del libro de la vida.

    Pero desconocamos las reglas gramaticales para poder descifrar la informacin.

    La piedra rosseta de la biologa molecular.

  • http://www.geneprediction.org/book/Comparative.ppt

    Tcnicas para la Bsqueda de Genes

  • ATAGGACTAGACTAGCATAGATGACG

    AACGTGGGAGAGAGAGGAGAGTAGCA

    Podemos identificar

    Genes Limites de exones Sitios de splicing Inicio y fin de la traduccin

    Splicing alternativo Elementos regulatorios

    Objetivos primarios

    Objetivos secundarios

    Mtodos experimentales

    Mtodos computacionales

  • ESTRUCTURA DE UN GEN PROCARIOTICO

    Imagen superior from Purves et al., Life: The Science of Biology, 4th Edition, by Sinauer Associates (www.sinauer.com) and WH Freeman (www.whfreeman.com)

    Promotor CDS Terminador

    transcripcin

    ADN genmico

    ARNm

    Seal Shine-Delgarno5'-TATAAT-3

    Secuencia codificante

    Seal del trmino de la secuencia codificante

    La morfologa

  • La morfologa

  • SEAL CONTENIDO

    RBS (secuencia Shine-Delgarno) secuencia rica en pU, complementaria a 16S rRNA

    Codn de Inicio ATG, (GTG, TTG)

    Uso de Codn dependiente de la especie

    Tercera Posicin del Codn preferencia por un nucletido especfico (G,C)

    Frecuencia k-mers dependiente de la especie

    Codn Termino TGA, TAA, TAG

  • Arch. argent. pediatr. v.108 n.4 Buenos Aires jul./ago. 2010

    ESTRUCTURA DE UN GEN EUCARIOTICOLa morfologa

  • La secuencia Kozac, facilita el reconocimiento de la secuencia de iniciacin AUG, en el proceso de traduccin de los eucariontes.

    La morfologa

  • SEAL CONTENIDOS

    Inicio Transcripcional regiones circundantes a

    Codn Start (CpG islands)

    Codn de Inicio ATG, regiones circundantes

    (Seq Kozak: CCGCCATGG)

    Uso de Codn dependiente de la especie

    Tercera Posicin del Codn preferencia por un

    nucletido especfico (G,C)

    Frecuencia k-mers dependiente de la especie

    5' Splice Junction GT(AAGT)

    3' Splice Junction (Py)12NCAG

    Codn de Termino TGA, TAA, TAG

    Seal Poly-A CAATAA(T/C)

  • Genoma Procaritico

    0.5 10 Mpb

    Alta densidad gnica : >90% regiones codificantes

    Baja frecuencia de secuencias repetitivas

    ORF nico y continuo

  • Facilidad en el anlisis deORF.

    No todos los ORF corresponden a genes verdaderos.

    Genes con ORF cortos y ARN no codificantes (ARN funcionales que no son traducidos) se ven subrepresentados.

  • Genoma Eucaritico

    10Mpb 670 Gpb

    Baja densidad gnica :

  • http://ghr.nlm.nih.gov/glossary=openreadingframe

    ORF

  • http://www.kazusa.or.jp/codon/

    Data source

    NCBI-GenBank Flat File Release 160.0 [June 15 2007].Data amount

    35,799 organisms3,027,973 complete protein coding genes (CDS's)

  • Seales Intrones / Exones

  • Deteccin del Sitio de Splicing

  • human: AAGGGAAGACAGGTGAGGGTCAAGCCCCAGCAAGTGCACCCAG------------ACACC

    chimp: AAGGGAAGACAGGTGAGGGTCAAGCCCCAGCAAGTGCACCCAG------------ACACC

    cow: AAGGGAAGACATTTACGAGTCAAGCCACAGAAAGAGCCCCTGAG-----------GTGCC

    dog: AAAGGAGGACATGTGAGGGCCAAACTACTGAAGGTTCAACCAGG-----------ATGCT

    galago: AAGGGGAGACAGGGGAGGGTCACACCATGGCAGAGG--CCAAG------------ACAGC

    rat: AAAGGAAACAATGGGAAGGTTA-TCAACTCCAAGTATGCCCAAGATCAAGGGAACCCCTT

    mouse: AAAGGAAACCACTGGGAGGTTA-GAAATCACAGGTGCACCCAAGATCAAGGAA--CCCCT

    humanchimpanzee

    cowdog

    mouserat

    chicken galago

    Usar mltiplesgenomas

    incrementa la

    efectividad

    Conservacin de Secuencias en la Evolucin

  • Prediccin de Genes

    aatgcatgcggctatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttggaatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttggaatatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatcctgcggctatgctaatgaatggtcttgggatttaccttggaatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttggaatatgctaatgcatgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcggctatgctaagctcatgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcggctatgctaagctcggctatgctaatgaatggtcttgggatttaccttggaatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttggaatatgctaatgcatgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcggctatgctaagctcatgcgg

    Gen!