Marcadores Genéticos - LGE - Laboratório de Genômica e...

Post on 16-Nov-2018

222 views 1 download

Transcript of Marcadores Genéticos - LGE - Laboratório de Genômica e...

Marcadores Genéticos

Qualquer característica morfológica ou molecular quediferencia indivíduos, e que seja facilmente detectável

Marcadores Morfológicos

É um fenótipo de fácil identificação, normalmente determinado por um único alelo.

Características fenotípicas são utilizadas como marcadores morfológicos desde os tempos de Mendel, como fenótipos de fácil identificação visual

Marcadores Bioquímicos (moleculares)

Baseado na propriedade de migração dasproteínas, as quais podem ser separadas poreletroforese;

Marcadores de DNA (moleculares)

Polimorfismo detectado na seqüência de DNA

� Vantagens:

- Não é objeto de influências ambientais;

- Potencialmente ilimitado em número;

Maior desvantagem é a necessidade de técnicas e equipamentos

mais complexos.

Características Desejáveis

• alto polimorfismo;

• reprodutibilidade;

• amplamente distribuído através do genoma;

• discriminação;• discriminação;

• ausência de influências ambientais;

• barato;

• fácil de mensurar

Tipos de marcadores

• Hibridação– RFLP – (Restriction Fragment Length Polymorphism)

– Minissatélites – VNTR –(Variable Number of Tandem Repeats)

• Amplificação de DNA• Amplificação de DNA– RAPD – (Random Amplified Polymorphic DNA)

– SCAR (Sequence Characterized Amplified Regions) ouASA (Amplified Specific Amplicon)

– Microssatélites –SSR (Simple Sequence Repeats)

– AFLP (Amplified Fragment Length Polymorphism)

RAPD

• Polimorfismo de DNA entre indivíduos pode ser devido a:

– Ausência do sítio do primer.

– Surgimento de um novo sítio.– Surgimento de um novo sítio.

– Ao comprimento da região amplificada entre sítios de primer

• SNPs**

Microssatélites – SSR (SimpleSequence Repeats)

• Significa Seqüências Simples Repetidas, a qual consiste de pequenas seqüências de nucleotídeos (1 a 4) repetidas em tandem.

• Essas seqüências são distribuídas ao acaso no • Essas seqüências são distribuídas ao acaso no genoma e constituem a classe de marcador mais polimórfica hoje disponível

• Primers específicos (20 a 30 pb).

• Diferentes números de elementos simples repetidos.

• Cada segmento amplificado de tamanho diferente representa um alelo diferente do mesmo locomesmo loco

•Requer biblioteca de

fragmentos genômico para

o organismo de interesse

Genótipos na eletroforese

http://tandem.bu.edu/trf/trf.intermediate.submit.html

SNPs

• A Single Nucleotide

Polymorphism, ou SNP ("snip"):

– pequena mudança, ou– pequena mudança, ouvariação, que pode ocorrernuma sequência de DNA emuma porção significativa (maisde 1% ) de uma população.

Single Nucleotide Polymorphism

• SNPs são as mais frequentes formas de variações genéticas

– 90% das variações genéticas humanas vêm dos SNPsSNPs

– SNPs ocorrem a cada 300~600 nucleotídeos

• SNPs tem se tornado marcadores de preferênciapela sua grande abundância e pelodesenvolvimento de tecnologias de genotipagemem larga escala

Single Nucleotide Polymorphism

• SNPs são alterações no DNA que se mantém nas gerações futuras

– SNP: variação >1%

– Mutação: variação <1%– Mutação: variação <1%

C T T A G C T T

C T T A G T T T

SNP

C T T A G C T T

C T T A G T T T

Mutação

94%

6%

99.9%

0.1%

De onde vem essas variações?

• variações nas sequências são resultados de mutações TAAAAAT

TAACAAT

TAAAAAT

• SNPs foram mutações que se propagaram ao longo de gerações

TAAAAAT TAAAAAT TAACAAT TAACAAT TAACAAT

TAAAAAT TAACAAT

Mutações and SNPs

Variações genéticas

observadasMutaçõesSNPs

Ancestral comum

tempo presente

Não-codificantes

Codificantes

SinônimasNão-

sinônimas

Classificação de SNP

sinônimas

conservativasNão-

conservativas

podem modificar a

estrutura e a estabilidade do

RNA mensageiro

Aplicações dos SNPs

• Genotipagem - padrões de SNP

• Pesquisas em desenvolvimentos de drogas

• São marcadores para identificar genes e diferenças genéticas que podem determinar a diferenças genéticas que podem determinar a resposta de pacientes a uma doença ou tratamento.

• Descoberta e mapeamento de genes

• Diagnóstico ou perfil de risco

• Encontrar o par perfeito

Encontrando SNPs:

Mineração de SNPs baseados no sequenciamento

mRNA

cDNALibrary

Genomic

BACLibrary

RRSLibrary

Sequenciamento

De DNA

Library

ESTOverlap

Library Library

BACOverlap

ShotgunOverlap

Fragment DNA

DNA from multiple individuals

Encontrando SNPs:

Mineração de SNPs baseados no sequenciamento

Sequence and Reassemble (known sequence) Assembly with other overlapping

GTTACGCCAATACAGGATCCAGGAGATTACCGTTACGCCAATACAGCATCCAGGAGATTACC

From overlap identify mismatches = SNPs

Base-calling Contig assembly

Polymorphism detection

PolyPhred

Consed

Sequenciamento Phred PhrapAmplificação do DNA5’ 3’

Vários indivíduos

Sequence viewing

Polymorphism tagging

Relatório de polimorfismosGenotipagem individual

Consed

Analysis

Análise filogenética

Homozigoto

C/C

Heterozigoto

C/TC/T

Homozigoto

T/T

Alinhamento multiplo ancorando os fragmentos na sequência de referência

Etapas do PolyBayes

Filtro de parálogos: excesso de mismatchs levando em conta os valores de qualidade

fragmentos na sequência de referência

Detecção de SNPs -> diferença entre verdadeiros polimorfismos e erros de sequenciamento utilizando valores de qualidade

Identificação de SNPs com o QualitySNP

• Análise das informações do agrupamento

• Detecção dos SNPs (todos os SNPs potenciais bi, tri e tetra alélico)

• Filtro dos dados

• Detecção dos haplótipos• Detecção dos haplótipos

• Detecção dos SNPs sinônimos e não sinônimos com o fasty (blastx)

• Identificação do KaKs

• Geração dos dados e transferência para um banco de dados

• Interface para recuperação dos dados

Reconstrução dos Haplótipos com o qualitySNP

• Grupo de sequências num cluster que representa o mesmo alelo de um gene

• Tem o mesmo nucleotídeo no sítio polimórfico

• Utiliza métodos matemáticos para minimizar falsas contruções de haplótipos causados por erro de sequenciamento

Identificação dos SNPs sinônimos e não-sinônimos

• Fasty para alinhamento com o UNIPROT

– Permite frameshifts entre os códons

– Produz melhores alinhamento com sequências de qualidade ruim

• Seleciona primeiro hit• Seleciona primeiro hit

• Detecta a ORF

• Corrige possíveis frameshifts

• Detecta sSNP/nsSNP e SNPs ou INDELs em região UTR

haplótipos

-A C T T T G C T C- C T CHaplotype 1

SNP1 SNP2 SNP3

-A C T T A G C T T-

-A A T T T G C T C-

-A C T T T G C T C-

Haplotype 2

Haplotype 3

C A T

A T C

C T CHaplotype 1

SNP1 SNP2 SNP3

Blocos de haplótipos

• Dentro de um bloco haplótipo, acontece pouca ou nenhuma recombinação

• Os SNPs dentro de um bloco haplótipo tendem a ser passados juntos nas gerações posterioresa ser passados juntos nas gerações posteriores

• Dentro de um bloco haplótipo, um pequeno subconjunto de SNPs (Tag SNPs) é suficiente para distinguir cada haplótipo

– Então será preciso utilizar apenas os Tag SNPs para genotipar ao invéz de usar todos os SNPs no bloco haplótipo

Zonas de recombinação e Blocos de haplótipos

Recombinationhotspots

P1 P2 P3 P4

S1

S2

S3

S

Haplotype patterns

Chromosome

Haplotypeblocks

S4

S5

S6

S7

S8

S9

S10

S11

S12

SNP loci

: Major allele

: Minor allele

Exemplos de Tag SNPs

P1 P2 P3 P4

S1

S2

S3

Haplotype patterns

� Desejamos distinguir um haplótipo desconhecido

� Podemos genotipar todos os SNPs para

Amostra desconhecida

S4

S5

S6

S7

S8

S9

S10

S11

S12

SNP loci

� Podemos genotipar todos os SNPs para identificar a amostra desconhecida

: Major allele

: Minor allele

Examples of Tag SNPs

P1 P2 P3 P4

S1

S2

S3

Haplotype pattern

� Não é necessário genotipar todos os SNPs

� SNPs S3, S4, e S5 podem formar um grupo de tag SNPs.

S4

S5

S6

S7

S8

S9

S10

S11

S12

SNP loci

grupo de tag SNPs.

P1 P2 P3 P4

S3

S4

S5

Exemplos de Tag SNPs errados

P1 P2 P3 P4

S1

S2

S3

Haplotype pattern

S4

S5

S6

S7

S8

S9

S10

S11

S12

SNP loci P1 P2 P3 P4

S1

S2

S3

Exemplos de Tag SNPs

P1 P2 P3 P4

S1

S2

S3

Haplotype pattern

� SNPs S1 e S12 podem formar um conjunto de tag SNPs

� Este é o menor conjunto de SNP nesse exemplo

S4

S5

S6

S7

S8

S9

S10

S11

S12

SNP loci

P1 P2 P3 P4

S1

S12

Taxa de Evolução

Para inferir uma taxa de evolução a um gene são estimados o KA e o KS

KA - é a relação entre substituições não sinônimas e KA - é a relação entre substituições não sinônimas e todos os possíveis sitios não sinônimos

KS – é a relação entre substituições sinônimas e todos os possíveis sítios sinônimos

• Exemplo:

• Prolina:

– CCT

– CCA

– CCG– CCG

– CCC

• Um sítio sinônimo e dois não sinônimos

KA/KS (dn/ds)

A taxa KA/KS é uma medida clássica da evolução de maneira global num gene

KA/KS << 1 indica que uma substancial proporção de mudanças de aminoácidos devem ter sido eliminadas por seleção de purificação. seleção de purificação.

KA/KS > 1 indica seleção adaptativa ou positiva

• A taxa de KAKS em humanos e chimpanzes é de 0,23.

• Assumindo que mutações sinônimas são neutras, esseresultado implica que 77% das alterações de aminoácidos emgenes hominideos são suficientemente deletérias e sãogenes hominideos são suficientemente deletérias e sãoeliminadas por seleção natural. Como mutações sinônimasnão são totalmente neutras, a proporção de alterações deaminoácido neutras com consequências deletérias deve sermaior

KaKs_calculator - Métodos

• NG: Nei, M. and Gojobori, T. (1986) - Faster• LWL: Li, W.H., et al. (1985) • LPB: Li, W.H. (1993) and Pamilo, P. and Bianchi, N.O. (1993) • MLWL (Modified LWL), MLPB (Modified LPB): Tzeng, Y.H., et

al. (2004) • YN: Yang, Z. and Nielsen, R. (2000) • YN: Yang, Z. and Nielsen, R. (2000) • MYN (Modified YN): Zhang, Z., et al. (2006)• GY: Goldman, N. and Yang, Z. (1994) • MS (Model Selection), MA (Model Averaging): based on a

set of candidate models defined by Posada, D. (2003) as follows.

Aula Prática

• Montar Ests com sequência

• Encontrar prováveis SNPs

• Visualizar cromatograma para validar e identificar homozigotos de heterozigotos

• Definir haplótipos• Definir haplótipos

• Definir tag SNPs

• Caracterizar – snSNP ou sSNP; CDS; Transição ou transversão;

• Desenhar sondas para separar haplotipos e genotipar