Meu Guia TNT Oficial Anexo 3 (1)

Como citar: Simões, Tiago R. (2012). Descrição de novos espécimes e posicionamento filogenético das

espécies mais antigas de Squamata da América do Sul - Anexo III. Dissertação de Mestrado. Museu

Nacional/UFRJ, Rio de Janeiro. 195pp (atualizado em Janeiro, 2015).

166

ANEXO III

Guia para o software T.N.T.

Este guia foi desenvolvido ao longo da disciplina de “Sistemática Filogenética” e durante as

fases de análise cladística desta dissertação, tendo como intuito servir de auxílio aos

comandos fundamentais do programa T.N.T. para iniciantes com este software. Este anexo

contou com o auxílio de Natasha Picciani para revisão do texto.

I - Instalação:

O T.N.T. é disponibilizado gratuitamente para download no site da Willi Hennig Society:

http://www.cladistics.org O programa não requer instalação, sendo necessário apenas

executá-lo para poder utilizá-lo. No entanto, recomenda-se que a pasta contendo o programa

seja alocada dentro do diretório “Arquivos de programas” ou “Program files” do Windows

para que os arquivos de extensão .T.N.T. possam ser abertos diretamente com o programa.

II- Importando uma matriz de dados:

Em "File":

"Open input file": selecione o arquivo da matriz em formato de texto (.txt) ou formato T.N.T.

(.T.N.T.). Utilize editores de matrizes que permitam abrir e salvar dados em múltiplos

formatos (Nexus, T.N.T., texto, etc), permitindo que bases de dados de qualquer proveniência

possam ser rapidamente incorporados e editados para serem utilizados no T.N.T..

Recomendado: Mesquite (MADDISON & MADDISON, 2011), disponível gratuitamente

em: http://mesquiteproject.org

http://www.cladistics.org/

http://mesquiteproject.org/




167

III – Salvando o trabalho:

A - Salvando os procedimentos realizados no T.N.T. em formato de texto (.txt):

Em “File”:

1 – Ir em “Output” > “Open output file”. Cria arquivo log (.out)

2- Clique em “Save display buffer” para salvar todos os comandos realizados (armazenados

temporariamente na memória buffer do programa). Ele será salvo no arquivo output (.out)

criado e pode ser aberto pelo bloco de notas.

3 – Clique em “Close output file” após salvar todos os dados desejados. O arquivo de texto

só poderá ser aberto após este procedimento.

Mesmo que o arquivo .out não tenha sido criado desde o início do trabalho, todas os

procedimentos realizados e em exibição no display do T.N.T. serão salvos quando o

procedimento “Save display buffer” for realizado.

B - Editando e salvando (exportando) alterações na matriz (em formato Nexus):

Todos os dados alterados na matriz, como nome de táxons/caracteres ou os estados de caráter,

grupo externo, dentre outros, podem ser editados e salvos no próprio T.N.T. no formato

Nexus, para que possam ser reabertos e editados posteriormente em um editor de matrizes.

Mas veja considerações abaixo:

Em “Data” > “Edit data”

>“Data” > “Export (Nexus format)”

C - Editando e salvando o projeto em arquivo de formato T.N.T. (.T.N.T.):




168

Salva as alterações das configurações da matriz, incluindo as propriedades dos caracteres,

táxons ativos/inativos, “step-matrix costs”, árvores encontradas, entre outros. Este método

costuma ser mais eficiente do que salvar as alterações em formato NEXUS, pois o formato

NEXUS pode ser interpretado com erros ao ser aberto no T.N.T. e os arquivos NEXUS

exportados pelo T.N.T. muitas vezes são abertos com erros em programas de edição de

matrizes, como o NDE. Salvar alterações nos dados em formato .T.N.T. garante que ele seja

aberto pelo T.N.T. e também é reconhecido pelo Mesquite.

Em “Data” :

>“Save data”

D – Salvando os comandos e opções dos menus utilizados durante a análise:

Em “Settings”

> “Batch” > “Set menus to batch”

As ações então podem ser visualizadas, salvas e re-executadas através das seguintes opções

do sub-menu “Batch”:

> “Show actions stored”

> “Sabe actions to file”

> “Execute”

IV - Formato dos dados:

Em “Format”:

> “Data Format” – permite definir os tipos de estados (nucleotídeos, aminoácidos) ou o

número total de estados possíveis:

Modo DNA e proteínas: códigos da IUPAC

Modo 16 estados: 0-9 estados, e os estados de 10 a 16 definidos pelas letras A-F

Modo 32 estados: 0-9 estados, e os estados de 10 a 32 definidos pelas letras A-V




169

V - Caracteres:

A - Exibindo e editando as propriedades dos caracteres discretos

Em “Data”:

“Character settings” para editar e “Show character status” para exibir as configurações

ativas no momento:

Em “Character settings”:

> “of weight”- Adiciona peso diferente ao caráter selecionado.

> “step-matrix of costs” – Define um custo (peso) para determinadas transformações de

estados.

> “ancestral (force root states)” – Define que o estado presente no grupo externo para um

dado caráter (Ex: 0) permaneça fixo como o estado ancestral. Isto não traz diferenças na

análise quando todas as transformações têm pesos iguais. Porém, em um caráter onde o

estado do grupo externo seja, por exemplo, 0 e este mesmo caráter tiver uma transformação 1

–> 0 como tendo maior peso do que a 0 –> 1, este procedimento garante que, apesar deste

peso maior, a transformação 0 –> 1 continue sendo sempre a que ocorre entre o grupo externo

e o grupo interno. Em outras palavras, garante o estado 0 para o grupo externo, mas mantém a

maior probabilidade de uma transformação 1 –> 0 dentre táxons do grupo interno. Isso é de

particular importância para o estudo de caracteres moleculares, onde aplica-se maior peso

para transformações de nucleotídeos que costumam ocorrer com maior freqüência: transições

(conversões de uma purina em outra purina, ou uma pirimidina em outra pirimidina) são mais

frequentes de ocorrerem do que transversões (onde uma purina se converte em uma

pirimidina, ou vice-versa).

Default - T.N.T. considera todos os caracteres como sendo ativos e não-aditivos.

B - Caracteres contínuos: Não são transcritos na forma de caracteres discretos pelo

programa. Além disso, muitas das configurações disponíveis para se editar as propriedades

dos caracteres em "Character settings" não se aplicam aos caracteres contínuos. São um caso




170

especial onde são possíveis 0 – 65 estados de caráter, com até 3 casas decimais. Por exemplo,

eles são sempre considerados como ordenados, sem opção de mudança. Não são editáveis

pelos menus, apenas pela linha de comando. A padronização do peso dos caracteres quando

todos têm o mesmo peso (default – “Implied weights”) não afeta este tipo de caráter. Devem

ser sempre os primeiros caracteres listados numa análise.

O programa de edição de matrizes Mesquite não exporta matrizes com dados contínuos para

o T.N.T.. Em função disso, os dados contínuos devem ser inseridos separadamente no

arquivo .T.N.T. criado ao se exportar os dados discretos criados no Mesquite. Abra o arquivo

.T.N.T. no bloco de notas e insira os dados dos caracteres contínuos. Eles devem ser inseridos

em um bloco de caracteres a parte, produzindo a seguinte configuração final da matriz:

Em uma matriz com 9 caracteres (4 contínuos e 5 discretos) e 4 táxons:

nstates cont;

xread

9 4

&[cont]

Taxon1 4.145-5.248 0.77-0.823 0.093-0.107 0.058-0.077

Taxon2 2.917-3.274 0.723-0.803 0.023-0.032 0.11-0.134

Taxon3 4.598-5.309 0.708-0.776 0.102-0.114 0.032-0.04

Taxon4 1.336-1.424 0.616-0.657 0.056-0.074 0.029-0.042

&[num]

Taxon1 00000

Taxon2 01000

Taxon3 01110

Taxon4 01010

;

proc /;

comments 0

;




171

VI - Pesagem de caracteres:

Em “Settings”

“Implied weighting”:

> “Based on prior weights only”- Pesos pré-definidos ao se importar o arquivo com a

matriz de dados. Se pesos não tiverem sido atribuídos previamente, o T.N.T. atribui pesos

iguais a todos os caracteres (default).

> ”Using implied weights”- Ativa os pesos implícitos configurados no próprio T.N.T.: os

pesos atribuídos aos caracteres ou aos passos internos extras em “Data” > “Character

Settings”.

> “Weighting state transformations” - O programa irá gerar o peso dos caracteres

baseando-se na frequência de transformações deles em cada árvore. Quanto mais vezes ele

aparecer de maneira independente (homoplástica), menor peso relativo ele terá.

* O ícone “Set parameters” apesar de permanecer ativo em todas as seleções, atua somente

sobre o critério “Weighting state transformations”, se este for selecionado.

VII – Táxons

Para determinar quais táxons estão ativos:

Em “Data”:

> Taxa > selecione táxons que se deseja desativar (excluir da análise).

> Show táxon status > permite ver nominalmente os táxons ativos e inativos no momento.

“Contraint taxa”




172

Para forçar um grupo de táxons como um grupo monofilético antes de se realizar qualquer

análise, é necessário utilizar-se a linha de comando. Após realizar-se pelo menos uma rodada

de análises, pode-se escolher quais os táxons a se forçar um monofiletismo selecionando-os

em uma das árvores armazenadas na memória buffer após a análise realizada. Porém, para

realizar a primeira opção, digite na linha de comando:

Force+[A B C]

A, B e C acima representam os nomes dos táxons que se deseja incluir neste grupo de

“constrained taxa”, e devem ser separados entre si por espaço. Alternativamente, pode-se

inserir o número destes táxons na matriz.

Exemplo: Caso a matriz seja composta por:

Taxon 0: Sphenodon

Taxon 1: Kuehneosaurus

Taxon 2: Huehuecuetzpalli

Posso delimitar estes táxons através do comando:

> Force+[0 1 2]

Para criar um subgrupo de táxons flutuantes dentre este grupo monofilético, coloca-se os

mesmos entre “( )”

> Force+[A B C (D E)]

Para formar uma constraint negativa (forçar certos táxons como não monofiléticos):

> Force-[A B C]

“Constraint” de táxons como monofiléticos em árvores presentes na memória

Como mencionado acima, pode-se constringir táxons como um grupo monofilético

selecionando-os em árvores obtidas em rodadas anteriores de análises pelo T.N.T.. Esta é

geralmente a maneira mais prática, e também permite a seleção de um número grande de

táxons, algo que por muitas vezes não é possível de se realizar pela linha de comando. Isto é




173

importante em algumas situações, como por exemplo, ao se utilizar buscas do tipo “Sectorial

Search” (ver abaixo para uma explicação deste método). Isto ocorre porque ao se utilizar este

método de busca, e dentro dele, utilizar as árvores armazenadas na memória RAM de buscas

anteriores como árvores iniciais da análise, o T.N.T. poderá pedir que se realize o

“constraint”dos táxons para esta busca. Para realizar isso:

Em “Data”:

> “Define constraints”

No quadrante “for monophyly”, selecione o ícone “tree number”. Deste modo, você estará

solicitando que ele utiliza “constraints”de certos grupos à partir de uma determinada árvore

presente na memória RAM. Caso não se deseja atribuir nenhuma “constraint” para a análise

(manter a análise livre de qualquer pré-concepção em termos de hipóteses de monofiletismo),

selecione uma árvore qualquer dentro de “tree number” (exemplo: árvore 0) e depois clique

em:

> “Use selected groups” – será aberta uma janela com a árvore selecionada (e.g. árvore 0) e

nela você deverá selecionar o grupo que se deseja manter como monofilético. Clique no nó

mais basal da árvore (na bifurcação entre o se grupo externo e o seu grupo interno). O nó

ficará vermelho. Após isso clique OK. Você retornará a janela inicial, e clique OK nela

também. Desta forma, você constringiu como monofilético o grupo formado por todos os

táxons da sua análise, incluindo o grupo externo. Na prática isso representa 0 “constraints”, já

que todos os táxons poderão se agrupar de qualquer forma com outros táxons dentro da sua

análise. Isso poderá ser confirmado pela mensagem que aparecerá no programa logo após

clicar o último OK:

“ 0 negative constraints”

“ 0 positive constraints”

“ 0 tree-constraints”

Caso deseja-se, de fato, fixar certos grupos como monofiléticos. Ao invés de selecionar o nó

mais basal na etapa anterior, selecione o grupo em questão que se deseja manter como

monofilético.

* Usando constraints para buscas




174

Ao executar buscar, deve-se reforçar as “constraints” pelo ícone “Enforce constraints”

dentro do menu de opções de cada tipo de busca (“Implicit enumeration”, “Heuristic Search”

e “New Technology Search”)

VIII - Buscas

A - Buscas exatas:

Para análise de matrizes com número de táxons limitados, mas que garante encontrar a(s)

árvore(s) mais parcimoniosa(s) (AMPs) existente(s). No T.N.T. o mecanismo oferecido é o

de “Implicit enumeration”, limitado à 15 – 30 táxons (HOVENKAMP, 2004)

Em “Analyze”:

> “Implicit Enumeration” – equivalente ao branch-and-bound do PAUP*

B - Buscas heurísticas tradicionais:

Levando-se em conta uma matriz de dados com mais do que apenas alguns poucos táxons

(Ex: mais de 10 táxons), os programas de análise filogenética precisam fazer uso de buscas

não exatas, ou heurísticas, para conseguirem realizar a análise dentro de um período de tempo

viável para a pesquisa. Estas buscas consistem em dois passos: a obtenção de uma árvore

filogenética inicial (por “stepwise addition”) e o subseqüente rearranjo (ou “swapping”)

de seus ramos de forma aleatória, onde se busca encontrar por tentativa e erro uma árvore tão

ou mais parcimoniosa quanto à árvore inicial obtida. O T.N.T. realiza esta tarefa através dos

seguintes procedimentos:

Em “Analyze” > “Traditional search” – busca heurística equivalente à busca por branch

swapping do PAUP*,

1 – Obtendo-se uma árvore inicial.




175

Stepwise addition – Esta metodologia computacional (algoritmo) permite que se crie uma

cladograma inicial entre 3 táxons terminais. Posteriormente, é adicionado a este cladograma

em desenvolvimento táxon a táxon, de acordo com uma ordem pré-determinada, até finalizar-

se o processo e obtermos uma árvore inicial completa. As árvores filogenéticas construídas

por este método são denominadas árvores de Wagner.

A escolha dos 3 táxons iniciais, o critério para a ordem de inclusão dos outros táxons e qual o

ramo do cladograma em construção ao qual eles são inseridos são fundamentais para o

resultado final da análise. Alguns métodos foram desenvolvidos para tal tarefa, com o método

de adição aleatória de táxons (random addition sequence - RAS) o preferido pelo T.N.T.:

RAS (Random addition sequence) – Neste processo a ordem de inclusão dos táxons

terminais é determinada de forma aleatória antes mesmo de a análise começar. Cada

novo táxon será adicionado a algum ramo da árvore em construção de modo aleatório.

Quanto maior o número de replicações (default = 10), maior a probabilidade de se

encontrar as melhores árvores. Número de replicações sugerido = 1.000.

Árvore pré-existente na memória RAM – também é possível de se obter uma árvore

inicial dentre árvores mais parcimoniosas armazenada na memória RAM do programa

proveniente de uma análise anterior. Para tal, utilize as árvores salvas em formato .tre

de análises anteriores abrindo o arquivo .tre onde elas estão armazenadas.

Em todos estes métodos de “stepwise addition”, novos táxons são acrescentados em

diferentes ramos, mas, uma vez adicionados, o algoritmo não voltará atrás. Mesmo que

existam árvores mais curtas que poderiam ser descobertas através do rearranjo de árvores

menos parcimoniosas (ou sub-ótimas) o algoritmo não seria capaz de identificá-las e seguir

este caminho, como ocorre na “implicit enumeration” (ou “branch-and-bound”). Isto faz com

que algumas das árvores mais curtas NUNCA sejam encontradas nesta análise, pois a ordem

definida aleatoriamente para a inclusão dos táxons (RAS) impede que certas topologias sejam

alcançadas. Ou seja, cada RAS terá um conjunto finito de árvores mais semelhantes entre si

possíveis de se alcançar - as ilhas de árvores (Fig. 1). Uma ilha de árvore é definida como um

conjunto de árvores conectadas entre si (separadas por apenas um “passo” de distância) e




176

separadas de outras ilhas por árvores com maior número de passos (MADDISON, 1991).

Desta forma, os programas de análise filogenética ao esbarrar nas árvores mais longas

interrompem a busca por árvores mais curtas naquele sentido, tornando a análise limitada ao

conjunto de árvores constituintes de uma ilha. Por isso, os programas realizam novas e

múltiplas análises ao mesmo tempo utilizando o mesmo conjunto de dados (replicações)

alterando em cada uma a ordem aleatória dos táxons adicionados para poder enxergar todas

as ilhas de árvores possíveis, cada ilha com uma ou algumas árvores inicias mais curtas. Ou

seja, ter diferentes pontos de partida para se obter a maior variedade possível de ilhas dentro

do universo de árvores possíveis.

Figura A.1. Duas ilhas de árvores (discos claros) separadas por árvores de maior número de passos

(áreas cinzentas) – (MADDISON, 1991).

2 - Algoritmos de rearranjo de ramos utilizados (“swapping”):

Uma segunda etapa na estratégia de se encontrar árvores mais parcimoniosas em ilhas de

árvores distintas é a realização de rearranjos de ramos de maneira aleatória dentre as árvores

iniciais, buscando-se encontrar ao acaso uma combinação de ramos que produza uma árvore

ainda mais curta do que as demais encontradas. Para esta finalidade, existem três algoritmos

disponíveis no T.N.T.:

Nenhum – as árvores finais mais parcimoniosas são as árvores de Wagner mais curtas

(sem “swapping”).




177

SPR (Subtree Pruning and Regrafting) – equivalente ao “global rearrangements”

do PHYLIP.

TBR (Tree bisection and reconnection) – equivalente ao “branch breaker” do

Hennig86.

O mecanismo utilizando RAS + TBR realiza buscas com resultados consistentes em análises

de até 100 táxons. Acima deste valor, a análise levará um tempo exponencialmente maior (na

escala de semanas ou meses) para recuperar todas as AMPs.

C - Buscas heurísticas utilizando novas tecnologias:

Apesar de tornar buscas de matrizes amplas possíveis, o mecanismo de RAS + TBR ainda

apresenta significativas limitações na medida em que matrizes com uma larga base de dados

(Ex: com mais de 100 táxons) podem facilmente apresentar um grande número de árvores de

Wagner e de ilhas de árvores que não podem ser totalmente analisadas por análises

tradicionais de RAS+TBR em um tempo viável, dificultando a análise final (GOLOBOFF,

1999). Isto ocorre porque cada setor do cladograma de árvores com mais de 40 – 50 táxons

(Fig. 2) terá sua configuração ótima (menor número de passos) encontrada em árvores

distintas. Cada uma destas árvores, por sua vez, pode estar localizada em “ilhas de árvores”

distintas. Por isso, para dados extremamente amplos, um grande número de replicações por

RAS não é o suficiente para se vasculhar todo o universo de ilhas de árvores possível. Para

solucionar isto, é necessário que cada setor das árvores encontradas ao longo da análise seja

analisado independentemente do resto da árvore e que suas topologias ótimas sejam

combinadas em uma única AMP. Por isso, O T.N.T. lança mão de um conjunto de quatro

algoritmos que permitem isolar e analisar cada setor das árvores mais parcimoniosas de

maneira independente. Além disso, as árvores mais parcimoniosas encontradas por

“swapping” (e.g. RAS+TBR) diferem pouco das árvores iniciais utilizadas e raramente levam

a um novo conjunto de árvores mais curtas (GOLOBOFF, 1999), tornando os novos

algoritmos mais eficientes para se encontrar árvores mais curtas mesmo em análises de

matrizes que poderiam teoricamente ser analisadas apenas por buscas heurísticas.




178

Figura A.2. Um cladograma e seus diferentes setores constituintes (GOLOBOFF, 1999).

Os quatro algoritmos extras utilizados pelo T.N.T. que permitem os avanços citados em

análises com um grande número de dados (100 táxons ou mais) são:

Ratched (RAT) – Durante a fase de “swapping” (TBR), ele realiza perturbações nas árvores

de Wagner previamente encontradas, altera o peso dos caracteres e depois procura por

árvores mais parcimoniosas do que aquelas sendo utilizadas na fase de swapping. Estas fases

de perturbação são de três tipos: (O – original weight) mantendo o peso original; (U – upper-

weight) aumentando o peso de certos caracteres; ou (D - under-weight) diminuindo o peso

dos caracteres, alternando cada uma com uma fase de busca (S – search) por árvores

melhores dentre as possíveis novas árvores geradas. A sequência fica sendo: O, S, U, S, D, S,

O, S, D, S... Estas perturbações e buscas são realizadas até um certo limite de substituições

feitas ou até que uma determinada porcentagem do processo de rearranjo já tenha sido

realizada, ambas podendo ser definidas pelo usuário.

Tree-Drifting (DFT) – Método de perturbação das árvores semelhante ao “Ratchet” e

também ocorre simultaneamente ao processo de rearranjo de ramos. Porém, ao invés de re-

calibrar o peso dos caracteres, ele calcula a diferença de “fit” entre as árvores sofrendo

“swapping” naquela etapa do processo de rearranjo e a árvore seguinte sendo produzida. Com

esta medida, o programa só irá permitir a realização de rearranjos de ramos que gerem novas

árvores mais parcimoniosas ou árvores sub-ótimas dentro do limite estabelecido por este fit,

sendo ambas armazenadas temporariamente na memória RAM do programa. Por ter um




179

armazenamento de dados na memória mais “fácil” do que o “Ratchet”, o “Tree-Drift” pode

ser utilizado como um mecanismo de perturbação das árvores juntamente com o “Sectorial

Search”.

O “fit” é um índice que se apresenta de duas formas: o “fit” absoluto e o “fit” relativo. A

diferença entre dois “fits” absolutos é obtida pelo cálculo da diferença no número de passos

entre dois cladogramas, enquanto a diferença entre “fits” relativos (RFD) entre dois

cladogramas A e B é calculado pela fórmula: RFD = (F-C)/F, aonde F é a soma da diferença

entre o número de passos dos caracteres que são mais parcimoniosos ao cladograma A do que

o cladograma B; e C a soma dos caracteres que são mais parcimoniosos no cladograma B em

relação ao A (GOLOBOFF & FARRIS, 2001).

Sectorial searches (SS) – É um tipo especial de rearranjo de ramos das árvores. O programa

seleciona, de modo aleatório, ou definido por um critério do usuário, certos setores de uma

árvore já existente. Uma re-análise isolada deste pequeno conjunto de dados é feita,

utilizando-se RAS+TBR e, se uma nova combinação dos táxons com menor número de

passos for encontrada, esta irá substituir a original na árvore da qual ela foi retirada. Se um

número X de substituições forem feitas em uma mesma árvore, esta passará por um novo

processo de rearranjo por TBR após a “Sectorial search” se completar.

Nas configurações da "Sectorial search" o tamanho de cada setor (número de táxons em cada

um) que será reanalisado pode ser definido pelo usuário, assim como o número X de

substituições necessárias para se realizar um novo “Global rearrangement” (rearranjo de

ramos) na árvore obtida.

Conjuntos de dados extremamente amplos e complicados geralmente apresentam regiões

mais conflituosas dentre as árvores obtidas. O objetivo do “Sectorial search” é buscar e

resolver estas áreas de conflito. Portanto, buscas randômicas (random sectorial searches -

RSS) por setores a serem re-analisados não é o processo ideal para estes tipos de dados, por

ser menos eficiente. É então realizada uma busca definida pelo usuário, utilizando uma

análise de consenso (consensus-based sectorial search – CSS). Nesta, uma árvore de

consenso é calculada dentre os cladogramas mais parcimoniosos obtidos até então. As áreas




180

de maior conflito serão então expostas na forma de politomias, tendo então os setores com

estas áreas mais conflitantes selecionados para a busca setorial. Por último, há a opção de

uma busca setorial mista (mixed sectorial search – RSS + CSS). Neste tipo, cada replicação é

feita utilizando-se o procedimento RAS + SPR. Ao final de cada réplica, é produzida uma

árvore de consenso desta com a obtida anteriormente (como na CSS), com as áreas de

consenso sendo constringidas e então encaminhadas para um rearranjo de ramos por TBR.

Este processo se repete ao final de cada réplica e, ao se obter as árvores finais, as zonas de

constrição são abandonadas e uma RSS é realizada com todas as árvores.

Tree-fusing (TF) – No “Tree-fusing”, subgrupos (com 5 ou mais táxons) e com a mesma

composição em duas árvores diferentes são transferidos de uma destas árvores (árvore fonte)

para uma árvore alvo. Estas mudanças são realizadas utilizando o algoritmo de “down pass”

(GLADSTEIN, 1997), que permite calcular o número de passos da árvore resultante desta

fusão entre o subgrupo transferido e a árvore alvo. Múltiplos subgrupos são transferidos entre

as árvores, gerando novas árvores mais parcimoniosas e mais próximas de um padrão ótimo

global. Mecanismos de rearranjo de ramos são então realizados nestas novas árvores, para

encontrar padrões ainda mais parcimoniosos. Os melhores resultados deste método foram

obtidos utilizando-se vários subgrupos de diversas árvores simultaneamente.

Após o término da análise, o T.N.T. informa o número de replicações que obtiveram as

árvores mais parcimoniosas. Se este representar uma grande parte do número total de

replicações (Ex: 90 em 100 repls.), provavelmente foram alcançadas todas a(s) árvore(s) mais

parcimoniosa(s). Porém, se um grande número de árvores são retidas e, na centésima

replicação, novas árvores continuam surgindo, isto quer dizer que são grandes as chances de

árvores igualmente ou até mais parcimoniosas ainda não terem sido encontradas, exigindo um

maior número de replicações. Informa-se também o número total de rearranjos realizados

na fase de “swapping” e se foram encontradas mais árvores mais parcimoniosas do que a

memória foi capaz de armazenar – “some replications overflowed”. Se o objetivo for

encontrar todas as árvores mais parcimoniosas, isto poderá ser feito aumentando a capacidade

da memória:

Em “Settings”:

> “Memory” > “Max. Number of trees” (Default = 100)




181

IX – Vendo e editando árvores

A - Ver árvores:

Em “Trees”

> “Tree view” ou “Tree display/save”

É importante notar que no seu modo default, o T.N.T. não colapsa os ramos das árvores mais

parcimoniosas obtidas. Desta forma, agrupamentos não suporados por sinapomorfias

permanecem “ladderizados”, formando pseudo grupos monofiléticos (Fig. A.3). Para evitar

isso, selecione a regra de colapso desejada em:

“Settings”

> “Collapsing rules”

Em seguida, selecione o ícone “Collapse trees after the search” na janela do modo de busca

de árvores a ser utilizado. No exemplo abaixo (Fig. A.4), a regra de colapso é a de colapsar

ramos com grupos de estados semelhantes, sem transformação entre estados (não suportados

por sinapomorfias).

Tree 0, char. 3 (3 steps)

GF

E

D

CB

AOut

state 0

state 1

state 2

state 3

state 4

state 5

state 6

state 7

state 8

state 9

Ambiguous

Figura A.3. Colapso de ramos não utilizado. Quando um único caráter definindo as posições de E, F,

G e D é utilizado (caracter 3, neste caso), observe que G+D formam um grupo monofilético na

imagem, embora não exista nenhuma sinapomorfia definindo este grupamento.




182

Tree 0, char. 3 (3 steps)

GF

E

D

CB

AOut

state 0

state 1

state 2

state 3

state 4

state 5

state 6

state 7

state 8

state 9

Ambiguous

Figura A.4. Colapso de ramos sendo utilizado. No mesmo exemplo da figura A.3, observe que G+D

não formam mais um grupamento artificial, sendo colapsados juntamente com F no ponto onde a

transformação do estado 02 ocorre como sinapomorfia, definindo o grupo monofilético G+F+D.

B - Editando árvores:

Árvores trancadas – não permitem edição

Árvores destrancadas permitem edições: “Settings” > “Lock trees”.

Selecionando nós (e seus táxons terminais):

> “Clicar com botão esquerdo do mouse uma vez” - nó em vermelho – nó e seus táxons

terminais selecionados

> “Clicar com botão esquerdo do mouse duas vezes” – nó em verde – se este nó for interno a

um nó em vermelho (selecionado), fará com que os táxons internos a este último fiquem

desselecionados, tornando parafilético o conjunto de táxons efetivamente selecionados.

Nós não selecionados podem ser:

Compactados – clicando-se com o botão esquerdo do mouse duas vezes seguidas em nós

não-selecionados faz todo o agrupamento de táxons internos a este ser reduzido a um táxon

terminal, de novo nome a ser definido pelo usuário; Esta ferramenta é útil para se mostrar

versões reduzidas ou simplificadas de determinados setores das árvores obtidas quando estas

são demasiadamente grandes para serem impressas em uma única página.




183

Árvores visualizadas no modo “Trees”>”Display/Save” e com nós selecionados no modo

destrancado podem ter estes mesmos nós:

Deletados – clicando-se com o botão direito do mouse sobre o mesmo

Movidos – clicando-se em outro nó (que não seja o nó do grupo irmão do clado selecionado)

com o botão direito do mouse

Colapsados – clicando-se com o botão direito do mouse no nó imediatamente mais inclusivo

do que o selecionado (ancestral).

Adicionados – clicando-se com o botão direito do mouse em nós selecionados em verde,

pode-se incluir um táxon da matriz no agrupamento selecionado.

Rotacionados – na visualização da árvore de consenso, clique na letra “R” para entrar no

modo de rotação e, ao clicar em um nó qualquer da árvore, este irá trocar de posição com um

outro nó de posição equivalente na árvore. Todos representam apenas diferentes formas de

visualização que não alteram a topologia da árvore.

X - Obtendo uma árvore de consenso:

Em “Tree”

“Consensus” permite quatro tipos de árvores de consenso:

> "Strict (=Nelsen)” – consenso estrito

> "Combinable components” – consenso de componentes combináveis ou consenso semi-

estrito

> “Majority rule” – consenso de maioria

> “Frequency Diffs.”

*Consenso de Adams não está disponível no T.N.T..

No mesmo quadro de escolha do método de cálculo da árvore de consenso, estarão

disponíveis as opções para se salvar a árvore a ser obtida:




184

Em "Show/Save"

> Selecione "show/save tree diagram" (default) - para obter a figura da árvore na tela de

visualização, onde poderá salvá-la em formato de metarquivo (.emf) que pode ser editado

como uma fotografia (ver item XIII abaixo)

> Selecione a opção "Save to RAM" - para incluir as árvores a serem obtidas na memória

temporária do programa, juntamente com as árvores mais parcimoniosas já armazenadas na

mesma. O T.N.T. irá informar no display o número atribuído a cada árvore de consenso

obtida, para posterior localização delas dentre as demais árvores na memória.

Automaticamente também serão criados grupos de árvores para abrigar cada árvore de

consenso obtida onde, por exemplo, a árvore obtida pelo consenso estrito estará em um grupo

denominado "Strict consensus". Para checar este processo, observe os grupos de árvores

criados indo em:

> Trees > Tree Groups > Show

*Porém, veja a seção BUGs ao final.

XI - Selecionando a árvore com a qual se deseja trabalhar

Após obterem-se as árvores de consenso, selecione a(s) árvore(s) com a(s) qual(is) deseja

trabalhar para os passos seguintes. Para tal:

Em "Tree"

> "Tree Buffer" > "Select Trees" – escolha individualmente as árvores obtidas através do seu

número e armazene-as na memória temporária para as próximas análises em "select trees".

Alternativamente, vá em "group of trees" e selecione um dos grupos de árvores de consenso

que o programa cria automaticamente após a obtenção das mesmas.

XII – Obtendo-se dados das árvores obtidas:




185

IMPORTANTE: Abaixo estão definidas as diferentes formas de se mapear os estados de

caráter e como estes se apresentam em cada nó e táxon terminal das árvores produzidas. No

entanto, é crucial lembrar nesta etapa que o T.N.T. reduz em uma unidade o número de cada

caráter em relação ao número atribuído ao mesmo em sua matriz original. Por exemplo,

enquanto o primeiro caráter na matriz for o caráter 1, no T.N.T. o primeiro caráter é sempre

interpretado como caráter 0. Portanto, se a sinapomorfia de um dado clado na árvore de

consenso final for mapeada como sendo um estado referente ao caráter 283 pelo T.N.T.,

significa que este é na verdade o caráter 284 na matriz utilizada.

A - Listando e mapeando sinapomorfias das árvores mais parcimoniosas:

Em “Optimize”

“Synapomorphies”:

> “Map synapomorphies” – permite ver todas as sinapomorfias em todas as árvores geradas

com “see all trees” ou de uma árvore em especial em “select trees”. Novamente, pode-se

clicar na letra “M” para salvar a árvore num metarquivo extendido para publicação. Nesta

imagem, porém, não aparece o estado em que o caráter sinapomórfico se apresenta. Para tal,

deve-se gerar a listagem deles (abaixo).

> “List synapomorphies” - gera na tela a listagem de todos os táxons terminais e nós (do mais

basal aos mais derivados) e suas respectivas autapomorfias e sinapomorfias de todas as

árvores geradas com “see all trees” ou de uma árvore em especial em “select trees”. Ao

aparecer a listagem, salve a tela no arquivo log (.out) e abra-o no bloco de notas para

recuperar esta listagem em forma de texto editável.

> “Map common synapomorphies” e “List common synapomorphies” - fazem o mesmo que

as opções anteriores considerando sinapomorfias comuns a todas as árvores armazenadas na

memória.




186

B - Listando e mapeando transformações sofridas por cada caráter ao longo das árvores

selecionadas

Em “Optimize”

“Characters”:

> “Map characters” – mapeia as transformações de cada caráter ocorridas ao longo da

árvore.

> “List Characters” – lista todas as transformações sofridas por cada caráter.

> “Map common characters” e “List common characters”- fazem o mesmo que os

anteriores considerando transformações comuns a todas as árvores armazenadas na memória.

C – Outros dados

Em “Optimize” :

> "Character scores" – indica o número de transformações sofridas por todos os caracteres

> "Count specific changes" – indica o número de transformações de cada estado (definido

pelo usuário) para outro em cada caráter de cada árvore desejada.

> "Branch lenght" – indica o tamanho (número de passos) de cada ramo da árvore

> "Tree lenght" – indica o tamanho total das árvores

Em “Trees”:

> “Comparisons” > “Show resolutions” – reporta quais são os nós que apresentam

politomias não-resolvidas na árvore de consenso estrito.

D - Índices de suporte:

Índice de Bremer

Em “Tree”:

> “Bremer support” - índices de Bremer (ou índice de decaímento): É calculado obtendo-se

comparações entre as árvores mais parcimoniosas com árvores sub-ótimas. A diferença no

número de passos (“fit”) de uma árvore de consenso que contenha o agrupamento cujo




187

suporte deseja-se calcular e a árvore sub-ótima mais curta onde ele esteja colapsado será o

valor do índice. Para tal, um número significativo de árvores sub-ótimas deve ser calculado, o

que pode ser realizado de duas maneiras: na primeira, realiza-se TBR sobre um conjunto de

árvores sub-ótimas armazenadas na memória RAM plotando os índices encontrados ("plot

on") sobre a árvore de consenso estrito. Na segunda maneira, seleciona-se as árvore sub-

ótimas da memória RAM que foram retidas durante as análises de busca. Neste caso, é

aconselhável selecionar um número significativo de árvores sub-ótimas e que tenham uma

larga diferença no número de passos em relação às AMPs (ex: fit de 10 passos). Para

selecionar todas as árvores de fit absoluto ≤ 10, por exemplo, em relação às árvores mais

parcimoniosas, utiliza-se no menu “Tree”:

> “Tree Buffer” > “Filter” – Permite excluir árvores redundantes, ou árvores sub-ótimas. Por

exemplo, elimina-se todas as árvores sub-ótimas com 10 ou mais passos em relação à árvore

mais parcimoniosa. Esta ferramenta é importante para se decidir quais árvores sub-ótimas

serão mantidas na análise para, por exemplo, se calcular o índice de Bremer com base nestas

árvores sub-ótimas obtidas ao longo da análise.

Índices de Jackknife e Bootstrap

Em “Analyze”:

> “Resampling” – Para o cálculo dos índices de Boostrap e índices de Jackknife

Para este cálculo, uma re-análise da matriz será conduzida adquirindo novas árvores iniciais.

Portanto, o número de réplicas deverá ser alto (default = 100). Se o tamanho da matriz exige

uma análise utilizando “New Technology Search”, leve em consideração que o número total

de réplicas será aquele produzido pelo “New Technology Search” vezes o número de réplicas

da análise de Jackknife e Bootstrap. Logo, se o número de réplicas para o índice é de 100 e o

de replicações utilizando “New Technology Search” é 10, o número total de réplicas para o

cálculo dos índices será de 1.000 (100 x 10).

XIII - Salvando árvores:




188

Sempre após se obter as árvores mais parcimoniosas, e mais tarde, a árvore de consenso:

A - Salve-a como arquivo (.tre) para futuras edições no T.N.T. , outros programas de

análise filogenética ou edição ou de edições de árvores:

1- Em “File”:

“Tree Save File” > “Open, parenthetical” – para abrir um arquivo onde as árvores serão

salvas.

2 - Em “File”:

“Tree save file” > “Save trees to open file” – para salvar as árvores desejadas

Atenção: Se o usuário desejar salvar outras árvores neste mesmo arquivo posteriormente,

permaneça com ele aberto e salve as futuras árvores como mencionado no ítem 2. Após ter

salvo todas as árvores desejadas neste arquivo:

3 – Em "File":

“Tree save file" > "Close tree file"- os arquivos (.tre) só poderão ser abertos nos diretórios

onde foram salvos quando este procedimento for realizado.

B - Transfira-a para o display clicando na letra “S” e, consequentemente, salvando-a na

memória temporária e no arquivo .log onde todas as ações do display são salvas.

C - Salve a árvore num metarquivo extendido (.emf) para publicação (um arquivo de

imagem que pode ser posteriormente aberto e editado por programas de edição de imagem

vetorial (e.g. CorelDraw):

Em “Trees”:

> “Tree display/save” > clique na letra “M” para salvar a árvore

Produzindo imagens de qualidade para publicação




189

As opções de edição da árvore oferecidas pelo próprio T.N.T. (veja os procedimentos

clicando em "H" ao visualizar a árvore dentro do modo “Trees”>”Display/Save”) são

satisfatórios e permitem a produção de uma árvore de boa resolução quando comparado a

maioria dos programas de edição de árvores. No entanto, o formato .emf no qual as árvores

são exportadas como imagem pode ser interpretado com erros ou distorções por muitos

programas de visualização de imagem e edição (e.g. Photoshop, Microsoft Picture Manager).

Para se editar a imagem, a melhor opção encontrada foi abri-la no CorelDraw ou Adobe

Illustrator, onde ela pode ser editada como imagem vetorial e posteriormente exportada em

formato JPG, BMP ou TIF.

O programa Mesquite permite a importação dos arquivos de árvores no formato TRE e então

editá-los com uma boa variedade de ferramentas disponíveis, sendo muito superior ao

programa TreeView. No entanto, a única forma de exportar a árvore num formato de imagem

é salvando-a como PDF no menu "File".

XIV - Para sair do programa:

Em "File":

"Exit"

Ferramentas adicionais

1 - Identificando e removendo os táxons problemáticos

Se a árvore de consenso estrito apresentar resoluções que sejam insatisfatórias para o estudo

sendo conduzido, pode-se tentar identificar e remover os táxons responsáveis pelos conflitos

e subseqüentes agrupamentos colapsados. Para tal, deve-se primeiro identificar quantos nós

colapsados seriam recuperados realizando a remoção de determinados táxons:




190

Em ”Trees”

> “Comparisons” > “Prunned Trees”

Contendo todas (e apenas) as AMPs utilizadas no cálculo da árvore de consenso estrito da

análise anterior na memória RAM, escolha o nó que apresente as politomias que desejam ser

resolvidas (observando a árvore de consenso com os nós indicados ou pedindo a listagem dos

nós não-resolvidos, veja este último em “Show resolutions” acima). Uma lista com o número

de ramos (ou nós) colapsados que seriam recuperados e quais os táxons que devem ser

removidos para tal fim será calculada.

Numa segunda etapa deste processo, remova os táxons utilizando “Prune Taxa”, e depois,

faça uma nova filtragem (“Filter”) para se obter as novas AMPs recuperadas após o

“prunning”. Como um novo patamar de número de passos de AMPs foi alcançado, é

importante realizar novas rodadas utilizando-se os algoritmos de busca para saber se há

outras AMPs com este mesmo número de passos que não foram recuperadas utilizando-se

apenas o “prunning”.

2 – Selecionando-se árvores com uma determinada topologia dentre todas

as AMPs obtidas.

O usuário pode eventualmente se deparar com a seguinte pergunta: se o consenso de maioria

mostra uma certa topologia de táxons que não é recuperada no consenso estrito, qual seria a

posição destes táxons nas outras árvores que diferem do consenso de maioria? Esta é uma

pergunta relevante para apontar outras possibilidades de relacionamento caso uma resolução

100% resolvida não seja recuperada durante o consenso. Para tal, deve-se primeiramente abrir

uma das AMPs com a topologia presente no consenso de maioria. Abre-se a janela “define

constraints” e nela:

> selecione a opção “...for non-monophyly” > “use selected groups”. Nele, selecione com o

mouse o nó que sustenta os agrupamentos a serem investigados por não estarem presentes em

100% das AMPs.




191

Como deseja-se saber quais são as AMPs onde este agrupamento predominante está ausente,

deve-se realizar a filtragem de todas as árvores que possuam esta configuração, de forma a

remanescer apenas as de topologia distinta desta. Portanto, filtre as AMPs de modo a manter

na memória RAM apenas as árvores com a topologia definida no “constraint”:

> “Filter”

> “Constraints” > “Delete if not fulfilled”

O mesmo processo pode ser realizado para um resultado oposto, como para se reter as AMPs

que contém os agrupamentos que aparecem na árvore de consenso de maioria ou outras

operações equivalentes.




192

ADDENDUM 1 – BUGs

Para uma lista dos BUGs presentes nas versões anteriores e que foram corrigidos a partir de

2004 veja o link “Bug fixes” disponível no pacote de arquivos providos no download da

versão mais recente programa. Todos os BUGs de edições anteriores do T.N.T. já foram

reparados na edição mais recente disponível para download (2012). Os aqui referidos são

BUGs ainda presentes na edição de 2012.

1 – Índice de Bremer: Ao se calcular o índice de Bremer sobre uma árvore de consenso há

duas opções de exibição destes valores sobre esta árvore: “show/save tree diagram” para a

exibição da árvore no display de modo a ser salva como arquivo de imagem .emf ou “save to

RAM” para salvá-la na memória RAM em formato .tre, que permite futuras edições da árvore

em outros programas. No entanto, se escolhida a opção pela memória RAM a árvore salva

não conterá os valores do índice de Bremer conforme esperado. Somente a função

“show/save tree diagram” irá permitir a visualização dos valores.

2 – Valores do consenso de maioria: O problema ocorrido para se visualizar os valores do

índice de Bremer na árvore salva na memória RAM também ocorre com a árvore de consenso

de maioria. Para visualizar a porcentagm de vezes que cada ramo ocorre dentro das AMPs,

somente aplicando a visualização da árvore como arquivo de imagem .emf no momento em

que se pede o cálculo da mesma.

3 – Se a matriz importada para o T.N.T. conter caracteres aditivos (ordenados) já definidos

como tal pelo editor de matrizes (NDE, Mesquite), utilize a função “Data”>”Show

character sattus”>”Show additive characters” para exibir os caracteres considerados como

tais e verificar se não houve erros de interpretação do T.N.T.. Em algumas ocasiões apesar da

pré-definição de quais os caracteres são aditivos, o T.N.T. irá considerá-los todos como não

aditivos (default do programa) e estes terão que ser re-programados como aditivos dentro do

próprio T.N.T.. Neste caso, para este procedimento não ter que se repetir todas as vezes que a

matriz for aberta no T.N.T., salve estas alterações com “Data”>”Save data” para salvar a

matriz atualizada em formato .T.N.T..




193




194

ADDENDUM 2

Por que o T.N.T. é mais rápido do que o PAUP*?

O mecanismo tradicional de buscas pelas árvores mais parcimoniosas utilizando RAS + TBR

é empregado no PAUP, NONA e no T.N.T.. No entanto, a capacidade do algoritmo de

Goloboff (GOLOBOFF, 1996) para maximizar o RAS + TBR (presente no NONA e

posteriormente no T.N.T.) e de realizar análises em um tempo milhares de vezes menor do

que o PAUP se baseia no fato dele colapsar árvores mais parcimoniosas com agrupamentos

de suporte igual a zero durante as etapas de busca. Em outros programas de análise, todas

estas árvores ótimas temporárias eram salvas na memória temporária do programa

aumentando exponencialmente o tempo de análise sem efetivamente contribuir para uma

melhor resolução da mesma. Desta forma, o T.N.T. permite uma capacidade operacional mais

rápida, tornando viável completar a análise de todas as replicações por RAS (GOLOBOFF,

1999), seja para análises tradicionais (RAS+TBR) ou com os mecanismos de “New

Technology Search”. Isto permite tornar a análise não apenas mais rápida, mas também mas

eficiente, já que a análise do maior número de árvores iniciais possíveis obtidas por RAS é

fundamental para se realizar uma amostragem significativa do universo de árvores existentes

e evitar o problema das “ilhas de árvores” (FARRIS et al., 1996). Em função disso, a versão

mais recente do PAUP* 4.0 (SWOFFORD, 1998) também passou a incorporar este novo

algoritmo. Ainda assim, o mecanismo de RAS + TBR do T.N.T. é entre 5 – 10 vezes mais

rápido do que o do PAUP* 4.0 para pequenos conjuntos de dados e até 900 (!) vezes mais

rápido para matrizes com números de táxons na casa dos milhares, do que a versão 4.0

lançada por Swofford (GOLOBOFF et al., 2008). Como as análises com os mecanismos da

“New Technology Search” utilizam a busca RAS + TBR como base, estas análises ficam,

consequentemente, também mais rápidas do que se fossem realizadas no PAUP* 4.0.

Portanto, o grande mérito do T.N.T. é conseguir obter árvores mais parcimoniosas e em

menos tempo através tanto dos mecanismos tradicionais de busca heurística quanto através

dos quatro novos algoritmos de busca, além de viabilizar análises de matrizes extensas em

tempo viável de pesquisa através dos 4 novos algoritmos do “New Technologies Search”.




195

REFERÊNCIAS BIBLIOGRAFIA

FARRIS, J. S., ALBERT, V. A., KÄLLERSJÖ, M., LIPSCOMB, D. & KLUGE, A. G. 1996.

Parsimony jackknifing outperforms neighbor-joining. Cladistics, 12, 99-124.

GLADSTEIN, D. S. 1997. Efficient Incremental Character Optimization. Cladistics, 13, 21-

26.

GOLOBOFF, P. A. 1996. Methods for Faster Parsimony Analysis. Cladistics, 12, 199-220.

GOLOBOFF, P. A. 1999. Analyzing large data sets in reasonable times: solutions for

composite optima. Cladistics, 15, 415-428.

GOLOBOFF, P. A. & FARRIS, J. S. 2001. Methods for quick consensus estimation.

Cladistics, 17, S26-S34.

GOLOBOFF, P. A., FARRIS, J. S. & NIXON, K. C. 2008. T.N.T., a free program for

phylogenetic analysis. Cladistics, 24, 774-786.

HOVENKAMP, P. 2004. Review of: T.N.T.—Tree Analysis Using New Technology.

Version 1.0, by P. Goloboff, J. S. Farris and K. Nixon. . Cladistics, 20, 378-383.

MADDISON, D. R. 1991. The Discovery and Importance of Multiple Islands of Most-

Parsimonious Trees. Syst. Biol., 40, 315-328.

MADDISON, W. P. & MADDISON, D. R. 2011. Mesquite: a modular system for

evolutionary analysis. Version 2.75 (http://mesquiteproject.org).

SWOFFORD, D. 1998. Phylogenetic Analysis Using Parsimony (* and other methods),

version 4. Sinauer Associates, Sunderland, MA. . In).

Tiago Rodrigues Simões, PhD candidate

University of Alberta, Canada

[email protected]

http://mesquiteproject.org)/

Meu Guia TNT Oficial Anexo 3 (1)

Documents

Transcript of Meu Guia TNT Oficial Anexo 3 (1)