Total evidence phylogenies: the missing data issue

Post on 12-Apr-2017

292 views 0 download

Transcript of Total evidence phylogenies: the missing data issue

Total evidence phylogenies

The missing data issue

Thomas Guillerme

? @TGuillerme

Trinity College Dublin

Acknowledgements

Natalie Cooper (Natural History Museum - UK)

Gavin Thomas (Univ. Sheffield - UK)

Emmanuel Douzery (Univ. Montpellier II - FR)

Frédéric Delsuc (Univ. Montpellier II - FR)

Trevor Hodkinson (Trinity College Dublin - IE)

@TGuillerme

Time

A T T G A A C A T C G A A C A T C G G A C A T C G G A A

0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0

A T T G A A C A T C G A A C A T C G G A C A T C G G A A

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C A T C G A A C A T C G G A C A T C G G A A

0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C A T C G A A C A T C G G A C A T C G G A A

0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1

? ? ? ? ? ? ? ?

What is the effect of missing data on tree

topology?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

0 0 1 0

0 1 1 1

0 1 1 0

0 1 1 0

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

No missing data

Missing data

25%

50%

75%

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

? ? ? ?

0 1 1 1

0 1 1 0

0 1 1 0

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

0 0 1 0

? ? ? ?

0 1 1 0

? ? ? ?

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

? ? ? ?

? ? ? ?

? ? ? ?

0 1 1 0

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C A T C G A A C A T C G G A C A T C G G A A

0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C A T C G A A C A T C G G A C A T C G G A A

0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 ? 0 ? 0 0 1 ? 0 ? ? 1 ? 0 ? 1 1

Fossil taxa

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C A T C G A A C A T C G G A C A T C G G A A

? ? ? ? 0 1 1 1 ? ? ? ? ? ? ? ? 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1

Living taxa

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

0 0 1 0

0 1 1 1

0 1 1 0

0 1 1 0

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

No missing data

Missing data

25%

50%

75%

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

? ? ? ?

0 1 1 1

0 1 1 0

0 1 1 0

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

0 0 1 0

? ? ? ?

0 1 1 0

? ? ? ?

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

? ? ? ?

? ? ? ?

? ? ? ?

0 1 1 0

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

A B C D

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

0 0 1 0

0 1 1 1

0 1 1 0

0 1 1 0

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

No missing data

Missing data

25%

50%

75%

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

? ? ? ?

0 1 1 1

0 1 1 0

0 1 1 0

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

0 0 1 0

? ? ? ?

0 1 1 0

? ? ? ?

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

? ? ? ?

? ? ? ?

? ? ? ?

0 1 1 0

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

A B C D

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

150 CPU years later…

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

6 PhD months later…

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

0 0 1 0

0 1 1 1

0 1 1 0

0 1 1 0

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

No missing data

Missing data

25%

50%

75%

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

? ? ? ?

0 1 1 1

0 1 1 0

0 1 1 0

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

0 0 1 0

? ? ? ?

0 1 1 0

? ? ? ?

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C

A T C G A A C

A T C G G A C

A T C G G A A

? ? ? ?

? ? ? ?

? ? ? ?

0 1 1 0

1 0 0 0

0 1 1 0

0 0 1 1

0 1 1 1

Sim

ula

ted

Da

ta

A B C D

A B C D

A B C D

A B C D

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

A B C D

A B C D

A B C D

A B C D

No missing data

Missing data

25%

50%

75%

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

Tre

e s

imila

rity

Data

1

0

100% 25% Guillerme & Cooper, accepted, Mol. Phyl. Evol.

Tre

e s

imila

rity

1

0

Trees are identical

Trees are no more different than expected by chance

Data 100% 25% Guillerme & Cooper, accepted, Mol. Phyl. Evol.

Results

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

Tre

e s

imila

rity

1

0

Missing data in the fossil record

Data 100% 25% Guillerme & Cooper, accepted, Mol. Phyl. Evol.

Tre

e s

imila

rity

1

0

Missing data in the fossil record

Missing data for living taxa

Data 100% 25% Guillerme & Cooper, accepted, Mol. Phyl. Evol.

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C A T C G A A C A T C G G A C A T C G G A A

0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 1 1 0 0 0 1 1 0 1 1 1

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C A T C G A A C A T C G G A C A T C G G A A

0 0 1 0 0 1 1 1 0 1 1 0 0 1 1 0 1 0 0 0 0 ? 1 0 0 0 1 1 0 1 1 1

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

? ? ? ? ? ? ?

A T T G A A C A T C G A A C A T C G G A C A T C G G A A

0 0 1 0 0 1 1 1 ? ? ? ? 0 1 1 0 1 0 0 0 0 ? 1 0 0 0 1 1 0 1 1 1

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

We need morphological data

from living taxa!

Guillerme & Cooper, accepted, Mol. Phyl. Evol.

How much data are out there?

Guillerme & Cooper, 2015, bioRxiv

Guillerme & Cooper, 2015, bioRxiv

Available data

?

Guillerme & Cooper, 2015, bioRxiv

Available data

?

Guillerme & Cooper, 2015, bioRxiv

Available data

Guillerme & Cooper, 2015, bioRxiv

Available data

Guillerme & Cooper, 2015, bioRxiv

Available data

16% 56/351

Tre

e s

imila

rity

1

0

Missing data in the fossil record

Missing data for living taxa

Data 100% 25%

Tre

e s

imila

rity

1

0

Missing data in the fossil record

Missing data for living taxa

Data 100% 25%

Tre

e s

imila

rity

1

0

Missing data in the fossil record

Missing data for living taxa

Data 100% 25%

@TGuillerme

Guillerme & Cooper, 2015 biorxiv.org

Guillerme & Cooper, accepted Mol. Phyl. Evol.

Tre

e s

imila

rity

1

0

Missing data in the fossil record

Missing data for living taxa

Data 100% 25%

@TGuillerme

Thank you Guillerme & Cooper, 2015

biorxiv.org

Guillerme & Cooper, accepted Mol. Phyl. Evol.