Detectie van genomische structurele variaties op basis van paired-tag NGS data

24
genomische structurele variaties op basis van paired-tag NGS data Peter van ‘t Hof

description

Detectie van genomische structurele variaties op basis van paired-tag NGS data. Peter van ‘t Hof. Opbouw presentatie. Structurele Variaties Pair sequencing Clustering Resultaten. 2. Structurele Variaties. - PowerPoint PPT Presentation

Transcript of Detectie van genomische structurele variaties op basis van paired-tag NGS data

Page 1: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Detectie van genomische structurele variaties op basis van paired-tag NGS data

Peter van ‘t Hof

Page 2: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Opbouw presentatie

•Structurele Variaties

•Pair sequencing

•Clustering

•Resultaten

2

Page 3: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Structurele Variaties

3

Genome structural variation discovery and genotyping - Can Alkan, Bradley P. Coe and Evan E. Eichler - Nature Reviews Genetics 2011

Page 4: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Structurele Variaties

4

Extreem voorbeeld

Page 5: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Mate-pair sequencing

5

F R

Libary Prep

Page 6: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Paired sequencing

6

•Clustering

Computational methods for discovering structural variation with next-generation sequencing - P Medvedev1, M Stanciu1 & N Brudno - Nature Methods 2009

Page 7: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Insertsize

7

Size (bp)

Frag

men

ts

Page 8: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Huidige programma

•Algoritme vindt wel SV’s die bevestigd kunnen worden

•Sample van 700M reads duurt 5 dagen

•Veel geheugen vereist

•Onhandig in gebruik

8

Page 9: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Hoe?

•Programmeren in C++

9

Page 10: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Nieuw programma

•Sample van 700M duurt nu +/- 3 uur(single thread)

•Sample van 700M duurt +/- 30 min(multi thread, 8 cores)

10

Page 11: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Vergelijking metoude programma

11

Page 12: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Resultaten

12

Homozygote deletie

Inversie

Page 13: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Resultaten

13

Hetrozygote deletie

Homozygote insertie

Page 14: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Filter

14

SVcov = pairs coverage SVCcov = concordant pairs coverage

SVcov / Ccov = Relative to concordant

Page 15: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Filter

15

SVcov = pairs coverage SVnCcov = non-concordant pairs coverage

SVcov / (nCcov - SVcov) = Relative to non-concordant

Page 16: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Test set

•70 Mate-Pair samples van het UMC-U

•Vorige analyses zijn per sample of per groep gedaan

•Mogelijkheid om te kijken naar populatie SV’s

•In totaal meer dan 700.000 ongefilterde niet unieke SV’s

16

Page 17: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Filter

17

Page 18: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Filter

18

Page 19: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Populatie SV’s

19

Page 20: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Confirmatie PCR’s

20

•29 SV's met overlap over het breekpunt10 SV's zonder overlap maar wel beide kanten gezien10 SV's zonder overlap en maar één kant gezien

Totaal 96 PCR’s welke van 2 kanten gesequenced zijn

Page 21: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Confirmatie PCR’s

21

•14 breekpunten op een inversie welke in een palindromische sequenties33 breekpunten die niet bevestig konden worden

Totaal 96 PCR’s welke van 2 kanten gesequenced zijn

Page 22: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Mogelijke vervolg stappen

•Sequenties van onbekende inserts bepalen

•Combinatie van paired-sequecing met read-depth en split-read SV-call methodes

22

Page 23: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Conclusie•Tot nu toe is het +/- 150x sneller

•De ongefilterde resultaten komen overheen met het oude programma

•Filter kan groot deel van de false-positives er uit filteren

•Programma kan al als vervanging voor het oude programma gebruikt worden

23

Page 24: Detectie van genomische structurele variaties op basis van paired-tag NGS data

Dankwoord•Hubrecht

Instituut• Edwin Cuppen

• Marieke Simonis

• Wim Spee

• Sander Boymans

• Maarten van Iterson

• Sebastiaan van Heesch

• Roel Hermsen

• Eward Kuijk

• Eward de Bruijn

UMC Utrecht

Wigard Kloosterman

Mark van Roosmalen

Ivo Renkens

Hogeschool Utrecht

Anja ter Avest

Eva Greiner