0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP...

35
Makina Öğrenmesi ile Sinirsel Gelişim Hastalıkları için Gen Keşfi A. Ercüment Çiçek Yar. Doç. Dr. , Bilgisayar Mühendisliği Bolümü, Bilkent Üniversitesi Adjunct Fakülte Üyesi, Computational Biology Department, School of Computer Science, Carnegie Mellon University 1

Transcript of 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP...

Page 1: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Makina Öğrenmesi ile Sinirsel Gelişim Hastalıkları için Gen Keşfi

A. Ercüment Çiçek

Yar. Doç. Dr. , Bilgisayar Mühendisliği Bolümü, Bilkent Üniversitesi Adjunct Fakülte Üyesi, Computational Biology Department, School of

Computer Science, Carnegie Mellon University

1

Page 2: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Yol Haritası ∆ Otizm ve sinirsel gelişim hastalıkları ∆ Gen keşfi problemi ∆ Literatürdeki algoritmalar

∆ ST-Steiner: Zaman-mekansal gen keşfi algoritması

3

Page 3: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Otizm ∆ Semptomlar: Konuşma ve sosyal iletişim bozukluğu,

tekrar eden hareketler

∆ Geniş spektrum

∆ ABD’de her 56 çocuktan 1’inde görülüyor ∆ Genetik mimari:

Yüksek seviyede kalıtsal ve heterojen

*

*Resim: Autism Speaks 4

Page 4: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Gen Keşfi

5

Page 5: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

de novo mutasyonların önemi

Mike Wigler Lab

6

Page 6: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Gen Keşfi: de novo LoF mutasyonlar

7

Page 7: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

FOXP1

GIGYF1

KMT2E

MED13L

DIP2A

WAC

TCF7L2

KDM5B

CHD2

WDFY3

TNRC6B

KDM6B

DSCAM

PHF2

RIMS1

NCKAP1

CTTNBP2

BCL11A

TRIO

MLL3

APH1A

ASXL3

MIB1

VIL1

RELN

CDC42BPB

MYT1L

CUL3

NR3C2

ASH1L

ETFB

SYNGAP1

CACNA2D3

GABRB3

SETD5

SUV420H1

NAA15

PTEN

MYO9B

POGZ

ADNP

CHD8

TBR1

KATNAL2

GRIN2B

ANK2

SCN2A

ARID1B

DYRK1A

(23) (16)

(10)

Iossifov et al., Nature, 2014 De Rubeis et al., Nature, 2014

Gen keşfi: Son durum 2014

8

Page 8: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

FOXP1

GIGYF1

KMT2E

MED13L

DIP2A

WAC

TCF7L2

KDM5B

CHD2

WDFY3

TNRC6B

KDM6B

DSCAM

PHF2

RIMS1

NCKAP1

CTTNBP2

BCL11A

TRIO

MLL3

APH1A

ASXL3

MIB1

VIL1

RELN

CDC42BPB

MYT1L

CUL3

NR3C2

ASH1L

ETFB

SYNGAP1

CACNA2D3

GABRB3

SETD5

SUV420H1

NAA15

PTEN

MYO9B

POGZ

ADNP

CHD8

TBR1

KATNAL2

GRIN2B

ANK2

SCN2A

ARID1B

DYRK1A

(15) (16)

(10)

RANBP17

ZC3H4

SPAST

SARM1

ILF2

INTS6

USP45

CAPN12

OR52M1

AKAP9

SLC6A1

ZNF559

MFRP

P2RX5

NINL

(20)

ASC

ASC + SSC TRIP12

IRF2BPL

ACHE

PTK7

ERBB2IP

NRXN1

SHANK2

SHANK3

EP400

KAT2B

STARD3NL

NLGN3

(7)

+ küçük CNV

Slide by Stephan Sanders Sanders et al., Neuron, 2015

Gen keşfi: Son durum 2015

9

Page 9: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Kabullenim: Risk genleri biyolojik ağlarda fonksiyonel bir küme oluşturur. Guilt-by-association prensibi:

1. Bilinen ASD genlerini başlangıç noktası olarak kullan. 2. Sıkı ilişki içinde bir gen kümesi keşfet.

Gen Keşfi için algoritmalar

10

Page 10: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

1

Mutasyona uğramış genler

Gen Keşfi için algoritmalar

11

Page 11: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

● NETBAG1, NETwork-Based Analysis of Genetic Associations ● DAWN2, Detecting Association With Networks ● MAGI3, Merging Affected Genes into Integrated networks ● ST-Steiner4, Spatio-Temporal Gene Discovery for ASD

1 Gilman et al. 2011, “Rare de novo variants associated with autism implicate a large functional network of genes involved in

formation and function of synapses”. Neuron.

2 Liu et al. 2014, “DAWN: a framework to identify autism genes and subnetworks using gene expression and genetics”. Molecular Autism.

3 Hormozdiari et al. 2015, “The discovery of integrated gene networks for autism and related disorders”. Genome Research.

4 Norman and Cicek, 2018, Spatio-Temporal Gene Discovery for Autism Spectrum Disorder”. bioRxiv 2018.

Gen Keşfi için algoritmalar

12

Page 12: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

NETBAG Algoritması

Gilman et al. 2011, “Rare de novo variants associated with autism implicate a large functional network of genes involved in

formation and function of synapses”. Neuron. 13

Page 13: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

DAWN Algoritması

Liu et al. 2014, “DAWN: a framework to identify autism genes and subnetworks using gene expression and genetics”. Molecular

Autism. 14

Page 14: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

15 Figure from Hormozdiari et al. 2015, “The discovery of integrated gene networks for autism and related disorders”. Genome Research.

MAGI Algoritması

Page 15: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

16 Figure from Hormozdiari et al. 2015, “The discovery of integrated gene networks for autism and related disorders”. Genome Research.

MAGI Algoritması

Page 16: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

17

Gen etkileşimleri zamanla değişir

Farklı beyin gelişim pencereleri:

● Farklı topolojilere sahiptir, ● ASD gen kümelenmesi de zaman ve mekana göre değişir.

Erken dönemlerde, biyolojik patikalardaki problemler ileriki dönemlere ardışık olarak etki eder.

● Erken donem patika hasarı ileri dönemleri etkiler ve 36 kat ASD risk artısına neden olur*

● Yetişkinlikteki problemler ise risk artışına neden olmaz*.

Willsey et. al., 2013, Cell 155.

* Wang et. al., 2014, Neuron 83(3).

Eksiklikler

Page 17: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

18

Bu nedenle statik biyolojik ağlar kullanan metotlar: Dinamik beyin gelişimini modelleyemez ve tahmin güçleri limitlidir. Hipotezimiz: “Gen kümelenmesi statik değil dinamiktir.”

Eksiklikler

Page 18: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

ST-Steiner Algoritması

19

Zaman

Beyin bölgeleri

Page 19: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Methodlar

Statik biyolojik ağların yarattığı sorunları aşmayı hedefliyoruz:

● Prize-collecting Steiner tree (PCST) problemi kullanacağız. ● Zaman ve mekan bilgisini de algoritmaya vereceğiz.

Orijinal Steiner tree (ağaç) problemi: Verilen bir ağda, ayrıcalıklı, tohum noktaları bağlayan minimum bir ağaç bulur.

20

Page 20: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Prize-collecting Steiner tree problemi: Öyle bir ağaç bul ki: ● Seçilen nodların ödülleri maksimum. ● Seçilen bağlantıların cezaları minimum olsun.

21

Prize-Collecting Steiner Tree (PCST)

Page 21: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Prize-Collecting Steiner Tree (PCST)

G(V, E), a nodları ve bağlantıları ağırlıklı bir ağ olsun Nod seti V, bağlantı seti E, bağlantı cezası fonksiyonu c e ≥ 0, nod ödülü fonksiyonu p v ≥ 0

Aranan ağaç T(VT, ET ) bu fonksiyonu minimize eder: 𝛽 ≥ 0

22

Page 22: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

● Zaman-mekânsal sistem , T zaman penceresi ● i. pencere, n tane beyin bölgesi içerir. ● Buradan bir alt sistem bulmak istiyoruz.

alt kümesidir

23

Willsey et. al., 2013, Cell 155.

Problem Formulasyonu

Page 23: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

.

24

orijinal PCSF çözümleri

farklılıkları cezalandıran fonksiyon

ST-Steiner

Page 24: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Veri setleri

25 Resim: Willsey et al. 2013, Cell.

Hedef

Önceki ağlar

Page 25: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

26 1 De Rubeis et al. 2014, “Synaptic, transcriptional and chromatin genes disrupted in autism”. Nature. 2 Iossifov et al. 2014, “ The contribution of de novo coding mutations to autism spectrum disorder”. Nature.

Bu 251 geni tahmin edebilir miyiz?

ASC WES1 (Öğrenme) ● 16,098 DNA örneği ● 3,871 ASD örneği (trio) ● 9,937 kontrol örneği

SSC WES2 (Test) ● 1,643 ek DNA örneği (trio) ● 251 vurulmuş gen

Veri setleri

Page 26: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Sonuçlar 1

27

Page 27: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Alakalı Otizm Gen Listeleri

28

● SFARI Category 1 (24 gen) ● SFARI Category 2 (59 gen) ● FMRP Hedefleri (842 gen) ● RBFOX – peak (1048 gen) ● RBFOX – splice (587 gen) ● Histone Modifiers (152 gen) ● Sinaptik Genler (878 gen)

Page 28: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

29

Sonuçlar 2

Page 29: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

30

Sonuçlar 3

Page 30: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Zaman bilgisi ile elde edilen yeni genler ● 5 Kinesin ailesi (KIF) genleri: “transport cargo to dendritic

spines undergoing synaptic plasticity over microtubules also play a role in organization of spindle microtubules during mitosis.”

● NDC80 veSGOL2: kinetochore & microtubule attachment - cell division. Literatürde dile getirilmeyen genler.

31

Page 31: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Yorumlanabilir sonuçlar

● NOTCH3

Nöron başkalaşımı

32

● TCF3

○ Embriyonik kok hücre başkalaşımını başlatır

○ Nöron öncesi hücrelerde başkalaşımı durdurur

○ De Rubeis et. al., 2014, Nature yayınında merkez gen

Page 32: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Otizmin genetik mimarisinin anlaşılması önemli bir problem. Biyolojik ağ bazlı algoritmalar hangi genlerin ilgili olduğunu tespit etmede önemli katkıda bulunmuştur. ST-Steiner algoritması bunları bir adım öteye götürerek zaman mekânsal değişiklikleri hesaplamalarına katmıştır. ST-Steiner daha hassas sonuçlar vermektedir: ● Bağlantı için gerekli olmayan genleri dışarıda bırakır. ● Önceki donemde seçilen genleri hesaba katarak daha güvenli tercihler

yapar. ● Sonuçlar kümelenmenin statik değil dinamik olduğunu desteklemektedir.

33

Çıkarımlar

Page 33: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

34

Page 35: 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP … · 2019-04-23 · 0DNLQDg÷UHQPHVLLOH6LQLUVHO*HOLúLP +DVWDOÕNODUÕLoLQ*HQ.HúIL A. Ercüment Çiçek

Utku Norman Bilkent Yüksek Lisans mezunu - EPFL doktora öğrencisi

Teşekkürler! Spatio-Temporal Gene Discovery for Autism Spectrum Disorder

A. Ercument Cicek, Ph.D. ercumentcicek.com

@crashius

36