Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF...

Post on 13-Mar-2018

223 views 0 download

Transcript of Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF...

INSTITUT BIOSTATISTIKY A ANALÝZLékařská fakulta & Přírodovědecká fakulta

Masarykova univerzita, Brno www.iba.muni.cz

AplikovanAplikovanáá analýza dat v oboru analýza dat v oboru matematickmatematickáá biologie biologie

Kamenice 126/3, 625 00 Brno, Kamenice 126/3, 625 00 Brno, CzechCzech RepublicRepublic

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ

IBA MU IBA MU ––

hlavnhlavníí

projektovprojektovéé

oblasti oblasti

1)

Epidemiologie zhoubných nádorů, prediktivní

epidemiologie

2)

Analýza klinických dat, diagnostická

síla testů

3)

Hledání

prognostických a prediktivních faktorů

v medicíně

4)

Budování, správa a analýza klinických registrů

5)

Analýza humánních a ekologických rizik

6)

Analýza environmentálních dat, analýza biodiverzity, faktory ovlivňující životní

prostředí, environmentální

informatika

7)

Zdravotnická

informatika, vývoj analytických a expertních systémů

8)

Modelování

biologických systémů

a simulace

9)

Analýza obrazových dat

10)

Genomika, proteomika, analýza molekulárně

biologických dat

Evironmentální vědy

Analýza experimentálních

dat

Analýza klinických a populačních dat

Výzkum a vývoj nových technologií, biotechnologií

Genomika, proteomika, genové

inženýrství

Klinický výzkum a zdravotnictví

Základní

biologický výzkum

Ekologický výzkum

Plánování

a optimalizace experimentu

Matematický biolog a analýza datMatematický biolog a analýza dat

MatematickMatematickáá

biologie zasahuje vbiologie zasahuje vššechny echny úúrovnrovněě

Prospektivní

Retrospektivní

Popis proběhlých změn

EkosystémPřírodní

populace

Experimentální přístupy

JedinecExperimentální

populace

Molekulární úroveň

Molekulárně

biologické a biochemické

markery

Mechanismy účinku

BIOINDIKACE

BIOTESTY

BIOMARKERY

Matematický biolog a analýza dat: pMatematický biolog a analýza dat: přřidanidanáá

hodnotahodnota

InformatikMatematik

Statistik

ANALYTIK

ProgramátorVývojář

Významný podíl práce s externími znalostmi

Schopnost kritické

zpětné

vazby

Computational biology Computational biology ––

overall viewoverall viewB

ache

lor d

egre

eM

Scde

gree

Biology Mathematics ICTs

Basic courses –

scientific background of computational biology

Advanced courses on general topics of biology, mathematics, ICT

Ecology

Experimental biology

Molecular biology

And many more …

And many more …

Specialization: select your mission

Stochastic modelling

Multivariate analyses

Biostatistics

Bac

helo

rdeg

ree

MSc

degr

ee

1st

year 2nd

year 3rd

year Specialization

4th

year 5th

year Specialization Overall

Biology Mathematics ICT

53%

27%

20%

57%29%

14%

45%

33%

22%

43%

37%

20%

11%

45%

44%

0%

80%

20%31%

45%

24%34%

35%

31%

Computational biology Computational biology ––

overall viewoverall view

ANALÝZA DATANALÝZA DAT

DeteministickáStochastická?

x = ln (koncentrace)μp = ln EDp

α

Y =1+ p β (x - μp)

µp X

1 - p e

α

Y

A. Výpočet efektivní koncentrace (ECx)

Popis, definice

Verifikace, 0

1

2

3

4

5

0 0,2 0,4 0,6 0,8 1

ANALÝZA DAT je o datech ANALÝZA DAT je o datech

Ukázka uspořádaného datového souborucislo stadium vek tran1_3 tran1_4 tran1_5 tran1_6 alb_pbsct ldh_vstup sternum typ_myel

1 3 33 104.36 23.24 104.3 57.77 33 6.02 0.4 IgG2 3 33 184.88 7.84 105.5 13.82 26 4.01 30 IgG3 1 34 123.41 9.8 73.3 13.05 32 3.73 45.2 IgG4 2 43 52.17 6.66 18.03 17.19 42 4.67 40.8 IgG5 1 45 8.22 2.2 8.22 32 8.25 2 B-J6 3 46 403.08 115.31 29.7 7.17 38.8 IgA7 2 49 4.5 12.25 34 4.99 6.4 IgG8 2 50 33.13 9.64 33.13 35 3.99 14 IgG9 3 52 257.08 12.05 85.16 3.24 39 12.14 12.2 IgG10 2 53 78.33 11.34 47.54 7.77 39 5.3 13.6 IgG11 3 53 61.43 4.67 14.38 3.72 32 4.51 49.2 B-J12 3 53 135.8 6.7 135.8 59.3 38 26 IgG13 3 54 129.16 13.33 92.6 38.24 32 4.18 20 IgG14 3 54 66.89 6.74 33.58 17.3 38 8.44 7.2 B-J15 3 54 82.86 4.32 18.9 16.4 37 3.6 50 B-J16 3 55 71.37 6.34 23.91 5.34 43 8.75 27 B-J17 3 60 14.6 0.9 14.6 11.88 44 5.35 7.5 IgG18 3 61 94.07 5.62 94.07 1.51 33 4.29 6.4 B-J19 3 62 86.84 7.53 32.13 2.61 29 4.55 34 IgA

Primární dataPrimární data SumarizaceSumarizace• v jedné skupině („one-sample“)

• ve dvou skupinách („two-sample“)

• ve více skupinách („multiple sample“)

ANALÝZA BIOLOGICKÝCH DAT je o variabilitANALÝZA BIOLOGICKÝCH DAT je o variabilitěě

Data

2,12,83,21,25,22,9

Variabilita opakovaných měření

rozptyl znaku, přirozená variabilita

165 cm 140 cm 182 cm 163 cm

Variabilita znaku v populaci

chyba = nepřesnost modelu

Variabilita modelovaných dat

Variabilita časových řad

Variabilita ve skladběbiologických společenstev

DRUH 1DRUH 2DRUH 3DRUH 4

15304014

biodiverzitafluktuace, časová proměnlivost

chyba

y

x

y

čas

Jak vznikajJak vznikajíí

analýzou dat informace analýzou dat informace

KOLIK

se naměřilo

KOLIK

se naměřilo

CO

se naměřilo

CO

se naměřilo

Diskrétní

data

Spojitá

data

A B C D E

y

xI II III IV V

y

x

X: měřený znak

Y: frekvence-

absolutní

/ relativní

ANALÝZA DATANALÝZA DAT

Stochastická

Explorační

Konfirmační

0

0,25

0,5

0,75

1

0 0,2 0,4 0,6 0,8 10

0,25

0,5

0,75

1

0 0,2 0,4 0,6 0,8 1

1

2

MAX

MIN

MAX

MIN

1

2

Prokázání rozdílu ve středových hodnotách i přes variabilitu znaku

ANALÝZA DATANALÝZA DAT

Statických systémů Dynamických systémů

0

0,25

0,5

0,75

1

0 0,2 0,4 0,6 0,8 1

Typologie

Klasifikace

Diskriminace

0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5

M/(A+0.5) =1.0

P =0.50

Vývoj a trendy

Sesonalita

Pravděpodobnost změny

a1

a2a2

Predikce

ANALÝZA DATANALÝZA DAT

.

.

.

.

.

.

.

.

.

.

x

Sumarizace statistikou

středu a variability

Primární

dataPrimární

data

Vícerozměrné analýzy

Vícerozměrné analýzy

1

n

2. STATISTICKÉ TESTY

2. STATISTICKÉ TESTYODHADYODHADY

POPIS?(• ±)

• bodové

• intervaly spolehlivosti

.

.

.

.

.

.

.

.

.

.

x

A

SROVNÁNÍ?

1. Odhady (sumarizace)

x

.

.

.

.

.

.

.

.

.

.

B..........

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

xpx3x2x1 ……….

……….

ANALÝZA DATANALÝZA DAT

Jednorozměrná Vícerozměrná

YY X1X1 X2X2 X3X3 X4X4 XpXp

nn

11

VVíícerozmcerozměěrnrnáá

analýza dat = novanalýza dat = nováá

kvalitakvalita

VVíícerozmcerozměěrnrnáá

analýza dat = novanalýza dat = nováá

kvalitakvalita

A

AA

AAA A

AAA

A

A

AA

A AA

A

A

B

B

B

B

B

B BB

BB

BBBB

B B

BB

B B

A

X2

X1

V kombinaci parametrů je

prediktivní síla

BB

A

AA

AAA A

AAA

A

A

AA

A AA

A

A

B

B

B

B

B

B BB

BB

BBBB

B B

BB

B B

A

X2

X1

V kombinaci parametrů je

prediktivní síla

BB

1 2 3 4 5 6 7 8 9 10 11 12 13

Species rank

Qua

ntity

Forms

-> X1 X2 X3Species 1

. . .II . . .III . . .IV . . .V . . .VI . . .VII . . .

Primary data

Species rank models

Derived indices

S, ‘species richness’

R1

= (S-1)ln

N

R2 = S/√N

= -∑i

(pi

.lnpi

)

N1 = eH´

N2 = 1/∑i

pi2

E1 = H´/ln

S = H´/ H´max

H´adj

There is redundant offer of measures, however There is redundant offer of measures, however without focus on small communitieswithout focus on small communities

Analýza dat o biodiverzitAnalýza dat o biodiverzitěě

Stochastic

modelsNiche

oriented

models

> 20 species

> 4 –

5 species

TokeshiTokeshi, J. , J. AnnualAnnual EcolEcol., ., 1990 1990 –– 19941994

Pi

= f(N,S,k)

Analýza dat o biodiverzitAnalýza dat o biodiverzitěě

--

modelovmodelováánníí

MatBiolMatBiol

a aplikovana aplikovanáá

analýza dat analýza dat

Biostatistika

Základy stochastického modelování

Vícerozměrné

metody zpracování

dat

Hodnocení

ekologických rizikEnvironmentální

aplikace

Analýza biodiverzity

Experimentální

vědyGenomika, proteomika

Klinické

studieKlinická

a populační

data

Ana

lýza

dat

na

PC

P

lánováníexperim

entů

Faculty of Science, Masaryk University, Brno

Faculty of Medicine, Masaryk University, Brno

Současný trend stochastické

analýzy dat

Od zobecněník individualizaci

Od zobecnOd zobecněěnníí

k individualizacik individualizaciPo

dílp

řeží

vajíc

ích

paci

entů

Čas

(měsíce)

0.0

0.2

0.4

0.6

0.8

1.0

0 20 40 60 80 100 120

p = 0,032 0.0

0.3

0.5

0.8

1.0

0 10 20 30 40 50 60

p = 0,001

Posun v mediánu přežití

múže být klinicky i statisticky

významný -

ALE nikdy se nebude týkat všech pacientů

Od zobecnOd zobecněěnníí

k individualizacik individualizaci

Člověk -

pacient

Léčba

Nádor

+ molekulárně biologická

data

Od zobecnOd zobecněěnníí

k individualizacik individualizaci

I. Vícerozměrná investigativní

analýza

III. Pravděpodiobnostní

predikce na individuální

bázi

II. Definice diskriminačních indexů/skóre

M / (A + 0.5)

(M + 0.3*KI-67) / (A + 8.5)

Di = 0.096.[PCNA] -

0.108.[KI] + 1.802.[M] -

1.688.[A] -

1.042

-1

1

-1 10

PC1 (60.47 %)

PC2 (

28.0

5 %

)

KI-67

bcl2

Apoptosis

Mitosis

Estim

ated

pro

babi

lity

of e

arly

rela

pse

Ratio M / (A + 0.5)

Regression95% confid.0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5

M/(A+0.5) =1.0

P =0.50

Regression95% confid.0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5

M/(A+0.5) =1.5

P =0.50Grade = 2Grade = 1

Index Mitosis / (Apoptosis + 0.5)

Typ

II. (36.4%)

Mitóza

(M)

Diploidní

nádor

Aneuploidní

nádor

0

0

Apoptóza

(A)

[0.69;0.45]

Typ

I. (13.1%) Typ

III. (35.6%)

Typ

IV. (14.8%)

Neregulovaný intenzivní

růst

Degenerovaný fenotyp

N =

565

nád

orov

ých

vzor

kůod

5 d

iagn

ostic

kých

skup

in

Definice čtyř

typů

tumorů

na základě

apoptoticko

mitotické charakteristiky I –

IV, s korelacemi k ploiditě

a dalším markerům

Plně

regulovaný

Regulovaný / regresivní

typ

Od zobecnOd zobecněěnníí

k individualizacik individualizaci

N =

565

nád

orov

ých

vzor

kůod

5 d

iagn

ostic

kých

skup

in

DFS

0.0

0.2

0.4

0.6

0.8

1.0

0 20 40 60 80 100 120 1400.0

0.2

0.4

0.6

0.8

1.0

0 20 40 60 80 100 120 140

OS

Typ II

Typ I

Typ IVTyp III

Čas (měsíce)

Od zobecnOd zobecněěnníí

k individualizacik individualizaci

Gene expression profiles

Discrimination

power

?

Association

with

clinical

data ?

Information

redundancy

?

S. Ramaswamy

et

al., Nature Genetics, January

2003

?

Analýza Analýza genomickýchgenomických

a a proteomickýchproteomických

datdat

Faculty of Science, Masaryk University, Brno

Faculty of Medicine, Masaryk University, Brno

Analytik dat jako vývojář software ?

Comprehensive presentations with comments and access to appropriate analytic tools

Comprehensive presentations with comments and access to appropriate analytic tools

Data browser -

analysis of individual parameters

Data browser -

analysis of individual parameters

Predefined user controlled analytic tools

Predefined user controlled analytic tools

SW SW solutionsolution

UkUkáázka produktu zka produktu

UkUkáázka produktu zka produktu

About project

News

Epidemiological Epidemiological analysesanalyses

Publications, reports

Software SVODAnalytic tools

tutorialIncidence and mortalityIncidence and mortality

Time trendsTime trends

Regional overviewRegional overview

Age analysesAge analyses

Clinical stagesClinical stages

International dataInternational data

Comparative standardsComparative standards

Comprehensive overviewComprehensive overview

Epidemiological Epidemiological analysesanalyses

http://www.svod.cz

PortalPortal

solutionsolution

Rozvoj studijního oboru „Matematická biologie“ PřF MU Brno je finančně

podporován prostředky projektu

ESF č. CZ.1.07/2.2.00/07.0318 „Víceoborová inovace studia matematická biologie“a státním rozpočtem České republiky

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ