Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF...

31
INSTITUT BIOSTATISTIKY A ANALÝZ Lékařská fakulta & Přírodovědecká fakulta Masarykova univerzita, Brno www.iba.muni.cz Aplikovan Aplikovan á á analýza dat v oboru analýza dat v oboru matematick matematick á á biologie biologie Kamenice 126/3, 625 00 Brno, Kamenice 126/3, 625 00 Brno, Czech Czech Republic Republic INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ

Transcript of Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF...

Page 1: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

INSTITUT BIOSTATISTIKY A ANALÝZLékařská fakulta & Přírodovědecká fakulta

Masarykova univerzita, Brno www.iba.muni.cz

AplikovanAplikovanáá analýza dat v oboru analýza dat v oboru matematickmatematickáá biologie biologie

Kamenice 126/3, 625 00 Brno, Kamenice 126/3, 625 00 Brno, CzechCzech RepublicRepublic

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ

Page 2: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

IBA MU IBA MU ––

hlavnhlavníí

projektovprojektovéé

oblasti oblasti

1)

Epidemiologie zhoubných nádorů, prediktivní

epidemiologie

2)

Analýza klinických dat, diagnostická

síla testů

3)

Hledání

prognostických a prediktivních faktorů

v medicíně

4)

Budování, správa a analýza klinických registrů

5)

Analýza humánních a ekologických rizik

6)

Analýza environmentálních dat, analýza biodiverzity, faktory ovlivňující životní

prostředí, environmentální

informatika

7)

Zdravotnická

informatika, vývoj analytických a expertních systémů

8)

Modelování

biologických systémů

a simulace

9)

Analýza obrazových dat

10)

Genomika, proteomika, analýza molekulárně

biologických dat

Page 3: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Evironmentální vědy

Analýza experimentálních

dat

Analýza klinických a populačních dat

Výzkum a vývoj nových technologií, biotechnologií

Genomika, proteomika, genové

inženýrství

Klinický výzkum a zdravotnictví

Základní

biologický výzkum

Ekologický výzkum

Plánování

a optimalizace experimentu

Matematický biolog a analýza datMatematický biolog a analýza dat

Page 4: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

MatematickMatematickáá

biologie zasahuje vbiologie zasahuje vššechny echny úúrovnrovněě

Prospektivní

Retrospektivní

Popis proběhlých změn

EkosystémPřírodní

populace

Experimentální přístupy

JedinecExperimentální

populace

Molekulární úroveň

Molekulárně

biologické a biochemické

markery

Mechanismy účinku

BIOINDIKACE

BIOTESTY

BIOMARKERY

Page 5: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Matematický biolog a analýza dat: pMatematický biolog a analýza dat: přřidanidanáá

hodnotahodnota

InformatikMatematik

Statistik

ANALYTIK

ProgramátorVývojář

Významný podíl práce s externími znalostmi

Schopnost kritické

zpětné

vazby

Page 6: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Computational biology Computational biology ––

overall viewoverall viewB

ache

lor d

egre

eM

Scde

gree

Biology Mathematics ICTs

Basic courses –

scientific background of computational biology

Advanced courses on general topics of biology, mathematics, ICT

Ecology

Experimental biology

Molecular biology

And many more …

And many more …

Specialization: select your mission

Stochastic modelling

Multivariate analyses

Biostatistics

Page 7: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Bac

helo

rdeg

ree

MSc

degr

ee

1st

year 2nd

year 3rd

year Specialization

4th

year 5th

year Specialization Overall

Biology Mathematics ICT

53%

27%

20%

57%29%

14%

45%

33%

22%

43%

37%

20%

11%

45%

44%

0%

80%

20%31%

45%

24%34%

35%

31%

Computational biology Computational biology ––

overall viewoverall view

Page 8: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

ANALÝZA DATANALÝZA DAT

DeteministickáStochastická?

x = ln (koncentrace)μp = ln EDp

α

Y =1+ p β (x - μp)

µp X

1 - p e

α

Y

A. Výpočet efektivní koncentrace (ECx)

Popis, definice

Verifikace, 0

1

2

3

4

5

0 0,2 0,4 0,6 0,8 1

Page 9: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

ANALÝZA DAT je o datech ANALÝZA DAT je o datech

Ukázka uspořádaného datového souborucislo stadium vek tran1_3 tran1_4 tran1_5 tran1_6 alb_pbsct ldh_vstup sternum typ_myel

1 3 33 104.36 23.24 104.3 57.77 33 6.02 0.4 IgG2 3 33 184.88 7.84 105.5 13.82 26 4.01 30 IgG3 1 34 123.41 9.8 73.3 13.05 32 3.73 45.2 IgG4 2 43 52.17 6.66 18.03 17.19 42 4.67 40.8 IgG5 1 45 8.22 2.2 8.22 32 8.25 2 B-J6 3 46 403.08 115.31 29.7 7.17 38.8 IgA7 2 49 4.5 12.25 34 4.99 6.4 IgG8 2 50 33.13 9.64 33.13 35 3.99 14 IgG9 3 52 257.08 12.05 85.16 3.24 39 12.14 12.2 IgG10 2 53 78.33 11.34 47.54 7.77 39 5.3 13.6 IgG11 3 53 61.43 4.67 14.38 3.72 32 4.51 49.2 B-J12 3 53 135.8 6.7 135.8 59.3 38 26 IgG13 3 54 129.16 13.33 92.6 38.24 32 4.18 20 IgG14 3 54 66.89 6.74 33.58 17.3 38 8.44 7.2 B-J15 3 54 82.86 4.32 18.9 16.4 37 3.6 50 B-J16 3 55 71.37 6.34 23.91 5.34 43 8.75 27 B-J17 3 60 14.6 0.9 14.6 11.88 44 5.35 7.5 IgG18 3 61 94.07 5.62 94.07 1.51 33 4.29 6.4 B-J19 3 62 86.84 7.53 32.13 2.61 29 4.55 34 IgA

Primární dataPrimární data SumarizaceSumarizace• v jedné skupině („one-sample“)

• ve dvou skupinách („two-sample“)

• ve více skupinách („multiple sample“)

Page 10: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

ANALÝZA BIOLOGICKÝCH DAT je o variabilitANALÝZA BIOLOGICKÝCH DAT je o variabilitěě

Data

2,12,83,21,25,22,9

Variabilita opakovaných měření

rozptyl znaku, přirozená variabilita

165 cm 140 cm 182 cm 163 cm

Variabilita znaku v populaci

chyba = nepřesnost modelu

Variabilita modelovaných dat

Variabilita časových řad

Variabilita ve skladběbiologických společenstev

DRUH 1DRUH 2DRUH 3DRUH 4

15304014

biodiverzitafluktuace, časová proměnlivost

chyba

y

x

y

čas

Page 11: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Jak vznikajJak vznikajíí

analýzou dat informace analýzou dat informace

KOLIK

se naměřilo

KOLIK

se naměřilo

CO

se naměřilo

CO

se naměřilo

Diskrétní

data

Spojitá

data

A B C D E

y

xI II III IV V

y

x

X: měřený znak

Y: frekvence-

absolutní

/ relativní

Page 12: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

ANALÝZA DATANALÝZA DAT

Stochastická

Explorační

Konfirmační

0

0,25

0,5

0,75

1

0 0,2 0,4 0,6 0,8 10

0,25

0,5

0,75

1

0 0,2 0,4 0,6 0,8 1

1

2

MAX

MIN

MAX

MIN

1

2

Prokázání rozdílu ve středových hodnotách i přes variabilitu znaku

Page 13: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

ANALÝZA DATANALÝZA DAT

Statických systémů Dynamických systémů

0

0,25

0,5

0,75

1

0 0,2 0,4 0,6 0,8 1

Typologie

Klasifikace

Diskriminace

0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5

M/(A+0.5) =1.0

P =0.50

Vývoj a trendy

Sesonalita

Pravděpodobnost změny

a1

a2a2

Predikce

Page 14: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

ANALÝZA DATANALÝZA DAT

.

.

.

.

.

.

.

.

.

.

x

Sumarizace statistikou

středu a variability

Primární

dataPrimární

data

Vícerozměrné analýzy

Vícerozměrné analýzy

1

n

2. STATISTICKÉ TESTY

2. STATISTICKÉ TESTYODHADYODHADY

POPIS?(• ±)

• bodové

• intervaly spolehlivosti

.

.

.

.

.

.

.

.

.

.

x

A

SROVNÁNÍ?

1. Odhady (sumarizace)

x

.

.

.

.

.

.

.

.

.

.

B..........

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

xpx3x2x1 ……….

……….

Page 15: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

ANALÝZA DATANALÝZA DAT

Jednorozměrná Vícerozměrná

YY X1X1 X2X2 X3X3 X4X4 XpXp

nn

11

Page 16: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

VVíícerozmcerozměěrnrnáá

analýza dat = novanalýza dat = nováá

kvalitakvalita

Page 17: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

VVíícerozmcerozměěrnrnáá

analýza dat = novanalýza dat = nováá

kvalitakvalita

A

AA

AAA A

AAA

A

A

AA

A AA

A

A

B

B

B

B

B

B BB

BB

BBBB

B B

BB

B B

A

X2

X1

V kombinaci parametrů je

prediktivní síla

BB

A

AA

AAA A

AAA

A

A

AA

A AA

A

A

B

B

B

B

B

B BB

BB

BBBB

B B

BB

B B

A

X2

X1

V kombinaci parametrů je

prediktivní síla

BB

Page 18: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

1 2 3 4 5 6 7 8 9 10 11 12 13

Species rank

Qua

ntity

Forms

-> X1 X2 X3Species 1

. . .II . . .III . . .IV . . .V . . .VI . . .VII . . .

Primary data

Species rank models

Derived indices

S, ‘species richness’

R1

= (S-1)ln

N

R2 = S/√N

= -∑i

(pi

.lnpi

)

N1 = eH´

N2 = 1/∑i

pi2

E1 = H´/ln

S = H´/ H´max

H´adj

There is redundant offer of measures, however There is redundant offer of measures, however without focus on small communitieswithout focus on small communities

Analýza dat o biodiverzitAnalýza dat o biodiverzitěě

Page 19: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Stochastic

modelsNiche

oriented

models

> 20 species

> 4 –

5 species

TokeshiTokeshi, J. , J. AnnualAnnual EcolEcol., ., 1990 1990 –– 19941994

Pi

= f(N,S,k)

Analýza dat o biodiverzitAnalýza dat o biodiverzitěě

--

modelovmodelováánníí

Page 20: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

MatBiolMatBiol

a aplikovana aplikovanáá

analýza dat analýza dat

Biostatistika

Základy stochastického modelování

Vícerozměrné

metody zpracování

dat

Hodnocení

ekologických rizikEnvironmentální

aplikace

Analýza biodiverzity

Experimentální

vědyGenomika, proteomika

Klinické

studieKlinická

a populační

data

Ana

lýza

dat

na

PC

P

lánováníexperim

entů

Page 21: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Faculty of Science, Masaryk University, Brno

Faculty of Medicine, Masaryk University, Brno

Současný trend stochastické

analýzy dat

Od zobecněník individualizaci

Page 22: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Od zobecnOd zobecněěnníí

k individualizacik individualizaciPo

dílp

řeží

vajíc

ích

paci

entů

Čas

(měsíce)

0.0

0.2

0.4

0.6

0.8

1.0

0 20 40 60 80 100 120

p = 0,032 0.0

0.3

0.5

0.8

1.0

0 10 20 30 40 50 60

p = 0,001

Posun v mediánu přežití

múže být klinicky i statisticky

významný -

ALE nikdy se nebude týkat všech pacientů

Page 23: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Od zobecnOd zobecněěnníí

k individualizacik individualizaci

Člověk -

pacient

Léčba

Nádor

+ molekulárně biologická

data

Page 24: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Od zobecnOd zobecněěnníí

k individualizacik individualizaci

I. Vícerozměrná investigativní

analýza

III. Pravděpodiobnostní

predikce na individuální

bázi

II. Definice diskriminačních indexů/skóre

M / (A + 0.5)

(M + 0.3*KI-67) / (A + 8.5)

Di = 0.096.[PCNA] -

0.108.[KI] + 1.802.[M] -

1.688.[A] -

1.042

-1

1

-1 10

PC1 (60.47 %)

PC2 (

28.0

5 %

)

KI-67

bcl2

Apoptosis

Mitosis

Estim

ated

pro

babi

lity

of e

arly

rela

pse

Ratio M / (A + 0.5)

Regression95% confid.0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5

M/(A+0.5) =1.0

P =0.50

Regression95% confid.0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5

M/(A+0.5) =1.5

P =0.50Grade = 2Grade = 1

Index Mitosis / (Apoptosis + 0.5)

Page 25: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Typ

II. (36.4%)

Mitóza

(M)

Diploidní

nádor

Aneuploidní

nádor

0

0

Apoptóza

(A)

[0.69;0.45]

Typ

I. (13.1%) Typ

III. (35.6%)

Typ

IV. (14.8%)

Neregulovaný intenzivní

růst

Degenerovaný fenotyp

N =

565

nád

orov

ých

vzor

kůod

5 d

iagn

ostic

kých

skup

in

Definice čtyř

typů

tumorů

na základě

apoptoticko

mitotické charakteristiky I –

IV, s korelacemi k ploiditě

a dalším markerům

Plně

regulovaný

Regulovaný / regresivní

typ

Od zobecnOd zobecněěnníí

k individualizacik individualizaci

Page 26: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

N =

565

nád

orov

ých

vzor

kůod

5 d

iagn

ostic

kých

skup

in

DFS

0.0

0.2

0.4

0.6

0.8

1.0

0 20 40 60 80 100 120 1400.0

0.2

0.4

0.6

0.8

1.0

0 20 40 60 80 100 120 140

OS

Typ II

Typ I

Typ IVTyp III

Čas (měsíce)

Od zobecnOd zobecněěnníí

k individualizacik individualizaci

Page 27: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Gene expression profiles

Discrimination

power

?

Association

with

clinical

data ?

Information

redundancy

?

S. Ramaswamy

et

al., Nature Genetics, January

2003

?

Analýza Analýza genomickýchgenomických

a a proteomickýchproteomických

datdat

Page 28: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Faculty of Science, Masaryk University, Brno

Faculty of Medicine, Masaryk University, Brno

Analytik dat jako vývojář software ?

Page 29: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Comprehensive presentations with comments and access to appropriate analytic tools

Comprehensive presentations with comments and access to appropriate analytic tools

Data browser -

analysis of individual parameters

Data browser -

analysis of individual parameters

Predefined user controlled analytic tools

Predefined user controlled analytic tools

SW SW solutionsolution

UkUkáázka produktu zka produktu

Page 30: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

UkUkáázka produktu zka produktu

About project

News

Epidemiological Epidemiological analysesanalyses

Publications, reports

Software SVODAnalytic tools

tutorialIncidence and mortalityIncidence and mortality

Time trendsTime trends

Regional overviewRegional overview

Age analysesAge analyses

Clinical stagesClinical stages

International dataInternational data

Comparative standardsComparative standards

Comprehensive overviewComprehensive overview

Epidemiological Epidemiological analysesanalyses

http://www.svod.cz

PortalPortal

solutionsolution

Page 31: Lékařská fakulta & Přírodovědecká fakulta Masarykova ... · PDF fileAnalýza experimentálních dat . Analýza klinických a popula. č. ních dat. Výzkum a vývoj nových

Rozvoj studijního oboru „Matematická biologie“ PřF MU Brno je finančně

podporován prostředky projektu

ESF č. CZ.1.07/2.2.00/07.0318 „Víceoborová inovace studia matematická biologie“a státním rozpočtem České republiky

INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ