Post on 13-Mar-2018
INSTITUT BIOSTATISTIKY A ANALÝZLékařská fakulta & Přírodovědecká fakulta
Masarykova univerzita, Brno www.iba.muni.cz
AplikovanAplikovanáá analýza dat v oboru analýza dat v oboru matematickmatematickáá biologie biologie
Kamenice 126/3, 625 00 Brno, Kamenice 126/3, 625 00 Brno, CzechCzech RepublicRepublic
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ
IBA MU IBA MU ––
hlavnhlavníí
projektovprojektovéé
oblasti oblasti
1)
Epidemiologie zhoubných nádorů, prediktivní
epidemiologie
2)
Analýza klinických dat, diagnostická
síla testů
3)
Hledání
prognostických a prediktivních faktorů
v medicíně
4)
Budování, správa a analýza klinických registrů
5)
Analýza humánních a ekologických rizik
6)
Analýza environmentálních dat, analýza biodiverzity, faktory ovlivňující životní
prostředí, environmentální
informatika
7)
Zdravotnická
informatika, vývoj analytických a expertních systémů
8)
Modelování
biologických systémů
a simulace
9)
Analýza obrazových dat
10)
Genomika, proteomika, analýza molekulárně
biologických dat
Evironmentální vědy
Analýza experimentálních
dat
Analýza klinických a populačních dat
Výzkum a vývoj nových technologií, biotechnologií
Genomika, proteomika, genové
inženýrství
Klinický výzkum a zdravotnictví
Základní
biologický výzkum
Ekologický výzkum
Plánování
a optimalizace experimentu
Matematický biolog a analýza datMatematický biolog a analýza dat
MatematickMatematickáá
biologie zasahuje vbiologie zasahuje vššechny echny úúrovnrovněě
Prospektivní
Retrospektivní
Popis proběhlých změn
EkosystémPřírodní
populace
Experimentální přístupy
JedinecExperimentální
populace
Molekulární úroveň
Molekulárně
biologické a biochemické
markery
Mechanismy účinku
BIOINDIKACE
BIOTESTY
BIOMARKERY
Matematický biolog a analýza dat: pMatematický biolog a analýza dat: přřidanidanáá
hodnotahodnota
InformatikMatematik
Statistik
ANALYTIK
ProgramátorVývojář
Významný podíl práce s externími znalostmi
Schopnost kritické
zpětné
vazby
Computational biology Computational biology ––
overall viewoverall viewB
ache
lor d
egre
eM
Scde
gree
Biology Mathematics ICTs
Basic courses –
scientific background of computational biology
Advanced courses on general topics of biology, mathematics, ICT
Ecology
Experimental biology
Molecular biology
And many more …
And many more …
Specialization: select your mission
Stochastic modelling
Multivariate analyses
Biostatistics
Bac
helo
rdeg
ree
MSc
degr
ee
1st
year 2nd
year 3rd
year Specialization
4th
year 5th
year Specialization Overall
Biology Mathematics ICT
53%
27%
20%
57%29%
14%
45%
33%
22%
43%
37%
20%
11%
45%
44%
0%
80%
20%31%
45%
24%34%
35%
31%
Computational biology Computational biology ––
overall viewoverall view
ANALÝZA DATANALÝZA DAT
DeteministickáStochastická?
x = ln (koncentrace)μp = ln EDp
α
Y =1+ p β (x - μp)
µp X
1 - p e
α
Y
A. Výpočet efektivní koncentrace (ECx)
pα
Popis, definice
Verifikace, 0
1
2
3
4
5
0 0,2 0,4 0,6 0,8 1
ANALÝZA DAT je o datech ANALÝZA DAT je o datech
Ukázka uspořádaného datového souborucislo stadium vek tran1_3 tran1_4 tran1_5 tran1_6 alb_pbsct ldh_vstup sternum typ_myel
1 3 33 104.36 23.24 104.3 57.77 33 6.02 0.4 IgG2 3 33 184.88 7.84 105.5 13.82 26 4.01 30 IgG3 1 34 123.41 9.8 73.3 13.05 32 3.73 45.2 IgG4 2 43 52.17 6.66 18.03 17.19 42 4.67 40.8 IgG5 1 45 8.22 2.2 8.22 32 8.25 2 B-J6 3 46 403.08 115.31 29.7 7.17 38.8 IgA7 2 49 4.5 12.25 34 4.99 6.4 IgG8 2 50 33.13 9.64 33.13 35 3.99 14 IgG9 3 52 257.08 12.05 85.16 3.24 39 12.14 12.2 IgG10 2 53 78.33 11.34 47.54 7.77 39 5.3 13.6 IgG11 3 53 61.43 4.67 14.38 3.72 32 4.51 49.2 B-J12 3 53 135.8 6.7 135.8 59.3 38 26 IgG13 3 54 129.16 13.33 92.6 38.24 32 4.18 20 IgG14 3 54 66.89 6.74 33.58 17.3 38 8.44 7.2 B-J15 3 54 82.86 4.32 18.9 16.4 37 3.6 50 B-J16 3 55 71.37 6.34 23.91 5.34 43 8.75 27 B-J17 3 60 14.6 0.9 14.6 11.88 44 5.35 7.5 IgG18 3 61 94.07 5.62 94.07 1.51 33 4.29 6.4 B-J19 3 62 86.84 7.53 32.13 2.61 29 4.55 34 IgA
Primární dataPrimární data SumarizaceSumarizace• v jedné skupině („one-sample“)
• ve dvou skupinách („two-sample“)
• ve více skupinách („multiple sample“)
ANALÝZA BIOLOGICKÝCH DAT je o variabilitANALÝZA BIOLOGICKÝCH DAT je o variabilitěě
Data
2,12,83,21,25,22,9
Variabilita opakovaných měření
rozptyl znaku, přirozená variabilita
165 cm 140 cm 182 cm 163 cm
Variabilita znaku v populaci
chyba = nepřesnost modelu
Variabilita modelovaných dat
Variabilita časových řad
Variabilita ve skladběbiologických společenstev
DRUH 1DRUH 2DRUH 3DRUH 4
15304014
biodiverzitafluktuace, časová proměnlivost
chyba
y
x
y
čas
Jak vznikajJak vznikajíí
analýzou dat informace analýzou dat informace
KOLIK
se naměřilo
KOLIK
se naměřilo
CO
se naměřilo
CO
se naměřilo
Diskrétní
data
Spojitá
data
A B C D E
y
xI II III IV V
y
x
X: měřený znak
Y: frekvence-
absolutní
/ relativní
ANALÝZA DATANALÝZA DAT
Stochastická
Explorační
Konfirmační
0
0,25
0,5
0,75
1
0 0,2 0,4 0,6 0,8 10
0,25
0,5
0,75
1
0 0,2 0,4 0,6 0,8 1
1
2
MAX
MIN
MAX
MIN
1
2
Prokázání rozdílu ve středových hodnotách i přes variabilitu znaku
ANALÝZA DATANALÝZA DAT
Statických systémů Dynamických systémů
0
0,25
0,5
0,75
1
0 0,2 0,4 0,6 0,8 1
Typologie
Klasifikace
Diskriminace
0.0
0.2
0.4
0.6
0.8
1.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5
M/(A+0.5) =1.0
P =0.50
Vývoj a trendy
Sesonalita
Pravděpodobnost změny
a1
a2a2
Predikce
ANALÝZA DATANALÝZA DAT
.
.
.
.
.
.
.
.
.
.
x
Sumarizace statistikou
středu a variability
Primární
dataPrimární
data
Vícerozměrné analýzy
Vícerozměrné analýzy
1
n
2. STATISTICKÉ TESTY
2. STATISTICKÉ TESTYODHADYODHADY
POPIS?(• ±)
• bodové
• intervaly spolehlivosti
.
.
.
.
.
.
.
.
.
.
x
A
SROVNÁNÍ?
1. Odhady (sumarizace)
x
.
.
.
.
.
.
.
.
.
.
B..........
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
xpx3x2x1 ……….
……….
ANALÝZA DATANALÝZA DAT
Jednorozměrná Vícerozměrná
YY X1X1 X2X2 X3X3 X4X4 XpXp
nn
11
VVíícerozmcerozměěrnrnáá
analýza dat = novanalýza dat = nováá
kvalitakvalita
VVíícerozmcerozměěrnrnáá
analýza dat = novanalýza dat = nováá
kvalitakvalita
A
AA
AAA A
AAA
A
A
AA
A AA
A
A
B
B
B
B
B
B BB
BB
BBBB
B B
BB
B B
A
X2
X1
V kombinaci parametrů je
prediktivní síla
BB
A
AA
AAA A
AAA
A
A
AA
A AA
A
A
B
B
B
B
B
B BB
BB
BBBB
B B
BB
B B
A
X2
X1
V kombinaci parametrů je
prediktivní síla
BB
1 2 3 4 5 6 7 8 9 10 11 12 13
Species rank
Qua
ntity
Forms
-> X1 X2 X3Species 1
. . .II . . .III . . .IV . . .V . . .VI . . .VII . . .
Primary data
Species rank models
Derived indices
S, ‘species richness’
R1
= (S-1)ln
N
R2 = S/√N
H´
= -∑i
(pi
.lnpi
)
N1 = eH´
N2 = 1/∑i
pi2
E1 = H´/ln
S = H´/ H´max
H´adj
There is redundant offer of measures, however There is redundant offer of measures, however without focus on small communitieswithout focus on small communities
Analýza dat o biodiverzitAnalýza dat o biodiverzitěě
Stochastic
modelsNiche
oriented
models
> 20 species
> 4 –
5 species
TokeshiTokeshi, J. , J. AnnualAnnual EcolEcol., ., 1990 1990 –– 19941994
Pi
= f(N,S,k)
Analýza dat o biodiverzitAnalýza dat o biodiverzitěě
--
modelovmodelováánníí
MatBiolMatBiol
a aplikovana aplikovanáá
analýza dat analýza dat
Biostatistika
Základy stochastického modelování
Vícerozměrné
metody zpracování
dat
Hodnocení
ekologických rizikEnvironmentální
aplikace
Analýza biodiverzity
Experimentální
vědyGenomika, proteomika
Klinické
studieKlinická
a populační
data
Ana
lýza
dat
na
PC
P
lánováníexperim
entů
Faculty of Science, Masaryk University, Brno
Faculty of Medicine, Masaryk University, Brno
Současný trend stochastické
analýzy dat
Od zobecněník individualizaci
Od zobecnOd zobecněěnníí
k individualizacik individualizaciPo
dílp
řeží
vajíc
ích
paci
entů
Čas
(měsíce)
0.0
0.2
0.4
0.6
0.8
1.0
0 20 40 60 80 100 120
p = 0,032 0.0
0.3
0.5
0.8
1.0
0 10 20 30 40 50 60
p = 0,001
Posun v mediánu přežití
múže být klinicky i statisticky
významný -
ALE nikdy se nebude týkat všech pacientů
Od zobecnOd zobecněěnníí
k individualizacik individualizaci
Člověk -
pacient
Léčba
Nádor
+ molekulárně biologická
data
Od zobecnOd zobecněěnníí
k individualizacik individualizaci
I. Vícerozměrná investigativní
analýza
III. Pravděpodiobnostní
predikce na individuální
bázi
II. Definice diskriminačních indexů/skóre
M / (A + 0.5)
(M + 0.3*KI-67) / (A + 8.5)
Di = 0.096.[PCNA] -
0.108.[KI] + 1.802.[M] -
1.688.[A] -
1.042
-1
1
-1 10
PC1 (60.47 %)
PC2 (
28.0
5 %
)
KI-67
bcl2
Apoptosis
Mitosis
Estim
ated
pro
babi
lity
of e
arly
rela
pse
Ratio M / (A + 0.5)
Regression95% confid.0.0
0.2
0.4
0.6
0.8
1.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5
M/(A+0.5) =1.0
P =0.50
Regression95% confid.0.0
0.2
0.4
0.6
0.8
1.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5
M/(A+0.5) =1.5
P =0.50Grade = 2Grade = 1
Index Mitosis / (Apoptosis + 0.5)
Typ
II. (36.4%)
Mitóza
(M)
Diploidní
nádor
Aneuploidní
nádor
0
0
Apoptóza
(A)
[0.69;0.45]
Typ
I. (13.1%) Typ
III. (35.6%)
Typ
IV. (14.8%)
Neregulovaný intenzivní
růst
Degenerovaný fenotyp
N =
565
nád
orov
ých
vzor
kůod
5 d
iagn
ostic
kých
skup
in
Definice čtyř
typů
tumorů
na základě
apoptoticko
–
mitotické charakteristiky I –
IV, s korelacemi k ploiditě
a dalším markerům
Plně
regulovaný
Regulovaný / regresivní
typ
Od zobecnOd zobecněěnníí
k individualizacik individualizaci
N =
565
nád
orov
ých
vzor
kůod
5 d
iagn
ostic
kých
skup
in
DFS
0.0
0.2
0.4
0.6
0.8
1.0
0 20 40 60 80 100 120 1400.0
0.2
0.4
0.6
0.8
1.0
0 20 40 60 80 100 120 140
OS
Typ II
Typ I
Typ IVTyp III
Čas (měsíce)
Od zobecnOd zobecněěnníí
k individualizacik individualizaci
Gene expression profiles
Discrimination
power
?
Association
with
clinical
data ?
Information
redundancy
?
S. Ramaswamy
et
al., Nature Genetics, January
2003
?
Analýza Analýza genomickýchgenomických
a a proteomickýchproteomických
datdat
Faculty of Science, Masaryk University, Brno
Faculty of Medicine, Masaryk University, Brno
Analytik dat jako vývojář software ?
Comprehensive presentations with comments and access to appropriate analytic tools
Comprehensive presentations with comments and access to appropriate analytic tools
Data browser -
analysis of individual parameters
Data browser -
analysis of individual parameters
Predefined user controlled analytic tools
Predefined user controlled analytic tools
SW SW solutionsolution
UkUkáázka produktu zka produktu
UkUkáázka produktu zka produktu
About project
News
Epidemiological Epidemiological analysesanalyses
Publications, reports
Software SVODAnalytic tools
tutorialIncidence and mortalityIncidence and mortality
Time trendsTime trends
Regional overviewRegional overview
Age analysesAge analyses
Clinical stagesClinical stages
International dataInternational data
Comparative standardsComparative standards
Comprehensive overviewComprehensive overview
Epidemiological Epidemiological analysesanalyses
http://www.svod.cz
PortalPortal
solutionsolution
Rozvoj studijního oboru „Matematická biologie“ PřF MU Brno je finančně
podporován prostředky projektu
ESF č. CZ.1.07/2.2.00/07.0318 „Víceoborová inovace studia matematická biologie“a státním rozpočtem České republiky
INVESTICE DO ROZVOJE VZDĚLÁVÁNÍ