Basic Statistical Analysis (Practical Approach)
-
Upload
vaughan-taylor -
Category
Documents
-
view
35 -
download
1
description
Transcript of Basic Statistical Analysis (Practical Approach)
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
Introduction to Clinical Research
Basic Statistical Analysis(Practical Approach)
PhD course
Introduction to Clinical Research
University of Copenhagen, Bispebjerg University Hospital
March 2013
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
Ingredients:
●Choice of method – what kind of data for the analysis●Normal Continouos Variable, 2 groups
●Paired - T-test●Unpaired – F-test and T-test
Normal Continouos Variable, more groupsANOVA
Dichotomous VariableChi-square test and fictive SD
●Spreadsheet, functions and macros
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
80 100 120 140 160 180 200 220 240 2600
2
4
6
8
10
12
14
16
18
Best determination of mean value?
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
Where was the mean value determined best?
The precision, also intuitively, is dependent on the relation between ”height and width”.
These relations are described in the t- as well as the Chi2- and F-distributions
The t-distribution is used to evaluate the height-width relation when looking at the normal-distribution.
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
Paired data – evalution of medicine – NOT evaluation of population blood pressure (which is just ”noise”)
Person mmHg Before mmHg After Difference1 135 110 252 80 60 203 105 80 254 75 55 205 140 120 206 95 70 257 90 70 208 125 100 25
SD 24,99 24,04 2,67SEM 8,84 8,50 0,94Average 105,63 83,13 22,50
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
60 70 80 90 100 110 120 130 1400
2
4
6
8
10
12
14
16
18
Fictive, illustrative curves with same SEM (no need for F-test), ”No overlap” (at 95% cut off), p-value <0.001
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
T-test, paired5,85671E-008
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
Person (KBH) Person (GL)135 11080 60
105 8075 55
140 12095 7090 70
125 100SD 24,99 24,04SEM 8,84 8,50Average 105,63 83,13
Unpaired data – it is not possible to subtract GL persons from KBH persons
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
60 70 80 90 100 110 120 130 1400
2
4
6
8
10
12
14
16
18
Fictive curves with different SEM (F-test needed!), overlap (at 95% cut off), p-value >0.05
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
F-test T-test, unpaired
0,9214535572 0,0878279815
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
ANOVA-test (Analysis Of Variance)●One variable and more than two groups (one way-ANOVA)
●Two or more varying parameters (two way-,Multivariate-ANOVA)
●One way-ANOVA with just two groups is the same as T-Test, whereas several T-test gives the risk of mass significans problems
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
Dichotomous Data analysis and test (Chi-Square Test)
Affected Not Affected Total Chi-Square TestExposed 80 20 100 4,8288776E-074Unexposed 15 85 100Total 63,3 36,7 100
Affected Not AffectedExposed a bUnexposed c d
Relative Risk (RR) for Affected when Exposed: a/(a+b)*(c+d)/c (= 5.33)SD for Ln(RR): Squareroot (1/a+1/c-1/(a+b)-1/(c+d))
Odds Ratio (OR) for Exposed when Affected: a/c*d/b (= 22.6)SD for Ln(OR): Squareroot (1/a+1/b+1/c+1/d)
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
So now we've seen the different test end up with a p-value. So let's make sure we have the definition straight:
Definition:
P-value: The Probability of getting the observed results (or more extreme) although the null-hypothesis is true.
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
Often, with more than one result, evaluate of those results statistically are performed even though any results except the primary endpoint only carry hypothesis generating potential.
With more results the is a risk of mass-significance. To avoid that a Bonferoni-correction is needed:
The Bonferoni-correction is the simplest correction for mass-significance and it is very conservative. It is only valid for evaluating significance, i.e. preventing Type I errors. Power will be lost using Bonferoni. Bonferoni is only usable with a little number of results (<30).
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
Example why Bonferoni-correction is needed:
P (for at least one significant result) = 1 – P (no significant result)↕P (for at least one significant result) = 1 – (1-0.05)20
↕P (for at least one significant result) = 0.64
How is Bonferoni-correction done:
Simple: The general significance level (alpha), must be divided by number of results evaluated, i.e. alpha
i = alpha/i
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
Going more into detail with the statistical analysis, you should consider:
Origin of noise and contribution to SD?
Type of noise. What is it indicating?
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
Is noise additive and what about SD then?
SDTotal=√(SD1 2+ SD22+ ...+ SDX 2 )
YES!
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
Now what if one of the noise components is systematic?
Bias (systematic noise) Random noise
Ideal
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
We can (try to) design the experiment away from bias
We can (try to) be skilled away from random noise
Remember:
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
Tips, tricks and drop outs:
If at all possible, always show your original data e.g. in a graph or in a table.
In that way you have been as honest as possible to your findings and readers, who then, when viewing your data can decide for herself if she wants to believe it or not.
Many continouos data sets have a right skewed part of the distribution. This can often be ”corrected” to a normal distribution by log(data-points) – and then the T-, F- or ANOVA can be done.
Remember, all the statistical calculations are based on your own subjective asssumptions – do you believe the results yourself?
For at ændre ”Enhedens navn” og ”Sted og dato”:
Klik i menulinjen, vælg ”Indsæt” > ”Sidehoved / Sidefod”.Indføj ”Sted og dato” i feltet for dato og ”Enhedens navn” i Sidefod
http://en.wikipedia.org/wiki/List_of_statistical_packages
http://office.microsoft.com/en-us/excel-help/load-the-analysis-toolpak-HP001127724.aspx