Post on 04-Apr-2015
L’analyse de varianceL’analyse de variance
L’analyse de varianceL’analyse de variance
L’analyse de variance: ANOVA (ANalysis Of L’analyse de variance: ANOVA (ANalysis Of VAriance)VAriance)
Utilité: tester 2 ou plusieurs hypothèses sur des Utilité: tester 2 ou plusieurs hypothèses sur des population indépendantespopulation indépendantes
ExempleExemple
Acrophobie: Acrophobie: groupe 1: contrôlegroupe 1: contrôlegroupe 2: behavioralgroupe 2: behavioralgroupe 3: rogériengroupe 3: rogérien
0 1 2 3
1 1 2 3
:
:
H
H
Hypothèses: (Les hypothèses directionnelles ne font Hypothèses: (Les hypothèses directionnelles ne font pas de sens lorsqu’il y a plus de deux groupes)pas de sens lorsqu’il y a plus de deux groupes)
Tests Tests tt
Pourquoi ne pas faire 3 tests Pourquoi ne pas faire 3 tests tt ? ?
0 1 2
0 1 3
0 2 3
:
:
:
H
H
H
Comme les Comme les teststests ne sont pas indépendants les uns des autres, ne sont pas indépendants les uns des autres, cela augmente l’erreur commune (familywise error)cela augmente l’erreur commune (familywise error)
Probabilité=(1-)c
Probabilité=(1-)3=0.14
Donc, si on fait trois comparaisons l’erreur de type I sera de 14%.
LogiqueLogiqueEst-ce que les différences entre les moyennes est la conséquence Est-ce que les différences entre les moyennes est la conséquence
d’un effet de traitement? Ou est-ce uniquement de l’erreur ?d’un effet de traitement? Ou est-ce uniquement de l’erreur ?
2
Contrôle Behavioral Rogérien
5 1 3
6 2 3
8 3 4
6.33 2 3.33
1.53 1 0.57
2.34 1 0.33
x
s
s
LogiqueLogiquePour répondre à la question:
- Variabilité à l’intérieur des groupes (erreur d’échantillonnage) « within error »
- Variabilité entre les groupes (erreur d’échantillonnage + effet de traitement ?) « between error »
Si la variabilité intergroupe est largement supérieur a variabilité intragroupe, alors nous aurons un indice de l’effet de traitement.
2
2
2
2
variabilité de l'erreur
variabilité de l'erreur + effet de traitement
intra
inter
interobs
intra
s
s
sF
s
LogiqueLogiqueDegrés de liberté:
Il y a deux degrés de liberté
1- dlinter = nombre de groupes -1 = k-1
2- dlintra = nombre de participants -1 = n-k
Hypothèses:
0 1 2
1 1 2
: ...
: ... (pour au moins un groupe)k
k
H
H
LogiqueLogiquePostulats de base:1- Indépendance
2- Normalité
3- Homogénéité des variances
2
2
max( )0.5 2
min( )i
i
s
s
CalculCalculVariabilité totale = variabilité inter + variabilité intra
le groupe
la grande moyenne
la moyenne d'un groupe
le participant
G
i
i
x
x
p =
Les sommes des carrés
2
1 1
2
1 1
2
1
( )
( )
( )
k n
Total pi Gi p
k n
intra pi ii p
k
inter i i Gi
SC x x
SC x x
SC n x x
Total intra interSC SC SC
CalculCalcul
Les degrés de liberté
1
1
total
intra
inter
dl n
dl n k
dl k
total intra interdl dl dl
Les carrés moyens
2
2
( )
( )
intraintra intra
intra
interinter inter
inter
SCCM s
dl
SCCM s
dl
F
intra
inter
CMF
CM
Table d’ANOVATable d’ANOVA
2
2 1
1
2
1 12
1 1
2
1 1
Source de variation
( )( ) 1
1
( )
( ) ( )
( ) 1
k
i i Gki Inter
i i Gi Intra
k n
pi ik ni p
pi ii p
k n
pi Gi p
SC dl CM F
n x xCM
Inter n x x kk CM
x x
Intra erreur x x n kn k
Total x x n
ExempleExemple
2
Contrôle Behavioral Rogérien
5 1 3
6 2 3
8 3 4
6.33 2 3.33
1.53 1 0.57
2.34 1 0.33
x
s
s
(5 6 8 1 2 3 3 3 4) / 9 3.889Gx
ExempleExemple
32 2
1 1
2 2 2
( ) ( )
3(6.33 3.889) 3(2.00 3.889) 3(3.33 3.889)
17.88 10.70 0.94 29.52
k
inter i i G i i Gi i
inter
inter
SC n x x n x x
SC
SC
3 32
1 1
2 2 2
2 2 2
2 2 2
( )
(5 6.33) (6 6.33) (8 6.33)
(1 2) (2 2) (3 2)
(3 3.33) (3 3.33) (4 6.33)
4.67 2 0.67 7.34
intra pi ii p
intra
intra
SC x x
SC
SC
3 3
2 2
1 1 1 1
2 2 2
2 2 2
2 2 2
( ) ( )
(5 3.889) (6 3.889) (8 3.889)
(1 3.889) (2 3.889) (3 3.889)
(3 3.889) (3 3.889) (4 3.889)
22.59 12.71 1.59 36.89
k n
total pi G pi Gi p i p
total
total
SC x x x x
SC
SC
Les sommes des carrés
7.34 29.52 36.86Total intra interSC SC SC
ExempleExemple
Les degrés de liberté
1 9 1 8
9 3 6
1 3 1 2
total
intra
inter
dl n
dl n k
dl k
6 2 8total intra interdl dl dl
Les carrés moyens
29.5214.76
2
7.341.22
6
interinter
inter
intraintra
intra
SCCM
dl
SCCM
dl
F
14.7612.1
1.22intra
inter
CMF
CM
Table d’ANOVATable d’ANOVA
( , , ) (0.05,2,6) 5.14crit inter intra critF dl dl F
Puisque le Fobs(2,6)=12.1, p<0.05 nous rejetons l’hypothèse nulle. Par conséquent, il y a au moins une différence significative entre les groupes par rapport au traitement d’acrophobie.
Source de variation
29.52 2 14.76 12.1
( ) 7.34 6 1.22
36.89 8
SC dl CM F
Inter
Intra erreur
Total
Mesure de la force d’associationMesure de la force d’association
2 ( 1) 29.52 (3 1)1.22 27.080.71
36.89 1.22 38.11inter intra
total intra
SC k CM
SC CM
Idée: Semblable au r2ajusté
Proportion de la variation totale des données qui peuvent être expliquée par les niveaux des variables indépendantes.
Quelle quantité de la variance peut être expliqué par les différences dans les groupes de traitements?
Donc, 71% de la variance de la variable dépendante (peur des hauteurs) est déterminé par les différences dans les traitements thérapeutique (contrôle, behav. et rogér.)
PuissancePuissance Mesure de la force Mesure de la force
d’associationd’association2
Comparaisons post hocsComparaisons post hocs
Test de SchefféTest de SchefféC’est bien beau savoir qu’il y a une différence significative globale, mais ce que l’on veut savoir c’est quels sont les groupes qui se distinguent des uns et des autres ?
Planification des hypothèses alternatives
1
2
3
:
:
:
C B
C R
B R
H
H
H
4 :2
B CCH
De plus
Test de SchefféTest de SchefféUtilisation des contrastes
1 : C BH
Exemple
1 1 2 2
1
ˆ ...
les "w" peuvent prendre n'importe quelle valeur en autant que
0
k k
k
ii
c w x w x w x
w
1
2
3
1
1
0
0
w
w
w
ˆ (1)6.33 ( 1)2.00 (0)3.33
ˆ 4.33
c
c
Test de SchefféTest de SchefféStatistique utilisée
2 2 222 21 2
1 2
ˆ 4.334.8
(1) ( 1) (0)1.22...
3 3 3
obs
kintra
k
ct
ww wCM
n n n
' 1 ( , , ) 3 1 5.14 3.21crit crit inter intrat k F dl dl
Puisque le tobs>t’crit, on rejette l’hypothèse nulle et nous concluons que le groupe contrôle est significativement (= 0.05) plus élevé que le groupe ayant suivi une thérapie behavioriste.
Test de TukeyTest de TukeyHSD (honestly significant difference)
Planification des hypothèses alternatives
0
1
: 0
: 0
où = , i j ij
H c
H c
c
( , , ) intraintra
CMHSD q dl k
n
Attention, n = nombre de sujet dans un groupe (n1~ n2~ …~ nk)
Si les le nombre de sujet diffère trop, il faut faire la moyenne harmonique
Test de TukeyTest de Tukey
Supposons que vous faites une balade à vélo : vous commencez par escalader une côte de 1km à 20km/h, puis vous redescendez cette même côte à 30km/h. Quelle est votre vitesse moyenne???
Vous avez répondu 25?? Faux!!!
Pour monter : 1km à 20km/h cela me prendra 3 minutes pour gravir la côte.
Pour descendre : 1km à 30km/h cela me prendra 2 minutes pour gravir la côte.
Pour calculer la vitesse moyenne il faut tenir compte du temps.
Distance totale=2 km, par conséquent la vitesse moyenne = 2/t.
Or, le temps total (t) = t1+t2, où t1=1/v1 et t2=1/v2
Donc si on remplace,
vitesse moyenne = 2/(1/v1+1/v2)
vitesse moyenne = 2/(1/20+1/30)=2/5 /60=120/5=24km/h
Moyenne harmonique
Test de TukeyTest de Tukey
Exemple: n1= 4; n2=6 et n3=6
1
3 3 365.143
1 1 1 71 74 6 6 12
4 6 6 165.3333
3 3
H k
i i
kx
n
x
Moyenne harmonique
1
1H k
i i
kx
n
Test de TukeyTest de TukeyTable des différences
1 2
1 1 2 1
2 2
... k
k
k
k
x x x
x x x x x
x x x
x
0Si , on rejette i jx x HSD H
Test de TukeyTest de TukeyExemple
2.00 3.33 6.33
2.00 1.33 4.33
3.33 3.00
6.33
B R C
B
R
C
x x x
x
x
x
0.05
1.22
6
3
3
inter
inter
CM
dl
k
n
(0.05,6,3) 4.34
1.22( , , ) 4.34 2.78
3intra
intra
q
CMHSD q dl k
n
****
* * pp<0.05<0.05