Corso di biomatematica lezione 7: Test di significatività Davide Grandi.
-
Upload
felisa-guarino -
Category
Documents
-
view
217 -
download
0
Transcript of Corso di biomatematica lezione 7: Test di significatività Davide Grandi.
Corso di biomatematica Corso di biomatematica lezione 7:lezione 7:
Test di significativitàTest di significatività
Davide Grandi
Sommario•Test per la bontà dell’adattamento•Stabilire delle ipotesi•Test del 2
•Test del 2 e correzione di Yates
Adattamento dei dati
Davide Grandi - Dottorato in Biologia
• Bontà dell’adattamentoBontà dell’adattamentoLo scopo è verificare se esiste un accordo
tra una distribuzione osservata ed una distribuzione
attesa.Per questo scopo è stato proposto il 2 E’ un metodo detto di INFERENZA statistica.Il 2 serve anche per confrontare 2 o più
distribuzioni statistiche: posso avere:1. differenze piccole (accidentali…)2. differenze grandi (non per caso)Devo dunque dedurre scientificamente:1. differenze sono trascurabili (caso)2. distribuzione osservata realmente diversa
(attesa)
Adattamento dei dati
Davide Grandi - Dottorato in Biologia
• Bontà dell’adattamentoBontà dell’adattamentoVoglio trarre conclusioni generali dal
singolo esperimento:E’ possibile ricorrere al test del
2
utilizzando le frequenze assolute, cioè:
Dove i suffissi indicano la frequenza attesa o osservata ed i
gradi di libertà (g.d.l.) sono n – 1 (n numero di gruppi o
classi NON numero di individui)Se tra n variabili casuali ho k vincoli, i g.d.l.
del 2 corrispondente diventano n – k
n
katt
k
att
k
oss
k
ldg f
ff1
2
)..(
2
Adattamento dei dati
Davide Grandi - Dottorato in Biologia
• Schema Schema Il procedimento logico sarà dunque:• Stabilisco un’ipotesi nulla H0 ed una
alternativa H1 • Scelgo il test più appropriato• Specifico il livello di significatività
(indicato con )• Trovo la distribuzione di campionamento
nell’ipotesi nulla (da tabelle)• Stabilisco la zona di rifiuto (di norma
=0.05 )• Calcolo il valore del test statistico
stimando la probabilità P ad esso associata
• Data P traggo le conclusioni: P> non rifiuto H0 , P< rifiuto H0 e accetto H1
Adattamento dei dati
Davide Grandi - Dottorato in Biologia
• Esempio 1Esempio 1Abbiamo delle distribuzioni fenotipiche
(osservate ed attese) di Pisum sativum in un esperimento di
mendel per due caratteri: distribuzione (teorica attesa
9:3:3:1)
Fenotipi Freq. Osserv.
Freq. Attese
Gialli lisci 315 9/16=312,75
Gialli rugosi 101 3/16=104,25
Verdi lisci 108 3/16=104,25
Verdi rugosi
32 1/16=34,75
totale 556 556,00
Adattamento dei dati
Davide Grandi - Dottorato in Biologia
• Esempio 1Esempio 1Le distribuzione attesa e quella osservata
sono ovviamente diverse, calcoliamoci ora il 2 i cui gradi di
libertà saranno come accennato 3= n – 1
Ora consultiamo le tavole stimando la probabilità di trovare
differenze superiori a quelle riscontrate nell’ipotesi nulla H0
47,0
25,10425,104101
75,31275,312315
....
22
)3(
2
Adattamento dei dati
Davide Grandi - Dottorato in Biologia
• Esempio 1Esempio 1Per =0,05Per 3 gradi di libertà (come accennato 3= n
– 1) Abbiamo 2 =7,81
Il valore calcolato dunque è molto diverso da quello riportato
in tabella per =0,05, ovvero la probabilità di trovare per
caso le differenze osservate o ancora maggiori che possano
essere attribuite al caso è alta, superiore al valore
prefissato del 5%, in generale avremo2 alto probabile H1 2 basso probabile H0
Adattamento dei dati
Davide Grandi - Dottorato in Biologia
• Esempio 2Esempio 2Abbiamo una popolazione di Mixodiaptomus
kupelwieseri campionate in una pozza temporanea sono
state osservate le seguenti frequenze di 4 alleli del locus MPI
(mannoso fosfato isomerasi):
Tipo di Allele
Freq. Osserv.
Allele 1 26
Allele 2 38
Allele 3 62
Allele 4 118
totale 244
Adattamento dei dati
Davide Grandi - Dottorato in Biologia
• Esempio 2Esempio 2Mi chiedo dunque se sono le stesse
frequenze (differenze dovute al caso) ovvero ipotesi nulla H0 Oppure sono differenti, ipotesi alternativa
H1?Ora se fosse vera l’ipotesi nulla dovrei
avere frequenza 244/4 = 61 (valore atteso), per cui
calcolando il 2 otteniamo:
03,82
616162
616126
....
22
)3(
2
Adattamento dei dati
Davide Grandi - Dottorato in Biologia
• Esempio 2Esempio 2 Dalla tabella del 2 per tre gradi di libertà
abbiamoPer = 0.05 abbiamo 2 = 7,82Per = 0.01 abbiamo 2 = 11,43Per = 0.001 abbiamo 2 =16,27
Il valore del 2 calcolato da noi è superiore, il che significa
che la probabilità che le differenze tra le frequenze attese e
quelle riscontrate siano dovute al caso è molto piccola,
inferiore anche allo 0,1%.Rigetto l’ipotesi H0 e accetto H1
Adattamento dei dati
Davide Grandi - Dottorato in Biologia
• Validità e correzione di Yates Validità e correzione di Yates Il valore del 2 è determinato dai gradi di
libertà e quindi dal numero di gruppi, se il numero di frequenze
attese e piccolo, o il campione contiene pochi elementi (tra
100 e 30), è necessario correggere per la continuità
(Yates).Ovvero data la misura precisa X si dovrà
considerare lo spazio unitario compreso tra X – 0.5 e
X+0.5.Posso calcolare dunque il 2 in due modi:1. Sottraggo 0.5 ad ogni scarto in valore
assoluto2. Sottraggo 0.5 allo scarto maggiore e
aggiungo 0.5 a quello minoreRiduco sempre con la correzione il valore
del 2
Adattamento dei dati
Davide Grandi - Dottorato in Biologia
• Test a 1 e a 2 codeTest a 1 e a 2 codeAbbiamo la possibilità di effettuare dei test
cosiddetti ad una coda (unilaterali) o a due code (bilaterali) in
funzione della parte di distribuzione gaussiana che
consideriamo, ovvero se solo oltre un certo valore di Z=(x – m)/ con
segno o considerandone il valore assoluto.• Nel test ad una coda mi chiedo solamente
se una media è maggiore di un’altra (o di un valore atteso), escludendo a priori che possa esere minore
• Nel test a due code mi chiedo se tra le due medie o la media ed il valore atteso esistano differenze significative senza indicazioni su chi sia maggiore o minore.
Adattamento dei dati
Davide Grandi - Dottorato in Biologia
• Test a 1 e a 2 codeTest a 1 e a 2 codeI test unilaterali sono più potenti dei test
bilaterali e a volte sono anche logicamente più appropriati (ad
esempio se so che un determinato farmaco è più efficace
dell’altro e devo solamente verificare se lo è in una
determinata percentuale.In termini tecnici si dice che il test a due
code è più conservativo.