La ricerca di nessi causali. I disegni di indagine in...

27
47 La ricerca di nessi causali. I disegni di indagine in Epidemiologia e le Misure del Rischio A cura di Mario Bolzan(*) 1.Premessa Nelle indagini svolte a fini genericamente conoscitivi o di valutazione, una fase fondamentale è rappresentata dallo studio di uno specifico evento (malattia, risparmio, opinioni, comportamenti, gradimenti, successi, ecc.) legato all’uomo, ad una struttura del sistema, al sevizio. Le esigenze dello studio ritiene che questo evento sia da ritenersi conseguenza di un fattore, o agente, generalmente esterno all’uomo/servizio. Il nesso che lega gli eventi a tali fattori è detto di causalità o di causa-effetto (Feinstein, 1979b). In ambito sanitario (in particolare nell’epidemiologia e nella sperimentazione clinica) tali tipologie di studi hanno trovato, ormai da molti decenni, ampia accoglienza e dibattito producendo proposte soddisfacenti sul versante metodologico ed applicativo. Quanto di seguito descritto è il risultato anche di tali contributi. Nella ricerca applicata in settori di interesse specifico (sociale, amministrativo, politico, sanitario, economico, ecc.), l’attenzione viene posta spesso l’attenzione sulla circostanza del cambiamento di una determinata condizione dell’unità di osservazione, da una situazione precedente di assenza a quella di presenza dell’evento osservato (malattia, diversa tipologia di risparmio, differente opinione, comportamento, gradimento, avvenuto successo, ecc.). Un approccio valutativo di tale cambiamento, osservato presso l’insieme di unità statistica, oggetto d’indagine, è quello di confrontarlo con ciò (quanto, come) che è avvenuto in altri soggetti, il più possibilmente simili ai primi, i quali però non hanno conosciuto l’esperienza dell’ esposizione e/o contatto al fattore in studio ritenuto, nell’ambito di quello studio, possibile causa. Il nesso di causalità nell’associazione tra fenomeni si fa discendere, nella ricerca scientifica, dal realizzarsi delle seguenti condizioni (Sartwell, 1959): a) consistenza: l’associazione causale deve essere indipendente dalla località e dal metodo seguito per rilevarla. Deve essere, in particolare, possibile dimostrare la rilevanza dell’associazione sia “prospetticamente”, rilevando l’insorgenza di effetti diversi nei gruppi diversamente esposti alla possibile causa, sia “retrospettivamente”, ricavando una diversa esposizione nei soggetti colpiti dall’effetto gradimento/danno rispetto ai “controlli” (unità statistiche esenti da quell’effetto); (*)Materiale ad uso esclusivo degli studenti del Corso di Laurea in Fisioterapia, a.a 2014/15, da non diffondere o utilizzare senza lautorizzazione del docente.

Transcript of La ricerca di nessi causali. I disegni di indagine in...

Page 1: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

47

La ricerca di nessi causali.

I disegni di indagine in Epidemiologia e le Misure del Rischio

A cura di Mario Bolzan(*)

1.Premessa

Nelle indagini svolte a fini genericamente conoscitivi o di valutazione, una fase fondamentale è

rappresentata dallo studio di uno specifico evento (malattia, risparmio, opinioni, comportamenti,

gradimenti, successi, ecc.) legato all’uomo, ad una struttura del sistema, al sevizio. Le esigenze

dello studio ritiene che questo evento sia da ritenersi conseguenza di un fattore, o agente,

generalmente esterno all’uomo/servizio. Il nesso che lega gli eventi a tali fattori è detto di causalità

o di causa-effetto (Feinstein, 1979b). In ambito sanitario (in particolare nell’epidemiologia e nella

sperimentazione clinica) tali tipologie di studi hanno trovato, ormai da molti decenni, ampia

accoglienza e dibattito producendo proposte soddisfacenti sul versante metodologico ed applicativo.

Quanto di seguito descritto è il risultato anche di tali contributi.

Nella ricerca applicata in settori di interesse specifico (sociale, amministrativo, politico, sanitario,

economico, ecc.), l’attenzione viene posta spesso l’attenzione sulla circostanza del cambiamento di

una determinata condizione dell’unità di osservazione, da una situazione precedente di assenza a

quella di presenza dell’evento osservato (malattia, diversa tipologia di risparmio, differente

opinione, comportamento, gradimento, avvenuto successo, ecc.).

Un approccio valutativo di tale cambiamento, osservato presso l’insieme di unità statistica, oggetto

d’indagine, è quello di confrontarlo con ciò (quanto, come) che è avvenuto in altri soggetti, il più

possibilmente simili ai primi, i quali però non hanno conosciuto l’esperienza dell’esposizione e/o

contatto al fattore in studio ritenuto, nell’ambito di quello studio, possibile causa.

Il nesso di causalità nell’associazione tra fenomeni si fa discendere, nella ricerca scientifica, dal

realizzarsi delle seguenti condizioni (Sartwell, 1959):

a) consistenza: l’associazione causale deve essere indipendente dalla località e dal metodo seguito

per rilevarla. Deve essere, in particolare, possibile dimostrare la rilevanza dell’associazione sia

“prospetticamente”, rilevando l’insorgenza di effetti diversi nei gruppi diversamente esposti alla

possibile causa, sia “retrospettivamente”, ricavando una diversa esposizione nei soggetti colpiti

dall’effetto gradimento/danno rispetto ai “controlli” (unità statistiche esenti da quell’effetto);

(*)Materiale ad uso esclusivo degli studenti del Corso di Laurea in Fisioterapia, a.a 2014/15, da non

diffondere o utilizzare senza l’autorizzazione del docente.

Page 2: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

48

b) intensità: al variare, in aumento o in diminuzione dell’esposizione al fattore agente, deve variare

adeguatamente il livello dell’effetto. Tale relazione viene descritta, laddove si rilevi l’intensità e

non solo la presenza del cambiamento, dalla cosiddetta curva di dose-effetto;

c) specificità: il rischio è specifico quando la relazione tra il fattore e l’effetto è originale e più

forte di quelle tra il fattore considerato e altri possibili effetti e tra l’effetto considerato e altri

potenziali agenti scatenanti;

d) sequenzialità temporale degli eventi: l’esposizione deve precedere l’effetto. Anche il periodo di

incubazione, o latenza, che precede la manifestazione dell’effetto, va conteggiato nello stabilire

la sequenzialità;

e) logicità: il nesso relazionale deve essere accettabile dal punto di vista sostantivo (sociale,

economico, sanitario, ecc.).

L’esistenza dei presupposti a), b), c), è valutata in base a metodi e tecniche statistiche; i criteri d), e)

afferiscono alla conoscenza della sociologia, economia, amministrazione, sanità, ecc..

Di seguito vengono illustrati alcuni principali disegni di indagine utilizzabili nella ricerca di nessi di

casualità di particolare interesse negli studi di valutazione degli interventi. Questi sono:

1. studio sperimentale;

2. studio di coorti osservate nel tempo;

3. studio di caso-controllo;

4. studio trasversale.

E’ opportuno precisare che questi rappresentano i principali disegni di indagine e da questi ne

derivano altri che rispondono a specifiche esigenze di ricerca e che dai primi traggono le

caratteristiche fondamentali. Ve ne sono comunque altre tipologie (quali lo studio dei casi oppure il

metodo delphi e altri ancora) che troveranno la loro adeguata presentazione in altri ambiti.

2 Lo studio sperimentale

Si definisce studio sperimentale lo studio di un gruppo (chiamata anche coorte) di soggetti, unità

(persone, aziende, agenzie, servizi, ecc.), omogenei secondo le principali caratteristiche (età di

servizio, sesso, dimensione dell’utenza, ecc.) estratti casualmente (cioè secondo criteri

probabilistici) da una popolazione di unità (chiamati anche non casi) nei quali è completamente

assente il fenomeno in studio (successo, gradimento sufficiente, ecc.). A due o più sottoinsiemi

della coorte, viene rispettivamente assegnato casualmente (cioè con criteri di campionamento

probabilistico al fine di garantire sia una sufficiente rappresentatività di tutti quei fattori di cui non

sono noti gli effetti, sia per poter successivamente applicare i metodi della statistica inferenziale) un

Page 3: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

49

diverso livello o modalità del trattamento/sperimentazione. Dall’osservazione successiva al diverso

trattamento, si perviene alla rilevazione del cambiamento di stato tra le unità (osservazione e

registrazione di un nuovo stato/evento) fino ad allora inesistente tra i soggetti trattati e quelli non

trattati (controlli o placebo).

Negli studi sperimentali è opportuno parlare di trattamento, anziché esposizione, poiché con

quest’ultimo termine si intende generalmente un contatto incontrollato con un agente di

rischio/beneficio. La somministrazione e le modalità del trattamento avvengono invece secondo

criteri fissati a priori dal ricercatore (Saracci, 1979; Schwartz et al., 1980) e che riflettono le

esigenze della ricerca sostantiva. Nello schema di figura 3.1 vengono descritte le fasi organizzative

e la struttura del disegno.

ToI

To

To I

N S s T1 I

T1

T1 I

Figura 3.1 - Schema descrittivo del disegno sperimentale

La sperimentazione si applica nelle ricerche di laboratorio (anche mediante simulazioni), nelle

ricerche cliniche e in comunità sociali (realizzate quest’ultime a fini di analisi dell’efficacia e

efficienza di specifici interventi; Peto et al., 1976). Naturalmente esistono vincoli etici per cui non si

possono sottoporre a sperimentazione fattori in cui l’assenza o presenza variegata possono

prevedere dei danni ai partecipanti l’esperimento. Si deve almeno configurare la condizione che

l’eventuale presenza del fattore non procuri (nel dubbio di ogni sperimentazione) nelle unità

Legenda:

N = popolazione generale (evento atteso assente);

S = campione casuale di soggetti/unità senza la condizione attesa;

s = assegnazione casuale degli individui ai trattamenti;

T0 = gruppo di controllo (detti anche placebo), con assenza di “esposizione” o senza “trattamento);

T1 = gruppo trattato, presenza “esposizione” (può essere a più modalità o livelli);

I = nuovo caso;

I = caso esente (ove non è stato osservato il cambiamento).

Page 4: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

50

sperimentali trattate, un danno superiore a quanto può produrne l’assenza.

Accanto agli studi sperimentali si collocano gli studi detti “quasi sperimentali” (Campbell e Stanley,

1963; Campbell e Cook, 1979), termine questo adottato dalle scienze sociali. In tali tipi di studi il

fattore di rischio o di causa o trattamento, detto anche sperimentale, viene “somministrato” secondo

criteri definiti dal ricercatore senza, però, introdurre la casualizzazione nella distribuzione delle

modalità o livelli del trattamento (Greenberg, 1983).

Applicazioni dei modelli quasi-sperimentali si hanno anche nel campo della valutazione di specifici

interventi sociali e sanitari in comunità umane nelle quali non si può intervenire con criteri di

casualizzazione (prevalentemente per motivi etici). Per esempio, la verifica dell’effetto

dell’introduzione di pene più severe per reati specifici e sul tasso di criminalità, oppure

l’obbligatorietà di azioni di prevenzione infantile, l’introduzione della cintura di sicurezza per gli

automobilisti, ecc.

Nello schema descrittivo (figura 3.1) la differenza con lo schema dello studio sperimentale consiste

nel salto della fase di assegnazione casuale degli individui ai trattamenti ed il confronto avviene con

la condizione storica precedente ove era ovviamente assente il nuovo fattore introdotto.

I vantaggi degli studi sperimentali sono ampi e noti. In sintesi, si ricorda che ad essi è possibile

applicare la teoria dell’inferenza statistica (Marubini, 1980).

I dati provenienti da una sperimentazione nell’ipotesi (più semplice) di risposta attesa dicotomica e

di due modalità o livelli di trattamento, possono essere statisticamente organizzati come nella

Tabella 1.

La misura del diverso grado di risposta tra le modalità del trattamento è funzione della differenza

fra i due rapporti n1/N1 e n0/N0:

0

0

1

1

N

n

N

nf che descrive l’incremento dell’effetto imputabile al

fattore sperimentale sulla popolazione trattata, a parità di altri fattori. Laddove la dimensione del

cambiamento è espressa dal livello di una variabile quantitativa (livello del gradimento, tempo di

permanenza nel servizio, ecc.), una misura dell’efficacia è data anche dal confronto fra due

parametri (ad esempio le medie aritmetiche) della variabile specifica espressione dell’effetto, fra i

due distinti gruppi.

Le tecniche statistiche applicate ai Disegni Sperimentali hanno come finalità quella di pervenire a

decisioni certe, di accettare o rifiutare certe ipotesi conoscitive con un margine di errore noto a

priori.

Page 5: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

51

Tabella 1 - Distribuzione delle frequenze congiunte dei cambiamenti di stato nel gruppo trattato e

in quello di controllo provenienti da uno studio sperimentale

Evento atteso

Totale I I

Trattamenti T1 n1 N1-n1 N1

T0 n0 N0-n0 N0

Totale n N-n N

2 Lo studio di coorti seguite nel tempo

Questo disegno di indagine è organizzato dall’osservazione prolungata e contemporanea per tutta la

coorte, nel tempo di una coorte di soggetti, nei quali è sicuramente assente il fenomeno atteso nella

ricerca (disagio, gradimento, successo, ecc.). L’insieme viene stratificato secondo la presenza o

assenza (a livelli definiti a priori) di un agente/fattore esterno, assunto come probabile causa del

possibile danno o beneficio (Feinstein, 1971). Di seguito viene riprodotto lo schema descrittivo del

disegno (figura 3.2), il quale evidenzia come la coorte sia rappresentata da un campione di soggetti

nei quali non è mai stato osservato l’evento oggetto di interesse (risparmio, soddisfazione, ecc.).

Nello studio di coorti l’esposizione al fattore è una variabile cosiddetta di stratificazione

dell’insieme delle unità statistiche poiché, diversamente dallo studio sperimentale, la collocazione

in uno dei livelli di esposizione non è imposta dallo sperimentatore ma è predefinita sulla base della

libera collocazione delle unità di osservazione nei due distinti insiemi (coorti).

_

C EC I

_

EC __

ECI

N

C

S S

__

ECI

_

EC

___

ECI

T1= somministrazione del trattamento

N1 = trattati

T0 = placebo

N0 = non trattati

I = cambiamento di stato

I = permanenza nello stato iniziale

Legenda:

N = popolazione generale (successo, insuccesso);

C = popolazione di non casi, soggetti che non hanno subito l’evento atteso (danno, beneficio);

C = popolazione di coloro dei quali si registra l’evento atteso;

S = campione di popolazione;

S = assegnazione non casuale;

E = esposti;

E = non esposti alla possibile causa dell’evento atteso ;

I = nuovi casi;

Ī = unità che rimangono nel medesimo stato originale sebbene sottoposti al fattore/agente

Page 6: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

52

Figura 3.2 - Schema descrittivo dello studio di coorti

Dall’osservazione nel tempo si rileva l’incidenza (frequenza di nuovi casi) dell’effetto nei gruppi

variamente esposti. Questa si configura come un rapporto (tasso) di derivazione rapportato

generalmente a multipli di 100 ed esprime la velocità di cambiamento di stato, della popolazione

della coorte, nell’unità di tempo. Il confronto fra l’incidenza negli esposti con quella rilevata nei

non esposti (assunta come misura standard della frequenza “naturale“ dell’effetto in condizioni

“normali”, cioè senza quella specifica esposizione) fornisce una misura della probabilità

incrementale, differenziata di avere un beneficio o danno a seguito dell’esposizione o

somministrazione del fattore.

La realizzazione di uno studio per coorte è complesso e impegnativo. Molteplici sono gli aspetti da

tenere in considerazione, peraltro spesso collegati tra loro (Feinstein, 1977a; Fletcher et al., 1982), i

più importanti sono:

a) necessità di avere una numerosità di soggetti componenti la coorte, spesso elevata;

b) necessità di ricercare i “persi di vista”, o fuorusciti dall’osservazione, in particolare se l’arco

temporale di osservazione è lungo;

c) le conseguenze dei cambiamenti nell’esposizione al fattore, che possono avvenire nell’arco di

tempo osservato;

d) la possibile esposizione a nuovi fattori/agenti di rischio/beneficio (differenziati e

indeterminabili);

e) l’obbligo di allungare i tempi se il periodo di “maturazione” o “incubazione”, dell’evento atteso

è lungo;

f) l’evoluzione dei sistemi di classificazione per valutare l’effetto atteso (es. diagnosi);

g) l’impiego per l’intero periodo osservato di personale qualificato.

Mentre nella sperimentazione i gruppi trattati e di controllo vengono sottoposti al medesimo tipo di

sorveglianza e con uguale attenzione, nello studio di una coorte tali attenzioni vengono

prevalentemente riservate (per pregiudizio e disponibilità di risorse) agli esposti (“effetto del

porcellino d’India”; Feinstein, 1973b, 1979c).

Page 7: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

53

L’adozione di tecniche di “semplice” (solo l’unità di osservazione conosce lo stato di esposizione

ma non il ricercatore per non venirne influenzato al momento della misurazione dell’effetto),

“doppio” (non conoscenza da parte dell’unità e del ricercatore), “triplice” (non conoscenza da parte

dell’unità, del ricercatore e di colui che analizza i dati individuali e complessivi) permette di ridurre

l’effetto di tali fattori condizionati (Feinstein 1973b). Scarsa accuratezza nei dati rivelati si ha anche

quando l’effetto è rilevato con strumenti inadeguati (autocertificazioni, questionari autocompilati,

ecc.), soprattutto se la manifestazione dell’evento è poco o affatto evidente (ad esempio il problema

dei dati o risposte mancanti).

Sulla base della modalità di rilevazione e organizzazione del dato relativo all’esposizione gli studi

per coorte vengono così suddivisi:

a) prospettico;

b) retrospettivo;

c) forzato o di risulta (contrived).

In uno studio di coorte prospettico tutta la coorte viene seguita lungo il periodo di osservazione

usando il medesimo protocollo e l’investigatore stesso cura la raccolta di tutte le osservazioni sia

degli esposti, sia dei non esposti (Royal College of General Practitioner, 1974).

Nella procedura detta retrospettiva avviene che i due gruppi vengono seguiti contemporaneamente

ma le informazioni relative all’esposizione sono registrate su archivi realizzati inizialmente per altri

fini da personale non direttamente interessato allo studio (Polednak e Damon, 1970).

Si noti che i termini prospettico e retrospettivo indicano la direzione temporale di ricerca delle

relazioni esistenti in un insieme di informazioni ma non la direzione di osservazione del

cambiamento di stato/opinione, che resta comunque longitudinale.

Nello studio forzato la coorte è costituita solo da esposti e viene osservata nel tempo

indipendentemente dalla coorte che sarà utilizzato per confronto. Questo ultimo gruppo viene

ottenuto da fonti e con procedure diverse.

I dati rilevati in uno studio di coorte possono essere organizzati secondo lo schema descritto nella

Tabella 2.

Procedendo quindi da un campione di “non casi” si costruiscono due coorti di soggetti o unità a

diverso livello o modalità di esposizione E e E , nei quali si osserverà, lungo un tempo di

osservazione fissato al momento della progettazione della ricerca, l’insorgenza dell’evento atteso C

o in alternativa si concluderà (alla fine dell’osservazione) che la condizione iniziale C non è

mutata.

Le frequenze a, b, c, d, rappresentano rispettivamente: a il numero di nuovi casi fra gli esposti nei

quali si è verificato l’evento, b gli esposti ove non si è verificato l’evento, c i non esposti nei quali è

Page 8: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

54

insorto l’evento, d né esposti né “casi”.

Tabella 2 - Distribuzione delle frequenze dei cambiamenti di stato nella coorte degli esposti ed in

quella dei non esposti(controllo) ad un fattore di rischio

Evento atteso

Totale C C

Fattore di

rischio

E a b n1

E c d n2

Totale a+c b+d n

Il tasso d’incidenza (espressa su opportuna scala) negli esposti è data da R1 = a/n1; l’incidenza nei

non esposti da R0 = c/n2. Una misura del rischio differenziale fra i due campioni diversamente

esposti, di essere “danneggiati” o “colpiti” dall’evento atteso, è dato da:

1

2

2

1

0

1

/

/

cn

an

nc

na

R

RRR .

Negli studi di epidemiologia tale rapporto è anche denominato Rischio Relativo, RR.

Anche per tale rapporto esistono metodi statistici per la valutazione del livello di significatività e

per la costruzione di intervalli di confidenza.

4 Lo studio caso-controllo

Lo studio caso-controllo consiste nella investigazione sul passato di soggetti provenienti da due

distinte popolazioni, una definita dalla presenza (“casi”) e l’altra dall’assenza (“controlli”) di uno

specifico e probabile “effetto”. Viene ricercata nella “vita”, (attività, esperienza) passata la presenza

nei due gruppi di uno o più probabili fattori potenziali cause dell’esito osservato (Cornfield, 1960;

Cole, 1979; Breslow e Day, 1980; Choi e Howe, 1984). In figura 3.3 viene presentato lo schema

illustrativo delle fasi organizzative del disegno. Si osservi che non si procede da una unica

omogenea popolazione (come per gli studi di coorte o sperimentali) ma da due che almeno

idealmente dovrebbero appartenere ad un’unica. Lo studio caso-controllo è sostituibile con quello di

coorte “retrospettivo” quando I coincide con C e I con C , cioè quando il gruppo C è

rappresentativo della popolazione N1 in cui sono insorti i “casi”, ossia quando N1 e N2 sono

equivalenti.

Presso ciascuna unità statistica (“caso” o “controllo”) viene rilevata la esposizione in passato al

E = esposti;

E = non esposti;

C = nuovi casi;

C = non casi, evento atteso non presente;

n1 = campione di esposti;

n2 = campione di non esposti.

Page 9: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

55

fattore potenziale. Lo studio caso-controllo non differisce da quello su coorti per il periodo di

riferimento ma per l’opposta direzione di osservazione della popolazione (alcuni autori inglesi

chiamano tale modello trohoc study, ovvero l’inverso di cohort study). Vale la pena sottolineare che

nello studio di coorti si rileva la frequenza di “nuovi casi” fra gli esposti e fra i non esposti;

viceversa, nello studio caso-controllo si determina la frequenza di esposizione (l’esperienza, il

vissuto dichiarato o espresso da altre fonti) distintamente fra i “casi” e fra i “controlli”. Ciò

comporta che, mentre nel primo disegno si ricerca l’effetto più probabile dall’esposizione al fattore

noto e definito, nel caso-controllo si ricercano, fra i fattori di rischio passati, quello/i più

probabilmente legato all’unico effetto considerato (Anderson et al. 1980). E’ importante garantire

anche per i casi ed i controlli la massima omogeneità rispetto alla presenza di variabili di disturbo

(confounding variables) (Breslow and day, 1980; Smith e Day, 1984) per avere risultati più accurati

(Ibrahim 1979).

Il sistema di rilevazione dell’esposizione passata si basa sul ricordo del soggetto che può essere non

accurato o meglio ancora condizionato sapendosi osservato per alcuni suoi possibili comportamenti

“a rischio”. Per ridurre tale effetto anche in questi studi si procede come per lo studio per coorte o

sperimentale con l’adozione di tecniche di “semplice” (solo l’unità di osservazione conosce lo stato

di esposizione ma non il ricercatore per non venirne influenzato al momento della misurazione

dell’effetto), “doppio” (non conoscenza da parte dell’unità e del ricercatore), “triplice” (non

conoscenza da parte dell’unità, del ricercatore e di colui che analizza i dati individuali e

complessivi) permette di ridurre l’effetto di tali fattori condizionanti (Feinstein 1973b).

Una particolare importanza assume la scelta dei “controlli”. Vengono consigliate alcune procedure

da seguire, anche contemporaneamente, per garantirsi contro rischi di errore comune quando si

utilizzano fonti di archivi istituzionali, come ad esempio ospedali, assicurazioni, ecc. (Berkson,

1946; Sackett, 1979). Tra queste si segnala la scelta di:

a) soggetti residenti nella stessa area geografica dei “casi” (omogeneità nell’esposizione

ambientale);

b) soggetti, utenti ammessi negli stessi servizi/aziende, ospedali o banche/scuole nei quali i “casi”

sono assistiti/serviti (uguale selettività nell’accessibilità, accettazione, ricoverabilità);

c) registrati per cause particolari ragionevolmente indipendenti dalla causa in studio;

d) soggetti risultati “negativi” all’esame di ammissione utilizzato per individuare i “casi”

(omogeneità nella procedura di rilevazione);

e) soggetti per i quali esistono fonti di esposizione di buona attendibilità (Enti Assicurativi,

professionali, ecc.).

Una soluzione operativa molto efficace per ridurre l’effetto delle variabili di confondimento è

Page 10: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

56

costituito dall’appaiamento che consiste nella valutazione non di due campioni di soggetti ma di

insiemi di coppie di unità appaiate secondo il criterio dell’appartenenza alla stessa modalità delle

variabili di confondimento (sesso, età, ecc.), ma diverse per l’esperienza dei possibili fattori in

studio.

Il modello d’indagine non si presta per studiare condizioni ad alta incidenza e breve durata, quali ad

esempio: lo studio del particolare utilizzo di carte di credito durante le feste di Natale o lo studio di

condizioni con notevoli effetti collaterali o complicazioni. I dati rilevati in uno studio caso-

controllo possono essere organizzati secondo lo schema descritto dalla figura 3.3.

La prevalenza di esposti tra “casi” è: a/m1; quella tra i controlli è b/m2. Il loro rapporto può, sotto

certe ampie condizioni essere interpretato come una misura del Rischio Relativo prodotto dagli

studi di coorte. Negli studi di caso controllo tale indicatore viene chiamato Odds Ratio (OR).

I E

I S

I E N1

Ī

C E

C S

C E N2

C

Figura 3 - Schema descrittivo dello studio caso-controllo

Page 11: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

57

Tabella 3 - Distribuzione congiunta e marginale del numero di esposti al fattore di rischio nel

gruppo dei Casi e in quello dei Controlli

Evento

Totale C C

Fattore di

rischio

E a b a+b

E c d c+d

Totale m1 m2 m

5 Lo studio trasversale

L’indagine trasversale (chiamata anche cross-sectional) è condotta su un insieme di soggetti nei

quali viene rilevata la contemporanea presenza di più variabili, spesso senza controllo della

eventuale sequenzialità fra causa/e ed effetto/i e del “tempo di esposizione”. In figura 3.4 viene

riprodotto lo schema del disegno.

CE

C Ē

N S

C E

C Ē

Figura 4 - Schema descrittivo dell’organizzazione dell’osservazione negli studi trasversali

Nei modelli di indagine esposti precedentemente il ricercatore svolgeva un ruolo “attivo” nella

determinazione dei gruppi di soggetti da osservare (Feinstein, 1977b; Jick et al., 1979). Qui

l’investigatore conduce un “passivo esercizio” di organizzazione e/o di elaborazione matematica di

dati, spesso raccolti da altri per fini non esclusivamente sociali/economici (fonti anagrafiche,

censimenti, dati di istituti di previdenza, ecc.).

E = esposti;

E = non esposti;

C = casi;

C = non casi o controlli;

m1 = campione “casi”;

m2 = campione “controlli”.

Page 12: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

58

Non solo le procedure di raccolta sono spesso poco raffinate e difficilmente controllabili ma, poiché

la popolazione oggetto di studio può essere fortemente eterogenea per l’esposizione incontrollata (e

incontrollabile) a molteplici fattori (ambientali, sociali, ecc.), l’analisi statistica, per quanto

sofisticata in quanto opera spesso su casistiche ampie, sarà limitata con l’aggiunta di poter essere

spuria nel contenuto informativo specifico.

Inoltre, mentre gli studi per coorte e sperimentali permettono di misurare correttamente l’incidenza

di un evento, giacché il fenomeno espresso dal numeratore segue quello espresso dal denominatore,

nello studio trasversale generalmente il numeratore e il denominatore rappresentano tutt’al più

misure di eventi riferiti alla stessa data, ossia misure della prevalenza.

Un valore significativo (positivo o negativo) della correlazione fra le serie statistiche, suggerisce

l’esistenza di una relazione forte tra fenomeni compresenti nelle stesse aree o contemporanei (ad

esempio: le cabine telefoniche per Km e delinquenza minorile). E’ ovvio pertanto che possono

essere rilevate associazioni statisticamente significative ma dal punto di vista sostantivo, spurie.

Gli studi trasversali permettono comunque di realizzare interessanti obiettivi informativi, quali il

controllo della qualità di analisi specifiche e valutazioni sulla sensibilità e sulla specificità di test di

comportamento/opinioni e sulla stima campionaria della diffusione, nella popolazione, dei fattori in

osservazione e delle loro combinazioni.

La disponibilità di dati per svolgere indagini trasversali è spesso elevata, seppur non immediata a

causa di vincoli legali (es. problema della privacy).

I dati raccolti negli studi trasversali possono essere organizzati secondo lo schema riportato nella

Tabella 4.

Tabella 4 - Distribuzione delle frequenze rilevate in una indagine trasversale, per presenza/assenza

dell’evento morboso e del fattore di rischio

Evento

Totale C C

Fattore di

rischio

+ n11 n12 n1.

- n21 n22 n2.

Totale n.1 n.2 n

Per meglio chiarire il concetto, può essere utile ricordare che ad esempio nella moderna medicina vi

sono altre forme di ricerca rivolte alla verifica dei risultati di un intervento o processo rispetto alle

+ = presenza;

- = assenza.

Page 13: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

59

attese ovvero al beneficio apportato dall’intervento rispetto ai costi e alle risorse impegnate

(Feinstein, 1980).

6 La misura del rischio

Il rischio è la probabilità che un soggetto “sano” (senza quell’opinione, condizione o effetto) sia

colpito da uno specifico effetto, in un periodo definito, condizionatamente al fatto che prima della

fine del periodo non “muoia” (cioè non esca dall’osservazione) per altre cause. Generalmente tale

probabilità viene condizionata all’esposizione di un fattore detto appunto di rischio (Comfield,

1951; Saracci, 1967; Feinstein, 1968; Lellouch, 1976).

È possibile definire una serie di informatori del rischio R specifico all’evento:

1) Rischio assoluto (incidenza) in presenza del fattore di rischio:

esposti Numero

esposti gli tracasi nuovi Numero1 R ; (1)

2) Rischio assoluto in assenza del fattore di rischio:

espostinon Numero

espostinon i tracasi nuovi Numero0 R (2)

3) Rischio Relativo:

01 R/RRR (3)

Si noti che RR è un rapporto tra due probabilità;

4) Rischio Incrociato:

esposti gli tra casi nonx esposti non i tra casi Nuovi

esposti non i tra casi nonx esposti gli tra casi NuoviRI (4)

Le quantità a/m1, b/m2 rappresentano, rispettivamente, le prevalenze di esposizione nei casi e nei

controlli. Nell’ipotesi che le frazioni di casi e di controlli siano rappresentative, rispetto

all’esposizione, delle popolazioni base (dei casi e dei controlli) e che la quota di casi nella

popolazione generale sia piccola ) ;( dcdbab , allora RI è uguale, sotto certe condizioni a

RR (Levin e Bertell, 1978, Ibrahim e Spitzer, 1979; Fleiss, 1981):

ratio) (odds incrociato rapportocd

adRIRR .

Page 14: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

60

Il rischio relativo è il rapporto tra l’incidenza negli esposti e nei non esposti. Se RR > 1 il fattore è

di effetto consistente e specifico (danno) alla condizione sotto osservazione, ovvero è di rischio; se

RR = 1 il fattore è indifferente alla condizione o agisce in forma diversa nella popolazione esposta;

se RR < 1 il fattore agisce in termini di prevenzione da un possibile effetto atteso (successo, ecc.).

7 La differenza semplice di Berkson

Il rischio relativo e il rischio incrociato, non tengono conto in modo opportuno della frequenza del

fenomeno “effetto” sulle popolazioni confrontate.

In sintesi ad esempio un RR pari a 10 dice che per ogni “caso” tra i non esposti ve ne sono 10 tra gli

esposti, ma a parità di RR in due studi, non è dato conoscere dove l’effetto è più diffuso e quindi

dove il rischio ha la maggiore rilevanza sociale.

Lo stesso valore del RR si può, infatti, ottenere da due diverse coppie di incidenze, multiple una

dell’altra (Berkson, 1958).

La quantità:

01 RRB (5)

detta Differenza semplice di Berkson, è una misura dell’associazione fra causa ed effetto che fa

risaltare l’eccesso di “casi” dovuto all’esposizione, rispetto ai non esposti.

Negli studi trasversali la differenza B si calcolerà come segue:

..B n/nn/n 221111 (6)

Negli studi caso-controllo B non è direttamente calcolabile se non per approssimazione ed è

necessario essere circospetti nell’interpretare i risultati poiché, in un tale studio, si analizzano

prevalenze, anziché incidenze.

8 La differenza relativa di Sheps

La differenza relativa di Sheps (1959) è una misura relativa del rischio:

00

01

11 RR

RR BS

; (7)

S è espressa al numeratore dal rischio eccedente tra i gruppi diversamente esposti e al

denominatore dalla quota di “sani” (non casi) fra i non esposti.

Page 15: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

61

S, numero adimensionale, esprime allora la quota di “casi” fra gli esposti che altrimenti non si

sarebbero ammalati se non fossero stati esposti. Può essere espressa in percentuale.

Se l’evento in osservazione (insoddisfazione, insuccesso, malattia, ecc.) è raro )R( 00 ed

altamente associata all’esposizione, allora BS . Negli studi caso-controllo tale indice è

calcolabile sotto alcune condizioni (sostituendo le prevalenze alle incidenze), mentre negli studi

trasversali vale:

22

2212

n

)nn(BS

(8)

dove B è calcolato secondo la formula (6).

Il rischio attribuibile fra gli esposti

La frazione di “casi” tra gli esposti eccedente la quota di casi tra i non esposti, attribuibile quindi

all’esposizione, è data da (Walter, 1976; 1978):

11

011

RR

RR

RR

RRRE B

(9)

dove al numeratore appare il rischio relativo eccedente negli esposti rispetto ai non esposti presi

come unità di confronto (a questi è assegnato il valore 1) e a dominatore l’incidenza tra gli esposti.

Il rischio RE si riferisce solamente ai “casi” insorti negli esposti e non all’intera popolazione. Tale

misura del rischio è calcolabile in ogni modello di indagine, con le opportune approssimazioni

(negli studi caso-controllo anziché RR vi sarà RI).

10 Il rischio attribuibile

Per valutare la quota di “casi” attribuibile al fattore di rischio verificatosi non solo tra gli esposti ma

anche tra i non esposti, si consideri la quota P di popolazione esposta al fattore tra i casi e i non

casi. Nello studio di coorti, la quantità (Walter, 1975; Leung e Kupper, 1981):

11

1

)RR(P

)RR(PRA . (10)

esprime il rischio attribuibile nella popolazione generale.

Si può notare che se RR = 1 (ossia il fattore non è di rischio) allora RA = 0. Al numeratore si ha la

quota di rischio relativo eccedente negli esposti rispetto ai non esposti moltiplicato per la quota

Page 16: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

62

della popolazione esposta. Nella (10) la quantità 1 esprime la quota di malati non associata

all’esposizione.

Il RA è utile perché si riferisce alla popolazione ed esprime la quota di tutti i “casi” in essa presenti

e riferiti al fattore specifico. L’indicatore permette interessanti considerazioni nell’ambito della

prevenzione poiché esprime la quota di “casi” nella popolazione che si potrebbero evitare se venisse

svolta una azione di prevenzione rispetto all’esposizione del fattore. Questo, ovviamente,

nell’ipotesi che tale quota sia imputabile unicamente a quel fattore.

In uno studio caso-controllo il rischio attribuibile si calcola:

2

1

1

11

m/b

m/aRA

(11)

dove 1m/a e 1m/b rappresentano, rispettivamente, le prevalenze di esposizione nei casi e nei

controlli. La formula (11) prevede che l’evento sia raro e che l’esposizione nella popolazione

generale sia ben rappresentata dalla quota presente nei “controlli”.

Page 17: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

63

11 Proposte di lavoro

Esempio 3.1

Viene compiuta una indagine longitudinale (studio di coorte) di un campione di 1239 soggetti(dati

fittizzi) visitati da un Centro Polifunzionale Regionale per la prevenzione di disturbi muscolari i

quali si sono rivolti negli ultimi due mesi per ricevere informazioni e offerte di servizi . Di questi

756 erano lavoratori presso aziende manifatturiere della Regione ad esposizioni di lavoro usuranti

da almeno 10 anni e 573 che non svolgono ne hanno svolto lavori usuranti negli ultimi 10 anni.

Durante la visita venivano rilevati mediante intervista e visita la presenza di disfunzioni muscolari

di varia intensità. I risultati sono riprodotti nella tavola seguente.

Distribuzione del numero di utenti per grado di soddisfazione del servizio di consulenza turistica fornito da

una società di servizi nazionale (Studio di coorte)

Presenza di disfunzioni muscolari

TOTALE Poco o niente Almeno

abbastanza

Lavoratori di Aziende

manifatturiere della

regione

Lavoro usurante 72 (a) 684 (b) 756 (n1)

Lavoro non

usurante

20 (c) 553 (d) 573 (n2)

92 (a+c) 1237 (b+d) 1329 (n)

Si costruiscono i seguenti indicatori del livello di disfunzione muscolare e dipendenza con il fattore

di potenziale causa della soddisfazione (lavoro usurante).

%,,R%;,,R 530350573

20 590950

756

7201 732

0350

0950,

,

,RR

91268420

55372,

)(

)(RI

%,,,,B 0606003500950 eccesso di “casi” cioè di lavoratori con

disfunzioni muscolari, negli esposti(che

svolgono un lavoro usurante) rispetto ai non

esposti

%,,,

,

,

,,S 260620

9650

060

03501

03500950

quota di “casi” in eccesso fra esposti e non (i

casi, cioè i lavoratori con disfunzioni muscolari

non avrebbero tale disturbo se non fossero stati

esposti a lavori usuranti)

%,,

,

,

,RE 3763

0950

060

732

1732

quota di “casi” cioè di lavoratori con disfunzioni

muscolari, in eccesso fra esposti(svolgono un

Page 18: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

64

lavoro usurante) e non rispetto ai “casi” negli

esposti.

56901329

756

totaleepopolazion

esposta epopolazion 1 ,n

nP Frazione o percentuale di esposti cioè di

lavoratori che svolgono lavori usuranti negli

ultimi 10 anni sul totale degli intervistati o

visitati

%,,

,

),(,

),(,RA 649

9841

9840

117325690

17325690

Il 49,6% dei lavoratori con disfunzioni

muscolari (“casi”) presenti nella popolazione

deriva dall’esposizione al fattore(lavoro

usurante da almeno 10 anni) variamente

presente in essa.

Esempio

È stato presentato un indicatore statistico che permette di misurare l'associazione tra l'agente

(considerato causa) e l'effetto che noi abbiamo in osservazione: il rischio relativo.

Di seguito verranno presentati due esempi applicativi nei due disegni di indagine, lo studio di

Coorte e il Caso-Controllo.

Nei disegni d'indagine longitudinali o per coorte si ha una situazione di questo tipo:

C’è un gruppo di soggetti così classificati:

E = (esposti) che sono stati selezionati sulla base della loro attuale condizione (facoltà che hanno

attivato quest'anno un nuovo corso di laurea);

e = (non esposti) facoltà che non hanno attivato quel corso di laurea e che quindi non conoscono

quella esperienza;

n1 = insieme di facoltà che hanno attivato il corso di laurea;

n2 = insieme di facoltà che non hanno attivato il corso di laurea;

n1 + n2 = facoltà coinvolte nel campione.

Supponiamo che a distanza di un anno dalla conclusione del 1° ciclo (i primi studenti che si sono

laureati in quel determinato nuovo corso di laurea) si vuole valutare quanti hanno trovato lavoro

pertinente dopo aver acquisito la laurea.

Indichiamo con C i casi nei quali è stata rilevata la condizione: lavoro pertinente dopo un anno, e

con c i soggetti che non hanno trovato lavoro pertinente dopo un anno dalla laurea.

Page 19: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

65

Evento atteso

C c Totale

Fattore di rischio E a b n1

e c d n2

n1 + n2

a = laureati nel corso di laurea considerato (nuovo), che hanno trovato lavoro soddisfacente entro

un anno;

c = laureati con altra laurea, che hanno trovato lavoro soddisfacente entro un anno;

b = laureati nel corso di laurea considerato (nuovo), che non hanno trovato lavoro soddisfacente

entro un anno;

d = laureati con altra laurea, che non hanno trovato lavoro soddisfacente entro un anno.

I seguenti indicatori:

a / n1 e c / n2 rappresentano le distinte quote di laureati che hanno trovato lavoro e provenienti

rispettivamente dalla laurea in studio (E) e dalle altre lauree (e).

Con la frazione f1 (a / n1) si indica la percentuale di soggetti che si sono laureati nella laurea in

osservazione e che hanno trovato lavoro pertinente entro un anno rispetto alla quota di laureati in

altra laurea f2 (c / n2).

Si definisce il RISCHIO RELATIVO dato dal rapporto (a / n1) / (c / n2)

Questo rapporto esprime la forza o la resistenza o l’indifferenza che svolge la laurea in studio

rispetto ad altre lauree nel trovare lavoro soddisfacente (Rapporto di derivazione).

Cerchiamo di capire perché.

Intanto possiamo scrivere il rapporto sopra anche nel modo seguente:

> 1

R = (a / n1) / (c / n2) oppure R = (a × n2) / (c × n1) = 1

< 1

R può valere più di 1, uguale a 1, meno di 1.

Se R sarà maggiore di 1 cosa significa?

Significa che a × n2 darà un risultato maggiore di c × n1 quindi: coloro che trovano lavoro

soddisfacente tra i laureati con la laurea in studio sono più di quelli che provengono dalle altre

lauree. Quindi, se R > 1 vorrà dire che la quota di studenti che si sono laureati nella laurea in studio

è molto maggiore delle altre, perciò è migliore.

Page 20: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

66

Se risulterà R < 1 significherà che avranno trovato lavoro soddisfacente molti più studenti

provenienti da altre lauree.

Si veda il seguente esempio numerico:

Evento atteso

C c Totale

Fattore di rischio E a (30) b (10) n1 (40)

e c (15) d (25) n2 (40)

n1 + n2

R = (a / n1) / (c / n2) = (30 / 40) / (15 / 40) = 2

R = 2 significa che la probabilità che uno studente ha di laurearsi nella laurea oggetto di studio e

trovare lavoro pertinente entro un anno è doppia di quella delle altre lauree.

Se invece si procede secondo lo studio caso controllo, si procede dalla direzione opposta, cioè da

quello che noi consideriamo l’EVENTO (es. aver trovato lavoro entro un anno dalla laurea).

Avremo quindi:

m1= laureati che hanno trovato lavoro pertinente entro un anno,

m2 = laureati che non hanno trovato lavoro entro un anno.

Si parte dell'EFFETTO. Vogliamo andare a capire che cos’è che facilita il fatto di trovare lavoro

entro l’anno.

Evento atteso

C c Totale

Fattore di rischio E a (30) b (10)

e c (15) d (25)

Totale m1 (45) m2 (35)

a / m1 è la percentuale di laureati nella laurea in studio che hanno trovato lavoro entro un anno sul

totale di tutti quelli che hanno trovato lavoro (in quest’ultimo dato comprendendo tutti gli studenti

che hanno trovato lavoro, indipendentemente dalla laurea)

Page 21: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

67

b / m2 è la percentuale di laureati nella laurea in studio che non hanno trovato lavoro entro un anno

sul totale di tutti quelli che non hanno trovato lavoro (in quest’ultimo dato comprendendo tutti gli

studenti che non hanno trovato lavoro, indipendentemente dalla laurea)

Qui noi dobbiamo spiegare perché hanno trovato lavoro, non perché si sono laureati!

Allora il denominatore della frazione non può essere il dato riferito a quelli che hanno trovato

lavoro, perché non è quel dato che mi da la spiegazione occorrente.

In altre parole il rapporto non può essere:

(a / m1) / (b / m2) oppure (a × m2) / (b × m1)

perché questo che stiamo analizzando è un Rapporto di composizione (il lavoro deriva dai laureati,

come i nati vengono da una popolazione, invece gli anziani compongono una popolazione, ecc.).

Se si deve spiegare un effetto, una derivazione, cioè il perché un evento insorge, devo capire qual è

il motore generatore (e nel nostro caso il motore generatore è la laurea non il fatto di aver trovato

lavoro).

Il nostro problema è che però non sappiamo quanti sono i laureati di partenza.

Il rapporto (a / n1) è un RAPPORTO DI DERIVAZIONE perché n1 = laureati: di questi quanti

hanno trovato lavoro?

Qui invece abbiamo m1 = hanno trovato lavoro subito, ma di questi non so quanti hanno la laurea in

studio. Questo quindi è un RAPPORTO DI COMPOSIZIONE perché si dirà: “su 100 che hanno

trovato lavoro, 30 sono laureati in …”.

Per capire meglio questo passaggio facciamo un esempio: un soggetto positivo all'HIV che

contragga la malattia è molto alta, ma la probabilità che un soggetto sia positivo è tutt’altra cosa.

Si capisce che la seconda condiziona il fatto che un soggetto può avere la malattia senza essere

positivo. Dire “la probabilità che un malato sia positivo” non è la stessa cosa che dire “la probabilità

che un soggetto positivo sia malato”.

Per questo motivo, negli studi di caso controllo, in alternativa al Rischio Relativo, si propone

l’Odds Ratio (OR), (che rappresenta un Rapporto Incrociato).

L’OR è dato dal prodotto incrociato dei dati delle quattro tabelle contenenti i dati quantitativi

relativi al numero di soggetti.

Page 22: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

68

Evento atteso

C c Totale

Fattore di rischio E a (30) b (10)

e c (15) d (25)

Totale

(a × d) / (c × b) = (30 × 25) / (15 × 10) = 5

Questo mi permette di valutare l’intensità dell’associazione tra evento certo (avere o non avere

trovato lavoro entro l’anno) e causa probabile.

Questo indicatore ha tutta una serie di proprietà importanti che permettono di trarre le stesse

conclusioni del rischio relativo; si calcola in modo diverso, perché i dati hanno una struttura

informativa diversa.

Facciamo un esempio: nell’ipotesi a n1 cioè nell'ipotesi che il fattore sia fortemente associato

allevento atteso, se potessimo prendere un campione (fare uno studio longitudinale: un certo

numero di studenti che hanno ottenuto la laurea X) e un altro campione di laureati altrove,

nell’ipotesi che ci sia associazione tra il fattore e l’evento atteso si capisce benissimo che le quote

della tabella daranno questi risultati:

se è vero che la laurea in studio (X) produce un buon numero di occupati (a = 30),

sono pochi i laureati con la laurea in studio che non trovano lavoro soddisfacente (b = 10)

e sono pochi anche coloro che con altre lauree trovano lavoro soddisfacente (c = 15)

allora avremo che :

a n1 (a è approssimato a n1) d n2 (d è approssimato a n2)

per cui se abbiamo la funzione:

(a / n1) / (c / n2) = (a × n2) / (c × n1)

succede che n2 e n1 si possono sostituire con gli estremi, per cui siccome “b” sarebbe molto basso e

“c” sarebbe molto basso, alla fine “a” coincide con n1 e “d” con n2.

Questi due indicatori (il rischio relativo e il rapporto incrociato o odds ratio) sono molto importanti

in quanto pernettono di misurare l’associazione tra un fattore possibile causa e un evento possibile

effetto.

Da questi indicatori R o OR si possono elaborare tutta una serie di indicatori molto interessanti.

Page 23: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

69

Uno di questi è il Rischio Attribuibile.

Supponiamo che si dimostri che la presenza di un servizio di tutoraggio serva (quindi sia molto

associato) al superamento di esami, per cui la presenza di questo tutoraggio permette agli studenti

di sostenere in media non più di due appelli per esame.

Facendo un confronto fra due corsi di laurea, uno supportato da tutoraggio e l’altro no, supponiamo

che il rischio relativo sia = 3 (il che significa che la percentuale di coloro che non faranno mai il

terzo appello è tre volte superiore a quello degli altri corsi di laurea dove non c’è il tutoraggio).

A questo punto verrebbe da affermare che conviene istituire il tutoraggio, in modo da eliminare il

problema degli studenti ripetenti.

Ma qui non si opera in un contesto di sperimentazione pura, per cui non è detto che con questo

accorgimento (l’istituzione del tutoraggio) si elimini del tutto il problema.

Di certo però una parte importante del problema sarebbe superato. Ma quanta parte?

Come nell’esempio della fluoroprofilassi o delle campagne contro il fumo, non è detto dopo

l’intervento correttivo (tutoraggio, campagne di fluoroprofilassi o antifumo) il problema sia

sradicato completamente; rimane sempre uno zoccolo duro.

Non è per esempio la stessa cosa nelle malattie infettive dove, tolto l’agente eziologico che le

sostiene, il problema è completamente e assolutamente risolto.

Consideriamo un secondo esempio per capire il Rischio attribuibile.

Supponiamo che per favorire la qualità della didattica e quindi il superamento dell’esame si abbiano

due possibilità: con la prima, l’adozione di un tutor, con l’altra l’istituzione di didattica a distanza.

La questione allora sarà: quale sarà l’efficacia di queste due modalità in termini di promozioni?

Supponiamo che il rischio relativo delle due modalità sia per entrambe le opportunità pari a 3 (cioè:

la percentuale di coloro che superano l’esame tra coloro che sono ricorsi al tutor è tripla di quelli

che non ne hanno usufruito, e ugualmente per la didattica a distanza).

Se rileviamo che la frazione di successi fra coloro che si sono fatti seguite da un tutor è tripla

rispetto a coloro che non si sono fatti seguire, e analogamente è il triplo fra coloro che hanno fatto

didattica a distanza e coloro che non l’hanno fatta, come operiamo la scelta tra le due modalità

potendo attuare solo una delle azioni?

La soluzione è la seguente. Si considerano non solo le proporzioni ma i dati assoluti. Se risultassero

risultati positivi nella misura di 10 su 30 e di 30 su 90 rispettivamente per la prima (tutoraggio) e la

seconda azione (didattica a distanza), la proporzione sarebbe la stessa, ma nella seconda

proporzione sono 30 su 90 gli studenti che superano gli esami, quindi sono 20 in più, in termini

assoluti, rispetto alla prima dove sono solo 10.

Page 24: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

70

Ecco quindi che è molto importante ricordare che non basta un indicatore per trarre delle

conclusioni che ci aiutano nelle nostre scelte, ma occorre riferirsi ad un insieme di indicatori,

ciascuno in grado di evidenziare un aspetto rilevante del problema.

LABORATORIO SU :L'ANALISI STATISTICA DELLA CAUSALITA’.

Vero Falso

1)L'incidenza si rileva in un istante e non in un intervallo di tempo 1 2

2)Il rischio relativo RR é sempre uguale al rapporto incrociato OR; 1 2

3)L’incidenza cumulata non risente dell’effetto della struttura dell’età della popolazione

sotto osservazione; 1 2

4)Il rischio attribuibile % é generalmente sempre prossimo al 100.0%; 1 2

5) Un OR = 0.2 indica che il fattore ad esso associato é ad alto rischio di danno

per la salute; 1 2

6) La prevalenza dipende dalla durata dell’effetto (ad esempio malattia); 1 2

7) L'analisi dell’associazione casuale permette di valutare l'effetto della eliminazione

dei fattori considerati di rischio a parità degli altri considerati nell'analisi; 1 2

8) Il rischio attribuibile negli esposti dipende unicamente dal rischio relativo; 1 2

9)Il rischio relativo è un indicatore che si calcola negli studi di caso-controllo 1 2

10) L'appaiamento dei casi e dei controlli rappresenta comunque la migliore tecnica

di controllo dei fattori di confondimento; 1 2

11) Un fattore associato all'esposizione viene definito di confondimento se é diversamente

distribuito fra esposti e non; 1 2

12) Il rischio attribuibile nella popolazione dipende solamente dall'incidenza nella

popolazione; 1 2

Page 25: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

71

LABORATORIO N. 2 . I DISEGNI DI INDAGINE IN VALUTAZIONE

VERO FALSO

1) Gli studi caso-controllo traggono origine da un gruppo si sani

sui quali è stata rilevata in maniera accurata la presenza

di uno o più specifici fattori di rischio 1 2

2) Gli studi cosidetti quasi-sperimentali garantiscono la massima

autonomia nell’organizzazione dell’esperimento al ricercatore 1 2

3)Gli studi longitudinali o per coorte si prestano allo studio di

eventi rari 1 2

4)La tecnica in doppio cieco permette di garantire il massimo

anonimato nella rilevazione di dati sperimentali 1 2

5)Gli studi descrittivi si basano prevalentemente su fonti statistiche

correnti o di servizio 1 2

6)Gli studi sperimentali il controllo dei possibili fattori di

confondimento viene garantita dalla randomizzazione della

somministrazione dei trattamenti e dalla scelta dei soggetti

a cui assegnare i singoli livelli sperimentali 1 2

7)I fattori di confondimento rappresentano fattori che posso intro-

durre distorsioni nella stima dei parametri delle causalità in

studio 1 2

8)L’incidenza viene osservata negli studi caso-controllo 1 2

9)La prevalenza viene registrata negli studi di casi 1 2

10)I cambiamenti vengono meglio rilevati negli studi trasversali 1 2

11)Un limite degli studi longitudinali prospettici è rappresentato

dalla complessità dell’organizzazione nel tempo per garantire

omogeneità della rilevazione 1 2

12) Gli studi di casi offrono sostanzialmente l’opportunità di avanzare

ipotesi di studio da verificare con disegni sperimentali o longitudinali 1 2

13)Gli screening di popolazione si configurano come studi di

causalità analitica 1 2

14)La possibile distorsione imputabile alla memoria viene ridotta

ricorrendo alla adozione di rilevazioni in cieco o doppio cieco 1 2

Page 26: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

72

Esempio 1. Viene compiuta una indagine di un campione di 2400 utenti ad un servizio di biblioteca

universitaria i quali si sono rivolti negli ultimi due mesi per ricevere informazioni e libri o materiale

di lettura didattica. Di questi 800 avevano richiesto il materiale via e-mail mentre i restanti 1600 per

richiesta diretta in ufficio. Alla riconsegna del materiale da parte degli studenti è stata compiuta

una valutazione dell’esperienza e quindi del servizio ricevuto. I risultati sono riprodotti nella tavola

seguente.

Distribuzione del numero di utenti per grado di soddisfazione del tipologia di contatto per richiesta

del servizio (Studio di coorte).

Clienti che hanno restituito il

materiale

TOTALE

Puntualmente In ritardo

Studenti che

hanno richiesto

materiale

didattico in

Biblioteca

Via e-mail 250 550 800

Per contatto

personale

1150 450 1600

1400 1000 2400

Si costruiscono i seguenti indicatori del livello di soddisfazione e dipendenza con il fattore di

potenziale causa del ritardo nella consegna (modalità di richiesta del servizio)

ALCUNI ULTERIORI RIFERIMENTI BIBLIOGRAFICI SUI TEST DIAGNOSTICI

1)Sackett D.L. , Haynes R.B., Tugwell P. (1986): CLINICAL EPIDE- MIOLOGY, Ed. Little, Brown

and Company, Boston;

2) Metz C. E. (1978): Basic Principles of ROC Analysis. Seminars in Nuclear Medicine, vol VIII, p.

283-298;

3)Lilienfeld A.M. , Lilienfeld D. E. (1986): FONDAMENTI DI EPIDE- MIOLOGIA; Ed. Piccin

Padova;

4)Browner W. S. , Newman T. B. and Cummings S. R. (1988): DESI- GNING A NEW STUDY:

DIAGNOSTIC TESTS; in DESIGNING CLINICAL RESEARCH Ed by Hulley S. B. and

Cummings S.R., ch. 9;

5)A. R. Feinstein (1989): CLINICAL EPIDEMIOLOGY, The architecture of Clinical Research;

6)Flecther R. H., Flecther S.W., Wagner E. H. (1990):CLINICAL E- PIDEMIOLOGY, The Essentials,

ch 3., II Ed;

7)Altman G. Douglas(1991): PRATICAL STATISTICS FOR MEDICAL RE- SEARCH; Chapman and

Hall London;

Page 27: La ricerca di nessi causali. I disegni di indagine in ...homes.stat.unipd.it/mariobolzan/sites/homes.stat.unipd.it.mariobolzan/files/...metodo delphi e altri ancora) che troveranno

73

8) Moise A. Salamon R., Commenges D., Clement B. (1986): L'utilisation des courbes ROC; Revue

d'épidémiologie et de santé publique, vol 34, p. 209 - 217;

9) M.C. Weinstein , H.V. Fineberg. (1984):L'ANALISI DELLA DECISIONE IN MEDICINA. Ed.

Italiana a cura di Vittorio Ghetti. Franco Angeli Ed.

10) Calbert I Philips (ed by) (1988): LOGIC IN MEDICINE. Articles from the British Medical

Journal.

11) Pauker S. G. and Kassirer J. P. (1975): Therapeutic Decision Ma- king: A Cost-Benefit Analysis. N

Eng J Med 293: 229-234.

12) Pauker S. G. and Kassirer J. P. (1980) : The Threshold Approach to Clinical Decision Making. N

Eng J Med. 302:1109 - 1117.