Sociologia generale e Statistica sociale (18) · 2019. 12. 9. · stessa, sia per la popolazione...

62
Sociologia generale e Statistica sociale (18) Corso di Lingue, Letterature e Culture Straniere Anno accademico 2019-2020 Prof. Michele Marzulli [email protected]

Transcript of Sociologia generale e Statistica sociale (18) · 2019. 12. 9. · stessa, sia per la popolazione...

  • Sociologia generale e Statistica sociale (18)

    Corso di Lingue, Letterature e Culture Straniere

    Anno accademico 2019-2020

    Prof. Michele Marzulli

    [email protected]

    mailto:[email protected]

  • Argomenti del giorno

    • Indipendenza

    • Connessione

    • Associazione

    • Campionamento

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale2

  • Analisi bivariata

    • Abbiamo visto che l’analisi bivariata permette di trattare il comportamento congiunto di due variabili.

    • L’obiettivo è individuare una eventuale relazione tra due fenomeni (o variabili che indicano fenomeni).

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale3

  • Indipendenza

    • Due fenomeni X e Y sono indipendentistatisticamente (i.s.) se non esiste alcuna relazione statistica tra loro.

    • Per verificarlo, bisogna confrontare le frequenze condizionate con le frequenze marginali.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale4

  • Indipendenza

    • Infatti, bisogna pensare che le freq. marginali si riferiscono all’intera U (non sono influenzate da nulla), mentre le freq. condizionate sono delle sotto-popolazioni (se guardiamo le righe: Y|xi).

    • Per operare un confronto in statistica ci vogliono le freq. relative: le freq. condizionate sono già relative; per le freq. marginali bisogna dividere per N (fi. / N e f.j / N).

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale5

  • Indipendenza

    • Se tutte le frequenze condizionate (fij / fi) sono uguali fra loro e uguali alla marginale (relativa), significa che Y si comporta nello stesso modo.

    • Quindi X e Y sono indipendentistatisticamente.

    • È sufficiente verificare una condizione: l’altra discende di conseguenza, l’indipendenza è simmetrica.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale6

  • Indipendenza

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale7

    • Come fare a verificare se due fenomeni sono indipendenti?

    Freq. condizionata (cioè la freq. congiunta / la freq. marginale della modalità condizionante).

    Freq. marginale relativa (cioè in rapporto a N).

  • Esempio (1/4)

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale8

    • Domanda: nella convivenza esiste una relazione statistica tra genere ed età?

    (Y)

    (X)

  • Esempio (2/4)

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale9

    • Consideriamo le righe (le sottopopolazioni di M e F).

    • Cioè le v.s. condizionate Y|F e Y|M.

    • Costruiamo le frequenze condizionate (fij / fi) e le confrontiamo con le frequenze marginali relative di Y (f.j / N).

    (Y)

    (X)

  • Esempio (3/4)

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale10

    • Riga Femmine: 6/40 = 0,15 (o 15%); 22/40=0,55; 12/40=0,30; 40/40=1.

    Classe di età

    Genere ≤ 34 35 − 54 ≥ 55 Tot.

    F 0,15 0,55 0,30 1

    M 0,15 0,55 0,30 1

    Tot. 0,15 0,55 0,30 1

  • Esempio (4/4)

    • La prima riga della tabella restituisce le % di età per le femmine, la seconda per i soli maschi, la terza per l’intera popolazione.

    • Le tre righe sono uguali, la distribuzione delle età è la stessa, sia per la popolazione intera che per le due sottopopolazioni considerate.

    – Cioè, il genere non fornisce alcuna informazione circa l’età.

    • Non c’è relazione statistica tra genere ed età; la condizione di indipendenza st. è verificata.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale11

  • Le frequenze attese

    • Le frequenze che realizzano (rendono vera) la condizione di indipendenza statistica sono definite frequenze attese* o teoriche (per differenza dalle frequenze osservate).

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale12

  • Frequenze osservate e attese

    • I dati che abbiamo rilevato con la ricerca si chiamano frequenze osservate.

    • Tenendo fisse le frequenze marginali, possiamo calcolare le frequenze attese (o teoriche) di indipendenza statistica (moltiplicare tra loro i marginali e dividere per i casi).

    • Quando la condizione di indipendenza statistica è soddisfatta, le due tabelle (osservata e teorica) coincidono.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale13

  • Esempio

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale14

    Classe di età

    Genere ≤ 34 35 − 54 ≥ 55 Tot.

    F 6 22 12 40

    M 9 33 18 60

    Tot. 15 55 30 100

    Frequenze osservate

    Classe di età

    Genere ≤ 34 35 − 54 ≥ 55 Tot.

    F (40x15)/100=6

    (40x55)/100=22

    12 40

    M (60x15)/100=9

    33 18 60

    Tot. 15 55 30 100

    Frequenze attese

  • Test di associazione

    • La distinzione tra frequenze attese e frequenze osservate è indispensabile per effettuare una verificastatistica molto importante, cioè il test del χ2 (chi quadro).

    • Si tratta di una procedura che confronta queste frequenze per verificare l’ipotesi di una associazionetra le variabili.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale15

  • Test di associazione

    • χ2 = 0 X e Y sono statisticamente indipendenti.

    • χ2 > 0 è presente una qualche forma di associazione.

    • Formula (semplificata):

    χ2 = σ 𝑓𝑜 −𝑓𝑒

    2

    𝑓𝑒• Cioè: (freq. osservate – freq. attese)2 / freq. attese

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale16

  • Test di associazione

    • Formula (alternativa) che però usa le sole frequenzeosservate (ed è più facile per i conti a mano):

    • Cioè:

    χ2 = 𝑁 σ𝑓𝑟𝑒𝑞. 𝑐𝑜𝑛𝑔𝑖𝑢𝑛𝑡𝑒2

    𝑓𝑟𝑒𝑞.𝑚𝑎𝑟𝑔.𝑟𝑖𝑔𝑎 𝑝𝑒𝑟 𝑓𝑟𝑒𝑞.𝑚𝑎𝑟𝑔.𝑐𝑜𝑙… − 1

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale17

  • Esempio

    • Calcolare le frequenze attese, date quelle osservate (n° occupati distinti per genere e tipo di occupazione, Cfr. Amaturo, 2012:413 e ss).

    • Queste sono le frequenze osservate.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale18

    Maschi Femmine Totale

    t.pieno 11.835 5.755 17.590

    t.parziale 538 2.162 2.700

    atipici 1.262 1.322 2.583

    Totale 13.634 9.239 22.873

  • Esempio • Calcolare le frequenze attese (17.590x13.634/22.873)

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale19

    Maschi Femmine Totale

    t.pieno 11.835 5.755 17.590

    t.parziale 538 2.162 2.700

    atipici 1.262 1.322 2.583

    Totale 13.634 9.239 22.873

    Maschi Femmine Totale

    t.pieno 10.485 7.105 17.590

    t.parziale 1.609 1.091 2.700

    atipici 1.540 1.043 2.583

    Totale 13.634 9.239 22.873

    oss

    erva

    teat

    tese

  • Test del X2

    • Con la seconda formula il risultato del test è = 2058,57.

    • È un valore significativo? Di per sé non è comprensibile. Allora occorre la normalizzazione.

    • Cioè: 2058,57 / 22873 = 0,09 cioè il 9%. Il grado di connessione è basso (il 9% della max connessione).

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale20

  • Esercizio (1)

    • Riempire la tabella con le frequenze osservate, conoscendo solo il contenuto di una cella.

    • La matrice 2x2 si dice che ha un solo grado di libertà (n° righe -1 x n° col. -1).

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale21

    Maschi Femmine Tot.

    Presenti 150

    Assenti 20 50

    Tot. 100 100 200

  • Esercizio (2)

    • Riempire la tabella con le frequenze, conoscendo solo il contenuto di una cella (20).

    • L’esercizio (preso da: Amaturo, 2012: 414), avrebbe la finalità di sottolineare come le frequenze sono obbligate e dedotte a partire dai marginali, se viene dato anche un solo valore (20). Sulla sua chiarezza dell’esempio ai fini espositivi rimangono alcuni dubbi.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale22

    Maschi Femmine Tot.

    Presenti 80 70 150

    Assenti 20 30 50

    Tot. 100 100 200

  • Dalla descrizione all’inferenza

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale23

  • Dalla descrizione all’inferenza

    • Normalmente in statistica non si dispone di dati sull’intera popolazione U (sulla quale si possono effettuare tutte le operazioni di tipo descrittivo viste finora).

    • Piuttosto, si ha a che fare con un sottoinsieme della popolazione totale, cioè con un campione.

    • Il campione ha una numerosità n < N.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale24

  • Dalla descrizione all’inferenza

    • Quando si ha a che fare con i campioni, si tratta di estendere i risultati dell’analisi del comportamento di X all’intera U.

    • Cioè inferire dal campione alla popolazione.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale25

  • Censimento e campione

    • Osservazione sull’intera popolazione U (di numerosità N) = censimento.

    • Osservazione sul campione = rilevazione campionaria.

    – Nelle scienze sociali, solitamente abbiamo a che fare con campioni (oltre all’analisi dei dati censuari come quelli ISTAT, fino al 2011).

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale26

  • Inferenza e rappresentatività

    • L’inferenza statistica è un processo induttivoche procede dal particolare (il campione) al generale (la popolazione).

    • Un buon campione deve essere rappresentativo, cioè riprodurre in piccolo le caratteristiche della popolazione.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale27

  • La rappresentatività

    • L’inferenza statistica classica si basa su campioni casuali.

    • Casuale, cioè scelto a caso, senza criteri specifici ma secondo le leggi del caso.

    • Se il campione è causale è anche rappresentativo.

    – Come lo spaghetto nell’acqua che bolle…

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale28

  • Inferenza statistica

    • Quindi l’inferenza statistica è l’estensione dell’analisi dei dati campionari all’intera popolazione.

    • Essa avviene nell’incertezza e sotto l’effetto del caso.

    • Cioè, secondo la teoria delle probabilità.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale29

  • Situazione deterministica e casuale

    • Situazione deterministica: quando è noto l’intero insieme di circostanze che determinano E. In questo caso E è prevedibile a priori con certezza.

    • Es. portando l’acqua a 0° C si ottiene ghiaccio.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale30

  • Situazione deterministica e casuale

    • Ci si trova in situazione casuale quando l’insieme di circostanze che determinano E è noto solo parzialmente. In questo caso E non è prevedibile apriori con certezza.

    • Es.: testa o croce?

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale31

  • Definizioni

    • La parte di circostanze ignote che impediscono di prevedere a priori con certezza il risultato E definisceil caso.

    • Esperimento casuale: esperimento condotto sotto l’effetto del caso. Di un esperimento casuale è possibile solo elencare a priori l’insieme dei possibili esiti.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale32

  • Definizioni

    • Evento elementare: ciascuno dei possibili esiti di un esperimento casuale.

    • Spazio campionario (Ω, omega): l’insieme di tutti i possibili esiti (eventi elementari) di un esperimento casuale, elencabili a priori.

    • Evento casuale (E): un sottoinsieme dello spazio campionario (un insieme di eventi elementari).

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale33

  • Esempio

    • Esperimento causale: lancio dei dadi.

    • Evento elementare: che esca 3 o 6 o 1…

    • Spazio campionario (Ω): 1, 2, 3, 4, 5, 6.

    • Evento casuale (E): esce un numero pari.

    – E = 2, 4, 6.

    – E = 2, 4, 6 ⊂ 1, 2, 3, 4, 5, 6 = Ω [E è un sottoinsieme proprio di Ω]

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale34

  • Realizzazione di un evento casuale

    • Un evento casuale E è realizzato o verificato se a posteriori è risultato uno degli eventi elementari che lo compongono.

    • Uno degli eventi elementari necessariamente si verifica. Quindi, intesi come eventi casuali: Ω è l’evento certo; 0 l’evento impossibile.

    • Tiro il dado, esce il 2 = l’evento E (numero pari) è verificato (2 ∈ E). Esce 3 = l’evento E non è verificato.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale35

  • Probabilità

    • La probabilità P(E) di un evento casuale E è un numero associato a E che ne quantifica a priori il grado di incertezza ovvero la possibilità di realizzazione.

    • Definizione classica: P(E) è il rapporto fra il numero di casi favorevoli a E e il numero di tutti i casi possibili, posto che possano ritenersi tutti ugualmente possibili.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale36

  • Probabilità

    • Esempio del numero pari (evento casuale) con il dado. Tutti i casi (6) sono ugualmente possibili.

    • L’evento favorevole: 3 casi possibili (2, 4, 6).

    • P (E) = casi favorevoli/casi possibili = 3/6 = 0,5.

    • Casi particolari: l’evento certo: 6/6=1; l’evento impossibile 0/6=0.

    • Quindi: evento certo: 1, evento impossibile 0. Ogni evento casuale diverso dai casi limite ha una probabilità compresa tra 0 e 1.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale37

  • Probabilità

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale38

    • La v.c. formalizza le situazioni casuali - cioè gli eventi E e le loro probabilità P(E) - in analogia con quanto fa la v.s. nella statistica descrittiva.

  • Il campionamento

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale39

  • Il campionamento

    • L’operazione di scelta casuale del campione di n unità statistiche fra le N che compongono l’intera U è chiamata campionamento.

    • Il numero n è detto numerosità o ampiezza campionaria.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale40

  • Il campionamento

    • Campionamento casuale (bernoulliano): è il risultato di nestrazioni casuali da U condotte tutte nelle stesse condizioni cioè fra loro indipendenti. Si tratta di effettuare n estrazioni con reinserimento fra le N unità di U tra loro equiprobabili.

    • Campionamento casuale semplice: senza reinserimento.

    • Se n è sufficientemente grande in assoluto ma allo stesso tempo piccolo rispetto a N, le due tecniche portano a risultati equivalenti.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale41

  • Variabilità campionaria ed errore campionario

    • Da U sono estraibili molti diversi campioni.

    • Variabilità campionaria: ciascuno dei campioni fornisce un’informazione parziale e potenzialmentedifferente circa il comportamento su U del fenomeno che interessa.

    • Il processo di inferenza statistica avviene sotto l’effetto della variabilità campionaria perché i soli dati noti sono quelli del campione effettivamente estratto, che è solo uno fra i possibili.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale42

  • Variabilità campionaria ed errore campionario

    • L’inferenza statistica comporta dunque necessariamente incertezza e rischio di errore(errore campionario).

    • Fare buona inferenza significa controllare e misurare l’errore campionario.

    • Nell’inferenza statistica che si basa su campioni casuali, l’errore campionario è controllato e misurato scientificamente con le probabilità.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale43

  • Errore campionario

    • Formula per calcolare l’errore standard:

    se = 𝝈

    𝑛

    • Standard error = deviazione standard in rapporto alla radice quadrata del valore del campione.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale44

  • Campione e campionamento

    • Per sapere se un campione è un «buon campione» occorre sapere come è stato selezionato.

    • Il campionamento è la procedura di selezione dei casi che saranno oggetto di indagine.

    • Esistono due famiglie di procedure campionarie:

    1. Il campionamento probabilistico (selezione casuale).

    2. Il campionamento non probabilistico.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale45

  • Campionamento probabilistico

    • Probabilità1. Il campione probabilistico è rappresentativo

    della popolazione.

    2. Le informazioni rilevate sul campione sono estendibili alla popolazione (inferenza sulla popolazione a partire dai dati osservati sul campione).

    • CP: quando, per ciascun caso che fa parte della popolazione di riferimento, la probabilità di essere selezionato è nota ed è diversa da zero.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale46

  • Condizioni: la lista della popolazione

    • È necessario conoscere la popolazione oggetto di studio. In primo luogo, conoscere la popolazione stessa, cioè avere una «lista della popolazione».

    – In genere: liste elettorali, anagrafiche… elenchi raccolti su una qualsiasi popolazione, di cui si conoscono i criteri.

    – Se uso le liste elettorali, per es., devo sapere chi aspettarmi sia presente o assente.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale47

  • Quando scegliere il cp?

    • Se dispongo di una lista della popolazione (aggiornata, affidabile…) il campionamento probabilistico è la strada preferibile. Proprio in virtù della possibilità di usare i risultati della ricerca in maniera inferenziale.

    • Ma il CP ha condizioni molto stringenti e costi elevati.

    • Inoltre, è utile/preferibile in relazione agli obiettivi della ricerca.

    • Ci sono ricerche che non richiedono come condizione l’inferenza sulla popolazione.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale48

  • Quando scegliere il cp?

    • Se per es. stiamo effettuando uno «studio pilota», cioè stiamo esplorando un fenomeno poco conosciuto con la sola finalità di raccogliere maggiori informazioni… il CP non ha alcun senso.

    • In genere, si ritiene, che gli studi esplorativi (non necessariamente qualitativi) possono essere usati in fase preliminare, per conoscere meglio un fenomeno da studiare successivamente attraverso una ricerca con CP.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale49

  • Campionamento non probabilistico

    • CNP: quando per ciascun caso appartenente alla popolazione oggetto di indagine, la probabilità di essere incluso nel campione non è nota.

    • Quando si usa? Per ragioni di praticità o comodità (convenienza).

    – Per es., costi e tempi di rilevazione.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale50

  • Campionamento non probabilistico

    • La conseguenze più rilevante è che i risultati osservati sul campione non si possono estendere alla popolazione di riferimento.

    • I risultati osservati però sono validi per il campione osservato: cioè il CNP non autorizza a svolgere ricerche non rigorose!

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale51

  • Tecniche di campionamento

    Campioni probabilistici

    Casuale semplice

    Sistematico

    Stratificato

    A grappoli

    A stadi

    Ad area

    Campioni non probabilistici

    A scelta ragionata

    Accidentale

    A valanga

    Per quote

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale52

  • Campionamento casuale semplice

    • Elenco della popolazione (numerata), urna, sorteggio.– Devo selezionare (a caso!) 10 studenti su 100 N = 100,

    n = 10.

    – Nel campionamento casuale semplice ogni individuo della popolazione (N) ha 1/N di essere estratto.

    – Il campionamento è «senza ripetizione» (nessuno viene inserito di nuovo nell’urna).

    • Ogni caso ha la stessa probabilità di essere estratto.

    • È la base di tutti i CP.– Però è facilmente applicabile solo a popolazioni piccole e

    omogenee.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale53

  • Campionamento sistematico

    • Il campione (n) è selezionato a intervalli regolari (k).– Passo di campionamento (k): si seleziona un caso ogni

    k dove k = N/n.

    – N = 1500, n = 100 k = 1500/100 = 15

    – Seleziono un caso ogni 15 (nella lista della popolazione).

    – In genere: se estrae anche un numero da 1 a 15, che sarà il primo della lista da cui partire: se esce 7, sarà il primo estratto, il secondo sarà 22, il terzo 37… fino all’esaurimento della lista.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale54

  • Campionamento stratificato (random)

    • È un tipo particolare di campionamento casuale semplice, particolarmente utile quando si conoscono le caratteristiche della popolazione oggetto di studio.

    • Serve a suddividere la popolazione in strati o sotto-popolazioni omogenee (area geografica, sesso, età…).

    • Dentro ogni strato viene effettuato un campionamento (semplice o sistematico, con o senza k).– Per es. indagine ISTAT su spese famiglie e forza lavoro: primo strato

    (comuni, selezionati in base a struttura economica), secondo strato (famiglie). https://www.istat.it/it/files/2014/12/Lucarelli-Ceccarelli.pdf

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale55

    https://www.istat.it/it/files/2014/12/Lucarelli-Ceccarelli.pdf

  • Campionamento a grappoli

    • Quando la lista della popolazione non è accessibile ma si dispone di liste che suddividono la popolazione in sotto-gruppi (ateneo, classe scolastica, azienda…).

    • I grappoli sono sotto-gruppi della popolazione totale, che la suddividono in modo artificiale (o naturale).

    • Grappolo ≠ strato – Non tutti i grappoli saranno estratti.

    – I grappoli devono essere eterogenei.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale56

  • Campionamento a stadi e per aree

    • Stadi: un campione in cui sono inclusi solo alcune unità dei grappoli estratti.

    • Procedura a imbuto:

    – Provincia ospedale paziente

    – Scuola classe studente

    • Aree: lo stadio è l’area geografica:

    – Macro-area Regione Provincia Comune Quartiere Individuo.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale57

  • Tecniche CNP: accidentale

    • Accidentale (o a casaccio).– L’opposto del campionamento casuale semplice.

    • Si scelgono le prime persone che si incontrano senza altri criteri.– I primi 100 studenti in fila alla segreteria.

    • Accuratezza ridotta (ma anche tempi e costi), utile in fase esplorativa.

    • Anche campione auto-selezionato è accidentale… il televoto!

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale58

  • Campionamento a scelta ragionata

    • Il ricercatore sceglie dei criteri in base alle sue conoscenze e alle finalità della ricerca.

    • Scelta razionale (ragionata) ma arbitrario. In ogni caso, la scelta va esplicitata (nota metodologica).

    • Per es. campionamento di esperti: opinion leader, testimoni privilegiati. Anche per le tecniche qualitative.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale59

  • Campionamento a valanga

    • Detto anche a «palla di neve» o «a catena».

    • Se la popolazione è difficilmente raggiungibile, scarsa numericamente… soprattutto fenomeni informali, extra-legali…

    • Si usano le reti di relazioni tra individui.

    • Distorsione: omogeneità del campione, omogeneità/non eterogeneità dei dati osservati (scarsa variabilità).

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale60

  • Campionamento per quote

    • Dentro un campionamento stratificato, possono essere individuate delle quote, cioè il numero di individui da intervistare per es.

    • La scelta è discrezionale... In genere in base all’opportunità/accessibilità…

    – Per es. 100 interviste a lavoratori: 50 a tempo determinato, 50 a tempo indeterminato.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale61

  • Differenze tra CP e CNP

    • Rappresentatività

    • Inferenza Campioni

    probabilistici

    • Semplicità

    • Rapidità

    • Economicità

    Campioni non probabilistici

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale62