Tema II Las muestras y la teoría paramétricarolan.webs.uvigo.es/statistics_course/Tema2.pdf ·...

16
1 Tema II. Las muestras y la teoría paramétrica 2.1. Muestras y muestreos: - La muestra: . Subconjunto de elementos de la población . Necesidad práctica: . Motivos económicos . Imposibilidad (práctica/teórica) de estudiar TODA la población . Inconveniencia práctica o ética (al destruir o afectar la muestra) . Representativa de la población - Estrategias de muestreo: . Muestreo aleatorio (conocemos la p de la población en la muestra) . Muestreo opinático (criterios subjetivos; experiencia del investigador) . Muestreo piloto (previo a un estudio) Ejemplo de muestra? UNIVERSIDAD DE VIGO

Transcript of Tema II Las muestras y la teoría paramétricarolan.webs.uvigo.es/statistics_course/Tema2.pdf ·...

1

Tema II. Las muestras y la teoría paramétrica

2.1. Muestras y muestreos:- La muestra:

. Subconjunto de elementos de la población

. Necesidad práctica:. Motivos económicos. Imposibilidad (práctica/teórica) de estudiar TODA la población. Inconveniencia práctica o ética (al destruir o afectar la muestra)

. Representativa de la población- Estrategias de muestreo:

. Muestreo aleatorio (conocemos la p de la población en la muestra)

. Muestreo opinático (criterios subjetivos; experiencia del investigador)

. Muestreo piloto (previo a un estudio)

Ejemplo de muestra?

UNIVERSIDAD DE VIGO

2

Tema II. Las muestras y la teoría paramétrica

2.1. Muestras y muestreos:- Tipos de muestreo aleatorio (representativo):

. Simple con reemplazamiento (o con N grande)

. Simple sin reemplazamiento

. Estratificado (en función de la estructura de la población)

. Por áreas (geográficas, por ejemplo)

Ejemplo de estratificación

UNIVERSIDAD DE VIGO

3

Tema II. Las muestras y la teoría paramétrica

∑(xi-x)2

s2 = (n-1)

∑xix =

n

2.2. Muestras, estadísticos y estimadores:- Normalmente SIEMPRE se trabaja con muestras (estadísticos y estimadores):

. Estadístico: cualquier función que resume propiedades de la muestra

. Estimador: cuando un estadístico pretende inferir el valor de la población:. μ (x). σ2 (s2)

- Estimación puntual (por intervalos)

UNIVERSIDAD DE VIGO

4

2.3. Las muestras y la distribución muestral:- La distribución de probabilidad del estadístico (estimador) cambia en la muestra- El procedimiento de inferencia parámetrico (empírico):

- Se obtiene una muestra- Se mide el estadístico- Se imagina uno ∞ muestras idénticas sobre las que se calcula el estadístico- Se obtiene la distribución muestral (ejemplo Excel)

Tema II. Las muestras y la teoría paramétrica

Población123456789

10

Muestra 1 = 2, 6, 9 (5,67)

Muestra 2 = 1, 3, 6 (3,33)

Muestra 3 = 4, 5, 5 (4,67)

Muestra 4 = 7, 7, 8 (7,33)

Muestra 5 = 1, 7, 9 (5,67)

Muestra 6 = 1, 5, 5 (3,67)

Muestra 7 = 6, 6, 8 (6,67)

Muestra 8 = 1, 2, 3 (2,00)

Muestra 9 = 8, 9, 10 (9,00)

Muestra 10 = 4, 5, 5 (4,67)

Distribución de Frecuencias

Clase 1-2: 1Clase 3-4: 2Clase 5-6: 4Case 7-8: 2Clase 9-10: 1

¡¡La distribución muestral ES normal!! 00.5

11.5

22.5

33.5

44.5

1 2 3 4 5

Distribución muestral

UNIVERSIDAD DE VIGO

0

0.2

0.4

0.6

0.8

1

1.2

1 2 3 4 5 6 7 8 9 10

Distribución Población

5

Fórmula General

S2

Varm =N

2.3. Las muestras y la distribución muestral:- Obtención de la distribución muestral de la media:

. Procedimiento inferencial teórico

. Tamaño de muestra (N)

. Media muestral (xs)

. Varianza muestral (s2s)

Distribución de la Población

N1 = 10

μσ2

N2 = 100

xs1 = μ

s2

S2s1 =

10

xs2 = μ

s2

S2s2 =

100

Muestra 1

Tema II. Las muestras y la teoría paramétricaUNIVERSIDAD DE VIGO

6

2.3. Las muestras y la distribución muestral:- El uso de tablas de referencia (distribución t):

- Obtención de IC- Test de Hipótesis

×±

Tema II. Las muestras y la teoría paramétricaUNIVERSIDAD DE VIGO

7

2.3. Las muestras y la distribución muestral:- Aplicación a muestras, la distribución t:

. Ejemplo de muestra (IC) ×±

Ejemplo de Muestra (N = 8)ALUMNOS DE UNA CLASE: 10,2 9,7 10 9,6 8,7 11 10,5 10,9

Estadística descriptiva:Media de muestra (μ) = 10,07 Varianza de muestra (σ2) = 0,571Desviación típica de muestra (σ) = 0,755

∑(xi-x)2

s2 = (n-1)

OBTENCIÓN DE INTERVALO DE CONFIANZA

N NC CÁLCULO INT1 INT2

8 95% 10,07 ± 0,63 (2,36 x 0,755/√8) 9,4 10,78 99% 10,07 ± 0,93 (3,50 x 0,755/√8) 9,1 11,0

80 95% 10,07 ± 0,17 (1,99 x 0,755/√80) 9,9 10,280 99% 10,07 ± 0,22 (2,64 x 0,755/√80) 9,8 10,3

Este intervalo se refiere al de la media de nuestra muestra

Tema II. Las muestras y la teoría paramétricaUNIVERSIDAD DE VIGO

8

2.3. Las muestras y la distribución muestral:- Aplicación a muestras, la distribución t:

. Ejemplo de muestra (Test de hipótesis)

Ejemplo de Muestra (N = 8)ALUMNOS DE UNA CLASE: 10,2 9,7 10 9,6 8,7 11 10,5 10,9

Estadística descriptiva:Media de muestra (μ) = 10,07 Varianza de muestra (σ2) = 0,571Desviación típica de muestra (σ) = 0,755

Nivel significación 5% (p una cola 0.025)

N = 8, si X = 10,5; H0 = pertenece a la población; H1 =no

(10,5 – 10,07)/(0,755/√8) = 1,61 : p en tabla t > 0.05; (>0,1 dos colas)

Según NS del 5% se acepta H0

Método General

x – μ (H0)

σ/√n

Tema II. Las muestras y la teoría paramétricaUNIVERSIDAD DE VIGO

9

2.4. Aplicación del test t en muestras:- Diferencias entre dos muestras:

. Ejemplo en el Hospital

. Análisis descriptivo

. Test t (H0 y H1)- Con comparaciones múltiples se usa ANOVA

Porcentage de HDL en sangre

Muestra 1 (10 enfermos): 120, 107, 110, 116, 114, 111, 113, 117, 114, 112Muestra 2 (10 sanos): 110, 111, 107, 108, 110, 105, 107, 106, 111, 111

Estadística descriptiva: Muestra 1 Muestra 2Media (μ) 113,4 108,6Varianza (σ2) 13,822 5,155Desviación típica (σ) 3,72 2,27

(n1-1) σ21 + (n2-2) σ2

2 (9x13,822) + (9x5,155)σ2

ponderada = = = 9,488 (3,08)n1 + n2 – 2 18

Método General

x1 – x2 – (μ1- μ2; H0=0) t =

σ2p 1 1

√ n1 n2

t = 3,484 Valor de probabilidad asociado a dicha t < 0.01 GL = n1 + n2 -2 = 18 Valor de t al límite del 5% = 2,109

por ello se puede rechazar la h0

Tema II. Las muestras y la teoría paramétricaUNIVERSIDAD DE VIGO

10

2.5. Aplicación del test t en muestras:- Diferencias entre dos muestras apareadas:

. Ejemplo en el Hospital

. Test t (H0 y H1)

Porcentage de HDL en sangre

Muestra 1 (10 enfermos): 120, 107, 110, 116, 114, 111, 113, 117, 114, 112Muestra 2 (los mismos sanos): 110, 111, 107, 108, 110, 105, 107, 106, 111, 111Diferencia: 10, -4, 3, 8, 4, 6, 6, 11, 3, 1

Estadística descriptiva: DMedia (μ) 4,8Varianza (σ2) 19,73Desviación típica (σ) 4,44

H0 = D no es distinto de 0; H1 = Si lo es

t = 3,42 Valor de probabilidad asociado a dicha t < 0.01 GL = n -1 = 9 Valor de t al límite del 5% = 2,26

por ello se puede rechazar la h0

Tema II. Las muestras y la teoría paramétricaUNIVERSIDAD DE VIGO

Método General

D – δ (H0=0) t =

√(σ2p/nparejas)

11

2.6. Estimación y test de hipótesis con otros estadísticos:- Diferencias entre dos varianzas:

. La razón de varianzas (s21/s22)

. La distribución F:. GL1 (numerador-1) y GL2 (denominador-1). Puede ser asimétrica o no. Test de una cola

Tema II. Las muestras y la teoría paramétrica

Casos de la distribución F:

F(1, ∞) = Distribución Normal

F(1, n2) = Distribución t

F(n1, ∞) = Distribución χ2

UNIVERSIDAD DE VIGO

12

2.6. Estimación y test de hipótesis con otros estadísticos :- Diferencias entre dos varianzas:

. Uso de la distribución F:. Se elige NS. Se busca valor F GL1 y GL2. Se determina rechazo o no de H0

Tema II. Las muestras y la teoría paramétrica

NS = 5%

Ejemplo: F = 3,45GL1 = 3GL2 = 17

Como 3,45 < 3,59

No significativoSe acepta H0

UNIVERSIDAD DE VIGO

13

2.6. Estimación y test de hipótesis con otros estadísticos :- Diferencias entre dos varianzas:

. Ejemplo en el Hospital

. Conclusión

Porcentage de HDL en sangre

Muestra 1 (10 enfermos): 120, 107, 110, 116, 114, 111, 113, 117, 114, 112Muestra 2 (10 sanos): 110, 111, 107, 108, 110, 105, 107, 106, 111, 111

Tema II. Las muestras y la teoría paramétrica

Estadística descriptiva: Muestra 1 Muestra 2Media (μ) 113,4 108,6Varianza (σ2) 13,822 5,155Desviación típica (σ) 3,72 2,27

H0 = no hay diferencias en varianzasH1 = si las hay

F = Mayor/Menor = 2,68 F5%(9,9) = 3.18

Fprueba < Ftabla = se acepta H0

Muestra 1 y 2 con iguales varianzas

UNIVERSIDAD DE VIGO

14

2.6. Estimación y test de hipótesis con otros estadísticos :- Diferencias entre dos varianzas:

. La razón de varianzas (s21/s22)

. La distribución F:. GL1 (numerador-1) y GL2 (denominador-1). Asimétrica. Test de una cola

Tema II. Las muestras y la teoría paramétrica

Casos de la distribución F:

F(1, ∞) = Distribución Normal

F(1, n2) = Distribución t

F(n1, ∞) = Distribución χ2

UNIVERSIDAD DE VIGO

15

2.7. Otros tests de hipótesis:- Evaluación de proporciones, frecuencias, etc:

. Métodos no paramétricos (análisis de frecuencias):. Χ2 (conjunto de distribuciones; asimétricas; de una cola). Test G

- Métodos NO-Paramétricos de aleatorización/remuestreo empírico, etc.

Tema II. Las muestras y la teoría paramétrica

df > 30: use z = sqrt(2chi2)-sqrt(2df-1)

44.31 37.65 34.38 16.47 14.61 11.52 25

37.57 31.41 28.41 12.44 10.85 8.260 20

30.58 25.00 22.31 8.547 7.261 5.229 15

23.21 18.31 15.99 4.865 3.940 2.558 10

15.09 11.079.236 1.610 1.145 0.554 5

13.28 9.488 7.779 1.064 0.711 0.297 4

11.34 7.815 6.251 0.584 0.352 0.115 3

9.210 5.991 4.605 0.211 0.103 0.020 2

6.635 3.8412.706 0.016 0.0039 0.00016 1

0.01 0.05 0.10 0.90 0.95 0.99 df\upper tail area

UNIVERSIDAD DE VIGO

16

Referencias Bibliográficas

Daniel, W.W. 1989. Bioestadística. Base para el análisis de las ciencias de la salud. Limusa, México.

Sokal,R.R., Rohlf, F.J. 1995. Biometry. Freeman and co., New York

LIBROS:

PÁGINAS WEB:

http://www.statsoft.com/textbook/sttable.html(tablas en línea para ver probabilidades de la distribución t)

http://home.ubalt.edu/ntsbarsh/excel/excel.htm(programación de cálculos estadísticos en EXCEL)

http://statpages.org/(Página que permite análisis estadísticos interactivos)

UNIVERSIDAD DE VIGO