Técnicas de muestreo
Click here to load reader
-
Upload
skchabelina -
Category
Education
-
view
3.137 -
download
4
description
Transcript of Técnicas de muestreo
Ing. Isabel Escudero Página 1
Aleatorio Simple Por Juicio o deliberado
• Sistemático • Estratificado • Por Conglomerados
Todos los procedimientos de muestreo
No Probabilísticos Probabilísticos
Por conveniencia
1. MÉTODOS Y TÉCNICAS DE MUESTREO
Muestreo probabilístico.
1. Se conoce la probabilidad de ser elegido
2. No existe garantía de que los resultados sean mejores que con la muestra no
probabilística
3. Con el muestreo probabilístico se puede conocer el error muestral.
Muestreo no probabilístico: Es aquel en el que la selección de los elementos de
la muestra no se hacen al azar.
Afijación simple: Supone repartir la muestra total en partes iguales para cada
estrato, independientemente del tamaño de la población, es decir, este criterio
determina que el número de encuestas que se realizarán será igual para cada
estrato. Este criterio es muy sencillo pero poco recomendable. Ejemplo: 25
elementos por estrato.
Afijación proporcional: Este criterio supone la división de la muestra en partes
proporcionales a la población de cada estrato, es decir, el reparto de las encuestas
se hace teniendo en cuenta el tamaño del estrato.
Afijación óptima: El reparto de la muestra se hace no solo atendiendo al tamaño
del estrato sino también a la dispersión de los datos dentro de los estratos, medida
ésta a través de la desviación típica.
Ing. Isabel Escudero Página 2
Muestreo aleatorio simple (m.a.s.)
Se eligen individuos de la población de estudio, de manera que todos tienen la
misma probabilidad de aparecer, hasta alcanzar el tamaño muestral deseado.
Se puede realizar partiendo de listas de individuos de la población, y eligiendo
individuos aleatoriamente con un programa estadístico.
En general, las técnicas de inferencia estadística suponen que la muestra ha
sido elegida usando m.a.s., aunque en realidad se use alguna de las que
veremos a continuación.
Muestra formulada de manera que cada integrante de la población tenga la misma
probabilidad de quedar incluido.
El método es impracticable con muestras muy grandes.
Ejemplo: Considerar una población de tamaño (Np) igual a 250.000 personas y
se elige una muestra (n) de 500 personas. En esa población existe un líder, por
tanto este se escogería directamente para la muestra y los 499 restantes se
eligen mediante un muestreo aleatorio simple entre las 249.999 personas
restantes de la población.
Supongamos que tenemos una población de 50.000 individuos, y que tenemos
un listado con sus nombres. Si queremos elegir 100 personas, lo que
necesitamos es que el ordenador elija al azar a 100 individuos de esos 50.000.
Muestreo sistemático
Se tiene una lista de los individuos de la población de estudio. Si queremos una
muestra de un tamaño dado, elegimos individuos igualmente espaciados de la lista,
donde el primero ha sido elegido al azar.
CUIDADO: Si en la lista existen periodicidades, obtendremos una muestra sesgada.
Un caso real: Se eligió una de cada cinco casas para un estudio de salud pública en una
ciudad donde las casas se distribuyen en manzanas de cinco casas. Salieron con mucha
frecuencia las de las esquinas, que reciben más sol, están mejor ventiladas…
Población Muestra
Ing. Isabel Escudero Página 3
Muestreo sistemático
Los integrantes de la población se ordenan de acuerdo algún método y se selecciona al
azar un punto de inicio y después se elige cada “k” elemento de la población para la
muestra de manera sistemática.
Ejemplo
Tenemos 10000 estudiantes (en una lista) y queremos obtener una muestra de
100 estudiantes. Primero elegimos al azar un estudiante entre los
10000/100=100 primeros (supongamos que salga el 26), el segundo elemento
será el estudiante 100+26 (126), el siguiente será el 226, luego el 326, etc.
Muestreo estratificado
Se aplica cuando sabemos que hay ciertos factores (variables, sub-poblaciones
o estratos) que pueden influir en el estudio y queremos asegurarnos de tener
cierta cantidad mínima de individuos de cada tipo:
Hombres y mujeres,
Jóvenes, adultos y ancianos…
Una población se divide en subgrupos denominados estratos, los cuales son lo más
homogéneo posible, y de cada estrato se seleccionan de manera proporcional los
integrantes de la muestra estratificada.
Aleatorización
Población ordenada
Muestra sistemática
Se realiza entonces una m.a.s. de los individuos de cada uno de los estratos.
Ing. Isabel Escudero Página 4
Ejemplo
Supongamos que, en Medellín, 70% de los niños de primaria van a escuela pública
y el 30% a privada. Si queremos 1,000 niños, lo que haremos es dividir los
alumnos en 2 estratos (pública y privada) y se eligen aleatoriamente 700 niños de
la pública y aleatoriamente 300 de la privada.
Muestreo por grupos o conglomerados
Se aplica cuando es difícil tener una lista de todos los individuos que forman parte
de la población de estudio, pero sin embargo sabemos que se encuentran
agrupados naturalmente en grupos.
Se realiza eligiendo varios de esos grupos al azar, y ya elegidos algunos podemos
estudiar a todos los individuos de los grupos elegidos o bien seguir aplicando
dentro de ellos más muestreos por grupos, por estratos, aleatorios simple…
Para conocer la opinión de los médicos del sistema nacional de salud, podemos
elegir a varias regiones de España, dentro de ellas varias comarcas, y dentro de
ellas varios centros de salud, y…
Al extrapolar los resultados a la población se debe tener en cuenta el tamaño relativo del estrato con
respecto al total de la población.
Población
estratificada
Aleatorización
Ing. Isabel Escudero Página 5
Al igual que en el muestreo estratificado, al extrapolar los resultados a la
población hay que tener en cuenta el tamaño relativo de unos grupos con respecto
a otros.
Regiones con diferente población pueden tener probabilidades diferentes de ser
elegidas, comarcas, hospitales grandes frente a pequeños.
La población se agrupa en conglomerados, los cuales poseen la característica de
ser dispersos dentro de ellos, esto son elegido por ubicación geográfica.
Tamaño de la muestra, poblaciones finitas e infinitas
El tamaño de la muestra está condicionado por el método de muestreo utilizado, pero en este
caso para simplificar el cálculo del tamaño de la muestra vamos a determinar dicho tamaño
para un muestreo aleatorio simple ya que, generalmente, ese muestreo aleatorio simple exige
muestras superiores (para un mismo grado de fiabilidad o nivel de confianza) al resto de
procedimientos.
La expresión a utilizar para calcular el tamaño de la muestra es diferente según sea la
población finita o infinita. Se considera que una población es infinita cuando es mayor o igual
Muestra estratificada
Muestra por conglomerado
Ing. Isabel Escudero Página 6
a 10.000 individuos. Mientras que se considera que una población es finita cuando la
población es menor de 10.000 individuos. Para el caso en que la población es infinita la
expresión a utilizar es la siguiente:
Estas son las formulas claves para la determinación del tamaño de la muestra.
Muestreo aleatorio simple
𝒏 =𝒏′
𝟏 +𝒏′
𝑵
𝒏′ = 𝒁𝜶/𝟐𝑺
𝑬
𝟐
Donde:
n = Tamaño de la muestra N = Tamaño del universo (población) 𝑍𝛼/2= Valor crítico de la distribución Z. (nivel de confianza)
E = error S = desviación estándar
Muestreo proporcional (cuando existen investigaciones anteriores)
Poblaciones infinitas Poblaciones finitas
𝑛 =𝑍𝛼/22 𝑝𝑞
𝐸2 𝑛 =
𝑍𝛼/22 𝑝𝑞𝑁
𝑁 − 1 𝐸2 + 𝑍𝛼/22 𝑝𝑞
Donde:
n = Tamaño de la muestra N = Tamaño del universo (población) e = Error muestral p = Probabilidad de ocurrencia q = Probabilidad de no ocurrencia 𝑍∝/2 = Valor de confianza (1,96)
Ing. Isabel Escudero Página 7
Muestreo proporcional (cuando no existen investigaciones anteriores)
Poblaciones infinitas Nivel de confianza 95% Poblaciones finitas
𝑛 =4p𝑞
𝐸2
e Encuestas
𝑛 =4p𝑞𝑁
𝑁 − 1 𝐸2 + 4𝑝𝑞
1% 2% 3% 4% 5%
10.000 2.500 1.111 620 400
Poblaciones infinitas Nivel de confianza 99.7% Poblaciones finitas
𝑛 =9p𝑞
𝑒2
e Encuestas
𝑛 =9p𝑞𝑁
𝑁 − 1 𝐸2 + 9p𝑞
1% 2% 3% 4% 5%
22.500 5.625 2.500 1.400 900
Donde: p = Probabilidad de ocurrencia (0.5) q = Probabilidad de no ocurrencia (1-0.5) Por ejemplo: Sabiendo la población de camas en un hospital es de 100, considerando un e = 0.05, un nivel de confianza del 95% y el caso más común para p = 0.5 y para q=1-0.5 el tamaño de la muestra será:
𝑛 =𝑍𝛼
2 2 pqN
𝑁 − 1 𝐸2 + 𝑍𝛼2
2 pq
)50,0)(50,0()96,1()05,0)(1100(
)100)(50,0)(50,0()96,1(22
2
n
2079.1
04.96n
50.79n
80n
Ing. Isabel Escudero Página 8
Una vez calculado el tamaño de la muestra procedemos a realizar el cálculo estratificado de la siguiente manera:
Formula: 𝑛ℎ = 𝑛𝑁ℎ
𝑁
𝑛ℎ = Tamaño de muestra del estrato N = Tamaño de la muestra 𝑁ℎ = Población del estrato N = Población estadística
Clínica = 8020
100 = 16 camas
Cirugía = 8010
100 = 8 camas
Pediatría = 8050
100 = 40 camas
Gineco-obstetricia = 8020
100 =16 camas
El escogitamiento de las camas se lo realiza utilizando la aleatoriedad y similar a un sorteo, tabla de números aleatorios, realizando un listado de las camas, asignando números.
EJERCICIO 1: El departamento de turismo planea realizar muestreos en los centros de
información de visitantes que llegan a este territorio para determinar la proporción
de los turistas que van a acampar al Estado. Se tiene una información según la cual
35% de los visitantes va a acampar. De que tamaño habría que tomar la muestra para
estimar la proporción poblacional, con un nivel de confianza del 95% y un error del
2%? Se sabe que en promedio mensual 7000 visitantes llegan a los centros de
información.
Datos
p = 0.35
= 0.05
E = 0.02
N = 7000
𝑛 =𝑍𝛼
2 2 pqN
𝑁 − 1 𝐸2 + pq𝑍𝛼2
2
22
2
)96.1)(65.0)(35.0()02.0)(17000(
)7000)(65.0)(35.0()96.1(
n
0873964.07996.2
50.1592)8416.3(
n
673564.3
748.6117n
166634.1665 n
Ing. Isabel Escudero Página 9
1.1.1 Tamaño de la muestra en poblaciones a través de
intervalos de confianza.
RELACIÓN Media muestral Proporcional Intervalo de confianza
𝑥 ± 𝑍∝2
𝜎
𝑛
p ± 𝑍∝2 p(1 − p)
𝑛
Error máximo admisible
𝐸 = 𝑍∝2
𝜎
𝑛
𝐸 = 𝑍∝2 p(1 − p)
𝑛
Tamaño de muestra
𝑛 = 𝑍∝2
𝜎
𝐸 2
𝑛 = p(1− p) 𝑍∝
2
𝐸
2
NOTA:
Mientras más alto sea el nivel de confianza elegido mayor es el numero de la muestra
EJEMPLOS 1: Se desea estimar el número medio de días que viaja un vendedor
foráneo. En un estudio piloto la media encontrada es 150 días, y la desviación
estándar, 14 días. Si usted debe estimar la media poblacional en 2 días. ¿Cuántos
agentes foráneos habrá que tomar en la muestra? Use el nivel de confianza de 90%.
50x 14s
10.0
2E
2
22
E
sZn
2
22
)2(
)14()64.1(n
1344.133 n
0.005
99%
1.64-1.64
Se mamarán 134 agentes foráneos.
EJEMPLOS 2: Se desea realizar un estudio para estimar la proporción de la fuerza
laboral que tiene dos o más empleos. Se quiere un nivel de confianza de 95% y que la
proporción estimada no se aleje más de 2% de la proporción poblacional. En un
estudio piloto se encontró que 5 de los 50 entrevistados tenían más de dos empleos.
¿Cuántas personas de la fuerza laboral deberán entrevistarse para satisfacer los
requerimientos?
∝= 0.05 𝐸 = 0.02
p =5
50
Ing. Isabel Escudero Página 10
𝑛 = p(1− p) 𝑍
𝐸 2
2
02.0
96.1)90.0)(010.0(
n
86536.864 n
Deberán entrevistarse 865 personas de la fuerza laboral.
EJEMPLOS 2: En una muestra de suscriptores a una revista, se encontró que la media
del tiempo que usan Internet por semana es 13.4 horas, con una desviación estándar
de 6.8 horas. Encuentre el intervalo de confianza de 95% para la media del tiempo que
los suscriptores de la revista utilizan Internet.
hx 4.13 hs 8.6 05.0
𝐸 = 2ℎ
2
E
zsn
n
sZx
2
2
2
)8.6(96.1
hn
45
)8.6)(96.1(4.13
4541.44 n 99.14.13
99.14.1399.14.13
El intervalo de confianza de 95% para la media del tiempo que los suscriptores
utilizan internet se encuentra entre 11.41 y 15.39.