Muestreo Por Conglomerados
description
Transcript of Muestreo Por Conglomerados
-
TEORA DEL MUESTREO UNT
1 Dr. Carlos A. Risco Dvila [email protected]
MUESTREO POR CONGLOMERADOS
I. INTRODUCCIN.
En el muestreo por conglomerados se requiere dividir a la poblacin en N conglomerados
de elementos, de tal manera que todo elemento de la poblacin pertenezca a uno y slo un
conglomerado. Por ejemplo, suponga que desea encuestar a votantes registrados en una
urbanizacin de la ciudad de Trujillo. Un mtodo sera formar un marco de todos los
votantes de la urbanizacin, para entonces tomar de aqu una muestra aleatoria simple de
votantes. En forma alterna, en el muestreo por conglomerados optaramos por definir al
marco como la lista de las N=60 manzanas de la urbanizacin. (vase la figura 1). En este
mtodo, cada manzana o conglomerado consistira en un conglomerado de votantes
registrados, y todo votante registrado en el estado pertenecera a uno y slo un
conglomerado.
Suponga que se selecciona una muestra aleatoria simple de n=10 de las 60
manzanas. En este punto, podramos reunir datos de todos los votantes registrados en
cada uno de los 10 conglomerados muestreados, mtodo al que se le da el nombre
muestreo por conglomerados en una etapa; o bien, podramos seleccionar una muestra
aleatoria simple de votantes registrados en cada uno de los 10 conglomerados
muestreados, mtodo llamado muestreo por conglomerados en dos etapas. En cualquier
caso se dispone de frmulas para emplear los resultados de la muestra con el fin de
establecer estimaciones puntuales y de intervalo de los parmetros de poblacin, como la
media el total y la proporcin.
El muestreo estratificado y el muestreo por conglomerados se parecen en que ambos
dividen a la poblacin en conglomerados de elementos. Pero las razones para elegir uno u
otro son distintas. El muestreo por conglomerados tiende a dar mejores resultados cuando
los elementos dentro de los conglomerados son heterogneos o distintos. En el caso ideal,
cada conglomerado debera ser una versin de toda la poblacin, aunque en pequea
escala. En este caso, una muestra de una pequea cantidad de conglomerados producira
buena informacin acerca de las caractersticas de toda la poblacin.
Una de las aplicaciones principales del muestreo por conglomerados es el muestreo
por reas, en que los conglomerados son departamentos, pueblos, manzanas urbanas o
secciones bien definidas en la poblacin. Debido a que los datos solo se recopilan de una
muestra de la totalidad de la reas geogrficas o conglomerados disponibles, los
elementos de los conglomerados se parecen entre s, se pueden tener ahorros
considerables de tiempo y costo cuando se manda a un encuestador a una unidad
muestreada. Como resultado de esto, incluso cuando se requiere un tamao grande de
muestra, el muestreo por conglomerados puede ser menos costoso que un muestro
aleatorio simple o estratificado; adems, puede minimizar el tiempo y el costo asociados
con el desarrollo del marco o la lista de los elementos que se encuestan, porque en l no
se requiere formar la lista con cada elemento de la poblacin, sino nicamente se necesita
una lista de los elementos de los conglomerados muestreados.
-
TEORA DEL MUESTREO UNT
2 Dr. Carlos A. Risco Dvila [email protected]
FIGURA 1: MANZANAS DE UNA URBANIZACIN DE TRUJILLO, USADOS
COMO CONGLOMERADOS DE LOS VOTANTES EMPADRONADOS.
Para dar un ejemplo de muestreo por conglomerados, un socilogo quiere estimar los
ingresos medios por persona en cierta ciudad pequea. No existe una lista disponible de
adultos residentes. Cmo se puede disear la encuesta por muestreo?
El muestreo por conglomerados parece ser la eleccin lgica para el diseo de la encuesta
porque no se encuentra una lista disponible de elementos. La ciudad se divide en bloques
rectangulares, excepto las dos reas industriales y los tres parques que contienen pocas
casas. El socilogo decide que cada bloque de la ciudad se considerar como un
conglomerado, las dos reas industriales se considerarn como otro, y finalmente, los
tres parques se considerarn un conglomerado ms. Los conglomerados se enumeran
sobre un mapa de la ciudad, con los nmeros del 1 al 415, y los conglomerados con esos
nmeros se marcan en el mapa. Despus se asignan los entrevistadores a cada uno de los
conglomerados seleccionados.
Las frmulas del muestreo por conglomerados que se necesitan en la determinacin de
intervalos de confianza aproximados de 95% para la media, el total y la proporcin
poblacional, requieren de la siguiente notacin.
N= nmero de conglomerados en la poblacin
n= nmero de conglomerados seleccionados en la muestra
Mi= nmero de elementos en el conglomerado i
-
TEORA DEL MUESTREO UNT
3 Dr. Carlos A. Risco Dvila [email protected]
M= nmero de elementos en la poblacin; M=M1+M2++MN
nmero promedio de elementos en un conglomerado
xi = Total de observaciones en el conglomerado i
ai = nmero de observaciones en el conglomerado i con determinada caracterstica.
II. MEDIA DE LA POBLACIN
El estimador puntual de la media poblacional obtenido con el muestreo por
conglomerados est definido con la siguiente ecuacin.
ESTIMADOR PUNTUAL DE LA MEDIA DE LA POBLACIN
(1)
Una estimacin del error estndar de este estimador puntual es
(2)
En consecuencia, la siguiente ecuacin define a la estimacin del intervalo de confianza
aproximado de 95% para la media de la poblacin.
ESTIMACIN DEL INTERVALO DE CONFIANZA APROXIMADO DE 95% PARA
LA MEDIA DE LA POBLACIN.
(3)
Se realizan entrevistas en cada uno de los 25 bloques muestreados del ejemplo. Los datos
sobre ingresos se presentan en la Tabla 1.
-
TEORA DEL MUESTREO UNT
4 Dr. Carlos A. Risco Dvila [email protected]
TABLA 1: INGRESOS POR PERSONA
Conglomerados Nmero de Ingreso total por Nmero de
residentes, mi conglomerado, xi arrendatarios, ai
1 8 96000 4
2 12 121000 7
3 4 42000 1
4 5 65000 3
5 6 52000 3
6 6 40000 4
7 7 75000 4
8 5 65000 2
9 8 45000 3
10 3 50000 2
11 2 85000 1
12 6 43000 3
13 5 54000 2
14 10 49000 5
15 9 53000 4
16 3 50000 1
17 6 32000 4
18 5 22000 2
19 5 45000 3
20 4 37000 1
21 6 51000 3
22 8 30000 3
23 7 39000 4
24 3 47000 0
25 8 41000 3
Clculos en Excel:
N = 415 M = 2500
8801 M-bar = 6.04 = 634501213.4 fc = 0.93975904
est V(x-bar c) 653785 error estand 808.5698451 gl = 126
t = 2.0
margen de error 1600
LI 7201 LS 16003
-
TEORA DEL MUESTREO UNT
5 Dr. Carlos A. Risco Dvila [email protected]
III. TOTAL DE LA POBLACIN
El estimador puntual del total de la poblacin X, se obtiene multiplicando M por
ESTIMADOR PUNTUAL DEL TOTAL DE LA POBLACIN
(4)
Una estimacin del error estndar del estimador anterior es
(5)
En consecuencia, una estimacin del intervalo de confianza aproximado de 95% para
el total de la poblacin est dado por la siguiente expresin.
ESTIMACIN DEL INTERVALO DE CONFIANZA APROXIMADO DE 95% PARA
EL TOTAL DE LA POBLACIN.
(6)
Utilice los datos de la Tabla 1 para estimar el ingreso total de todos los residentes de la
ciudad, y calcule un intervalo de confianza aproximado de 95%.
Clculos en Excel:
22003311.26
Li 18002971.43
Ls 40006282.69
Frecuentemente, el nmero de elementos en la poblacin no es conocido en problemas
donde el muestreo por conglomerados es apropiado. Entonces no podemos usar el
estimador , pero podemos formar otro estimador del total poblacional que no
depende de M. la cantidad , est dada por
es el promedio de los totales de conglomerados para los n conglomerados muestreados.
Por ello, es un estimador insesgado del promedio de los N totales de conglomerados en
la poblacin.
-
TEORA DEL MUESTREO UNT
6 Dr. Carlos A. Risco Dvila [email protected]
Por ejemplo, es muy improbable que se conozca el nmero de adultos varones en una
ciudad, por lo que se tendr que usar el estimador , en lugar de para estimar el
total poblacional.
ESTIMADOR DEL TOTAL POBLACIONAL, EL CUAL NO DEPENDE DE M
VARIANZA ESTIMADA DE
donde
Use los datos de la tabla 1 para estimar el ingreso total de todos los residentes de la
ciudad si M no es conocido. Y calcule un intervalo de confianza aproximado de 95%.
22061400
varianza (N x-bar) 3.07228E+12
error estand 1752792.018
margen de error 3505584
LI 18555816
LS 25566984
IV. PROPORCIN DE LA POBLACIN
El estimador de puntual de la proporcin poblacional, determinado con muestreo por
conglomerados, se obtiene con la siguiente expresin.
ESTIMADOR PUNTUAL DE LA PROPORCIN DE LA POBLACIN
(11)
-
TEORA DEL MUESTREO UNT
7 Dr. Carlos A. Risco Dvila [email protected]
Una estimacin del error estndar de este estimador puntual es
(12)
As, la siguiente expresin define una estimacin del intervalo de confianza aproximado
de 95% para la proporcin de la poblacin.
ESTIMACIN DEL INTERVALO DE CONFIANZA APROXIMADO DE 95% PARA
LA PROPORCIN DE LA POBLACIN.
(13)
Adems de la pregunta sobre sus ingresos, a los residentes de la encuesta muestral del
ejemplo, se les interroga acerca de si son dueos o alquilan la casa donde viven. Utilice
los datos de la Tabla 1 para estimar la proporcin de residentes que viven en casas de
alquiler usando un intervalo de confianza aproximado de 95%.
0.476821192
0.530543251
est V(p-bar c) 0.00055
error estand 0.023380926
margen de error 0.046270165
LI 0.4306
LS 0.9074
V. DETERMINACIN DEL TAMAO DE LA MUESTRA
Una vez formados los conglomerados, el asunto principal para definir el tamao de una
muestra es seleccionar n, la cantidad de conglomerados. El procedimiento para muestrear
conglomerados se parece al de otros mtodos de muestreo. Se especifica un nivel
aceptable de precisin, eligiendo un valor de B, la cota del error de muestro. A
continuacin, se determina una ecuacin para calcular el valor de n con el que se alcance
la precisin deseada.
El tamao medio de un conglomerado y la varianza entre conglomerados son
factores clave para decidir cuntos conglomerados se deben incluir en la muestra. Si los
conglomerados son parecidos, la varianza entre ellos ser pequea y puede ser menor la
cantidad de conglomerados muestreados. Tambin, si la cantidad media de elementos por
conglomerado es mayor, la cantidad de conglomerados muestreados se puede reducir.
-
TEORA DEL MUESTREO UNT
8 Dr. Carlos A. Risco Dvila [email protected]
a) Tamao de muestra aproximado requerido para estimar la media de la
poblacin, con un lmite B para el error de estimacin
donde
y
Usando los datos de la Tabla 1 De qu tamao debe tomarse la muestra en una
encuesta futura para estimar los ingresos medios por persona con un lmite de 500 para
el error de estimacin?
B = 500
M-bar = 6.04
D 2280100
N = 415
= 634501213
n = 166.58
Luego se deben muestrear 167 conglomerados
b) Tamao de muestra aproximado requerido para estimar el total de la poblacin,
usando con un lmite B para el error de estimacin
donde
y
Usando nuevamente los datos de la Tabla 1 como una muestra preliminar de ingresos
en la ciudad cul ser el tamao de la muestra que se necesita estimar los ingresos
totales de todos los residentes, con un lmite de 1000000 para el error de estimacin?
Hay 2500 residentes en la ciudad (M=2500)
B = 1000000
M = 2500
D= 1451589.49
N = 415
S2 r = 634501213.4
n = 212.88
Luego se deben muestrear 213 conglomerados.
-
TEORA DEL MUESTREO UNT
9 Dr. Carlos A. Risco Dvila [email protected]
c) Tamao de muestra aproximado requerido para estimar el total de la poblacin,
usando ,con un lmite B para el error de estimacin
donde
y
Suponga que los datos de la Tabla 1 provienen de un estudio preliminar de ingresos
en la ciudad y que no se conoce M. De qu tamao se debe tomar la muestra para
estimar el ingreso total de todos los residentes, con un lmite de 1000000 para el
error de estimacin?
B = 1000000
M = 2500
D= 1451589.49
N = 415
S2 t = 474556666.7
n = 182.87
Luego se deben muestrear 183 conglomerados.
d) Tamao de muestra aproximado requerido para estimar la proporcin de la
poblacin, con un lmite B para el error de estimacin
donde
y
Los datos de la Tabla 1 estn obsoletos. Se va a realizar un nuevo estudio en la
misma ciudad con el propsito de estimar la proporcin de residentes que viven en
alquiler. Cul sera el tamao de la muestra para estimar p con un lmite de 0.04 en
el error de estimacin?
B = 0.04
M-bar = 6.04
D 0.01459264
N = 415
= 0.530543251
n = 33.43
Luego se deben muestrear 34 conglomerados.
-
TEORA DEL MUESTREO UNT
10 Dr. Carlos A. Risco Dvila [email protected]
VI. USO DE PAQUETE ESTADSTICO EPIDAT.
-
TEORA DEL MUESTREO UNT
11 Dr. Carlos A. Risco Dvila [email protected]
VII. Ejercicios:
1. Una dependencia pblica desea saber ms acerca de las personas que viven en casa de
asistencia en determinada ciudad. Un total de 100 casa albergan a 4800 personas en la
ciudad, y se ha tomado una muestra por conglomerados de 6 casas. Se entrevist a
cada persona en las 6 casas. Parte de los resultados de la encuesta aparecen a
continuacin:
casa Residentes
Edad media de los
residentes
Residentes discapacitados
1 14 61 12
2 7 74 2
3 96 78 30
4 23 69 8
5 71 73 10
6 29 84 22
a) Establezca una estimacin de la media de la edad de los residentes en casas de
asistencia de esta ciudad.
b) Determine un intervalo de confianza aproximadado de 95% para la media de la
edad de los residentes en casa de asistencia de esta ciudad.
c) Determine un intervalo de confianza aproximadado de 95% para la proporcin de
discapacitados en las casas de asistencia de la ciudad.
2. Una empresa elctrica hace una encuesta entre ingenieros mecnicos para conocer
ms acerca de los factores que influyen en la eleccin del sistema de calefaccin,
ventilacin y aire acondicionado (CVAA) para edificios comerciales nuevos. Hay un
total de 120 empresas en el rea servida por la empresa elctrica que disean sistemas
de CVAA. El plan es emplear muestreo por conglomeradosen el que cada empresa
representa un conglomerado. En cada empresa de la muestra se entrevistar a todos
los ingeneirros mecnicos. Se cree que las 120 empresas dan trabajo,
aproximadamente, a 500 ingenieros mecnicos. Se tom una muestra de 10 empresas.
Entre otras cosas, se anotaron la edad de cada encuestado y si el encuestado haba
asistido a la universidad de la localidad.
Conglomerado (i) Mi xi ai
1 12 520 8
2 1 33 0
3 2 70 1
4 1 29 1
5 6 270 3
6 3 129 2
7 2 102 0
8 1 48 1
9 9 337 7
10 13 462 12
-
TEORA DEL MUESTREO UNT
12 Dr. Carlos A. Risco Dvila [email protected]
a) Establezca la media de la edad de los ingenieros mecnicos que intervienen en
estas actividades.
b) Estime la proporcin de ingenieros mecnicos en el rea servida por la empresa
electrica que asistieron a la universidad local.
c) Determine un intervalo de confianza aproximado de 95% para la media de la edad
de ingenieros mecnicos que disean sistemas de CVAA para edificios comerciales
d) Determine un intervalo de confianza aproximado de 95% para la proporcin de
ingenieros mecnicos en el rea servida por la empresa elctrica que asistieron a la
universidad local.que disean sistemas de CVAA para edificios comerciales
e) Estime puntual e intervalicamente el total de ingenieros mecnicos en el rea
servida por la empresa elctrica que asistieron a la universidad local.
f) Se va a realizar un mismo estudio en la misma ciudad con el propsito de estimar la
proporcin de ingenieros mecnicos que asistieron a la Universidad Local Qu tan
grande se debe tomar la muestra para estimar P, con un lmite de 0.08 en el error de
estimacin?
3. Supngase que se quiere obtener una muestra de aproximadamente 120 estudiantes de un centro universitario que tiene 966 alumnos registrados y que los alumnos estn
distribuidos en 52 grupos de tamaos variables y conocidos. El archivo
UNIVERSIDAD 4.xls contiene la lista de los 52 grupos y los tamaos de stos.
Ntese que el campo que contiene los conglomerados tiene que ser numrico (en este
archivo, el campo se llama GRUPO, estos estn identificados por los nmeros del 1 al
52).
4. Supngase ahora que se cuenta con un archivo que contiene la informacin completa: listado de los 966 sujetos y, para cada cual, el cdigo del grupo al que pertenece.
Puede contener, adems, otra informacin sobre los individuos, que no ser empleada
en el acto de seleccin.
El archivo UNIVERSIDAD 5.xls contiene los datos (nombre y edad) de cada uno de
los 966 estudiantes y el campo GRUPO, donde se consigna el grupo al que pertenece
cada uno de ellos (codificados como 1, 2,..., 52). En el archivo UNIVERSIDAD 5.xls
los registros estn ordenados segn grupos y, dentro de stos, alfabticamente (tal y
como verosmilmente se obtendran de un registro secretarial). Al correr el programa,
se obtiene un resultado similar en su estructura al del caso anterior, pero ahora se
tiene la posibilidad de guardar el archivo con la base de datos resultante del proceso
de seleccin (es decir, la informacin contenida en UNIVERSIDAD 5.xls, pero slo
para los sujetos que resulten elegidos).
-
TEORA DEL MUESTREO UNT
13 Dr. Carlos A. Risco Dvila [email protected]
MUESTREO POR CONGLOMERADOS BIETPICO
I. Introduccin.
El muestreo por conglomerados en dos etapas es una extensin del muestreo por
conglomerados monoetpico. Recordar que un conglomerado es usualmente una coleccin
conveniente o natural de elementos tal como manzanas de casas. Un conglomerado contiene
frecuentemente demasiados elementos para obtener una medicin de cada uno de ellos, o
stos son tan semejantes que la medicin de slo unos cuantos, proporciona informacin
sobre el conglomerado completo. Cuando cualquiera de las dos situaciones ocurre, el
investigador puede seleccionar una muestra aleatoria de conglomerados y despus tomar una
muestra aleatoria de los elementos dentro de cada conglomerado. El resultado es una
muestra de conglomerados en dos etapas.
II. Cmo seleccionar una muestra por conglomerados en dos etapas?
El primer problema en la seleccin de una muestra por conglomerados en dos etapas es la
eleccin de conglomerados apropiados. Dos condiciones son deseables: (1) proximidad
geogrfica de los elementos dentro de un conglomerado y (2) tamaos de conglomerados
convenientes para su manejo.
La seleccin de los conglomerados apropiados tambin depende de si queremos muestrear
pocos conglomerados y muchos elementos de cada uno, o muchos conglomerados y pocos
elementos de cada conglomerado. Fundamentalmente la seleccin se basa en los costos. Los
conglomerados grandes tienden a contener elementos heterogneos y, en consecuencia, se
requiere una muestra grande de cada uno para lograr estimaciones precisas de los parmetros
de la poblacin. Por el contrario, los conglomerados pequeos con frecuencia contienen
elementos relativamente homogneos, en cuyo caso puede obtenerse informacin precisa
sobre las caractersticas de un conglomerado seleccionando una muestra pequea de cada
uno.
Como ejemplo, considere la encuesta sobre la opinin de los estudiantes universitarios. Si
los estudiantes de una universidad tienen opiniones similares sobre la pregunta de inters,
pero difieren ampliamente de una universidad a otra, entonces la muestra deber contener
pocos representantes de muchas universidades. Si las opiniones varan mucho dentro de cada
universidad, entonces la encuesta deber incluir muchos representantes de cada una de las
pocas universidades.
III. Estimacin insesgada de la media y del total de una poblacin.
Se utiliza la siguiente notacin:
N= nmero de conglomerados en la poblacin
n= nmero de conglomerados seleccionados en la muestra
Mi= nmero de elementos en el conglomerado i
mi= nmero de elementos seleccionados en una muestra aleatoria simple
del conglomerado i
M= nmero de elementos en la poblacin; M=M1+M2++MN
-
TEORA DEL MUESTREO UNT
14 Dr. Carlos A. Risco Dvila [email protected]
nmero promedio de elementos en un conglomerado
xij = la j-sima observacin en la muestra del i-simo conglomerado.
la media muestral para el i-simo conglomerado
Estimador insesgado de la media de la poblacin :
Suponiendo un muestreo aleatorio simple en cada etapa.
Varianza estimada de :
donde
y
Estimador del total poblacional X
Suponiendo un muestreo aleatorio simple en cada etapa
Varianza estimada del total poblacional
-
TEORA DEL MUESTREO UNT
15 Dr. Carlos A. Risco Dvila [email protected]
IV. Estimador de razn de una media poblacional
El estimador , depende del nmero total de elementos en la poblacin, M. Cuando M es
desconocido, como es frecuente el caso, entonces debe estimarse en funcin de los datos
de la muestra. Se obtiene un estimador de M multiplicando el tamao medio de
conglomerados
por el nmero de conglomerados en la poblacin, N. si se
reemplaza M por su estimador, se obtiene un estimador de razn, denotado por , debido
a que tanto el numerador como denominador son variables aleatorias.
Estimador de razn de una media poblacional
Varianza estimada de :
donde
y
V. Estimacin de una proporcin de la poblacin
Estimador de una proporcin poblacional p:
Varianza estimada de p
-
TEORA DEL MUESTREO UNT
16 Dr. Carlos A. Risco Dvila [email protected]
donde
y
VI. Muestreo por conglomerados en dos etapas con probabilidades proporcionales al
tamao
Como el nmero de conglomerados puede variar mucho de un conglomerado a otro, una
tcnica que suele ser ventajosa consiste en muestrear conglomerados con probabilidades
proporcionales a sus tamaos. Generalmente, l muestreo pps slo se utiliza en la primera
etapa de un procedimiento de muestreo en dos etapas, debido a que los elementos dentro de
los conglomerados tienden a ser algo similares en tamao. Por tanto presentaremos los
estimadores de y X para el muestreo por conglomerados en dos etapas, en el cual, la
primera etapa se realiza con probabilidades proporcionales al tamao.
Estimador de la media poblacional :
Varianza estimada de :
Estimador del total poblacional X:
Varianza estimada de :
-
TEORA DEL MUESTREO UNT
17 Dr. Carlos A. Risco Dvila [email protected]
VII. Ejercicios propuestos:
1. Un fabricante de prendas de vestir tiene 90 plantas localizadas en todo Estados Unidos y
quiere estimar el nmero promedio de horas que las mquinas de coser estuvieren sin
funcionar por reparacin en los meses pasados. Debido a que las plantas estn muy
dispersas, el fabricante decide utilizar un muestreo por conglomerados, especificando
cada planta como un conglomerado de mquinas. Cada planta contiene muchas mquinas,
el verificar los registros de reparacin de cada mquina implicara consumir tiempo. Por
tanto el fabricante usa un muestreo en dos etapas. Se dispone de tiempo y dinero
suficientes para muestrear 10 plantas y aproximadamente un 20% de las mquinas de
cada planta. Dados los siguientes datos sobre el tiempo sin funcionar para las mquinas
de coser por plantas
PLANTA Mi mi tiempo sin funcionar (en horas) pi
1 50 10 5 7 9 0 11 2 8 4 3 5 0.4
2 65 13 4 3 7 2 11 0 1 9 4 3 2 1 5 0.4
3 45 9 5 6 4 11 12 0 1 8 4 0.3
4 48 10 6 4 0 1 0 9 8 4 6 10 0.3
5 52 10 11 4 3 1 0 2 8 6 5 3 0.5
6 58 12 12 11 3 4 2 0 0 1 4 3 2 4 0.4
7 42 8 3 7 6 7 8 4 3 2 0.4
8 66 13 3 6 4 3 2 2 8 4 0 4 5 6 3 0.3
9 40 8 6 4 7 3 9 1 4 5 0.3
10 56 11 6 7 5 10 11 2 1 4 0 5 4 0.4
a) El fabricante sabe que si tiene un total de 4500 mquinas en todas las plantas. Estimar
puntual e intervalicamente el tiempo sin funcionar promedio sin mquina. Use
alpha=0.05
b) Estimar tambin puntual e intervalicamente la cantidad total de tiempo sin funcionar
durante el mes pasado para todas las mquinas. Use alpha=0.05
c) Estimar puntual e intervalicamente el tiempo sin funcionar promedio por mquina en
caso de que no se conozca el nmero total de mquinas. Use alpha=0.05
d) Las proporciones muestrales de las mquinas que requieren reparaciones mayores se
presentan en la ltima columna. Estime puntual e intervalicamente la proporcin de
mquinas que involucran reparaciones mayores para todas las plantas. Use alpha=0.05
2. Una cadena de supermercados tiene 32 ciudades. Un director de la Compaa quiere
estimar la proporcin de tiendas en la cadena que no satisfacen un criterio de limpieza
especfico. Las tiendas dentro de cada ciudad al parecer poseen caractersticas similares;
por lo tanto el director decide seleccionar una muestra por conglomerados en dos etapas
conteniendo la mitad de las tiendas dentro de cada una de las 4 ciudades. El muestreo por
conglomerados es conveniente en esta situacin debido al costo de traslado. Los datos
recolectados se presentan en la tabla adjunta.
-
TEORA DEL MUESTREO UNT
18 Dr. Carlos A. Risco Dvila [email protected]
Ciudad
Nmero de tiendas en la ciudad
Nmero de tiendas
muestreadas
Nmero de tiendas que
no satisfacen el criterio
de limpieza 1 25 13 3 2 10 5 1 3 18 9 4 4 16 8 2
a) Dado que la cadena contiene 450 tiendas. Estime puntual e intervalicamente (99%) la
proporcin de tiendas que no satisfacen el criterio de limpieza
b) Estime puntual e intervalicamente (95%) el nmero total de tiendas que no satisfacen
el criterio de limpieza.
c) Asuma que se desconoce el nmero total de tiendas de la cadena de supermercados.
Estime puntual e intervalicamente (95%) la proporcin de tiendas que no satisfacen
que no satisfacen el criterio de limpieza.
3. Un investigador desea muestrear tres hospitales de entre los seis que existen en una
ciudad, con el propsito de estimar la proporcin de pacientes que han estado (o estarn)
en el hospital por ms de dos das consecutivos. Puesto que los hospitales varan en
tamao, stos sern muestreados con probabilidades proporcionales al nmero de sus
pacientes. En los tres hospitales muestreados se examinar un 10% de los registros de los
pacientes actuales para determinar cuntos pacientes permanecern por ms de dos das
en el hospital. Con la informacin sobre los tamaos de los hospitales dados en la tabla
adjunta, seleccione una muestra de tres hospitales con probabilidades proporcionales al
tamao.
Hospital Nmero de pacientes
Intervalo acumulado
1 328 1-328
2 109 329-437
3 432 438-869
4 220 870-1089
5 280 1090-1369
6 190 1370-1559
Supngase que los hospitales muestreados dieron los siguientes datos sobre el nmero de
pacientes con permanencia de ms de dos das:
Hospital
Nmero de pacientes
muestreados
Nmero con permanencia de ms de dos das
3 43 25
5 28 15
6 19 8
Estime la proporcin de pacientes con permanencia de ms de dos das, para los seis
hospitales, y establezca un intervalo de confianza del 95%
-
TEORA DEL MUESTREO UNT
19 Dr. Carlos A. Risco Dvila [email protected]
VIII. SELECCIN DEL TAMAO MUESTRAL USANDO EL PAQUETE
ESTADSTICO EPIDAT
-
TEORA DEL MUESTREO UNT
20 Dr. Carlos A. Risco Dvila [email protected]
Ejemplo 1:
Supngase que se quiere obtener una muestra bietpica equiprobabilstica de 120
estudiantes de un centro universitario que tiene 966 alumnos registrados. Supngase
adems que los alumnos estn distribuidos en 52 grupos de tamaos variables y
conocidos y que se ha decidido seleccionar 12 de esos grupos, o equivalentemente, 10
alumnos por grupo.
El archivo UNIVERSIDAD 4.xls contiene la informacin necesaria para hacer la
seleccin si se est en el primer caso; dicha base consta de 52 registros (tantos como
GRUPOS diferentes contiene el centro universitario). El campo TAMAO de la base
UNIVERSIDAD 4.xls contiene el nmero de sujetos existentes en cada uno de los 52
grupos.
Ejemplo 2:
Supngase ahora que se cuenta con un archivo que contiene la informacin completa:
listado de los 966 sujetos y, para cada cual, el dato del grupo al que pertenece. Cada
registro puede contener o no, adems, otra informacin sobre los individuos, que no ser
empleada en el acto de seleccin. El archivo UNIVERSIDAD 5.xls contiene los datos
(nombre y edad) de cada uno de los 966 estudiantes y el campo GRUPO, donde se
consigna el grupo al que pertenece cada uno de ellos (codificada como 1, 2,..., 52). En el
archivo UNIVERSIDAD 5.xls los registros estn ordenados segn grupos y, dentro de
stos, alfabticamente (tal y como verosmilmente se obtendran de un registro
secretarial). Al correr el programa, se obtiene un resultado similar al del caso anterior,
pero ahora se tiene la posibilidad de guardar el archivo con la base de datos resultante del
proceso de seleccin (es decir, la informacin contenida en UNIVERSIDAD 5.xls pero
slo para los sujetos que resulten elegidos).
IX. REFERENCIAS BIBLIOGRFICAS.
ANDERSON, D.; SWEENEY, D. y WILLIAMS, T. (2008). Estadstica para la
Administracin y Economa. (10 ed.). Mxico: CENGAGE.
SCHEAFFER y MENDENAHALL (2007). Elementos de Muestreo. 6ta Edicin.
Espaa: Ed. Thomson.
http://epidemiologia.bravehost.com/UDA2008_2T/bioestadistica_1_72.pdf
http://epidemiologia.bravehost.com/UDA2008_2T/bioestadistica_1_72.pdf