clase 2--Tecnicas de Estratificación (1)

download clase 2--Tecnicas de Estratificación (1)

of 36

Transcript of clase 2--Tecnicas de Estratificación (1)

MUESTREO ESTRATIFICADOTECNICAS DE MUESTREO IIEmail:[email protected] = n1 + n2+ n3+.........+ nLSupuestos del muestreo estratificado HOMOGENEIDAD: HETEROGENEIDAD: INDEPENDENCIA:CONSTRUCCION DE LOS ESTRATOS Cul es la mejor caracterstica para laconstruccin de los estratos? Cmo se determinan los lmites entre losestratos?Cuntos estratos debera haber? Definido por criterio del investigador Calculado por frmula terica:donde,Cn= costo por unidad de muestraCe= costo por estratificacinenC2nCL =EL NMERO DE ESTRATOSMETODOSDALENIUSCLUSTERA CRITERIO AL INVESTIGADORFORMACIN DE LOS ESTRATOS1Agrupar la variable estratificacin de Y en un nmerosuficientemente grande de clase.2Determinar la distribucin de frecuencias de Y, f(y) paracada clase3Acumular4Definir5Establecer los puntos de divisin de la variable, y quecaracterizan a los estratos, como Q, 2Q,, (L-1)Q.METODO DE DALENIUS ffQL= Gasto en trfico Telefnico (S/.) Nmero de Abonados (fI) if Acum if0 50120000346.41346.41 50 100220000469.04815.45 100 15080000282.841098.29 150 20050920225.651323.94 200 25020300142.481466.42 250 30010120100.591567.01 300 350100001001667.01 350 400950097.471764.48 400 450928096.331860.81 450 500862092.841953.65 500 550795089.162042.81 550 600 723085.032127.84 600 650702083.782211.62 650 700632079.492291.11 700 750600077.452368.56 750 800598077.332445.89 800 850500070.712516.60 850 900488069.862586.46 900 950430065.572652.03 950 1000390062.452714.48 1000 1050356059.672774.15 1050 1100 311055.772829.92 1100 1150291053.942883.86 1150 1200249049.892933.75 1200 1250210045.832979.58 1250 1300200044.723024.30 1300 1350198044.493068.79 1350 1400183042.783111.57 1400 1450 180042.433154.00 1450 1500179042.313196.31 1500 1550175041.833238.14 1550 1600171041.353279.49 1600 1650163040.373319.86 1650 1700150038.733358.59 1700 1750132036.333394.92 1750 1800128035.783430.70 1800 1850100031.623462.32 1850 190082028.643490.96 1900 1950 41020.253511.21 1950 200022014.833526.04 2000 a ms 507.073533.11 TOTAL 632580 Ejemplo : En un estudio de mltiples propsitos senecesita seleccionar una muestra de 400abonados de Lima Metropolitana. Una delas variables ms importantes es el gastoen trfico telefnico. Se decidi por utilizar L=5 estratos. Luego, obtenemos los lmites:706.62x2=1413.24706.62x3=2119.86706.62x4=2826.48706.62x5=3533.1162 . 706 =53533.11Y: variable objetivoX: variable complementaria que se utiliza para estratificar( )2 222( ) 1stSVYn Lpp = + Nmero ptimo de EstratosNestratos 2 3 4 5 60.520 0.4310.4000.386 0.378 ( )stVy2Sn2Sn2Sn2Sn2SnComportamiento de Varianza como funcin del nmero de estratos cuando p = 0.8Ejemplo Sea: p=0,85 C= 100L +10n Presupuesto= 5000Cul el nmero de estratos?L Razn n V(Yst)2 0.4581 480 0.0009544273 0.3578 470 0.0007612294 0.3227 460 0.0007014275 0.3064 450 0.0006808896 0.2976 440 0.0006762947 0.2922 430 0.0006796398 0.2888 420 0.0006875939 0.2864 410 0.00069858510 0.2847 400 0.0007118132S2S2S2S2S2S2S2S2S1Preparar el marco muestral2Seleccionar la muestra aleatoria3 La muestra estratificada es la unin de todas lasmuestras obtenidas de cada estratoPROCEDIMIENTO DE SELECCIN Cul es el tamao de muestra n? y cmo afijar el tamao de muestra a cada estrato? Qu factores influyen en el mejor esquema de afijacin? La variabilidad El nmero total de elementos de cada estrato El costo de obtener una observacin de cada estratoTAMAO DE MUESTRA Tamao de muestra. Afijaciones: Afijacin Optima (costo, varianza y tamao del estrato) Afijacin de Neyman ( varianza y tamao del estrato) Afijacin proporcional (tamao del estrato) Afijacin Uniforme (igual en cada estrato) Afijacin proporcional valoral (total X del estrato) Afijacin optimo relativo (proporcional al coeficiente devariacin del estrato) Afijacin desproporcional (no proporcional) Tamao de muestra. Afijacin Proporcional: Es conveniente cuando las varianzas y los costos de muestreo enlos estratos son casi iguales en todos los estratos. Para estimar una proporcin poblacional con un margen de errorabsoluto E, se reemplazar por Pi(1-Pi) en las frmulasanterioresSS===+L2h hh 1L2h hh 1Nn1ND NN|.|

\|=NNn nhh2ho Procedimiento de Estimacin : El estimador del total poblacional es dado por: La varianza es: El estimador de la varianza es:==L1 hhT T ==L1 h)( )(hT V T V==L1 h)()(hT V T V Ejemplo : Con la muestra aleatoria estratificada seleccionadaen el ejemplo 11, determine las siguientesestimaciones a nivel Per y por estratos: Precio promedio de diesel 2 por agente Proporcin de agentes EE.SS / Grifos en el Per Total de agentes EE.SS / Grifos en el Per Indicadores del error muestral para las estimacionesanteriores. Procedimiento con SPSS:Analizar/Muestras complejas/DescriptivosAnalizar/Muestras complejas/FrecuenciasDisponibilidad de marcos.Ejemplo:En una encuesta de hogares:Se utilizan planos catastrales para las zonasurbanas antiguas (un estrato), se usan fotografasareas para zonas rurales (otro estrato) y lasreas de posible nueva urbanizacin (otro estrato)se delimitan como otro marco; se muestrean reasy se investigan las nuevas urbanizaciones(muestreo en etapas o conglomerados).Estratos(h) ElementosNhWh1N1W12N2W2. . . . . .. . . . . .. . . . . .LNLWLYhSh2Y Y N 11 11, ......Y1S12Y YN 21 22, ......Y2S22Y YL LNL1, ......YLSL2Estratos(h) Muestra aleatorianhwh1n1w12n2w2. . . . . . .. . . . . . .. . . . . . .LnLwLyhsh2v yh( )y yn 11 11,......y1 s12v y ( )1y yn 21 22, ......y2 s22v y ( )2y yL LnL1,......yL sL2v yL( )PROPIEDADES DE LA ESTIMACIONES TEOREMA 1( )stEy Y = TEOREMA 2( )21( )Lh st hhVy WV y==ESTIMACION DE PARAMETROS MEDIA==Lhh h sty W y1 VARIANZA( )==Lhh h sty v W y v12) (( )hhh hnSf y v21 ) ( =Siendo:( )2211hnhi hhihy ynS.== ERROR ESTANDAR( )styy v Sst=LIMITES DE CONFIANZAPor el Teoremacentral del lmite, para cada estrato,se tendr que( )stststyLC Y y ts = ~ [ , ( )]h h hy N Y Vy ~N [ , ( )] Y Y VY( )ststyLC Y Ny tNs = Asignacin Proporcionalh hw W =NNn nhh =Asignacin optima) (sty v==Lhh hh hhS WS Wn n1Minimizar ( ) |.|

\| + ==Lhh stn n y v Min1) ( oMinimiza la varianza del estimador, para un costo especificado, o,habiendo fijado la varianza, minimiza el costo.ESTIMACION DEL TAMAO DE LA MUESTRADATOS CONTINUOS( )221 11 1L Lh hh h sth hhW Sv y W Sn w N= == YPara cualquier asignacin: V =(d/t)2( )21211Lh hhhLh h sthW Swnv y W SN===+Estimacin de la media de poblacinFORMULA GENERAL( )==+=Lhh h stLhh hS NNy vS Wn1221211. Asignacin Proporcional Casos particulares:2. Asignacin Optima. ( n fijo)h h hw W S o( )21211Lh hhLh h sthW Snv y W SN==| | |\ .=+Si el costo para obtener informacin de una unidad en el estrato h-simo es Ch, el costo total ser:C0: es costo administrativo.Ch:Costo correspondiente al estrato hC: Costo total01Lh hhC C C n== +AFIJACIN DEL TAMAO DE MUESTRA EN UNA POBLACIN ESTRATIFICADA ASUMIENDO UNA FUNCIN COSTOLa minimizacin de la varianza del estimador con costo fijo oviceversa, produce la asignacin ptima que es:11Lh h h hhhh hW S W Sn nC C= = h hhhNSnCA. Minimizacin de la Varianza para un costo fijo:( )011Lh hhhLh h hhNSC CCnNS C===(6.10)TAMAO DE MUESTRA01Lh hhC C C n== +1 1211( )L Lh hh h hh hhLh h sthW SW S CCnvy W SN= == | | |\ . =+ B. Minimizacin del costo total para un V fijo:( )2 211Lh ho hhhWSV fn== 1 Si la unidad i-sima del estrato hYhi= tiene la caracterstica0 De otro modoMUESTREO ESTRATIFICADO PARA PROPORCIONESESTIMACION DE PARAMETROS -PROPORCIONES MEDIA==Lhh h stp W p1 VARIANZA( )==Lhh h stp v W p v12) (( )11 ) ( =hh hh hnq pf p vSiendo:Asignacin OptimaA: Minimizacin de V para un costo fijo:1hhhhhhLhhhhP QNcn nP QNc==( )011hLhhhhLh h h hhP QC C NCnN PQ C===1 111( )L Lh hh h h h hh hhLh h h sthPQW PQ C WCnvy W PQN= == | | |\ . =| |+ |\ . B. Minimizacin del costo total, si V es fijo:( )211Lh h ho hhhWPQV fn== ..EstratoNhWhM.A.SClasificados despus. nh1N1W1Y11Y12 ..Y1n12N2W2Y21Y22Y2n2YL2YLnLn1LNLWLYL1nLn2hy2hS1y12S2y22SLy2LSTECNICA DE POST-ESTRATIFICACIONPROMEDIO1Lh st hhy Wy==VARIANZA( )( ) ( )2221 111 1L Lh hh h sth hW Sv y f W Sn n= == +