Sesion 2 No Para 2014 I
-
Upload
alejandrogarroromyrolando -
Category
Documents
-
view
18 -
download
0
Transcript of Sesion 2 No Para 2014 I
1
Estimación de Parámetros
La Inferencia Estadística comprende:
Estimación Puntual
Estimación por Intervalos.
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Pruebas de Hipótesis
ESTIMACION DE PARAMETROS
Estimación Puntual
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
2
Es la estimación de un valor único de uná t d l bl ió
Estimación Puntual:
parámetro de la población.
Esto es, la estimación por puntos o puntual esuna selección única para el valor de un parámetrodesconocido.
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Comparaciones entre Estimadores
Supongamos que un dirigente deportivo debe escoger un tirador de tiro al blanco para lospróximos Juegos Olímpicos.
Para ello el dirigente convoca a 3 participantes y los somete a pruebas de tiro, obteniendo lossiguientes resultados:
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Claramente el tirador 3 es nuestra mejor carta, ya que en promedio le da al blancoy la dispersión de sus tiros es baja.
3
¿Qué sucede si se enferma este último tirador?. ¿Es claro quién es mejortirador entre el 1 y el 2?
V ti d
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Veamos por tirador:-El tirador 1 llega menos al blanco (2 de 8 en el blanco), pero sus tiros son menosdispersos.
-El tirador 2 llega en 4 de 8 veces al blanco, es decir, en promedio llega más alblanco, pero sus tiros son más dispersos.
Este problema es análogo al tipo de problemas que vamos a tratar:
ˆ ˆ ˆSean y dos estimadores de θ, tales que es sesgadopero de varianza pequeña, y insesgado pero de varianzagrande.
¿Cuál escojo?
1θ̂ 2θ̂ 1θ̂2θ̂
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
4
ESTIMACION PUNTUAL
La estimación puntual consiste en utilizar datos muestralespara estimar el valor del parámetro desconocidos de unapoblación mediante un solo valor obtenido de un estadísticodeterminado.
Por ejemplo, si se pretende estimar la talla media de undeterminado grupo de individuos, puede extraerse unamuestra y ofrecer como estimación puntual la talla media dela muestra de individuos
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
la muestra de individuos.
Estimador Puntual: Sea X una v.a. con función de densidad deprobabilidad f(x;ɵ), (“ɵ” denota al parámetro desconocido de la población).
Sea X1, X2,…, Xn una m.a. extraída de esta población.
Un estimador puntual del parámetro “ɵ” es una función de lasobservaciones X1, X2,…,Xn y se escribe:
),...,,(ˆ21 nXXXG=θ
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
cuyo valor numérico particular se toma como una aproximación de “ɵ”, este valor se llama estimador puntual de “ɵ”.
),...,,(ˆ21 nxxxG=θ
5
Por ejemplo : Un estimador puntual de la media poblacional “μ”(esto es Θ=µ), es la estadística media muestral (esto es, )cuyo valor numérico es la estimación puntual del parámetro,esto es, .
x X X=Θ̂
x=θ̂
Algunas observaciones a ser consideradas:
Un estimador (en particular el estimador puntual) es una función de “n”v.a. independientes observables (valores muestra). Las estimacionesobtenidas de tal función variarán de una muestra a otra. Por lotanto , cada estimador tiene su propia estimación:
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
( ) ( ) ( )nnXXX xfxfxfxxxfn
...),...,,( 2121,...,, 21=
Puede haber varios posibles estimadores diferentes para unparámetro.
Por ejemplo: si queremos estimar la media de una variablealeatoria se puede considerar La media muestral o laaleatoria, se puede considerar. La media muestral o lamediana muestral, como estimadores puntuales.
Entonces, para estimar “θ” debe escogerse una función de lamuestra que dé el “mejor estimador” de “θ”.
La distribución de un buen estimador debería concentrarse lomás cerca posible del erdadero alor del parámetro de la
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
más cerca posible del verdadero valor del parámetro de lapoblación.
6
Ejemplo: supongamos que “θ” es el valor verdadero de unparámetro poblacional y que y son diferentesestimadores de “θ” con funciones de densidad de probabilidadque muestra en la gráfica:
21 ,θθ))
3θ)
( )3θ̂f
( )2̂θf ( )1̂θf
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Para decidir, que estimador puntual de un parámetro particular“ɵ” es mejor, se necesita estudiar sus propiedades estadísticas.
θ
PROPIEDADES DE UN BUEN ESTIMADOR
Supongamos que tenemos dos estimadores del mismoparámetro poblacional “θ”.
Nos preguntamos : ¿Cuál de los dos estimadores es mejor?
21ˆˆ θθ y
Surgen dos situaciones :
a) No es posible conocer el verdadero valor del parámetro “θ”, siendo así no podremos afirmar que es más adecuado que
, o viceversa 2̂θ
1̂θ
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
b) Si tuviéramos dos estimadores de “θ” , , trataremos de encontrar algún criterio para decir cuál de ellos es mejor.
21ˆˆ θθ y
Para poder determinar dichos criterios es necesario considerarlas siguientes definiciones:
7
ERROR CUADRATICO MEDIO
El error cuadrático medio tiene la siguiente definición:
Sea X1,…,Xn una m.a. extraída de una población con función1 n p
de densidad f(x,ɵ), y seaun estimador del parámetro ɵ.
Se denomina error cuadrático medio (E.C.M) del estimador“T” al valor dado por:
),...,(ˆnXXtT 1==θ
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
ECM [ T ]= Var[ T ] + (E( T ) - ɵ)2
Dicha expresión se obtiene de :
ECM [T]= E[e2]=E[(T- θ)2] =Luego:
E[[ T-E(T +E(T)-θ ]2]= E[(T-E(T))2 + 2(T-E(T))(E(T)-θ) + (E(T)-θ)2 ]=constante
-E(T) +E(T)( )( ) + (E(T)-θ)2(T-E(T))2 + 2(T-E(T)) (E(T)-θ)
Luego:
=
=E[(T-E(T))2] + 2 (E(T)-θ) E[(T-E(T))] + (E(T)-θ)2=
= E[( T - E(T) )2] + ( E(T) - θ )2 = {E(T2)-E2(T)} + (E(T)-θ)2E(T2-2TE(T)+E2(T) )
constante
=0
Entonces: ECM [T]= Var[T] + (E(T) - θ)2
+ (E(T)-θ)2E[(T - E(T))2] + 2 (E(T)-θ) E[ ( T - E(T))] + ( E(T) - θ )2 E[( T - E(T) )2]
+ (E(T)-θ)2(E(T2)-E2(T))T2 – 2 T E(T) + E2(T) + ( E(T) - θ )2
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
[ ] [ ] ( ( ) )
Donde : Sesgo(T) = E[T] - θ , (sesgo del estimador)
8
Lo que buscamos es mínimizar ECM ( ) y esto se obtiene si:
í V( )
T=θ̂
Tθ̂
ECM [T]= Var[T] + (E(T) - θ)2
mín V( ) y
(E(T)-θ)2 =0
T=θ
Sesgo(T) = E[T] - θ = 0 ,.. insesgado
Entonces estaremos interesados en un estimador con mínima varianza y quesea insesgado
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
sea insesgado.
Distribución Chi-cuadrado (X2) : Sea “X” una v.a. que
tiene una distribución Chi-cuadro con “r” grados de libertad.
MEDIA Y VARIANZA DE LA FUNCION DE DISTRIBUCIÓN X 2
g
La media y varianza de la variable aleatoria chi-cuadrado con
“r” grados de libertad son:
rXEE )()( 2 === χμ
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
rXVarV 2)()( 22 === χσ
9
PROPIEDADES DE UN BUEN ESTIMADOR
Un buen estimador, es aquel que está más cerca del parámetroque se estima.
Para que un estimador puntual sea un buen estimador debecumplir con ciertas propiedades, 3 de las cuales son:
Insesgabilidad,
consistencia,
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
eficiencia
ESTIMADOR INSESGADO
Definición :
Sea X1, X2,…,Xn una m.a.s extraída de una población conf( )función de densidad f(x;ɵ).
Sea un estimador puntual de “ɵ”.
Se dice que el estadístico es un estimador insesgado
del parámetro “ɵ” si:
),...,,(ˆ21 nXXXtT ==θ
T=θ̂
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
[ ] θθθ ∀= ,ˆE
10
Ejemplo:
Sea X1,X2,…,Xn una m.a.s extraída de una población N(μ,σ2)
a) Probar que es un estimador insesgado de μ
b) Probar si es un estimador sesgado de σ2
X
1
)(1
2
2
−
−=∑=
n
XXS
n
ii
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
c) Probar si es un estimador sesgado de σ2n
XXn
ii∑
=
−= 1
2
2)(
σ̂
a) Sabemos X1,X2,…,Xn una m.a.s extraída de una población N(μ,σ2)
[ ] ∑∑= =⎥
⎤⎢⎡
=⎥⎥⎤
⎢⎢⎡
=n
n
ii
XEX
EXE 1 1[ ]
[ ]∑ ∑
∑
= =
=
===
=⎥⎦
⎢⎣
=
⎥⎥⎥
⎦⎢⎢⎢
⎣
=
n
i
n
ii
ii
nn
nXE
n
XEnn
EXE
1 1
1
11 μμμ
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
X es un estimador insesgado de μ
11
Donde el Esperado de una variable que se distribuye como unachi-cuadrado es: n-1
b) Sabemos que :2
)1(2
2)1(−≈
−n
Sn χσ
chi-cuadrado es: n-1
[ ]222
2
22
2
222
)1(
)1(1)1(
))(1(σ
σσσ
⎤⎡
=⎥⎦
⎤⎢⎣
⎡ −−
=⎥⎦
⎤⎢⎣
⎡−
−=
S
Snn
En
SnESE
Entonces:
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
22
2
22
)1()1(
)1()1(
σσσ
σ=−
−=⎥
⎦
⎤⎢⎣
⎡ −−
nn
SnEn
Por tanto, S2 es un estimador insesgado de σ2
ESTIMADOR CONSISTENTE
Generalmente, un estimador puntual no es idéntico alparámetro que se estima, esto debido a la presencia del errorde muestreo : θθ −= ˆe
Pero esperamos que un buen estimador tenga su valor muycercano al valor verdadero del parámetro o por lo menos tengauna alta probabilidad de acercarse.
Es decir un buen estimador debe tener la propiedad deconsistencia.
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
12
Consistencia: se dice que
es una sucesión consistente de estimadores de “ɵ” si:),...,,(ˆ
21 nnn XXXtT ==θ
[ ] 0ˆlim =∞→ nnVar θ[ ] θθ =
∞→ nnE ˆlim
nθ̂Si es un estimador insesgado, obviamente la primera condición estará satisfecha.
1) 2)
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Ejemplo:
Sea X1,X2,…Xn una m.a.s extraída de una población N(μ,σ2).
)( 2∑ XXn
a) Demostrar que es un estimadorconsistente de σ2.
b) Demostrar que es un estimador consistente de σ2.
n
XXn
ii∑
=
−= 1
2
2)(
σ̂
1
)(1
2
2
−
−=∑=
n
XXS i
i
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
13
a) i) [ ]
222
2
22
2
222
)1(
)1(1)1(
))(1(σ
σσσ
⎤⎡
=⎥⎦
⎤⎢⎣
⎡ −−
=⎥⎦
⎤⎢⎣
⎡−
−=
S
Snn
En
SnESE
Entonces, aplicando el limite:
22
2
22
)1()1(
)1()1(
σσσ
σ=−
−=⎥
⎦
⎤⎢⎣
⎡ −−
nn
SnEn
[ ] 222 limlim σσ ==∞→∞→ nn
SE
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Cumple con la primera condición:
Ahora analizaremos si cumple con la segunda condición:
Sabemos que , entonces )1(2])1([ 2
2
−=− nSnVarσ
2)1(2
2)1(−≈
−n
Sn χσ
ii) ])1([)1(
])1(1
[][ 2
2
2
42
2
22
σσ
σσ SnVar
nSn
nVarSVar −
−=
−−
=
12)]1(2[
)1(][
4
2
42
−=−
−=
nn
nSVar σσ
2 4σ
Luego:
Aplicando limite:
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
01
2lim][lim 2 =−
=∞→∞→ n
SVarnn
σ
Por tanto, S2 es un estimador consistente.
14
Definición:
Sea X1 X2 X una m a s extraída de una población con
ESTIMADOR EFICIENTE
Sea X1,X2,…,Xn una m.a.s. extraída de una población con función de densidad de probabilidad f(x,θ).
Sean dos estimadores insesgados del mismo parámetro .
Se dice que el estimador es más eficiente que
'21ˆˆ
nn TyT == θθ
1̂θ 2̂θ
θ
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
]ˆ[]ˆ[ 21 θθ VarVar <Si y sólo si :
Ejemplo:
Sea X1,X2,…,Xn una m.a.s. extraída de una población N(μ,σ2).
][xMed=μ (media Poblacional = mediana Poblacional, simetría)
de la media poblacional).
Además se sabe que la mediana muestral es aproximadamente
~ 2σπ
XyX ~ˆˆ == μμ (media muestral, mediana muestral dos Estimadores
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
¿Cuál de los dos estimadores es más eficiente para la medianapoblacional?
)2
],[(~n
XMedNX σπ≈
15
Por el enunciado sabemos que:
),(2
nNX σμ≈
μ=)(XELuego:
Son estimadores insesgados
)2
],[(~ 2
nXMedNX σπ
≈
12
2][]~[
2
2
>== πσ
σπ
n
nXVarXVar
μ=)~(XEg
de la mediana poblacional
Usando la razón de varianza:
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
entonces, , luego es un estimador más eficiente que
n
]~[][ XVarXVar < XX~
1.Método de Máxima verosimilitud
Consiste en tomar como valor estimado de “θ” , el valor que hacemáxima la función de verosimilitud L(θ).
METODOS DE ESTIMACION PUNTUAL DE PARAMETROS
( )
Definición: Sea X una variable aleatoria cuya función de probabilidadf(x) depende de un parámetro “θ” (f(x;θ)).
Sea X1,…,Xn una m.a.s de X y sean x1,x2,…,xn los valores observadosde la muestra. La función de verosimilitud de la muestra se define asi:
∏n
f )( θ
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
L(θ)=f(x1,x2,…,xn;ɵ)=f(x1;ɵ) f(x2;ɵ)… f(xn;ɵ)=∏=i
ixf1
);( θ
Observación: si θ hace máxima a L(ɵ), entonces también hace máximaa su logaritmo ln(L(ɵ)).
16
Para convertir el producto de la función de máxima verosimilitud ensuma, se aplica la función L=ln(L(ɵ)) y determinar “θ” por laecuación :
0);(ln∂∂ ∑n
ixfL θ
Si, la distribución de probabilidad tiene varios parámetrosdesconocidos, , entonces en lugar de una ecuación,tendremos k ecuaciones.
kθθθ ,...,, 21
01
=∂
=∂ ∑
=i
i
θθ
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
0,...,0,021
=∂∂
=∂∂
=∂∂
n
LLLθθθ
En resumen:
para hallar el Estimador Máximo verosímil (EMV) se procede delsiguiente modo:
1º) Hallamos la función de verosimilitud L(θ):
∏n
fL )()( θθ
2º)Se observa que si hace máxima la función de verosimilitudL(θ), entonces también hace máxima a su logaritmonatural, entonces se toma ln(L(θ)).
∏=
=i
ixfL1
),()( θθ
θ̂
3º) d i i l fi d l l l l d l
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
3º) derivamos e igualamos a cero, a fin de calcular el valor delestimador :
0)(ln=
∂∂
θθL
17
Ejemplo:
Sea X una v.a. con f.d.p , x > 0 , ɵ>0xexf θθ −=)(
nnθθθθ∏∏1º) ni xxx
i
x
ii eeeexfL θθθθ θθθθθ −−−
=
−
=
=== ∏∏ ...)()( 21
11
∑= =
−n
iix
neL 1
θ
θθ )(
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
2º) ∑=
−
−=∑
= =
n
ii
xn xneL
n
ii
1
1 θθθθθ
)ln(]ln[)](ln[
3º) 01
11 =−=∂
∂−
∂∂
=∂
−∂=
∂∂ ∑
∑∑=
==n
ii
n
ii
n
ii
xnx
nxn
Lθθ
θ
θθ
θ
θθ
θθ
)()ln(
)ln()](ln[
por lo tanto:
01
=−∑=
n
iixn
θ =
∑=
n
xn
ii
1
1==
∑=
n
iix
n
1
θ̂x1
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
x1ˆ =θ
18
1º) Sea X una v.a. con función de densidad f(x; θ1,θ2,…,θk) o con distribución deprobabilidad p(x;θ1,θ2,…,θk) caracterizado por “k” parámetros desconocidos.
METODO DE LOS MOMENTOS
Es el método más intuitivo. Consiste en utilizar la relación que tienen los parámetros conlos “momentos” de la población
Donde los primeros k momentos de la variable poblacional alrededor del origen sonrespectivamente :
- Si X es continua :
- Si X es discreta :
xxfxXE kR
rrr
x
∂== ∫ ),...,,;()(' θθθμ 21 , r = 1,2,3,..,k
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Si X es discreta :
Los momentos μ’r (r = 1,2,3,…,k) de la población son en general función de los k parámetros
desconocidos θ1,θ2,..,θk.
),...,,;()('k
R
rrr xpxXE
X
θθθμ 21∑== , r = 1,2,3,..,k
2º)Sea X1, X2, … ,Xn una m.a.s de tamaño n, los primeros k momentosmuestrales alrededor del origen se define como:
∑=n
i
rir X
nM
1
' 1, r = 1,2,3,..,k
=in 1
El método de los momentos consiste en igualar los momentos muestrales ymomentos poblacionales, obteniendo k ecuaciones simultaneas, con kparámetros desconocidos θ1,θ2,..,θk.
Es decir : μ’r=M’
r , r = 1,2,3,.. ,k
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Las soluciones de las ecuaciones en μ’r=M’
r denotados por constituyen
los momentos estimados de respectivamente.kθθθ ˆ,...,ˆ,ˆ 21
kθθθ ,...,, 21
19
Ejemplo:
Sea X1, X2, … ,Xn una m.a.s de tamaño n, donde los , conμ y σ2 desconocidos. Encuentre los estimadores para μ y σ2 por elmétodo de los momentos.
E t d l i d b l t t
),(~ 2σμNXi
)(~ 2σμNXEntonces , del enunciado sabemos que , por lo tanto:
corresponde al 1er. momento poblacional, sabemos también que:
, expresión que contiene el 2do. momento:
, 2do. Momento poblacional
),(~ σμNXi
μ=)(XE
)()()( 22 XEXEXV −=
2222 )()()( μσ +=+= XEXVXE
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
Luego de la muestra obtendremos los momentos muestrales:
∑=
=n
iiX
nM
11
1'
∑=
=n
iiX
nM
1
22
1'
Igualando los momentos poblacionales y muestrales obtendremos un sistemas de ecuaciones mediante el cual hallaremos los estimadores de los parámetros:
μ=== ∑=
)(11
'1 XEX
nM
n
ii
222
1
2'2 )(1 μσ +=== ∑
=
XEXn
Mn
ii
Luego la primera ecuación obtenemos:
de la segunda ecuación :
1=i
XXn
n
ii == ∑
=1
1μ̂
222
22
1
2
1
1 Xn
n
n
ii +=
∑
∑=
μσ
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
2
1
22
22
1
2
1ˆ
ˆ1
XXn
XXn
n
ii
ii
−=
+=
∑
∑
=
=
σ
σ
∑=
=−=n
ini SXX
n 1
22)(1
20
∑=
+−=n
ii XnXnX
n 1
222 21][
Observación:
∑∑==
−=−=n
ii
n
ii XnX
nXX
n 1
22
1
222 ][11σ̂
22: XnXnartificio +−
∑n
X
)( 22 21 XXXXn
+∑
)()(2[11
21
1
2 ∑∑=
∑=
=
+−=n
in
iiXn
ii XXnX
n
][ ∑ ∑∑= ==
+−=n
i
n
ii
n
ii XXXX
n 1 1
2
1
2 21
LIC. RITA GUZMAN LOPEZESTADISTICA NO PARAMETRICA
)(1
2 XXXXn i
ii +−= ∑
=
∑=
=−=n
ini SXX
n 1
22)(1