Inferencia Estadistica Unidad II

1

Ingeniería en Gestión Empresarial

Luis Daniel Herrera Barrios

Unidad II

“INFERENCIA ESTADÍSTICA: ESTIMACIÓN”

Blanca Estefanía De la O Mondragón

11570120

Zihuatanejo Gro. A 24 de Febrero Del 2013

2

UNIDAD II. INFERENCIA ESTADÍSTICA: ESTIMACIÓN

Introducción 3

2.1 Conceptos básicos. 4

2.2 Distribuciones de muestreo. 5

2.3 Estimación puntual. 6

2.4 Estimación de intervalo. 7

2.5 Intervalos de confianza para medias. 8

2.6 Intervalos de confianza para diferencia entre medias. 9

2.7 Intervalos de confianza para proporciones. 11

2.8 Intervalos de confianza para diferencias entre proporciones. 12

2.9 Intervalos de confianza para varianzas. 15

2.10 Intervalos de confianza para razones de dos varianzas. 16

Bibliografía 18

CONTENIDO

3

A la inferencia estadística le interesa sacar conclusiones de un gran número de

acontecimientos (población), fundándose en las observaciones de una parte de los

mismos (muestra).

La estadística nos proporciona herramientas que formalizan y uniforman los

procedimientos para sacar conclusiones siempre que las muestras seleccionadas sean

representativas de la población que han sido extraídas. Esta representatividad permite

extender los valores que describen a las muestras (estadísticos), tales como la media, la

desviación típica, un coeficiente de correlación, a la población correspondiente, es decir,

la media o la desviación típica (estadísticos) pueden tomarse como estimadores de los

parámetros μ y σ, valores que caracterizan a la población.

Los estadísticos, valores obtenidos en la muestra, son, pues, estimadores de los

parámetros correspondientes (valores de la población).

I N T R O D U C C I Ó N

4

2.1 Conceptos básicos.

POBLACIÓN: Conjunto de elementos sobre los que se observa un carácter común. Se representa con la letra N.

MUESTRA: Conjunto de unidades de una población. Cuanto más significativa sea, mejor será la muestra. Se representa con la letra n.

UNIDAD DE MUESTREO: Está formada por uno o más elementos de la población. El total de unidades de muestreo constituyen la población. Estas unidades son disjuntas entre sí y cada elemento de la población pertenece a una unidad de muestreo.

PARÁMETRO: Es un resumen numérico de alguna variable observada de la población. Los parámetros normales que se estudian son:

- La media poblacional: x

- Total poblacional: X

- Proporción: P

ESTIMADOR: Un estimador θ*

de un parámetro θ, es un estadístico que se emplea para conocer el parámetro θ desconocido. ESTADÍSTICO: Es una función de los valores de la muestra. Es una variable aleatoria, cuyos valores dependen de la muestra seleccionada. Su distribución de probabilidad, se conoce como “Distribución muestral del estadístico”.

ESTIMACIÓN: Este término indica que a partir de lo observado en una muestra (un resumen estadístico con las medidas que conocemos de Descriptiva) se extrapola o generaliza dicho resultado muestral a la población total, de modo que lo estimado es el valor generalizado a la población. Consiste en la búsqueda del valor de los parámetros poblacionales objeto de estudio. Puede ser puntual o por intervalo de confianza:

Puntual: cuando buscamos un valor concreto.

Intervalo de confianza: cuando determinamos un intervalo, dentro del cual se supone que va a estar el valor del parámetro que se busca con una cierta probabilidad.

5

CONTRATE DE HIPÓTESIS: Consiste en determinar si es aceptable, partiendo de datos

muéstrales, que la característica o el parámetro poblacional estudiado tome un

determinado valor o esté dentro de unos determinados valores.

NIVEL DE CONFIANZA: Indica la proporción de veces que acertaríamos al afirmar que el

parámetro θ está dentro del intervalo al seleccionar muchas muestras.

2.2 Distribuciones de muestreo. La inferencia estadística es el proceso que permite hacer inferencias (predicciones, suposiciones, …) acerca de los parámetros de la población a partir de los estimadores obtenidos con una muestra. Utiliza como base el muestreo aleatorio simple. La distribución muestral de un estimador es la distribución de la probabilidad de la variable que recoge los distintos valores del estimador obtenidos al analizar diferentes muestras. Una población con cualquier distribución de frecuencias, que tiene una µ y σ concretas,

tiene una distribución muestral de la x (las medias de infinitas muestras obtenidas de dicha población): Con una media igual a la media de la población

Una desviación estándar, denominada error típico o estándar, igual a σ, desviación

estándar de la población, dividida entre la raíz cuadrada del tamaño de la muestra,

n:

y sigue una distribución normal (si n es suficientemente grande).

Ejemplo: Población:

Distribución muestral x :

Histograma de x en 1000 muestras de 11 elementos.

6

2.3 Estimación puntual. Con la estimación puntual se estima el valor del parámetro poblacional desconocido, a

partir de una muestra. Para cada muestra se tendrá un valor que estima el parámetro.

Esta estimación no es muy útil si desconocemos el grado de aproximación de la estimación

al parámetro.

Un estimador de un parámetro poblacional es una función de los datos muéstrales. En

pocas palabras, es una fórmula que depende de los valores obtenidos de una muestra,

para realizar estimaciones. Lo que se pretende obtener es el valor exacto de un

parámetro. Por ejemplo, si se pretende estimar la talla media de un determinado grupo

de individuos, puede extraerse una muestra y ofrecer como estimación puntual la talla

media de los individuos de la muestra.

La media de la muestra puede ser un estimador de la media de la población, la

cuasivarianza muestral es un buen estimador de la varianza poblacional y el total muestral

es un buen estimador del total poblacional.

Por tanto, una definición más matemática de un estimador y las propiedades que debe de

cumplir un estimador para ser bueno.

Sea X1......Xn, una m.a.s. de tamaño n, decimos que es un estimador θ* de un parámetro

θ si el estadístico que se emplea para conocer dicho parámetro desconocido es este.

Propiedades deseables de un estimador

Las propiedades o criterios para seleccionar un buen estimador son los siguientes:

A) Insesgadez: Diremos que un estimador θ* de un parámetro θ es insesgado si su

esperanza coincide con el verdadero valor del parámetro.

En el caso de que no coincidan, diremos que el estimador es sesgado.

B) Eficiencia: Dados dos estimadores θ1* y θ2* para un mismo parámetro θ, se dice que

θ1* es más eficiente que θ2* si:

7

C) Suficiencia: Se dice que un estimador de un parámetro es suficiente cuando para su

cálculo utiliza toda la información de la muestra.

D) Consistencia: Decimos que un estimador θ* de un parámetro θ es consistente si la

distribución del estimador tiende a concentrarse en un cierto punto cuando el tamaño de

la muestra tiende a infinito.

Métodos para obtener estimadores

El demostrar que un cierto estimador cumple estas propiedades puede ser complicado en

determinadas ocasiones. Existen varios métodos que nos van a permitir obtener los

estimadores puntuales. Los más importantes son:

MÉTODO DE LOS MOMENTOS: se basa en que los momentos poblacionales y se

estiman mediante los momentos muéstrales. Suelen dar estimadores consistentes.

MÉTODO DE MÍNIMOS CUADRADOS: consiste en obtener un estimador que hace

mínima una determinada función.

MÉTODO DE MÁXIMA VEROSIMILITUD: consiste en tomar como parámetro

poblacional el valor de la muestra que sea más probable, es decir, que tenga

mayor probabilidad. Se suelen obtener estimadores consistentes y eficientes. Es el

más utilizado.

La probabilidad de que la media muestral sea igual a la media poblacional es cero,

, es decir, que será bastante complicado obtener un estimador puntual, por

ello se utiliza más el Intervalo de Confianza y el Contraste de Hipótesis.

2.4 Estimación de intervalo.

Es deseable conocer un método que nos permita saber donde se encuentra el parámetro

con un cierto grado de certeza. Este método va a ser la determinación de un intervalo

donde estará el parámetro con un nivel de confianza.

Estimación de intervalo expresa la amplitud dentro de la cual probablemente se encuentra

un parámetro poblacional.

8

El intervalo se construye a partir de una muestra, entonces, para cada muestra se tendrá

un intervalo distinto. Llamaremos al error que se permite al dar el intervalo y el nivel de

confianza será 1- . Un intervalo tiene un nivel de confianza 1- cuando el 100·(1- )% de

los intervalos que se construyen para el parámetro lo contienen.

Es deseable para un intervalo de confianza que tenga la menor amplitud posible, esta

amplitud dependerá de:

El tamaño de la muestra, mientras mayor sea el tamaño mejor será la estimación,

aunque se incurre en un aumento de costes

Nivel de confianza, si se pide mayor nivel de confianza, el intervalo será mayor.

2.5 Intervalos de confianza para medias. En los capítulos anteriores se estudio el estadístico

Como estimador de la media poblacional , y si se considera una muestra grande , extraida de una población con conocida, entonces del teorema del limite central

y en consecuencia donde

Por lo que

De donde el intervalo de confianza de dos lados para la media con un nivel de confianza de , cuando la muestra es grande es:

9

Y los límites son:

El valor

se obtiene de tablas de distribución normal estándar de forma que

Al denotar a z como

es una notación común en estadística, pero no esta

completamente generalizada. Cuando la muestra es pequeña (n < 30) y la población tiene una distribución normal con variancia conocida, entonces puede emplearse.

2.6 Intervalos de confianza para diferencia entre medias. Para construir intervalos de confianza para la diferencia de medias poblacionales se hace uso de la distribución en el muestreo de la diferencia de medias muéstrales. Se sabe que si son variables aleatorias independientes, entonces:

Y por tanto, si las distribuciones de la variables son normales, cualesquiera que sean los

tamaños muéstrales, se verificara que

10

También se sabe que para muestras independientes se puede asegurar que la distribución

de la diferencia de medias muéstrales es

si las

distribuciones de las variables son normales.

Si se conocen las varianzas poblacionales

Y a partir del intervalo de probabilidad con para la diferencia de medias muéstrales se construye el intervalo de confianza con coeficiente de confianza (1- ) para la diferencia de medias poblacionales:

Si no se conocen las varianzas poblacionales

pero se pueden suponer iguales

Siempre que

y las muestras sean independientes la distribución

de la diferencia de medias muéstrales es

.

Si las varianzas poblacionales se pueden suponer iguales se estima la varianza común por

y en este caso la distribución del estadístico

no

es normal sino y por ello, el intervalo de confianza, con coeficiente de confianza

1- será en este caso

Si no se conocen las varianzas poblaciones

y no se pueden suponer iguales

11

Si las varianzas poblacionales no se pueden suponer iguales, se estiman por las cuasivarianzas de las muestras correspondientes, y es este caso el estadístico

sigue una distribución t de Student con g grados de libertad, siendo el

numero natural mas próximo a

El intervalo de confianza será:

.

2.7 Intervalos de confianza para proporciones. Si se toma una muestra de tamaño n de una población muy grande (o infinita), y X

observaciones pertenecen a la clase de interés, entonces

es un estimador puntual

de la proporción de la población que pertenece a la clase en cuestión, y la distribución de muestreo es

Donde Y p y n son los parámetros de la distribución binomial.

Utilizando el estimador

y aproximando la cantidad p(1-p) mediante su

estimador puntual se obtiene el intervalo de confianza de dos lados con un coeficiente para la proporción p es

…..(3.7)

Ejemplo

12

En una muestra al azar de 60 secciones de tubo en una planta química, 8 de ellos mostraron señales de corrosión seria. Construir un intervalo de confianza del 95 % para la proporción de los tramos de tubo con corrosión seria. Resolución

Utilizando la formula (3.7), con

de tablas, y recordando que

, se

tiene:

Finalmente:

2.8 Intervalos de confianza para diferencias entre proporciones. Si dos muestras independientes de tamaño se extraen de poblaciones infinitas

con distribuciones binomiales, X representa el numero de observaciones de la primera muestra que corresponden a la clase en cuestión, entonces la distribución de muestreo para la diferencia de proporciones esta dada por

Donde De la definición se obtiene el intervalo de confianza de dos lados para la diferencia de proporciones, con un nivel de confianza de ( , el cual es

…(3.8) Ejemplo Dos grupos de 80 pacientes tomaron parte en un experimento en el cual un grupo recibió píldoras que contenían un antialérgico, mientras que al otro grupo se le administro un placebo, es decir, una píldora sin droga alguna. En el grupo que recibió el medicamento 23 exhibieron síntomas alérgicos, mientras que en el otro grupo 41 los exhibieron. Obtener un intervalo de confianza del 99% para la diferencia entre las proporciones.

13

Tópicos especiales: Intervalo de confianza para la diferencia de medias, casos especiales. Existen algunos casos especiales para los intervalos de confianza de diferencia de medias. El primero de ellos es cuando se tienen datos apareados, o en pares, es decir, las muestras aleatorias no son independientes y tienen el mismo tamaño. El segundo de ellos, que queda un poco más allá del objetivo del presente curso, se tiene cuando las muestras son pequeñas, independientes, con distribuciones aproximadamente normales con varianzas desconocidas y diferentes. Datos en pares Cuando se observan datos en pares y se espera que exista una fuerte correlación entre cada pareja de datos, se debe generar una nueva variable aleatoria para construir el intervalo de confianza.

Sea la variable aleatoria , donde i =1, 2, … , n, entonces:

14

Y el intervalo se puede generar mediante:

Variancias diferentes muestras pequeñas Cuando el problema consiste en encontrar una estimación por intervalos para diferencia de medias , las muestras son pequeñas, las poblaciones son aproximadamente normales y las varianzas desconocidas no pueden considerarse iguales, entonces no existe un estadístico exacto para el problema; sin embargo, algunos autores han encontrado muy buenas aproximaciones utilizando el estadístico:

el cual tiene una distribución aproximadamente t, con v grados de libertad, los cuales se aproximan mediante:

O bien mediante

Puesto que v difícilmente es entero se aproxima al entero más cercano.

15

El intervalo de confianza de dos lados queda entonces:

2.9 Intervalos de confianza para varianzas. Si X es una v.a. con distribución normal con media y varianza desconocidas, entonces

el estadístico empleado es

Donde

Utilizando el estadístico

se obtiene el intervalo de confianza de dos lados con un

coeficiente de confianza de para , el cual es

Ejemplo: Considerese los siguientes datos:

8.2 8.28 8.24 8.23 8.21 8.25 8.24 8.23 8.24 8.25 8.2 8.26 8.19 8.23 8.26

Obtener:

a) Un intervalo de confianza de dos lados del 95% para . b) Un intervalo de confianza inferior del 95% para c) Un intervalo de confianza superior de 95% para

16

Resolución De los datos de la tabla se obtiene

a) Sustituyendo en

De tablas

Por lo que

b) Para un intervalo inferior

De tablas

Entonces

c) Para un intervalo superior

De tablas

Entonces

2.10 Intervalos de confianza para razones de dos varianzas. Si X y Y son vv.aa. independientes con distribuciones normales con medidas

desconocidas y variancias

desconocidas, respectivamente, entonces el estadístico

empleado es

17

Donde

Utilizando el estadístico

se obtiene el intervalo de confianza de dos lados con un

coeficiente de confianza de para la relación de las variancias

, el cual es

18

Hines, William W. y Montgomery, Douglas C., et al.- Probabilidad y Estadística para

Ingeniería y Administración, Cuarta Edición..-CECSA.- México, 2004.

María Teresa González.- Estadística Aplicada una Visión Instrumental, Díaz de

Santos.- España, 2009.

Scheaffer, Richard L y McClave, James T. Probabilidad y Estadística para Ingeniería.-

Grupo Editorial Iberoamérica.- México 1993.

Canavos, George C.- Probabilidad y Estadística Aplicaciones Y Métodos.- McGraw-

Hill.- México, 1988.

BIBLIOGRAFÍA

Inferencia Estadistica Unidad II

Documents

Transcript of Inferencia Estadistica Unidad II