Estimar con estadística v1

19
Estimar con Estadística Conceptos Previos Tipos de Muestreo Estimación por Intervalos Xavier Barber Estadística en investigación experimental y clínica

Transcript of Estimar con estadística v1

Page 1: Estimar con estadística v1

EstimarconEstadística

ConceptosPreviosTiposdeMuestreoEstimación porIntervalos

XavierBarber

Estadísticaeninvestigaciónexperimentalyclínica

Page 2: Estimar con estadística v1

ConceptosPrevios

Page 3: Estimar con estadística v1

DefinicionesPoblación Es el conjunto de elementos o individuos que reúnen lascaracterísticas que se pretenden estudiar. Cuando se conoce el número deindividuos que la componen, se habla de «población finita» y, cuando no seconoce su número, de «población infinita».

Existen tres niveles de población, según su tamaño y accesibilidad: la «poblacióndiana» es el conjunto de elementos o individuos al cual se pretenden inferir losresultados obtenidos; generalmente, es muy numerosa y no está al alcance delos investigadores. La «población accesible» es la que reúne las mismascaracterísticas que la anterior, pero con menor número de individuos, y portanto susceptible de estudio; es la que delimita el investigador con los criteriosde inclusión y exclusión. La «población de estudio» es de la que realmente serecogen los datos; suele ser lamuestra de estudio.

Cálculodeltamañodelamuestra.C.Fuentelsaz Gallegowww.uib.cat/.../303729_2014_animaleslaboratorio_num62_31_33.pdf

Page 4: Estimar con estadística v1

DefinicionesMuestra Es el grupo de individuos que realmente se estudiarán, es unsubconjunto de la población. Para que se puedan generalizar a la población losresultados obtenidos en la muestra, ésta ha de ser «representativa» de dichapoblación. Para ello, se han de definir con claridad los criterios de inclusión yexclusión y, sobre todo, se han de utilizar las técnicas de muestreo apropiadaspara garantizar dicha representatividad.

Individuo Es cada uno de los integrantes de la población o muestra en los que seestudiarán las características de interés determinadas por los objetivos delestudio. Normalmente, el número de individuos de la muestra se representa conla letra «n» y el número de sujetos de la población por la «N». Tras la definiciónde las características de la población a través de los criterios de inclusión yexclusión, se ha de decidir si se estudia a toda la población o –en caso de queésta sea demasiado grande– a un número de sujetos representativo, que no hande ser ni pocos ni demasiados, sino simplemente los necesarios.

Page 5: Estimar con estadística v1

DefinicionesEstimar un parámetro es proponer un valor para el mismo a partir de lamuestra; un estimador del porcentaje poblacional sería el porcentaje dediabéticas –al que se hacía mención anteriormente– de unamuestra; a este tipode estimación se le llama «estimación puntual». Es bastante probable que elvalor que se obtiene no sea realmente el valor del parámetro en la población.

El error estándar mide la variabilidad entre las diferentes medias de lasmuestras; es decir, mide la dispersión imaginaria que presentarían las distintasmedias obtenidasen las muestras estudiadas.

Page 6: Estimar con estadística v1

6

IntroducciónExistendosformasdehacerInferenciaEstadística:◦ Laestimacióndeparámetros◦ Laspruebasdehipótesis.

En la Inferencia Estadística hay varios métodos, pero en cualquier caso esnecesario utilizar una muestra que represente a la población, esto se consigue conlas Técnicas de muestreo.

Apartirdeunamuestranosproponemosdosobjetivos:◦ Obtenervaloresaproximadosdeparámetrospoblacionales:Estimaciónpuntual.◦ La estimación por intervalos de confianza tiene por objeto proporcionar, apartir de la información recogida en la muestra, un intervalo que contenga conalto nivel de confianza (probabilidad), al parámetro objeto de nuestrointerés. A partir de dicho intervalo obtendremos una medida del error máximocometido al aproximar puntualmenteel parámetro.

Page 7: Estimar con estadística v1

XAVIERBARBER2009/2010 7

IntroducciónEn particular, nos centraremos en extraerconclusiones específicas sobre parámetros deesta población, como pueden ser la media, lavarianza o la proporción de individuos queverifican una cierta propiedad.

EL VERDADERO VALOR DEL PARÁMETRO ESDESCONOCIDO, Y EL OBJETIVO SERÁESTIMARLO.

La principal razón para estudiar una muestra enlugar de la población completa es el hecho deque la recogida de toda la información será, enla mayoría de las ocasiones, exageradamentecara, e incluso imposible de realizar.

Page 8: Estimar con estadística v1

TiposdeMuestreo

M.C.IrmaNancyLariosRodríguezhttp://goo.gl/PvVf7

Page 9: Estimar con estadística v1

MuestreoAleatorioSimpleEl procedimiento empleado es el siguiente: 1) se asigna un número a cada

individuo de la población y 2) a través de algún medio mecánico (bolas dentro

de una bolsa, tablas de números aleatorios, números aleatorios generados con

una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario

para completar el tamaño de muestra requerido. Este procedimiento, atractivo

por su simpleza, tiene poca o nula utilidad práctica cuando la población que

estamos manejando es muy grande.

Page 10: Estimar con estadística v1

MuestreoaleatoriosistemáticoEste procedimiento exige, como el anterior, numerar todos los elementos de lapoblación, pero en lugar de extraer n números aleatorios sólo se extrae uno. Separte de ese número aleatorio i, que es un número elegido al azar, y loselementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k,i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultadode dividir el tamaño de la población entre el tamaño de la muestra: k= N/n. Elnúmero i que empleamos como punto de partida será un número al azar entre 1y k.

El riesgo este tipo de muestreo está en los casos en que se dan periodicidadesen la población ya que al elegir a los miembros de la muestra con unaperiodicidad constante (k) podemos introducir una homogeneidad que no se daen la población. Imaginemos que estamos seleccionando una muestra sobrelistas de 10 individuos en los que los 5 primeros son varones y los 5 últimosmujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempreseleccionaríamos o sólo hombres o sólo mujeres, no podría haber unarepresentación de los dos sexos.

Page 11: Estimar con estadística v1

MuestreoAleatorioEstratificado

Trata de obviar las dificultades que presentan los anteriores ya que simplificanlos procesos y suelen reducir el error muestral para un tamaño dado de lamuestra. Consiste en considerar categorías típicas diferentes entre sí (estratos)que poseen gran homogeneidad respecto a alguna característica (se puedeestratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo,el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarsede que todos los estratos de interés estarán representados adecuadamente enla muestra. Cada estrato funciona independientemente, pudiendo aplicarsedentro de ellos el muestreo aleatorio simple o el estratificado para elegir loselementos concretos que formarán parte de la muestra. En ocasiones lasdificultades que plantean son demasiado grandes, pues exige un conocimientodetallado de la población. (Tamaño geográfico, sexos, edades,...).

Page 12: Estimar con estadística v1

Métodosdemuestreonoprobabilísticos

ØMuestreoporcuotasØMuestreointencionalodeconvenienciaØBoladenieveØMuestreoDiscrecional

Page 13: Estimar con estadística v1

Distribución MuestralEl estudio de determinadas características de una población se efectúa a través dediversas muestras que pueden extraerse de ella.

El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinitao finita. Una población finita en la que se efectúa muestreo con reposición puedeconsiderarse infinita teóricamente. También, a efectos prácticos, una población muy grandepuede considerarse como infinita. En todo nuestro estudio vamos a limitarnos a unapoblación de partida infinita o a muestreo con reposición.

Consideremos todas las posibles muestras de tamaño n en una población. Para cadamuestra podemos calcular un estadístico (media, desviación típica, proporción,...) quevariará de una a otra. Así obtenemos una distribución del estadístico que sellama distribución muestral.

Las dos medidas fundamentales de esta distribución son la media y la desviación típica,también denominada error típico.

Hay que hacer notar que si el tamaño de la muestra es lo suficientemente grande lasdistribuciones muestrales son normales y en esto se basarán todos los resultados quealcancemos.

http://recursostic.educacion.es/descartes

Page 14: Estimar con estadística v1

Distribución Muestral delaMEDIACada muestra de tamaño n que podemos extraer de una población proporciona unamedia. Si consideramos cada una de estas medias como valores de una variablealeatoria podemos estudiar su distribución que llamaremos distribución muestralde medias.

Si tenemos una población normal N(µ,σ) y extraemos deella muestras de tamaño n, la distribución muestral demedias sigue también una distribución normal

Si la población no sigue una distribución normal pero n>30, aplicando el llamado Teorema central del límite la distribución muestral de medias se aproxima también a la normal anterior.

𝑁 𝜇,𝜎𝑛

Page 15: Estimar con estadística v1

Distribución NormaldeProporcionesEn numerosas ocasiones se plantea estimar una proporción o porcentaje. En estoscasos la variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), esdecir sigue una distribución binomial y cuando la extensión de la población es grande ladistribución binomial B(n,p) se aproxima a la normal

Para muestras de tamaño n>30, la distribución muestral de proporciones sigue unadistribución normal

donde p es la proporción de uno de los valores quepresenta la variable estadística en la población y q=1-p.

Page 16: Estimar con estadística v1

Estimación porintervalos

Page 17: Estimar con estadística v1

ESTIMACIÓNDEPARÁMETROSEn una población cuya distribución es conocida pero desconocemos algún parámetro, podemosestimar dicho parámetro a partir de unamuestra representativa.

Un estimador es un valor que puede calcularse a partir de los datos muestrales y queproporciona información sobre el valor del parámetro. Por ejemplo la media muestral es unestimador de la media poblacional, la proporción observada en la muestra es un estimador de laproporción en la población.

Una estimación es puntual cuando se obtiene un sólo valor para el parámetro. Los estimadoresmás probables en este caso son los estadísticos obtenidos en la muestra, aunque es necesariocuantificar el riesgo que se asume al considerarlos. Recordemos que la distribuciónmuestral indica la distribución de los valores que tomará el estimador al seleccionar distintasmuestras de la población. Las dos medidas fundamentales de esta distribución son la media queindica el valor promedio del estimador y la desviación típica, también denominada error típicode estimación, que indica la desviación promedio que podemos esperar entre el estimador y elvalor del parámetro.

Page 18: Estimar con estadística v1

ESTIMACIÓNDEPARÁMETROSMás útil es la estimación por intervalos en la que calculamos dos valores entrelos que se encontrará el parámetro, con un nivel de confianza fijado deantemano.

Llamamos Intervalo de confianza al intervalo que con un cierto nivel deconfianza, contiene al parámetro que se está estimando.

Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga alverdadero valor del parámetro. Se indica por 1-α y habitualmente se da enporcentaje (1-α)100%. Hablamos de nivel de confianza y no de probabilidad yaque una vez extraída la muestra, el intervalo de confianza contendrá alverdadero valor del parámetro o no, lo que sabemos es que si repitiésemos elproceso con muchas muestras podríamos afirmar que el (1-α)% de los intervalosasí construidos contendríaal verdadero valor del parámetro.

Page 19: Estimar con estadística v1