COMPROBACION HIPOTESIS sept2013

download COMPROBACION HIPOTESIS sept2013

of 36

Transcript of COMPROBACION HIPOTESIS sept2013

Comprovacin de la hipotesis

Comprobacin de la hiptesis

LAS HIPTESIS INDICAN LO QUE ESTAMOS BUSCANDO O TRATANDO DE PROBAR, PUEDEN DEFINIRSE COMO EXLICACIONES TENTATIVAS DEL FENMENO INVESTIGADO FORMULADAS A MANERA DE PROPOSICIONES HiptesisRal Rojas Soriano seala que es aquella formulacin que se apoya en un sistema de conocimientos organizados y sistematizados que establece una relacin entre dos o mas variables para explicar los fenmenos que interesan al investigador

Jos Luis Lpez Cano dice, es una suposicin que permite establecer relaciones entre hechos. El valor de la hiptesis reside en su capacidad para establecer esas relaciones entre los hechos y de esa manera explicarnos por qu se produce.

Santiago Zorilla indica que es una conjetura o proposicin sujeta a comprobacin2

Cmo comprueba el investigador social el rechazo o la aceptacin de la hiptesis ? PREGUNTA DE INVESTIGACINQuin presenta una tasa de suicidios ms alta, los catlicos o los protestantes?

Cules estudiantes de la MDE, obtienen en el mdulo de EI, una evaluacin final mayor, los magister con formacin docente o los magister con formacin universitaria?

Son ms infieles los hombres o las mujeres del estado de Puebla, en funcin de la profesin que ejercen?

El ndice de cncer pulmonar es mayor entre los fumadores que entre los no fumadores?

Cada pregunta de investigacin implica hacer una comparacin entre dos gruposCLASIFICACIN DE LAS HIPTESISHIPTESIS DE INVESTIGACINHIPTESIS NULAHIPTEIS ALTERNATIVA HIPTESIS ESTADSTICA

Alcance del estudioEXPLORATORIO NO SE FORMULAN HIPTESIS

DESCRIPTIVOSLO SE FORMULAN HIPTESIS CUANDO SE PRONOSTICA UN HECHO O DATOCORRELACIONALSE FORMULAN HIPTESIS CORRELACIONALES Hiptesis que establecen la relacin entre las variables. Hiptesis que establecen la direccin de las variables.Hiptesis de diferencia de grupos Hiptesis que establecen la diferencia entre los grupos Hiptesis que establecen la direccin de las diferenciasHiptesis Causales Hiptesis bivariadas Hiptesis MultivariadasEXPLICATIVOSE FORMULAN HIPTESIS CAUSALES Hiptesis NulaEn el anlisis estadstico de los datos recolectados es convencional empezar con la comprobacin de la HIPTEIS NULA HoPlantea una hiptesis contraria a la nuestra(hiptesis nula). Esto se hace negando la HIPTESIS DE INVESTIGACIN HiLa Ho, sustenta que dos muestras han sido extradas de la misma poblacin EL CONTRASTE DE LA Ho y la Hi se realiza a travs de las diferencias entre dos o ms muestrasDe acuerdo con la Ho cualquier diferencia entre las muestras se considera un hecho casual resultante del error de muestreo

HIPTESIS DE TRABAJOHiSi rechazamos la Ho, aceptamos la Hi (hiptesis alterna)Hi plantea que s existe una verdadera diferencia poblacionalHi establece que las dos muestras se han tomado de la poblacin teniendo medias diferentesAfirma que la diferencia obtenida es demasiado grande como para ser explicada por el error de muestreoComprobacin de la diferencia de mediasCuando estamos comparando entre dos grupos (muestras)

No busca diferencia entre las medias de cada muestraHo U1 = U2

Hi u1 u2La media m1 es diferente de la media m2

Ho HoNO EXISTE NINGUNA DIFERENCIA EN LA TASA DE SUICIDIOS DE LOS CATLICOS Y LOS PROTESTANTES, S EXISTE ALGUNA DIFERENCIA SLO SE DEBE A UN ERROR DE MUESTREO

HoNO EXISTE NINGUNA DIFERENCIA EN LA EVALUACIN FINAL DEL MDULO DE EI DE LOS ESTUDIANTES DE LA MDE, CON RELACIN A LOS MAGISTER CON FORMACIN DOCENTE Y LOS MAGISTER CON FORMACIN UNIVERSITARIA, S EXISTE ALGUNA DIFERENCIA SLO SE DEBE A UN ERROR DE MUESTREO Anlisis entre mediasCuando hacemos la comparacin entre nuestras dos muestras nos interesa saber la diferencia que hay entre estasSe toma la media de una muestra de cada poblacin y se comparan siguiendo las formulas en su antologaDentro del anlisis de medias tenemos 4 casos:Comparacion entre 2 muestras igualesComparacion para muestras pequeasComparacin para muestras de diferente tamaoComparacin de la misma muestra medida 2 veces

PARA QUE ES TIL LA ESTADSTICA INFERENCIAL? Se pretende generalizar los resultados obtenidos de la muestra a la poblacin Qu es un parmetro?Qu es un estadgrafo?Los parmetros no son calculados , pero pueden ser inferidos de los estadgrafos de ah el nombre de estadstica inferencialSe utilizan dos procedimientos probar hiptesis Estimar parmetros

En que consiste la prueba de hiptesis Es determinar si la hiptesis es congruente con los datos obtenidos en la muestraNivel de significancia o nivel alfa : es el nivel de probabilidad de equivocarse y que fija de manera a priori el investigador para probar hiptesis Nivel de significancia de 0.05 implica un nivel de confianza de 95% de seguridad para generalizar sin equivocarseNivel de signoficancia de 0.01 implica un nivel de confianza de 99% en su favor y 1% en contra

Anlisis de medias o prueba de significancia de la diferencia entre medias Puntaje z y razn t Comprobacin de hiptesis acerca de diferencias de muestras con muestras mayores a 30, puntaje Z y muestras menores a 30 razn t

Prueba de hiptesis

Anlisis paramtrico r de Pearson mangos Silvia y AngiPrueba t (t de student)fresas Carmen y LilianaRazn F papayas Rafael y JulioVarianza pepinos Elvira, Mica, Jos y Concepcin

Anlisis no paramtricoJi o Chi Cuadradatodos los magister (si se atoran, no se preocupen me tienen en m un couch, pueden encontrar otros que hasta hoy han sido invisibles)

REQUISITOS PARA EL USO DEL PUNTAJE Z Y LA RAZN t (anlisis de medias)Se debe tener presente los siguientes requisitos al pensar en las caractersticas del puntaje Z o la razn t como una prueba de significancia:Una comparacin entre dos medias: el puntaje z y la razn t se emplean para poder hacer comparaciones entre dos medias de muestras independientes o de una sola muestra ordenadas en un diseo de panel antes-despus.Datos por intervalos: la suposicin consiste en que tenemos puntajes al nivel de medicin por intervalos. Por lo tanto, no podemos usar el puntaje z o la razn t para datos colocados por grados o datos que slo pueden categorizarse al nivel nominal de medicin (ver captulo 1).Muestreo aleatorio: debemos haber extrado nuestras muestras sobre una base aleatoria de una poblacin de puntajes.Una distribucin normal: la razn t para muestras pequeas requiere que la caracterstica de la muestra que hayamos medido est normalmente distribuida en la poblacin fundamental (el puntaje z para grandes muestras no se ve muy afectado si no se cumple esta condicin). A menudo, no podemos estar 100 por ciento seguros de que existe normalidad. Al no tener motivos para creer otra cosa, muchos investigadores suponen pragmticamente que su caracterstica muestral est normalmente distribuida. Sin embargo, si el investigador tiene motivos para sospechar que no se puede suponer normalidad, estar ms acertado si considera que la razn t puede ser una prueba inapropiada.Ejercicio grupal fresas y pepinos Los investigadores sociales buscaban comprobar la hiptesis de que la prensa clandestina no est ni ms ni menos orientada, hacia cuestiones sexuales, que la prensa de la clase media. Empleando un ndice de sexualidad, recogieron datos de una muestra aleatoria de 40 artculos publicados en revistas de la clase media y de 40 artculos de revistas clandestinas. Mientras que la muestra de clase media tena un puntaje medio de sexualidad de 3,0 y una desviacin estndar de 1,5 la muestra clandestina tena un puntaje medio de sexualidad de 4,0 y una desviacin estndar de 2,0 (los puntajes medios ms altos indican mayor sexualidad). Usando los datos anteriores, comprobar la hiptesis nula de que no existe ninguna diferencia con respecto a la sexualidad entre la prensa de clase media y la prensa clandestina. Qu indican sus resultados?

2.- Dos grupos de estudiantes tuvieron exmenes finales de estadstica. Slo se dio a un grupo la preparacin formal para el examen, el otro grupo ley el texto requerido, pero nunca asisti a clases. El primer grupo (que asisti a clases) logr calificaciones de 2,2,3,y 4 en el examen; el segundo grupo (que nunca asisti a clases) obtuvo calificaciones de examen de 1,1,2 y 3. Comprobar la hiptesis nula de que no existe ninguna diferencia en cuanto a calificaciones de examen entre los estudiantes que no asistieron a clases y los que asistieron. Qu indican sus resultados? (Nota: Los exmenes se calificaron de 1 a 10; las calificaciones ms altas representaban mejores conocimientos de estadstica).

Ejercicio grupal mangos y papayas

3.- Comprobar la significancia de la diferencia entre las medias de las siguientes muestras aleatorias de puntajes:

MUESTRA 1MUESTRA 2 8 1 3 5 1 8 7 3 7 2 6 1 8 2

RESOLVER DE MANERA INDIVIDUAL EN CASA PRODUCTO SESIN 34.- Comprobar la significancia de la diferencia entre las medias de las siguientes muestras aleatorias de puntajes

MUESTRA 1 MUESTRA 21212243232

5.- Comprobar la significancia de la diferencia antes-despus entre las medias en la siguiente muestra aleatoria de puntajes:

ESTUDIANTES ANTES DESPUES A73B64C5 2D43

Anlisis de varianzaNuestra tcnica anterior nos ayuda a hacer una comparacin entre 2 muestras, pero en nuestra investigacin nos encontraremos a menudo la necesidad de comparar mas de dos muestras

Para esto analizaremos los siguientes mtodosLa media cuadrtica(o varianza). Usando la razn o coeficiente FLa comparacin mltiple de medias. Por medio de la HSD de Tukey (honestly significant difference) diferencia significativa honesta

REQUISITOS PARA EL USO DE LA RAZN F(anlisis de varianza)El anlisis de varianza deber hacerse slo despus de que el investigador haya tomado en cuenta los siguientes requisitos:

1.- Una comparacin entre tres o ms medias independientes: la razn F se emplea usualmente para comparar tres o ms medias de muestras independientes. No se puede comparar una sola muestra colocada en un diseo de panel. Sin embargo, es posible obtener una razn F en lugar de una razn t cuando se hacen comparaciones entres dos muestras. Para el caso de dos muestras F = t y se obtienen resultados idnticos.2.- Los datos de intervalo: para realizar un anlisis de varianza suponemos que hemos logrado el nivel de medicin por intervalos. Preferentemente, no se usaran datos categorizados o colocados por rango.3.- El muestreo aleatorio: debimos haber tomado nuestras muestras aleatoriamente de una poblacin de puntajes.4.- Una distribucin normal: suponemos que la caracterstica muestral que medimos esta distribuida normalmente en la poblacin original.

PROBLEMAS 1.- Comprobar, en las siguientes muestras aleatorias de clases sociales, la hiptesis nula de que la sociabilidad no varia segn la clase social. (Nota: Los puntajes ms altos indican mayor sociabilidad).BAJA TRABAJADORA MEDIA ALTA 8765 4352 7251 88432.-Comprobar la significancia de las diferencias entre las medias de las siguientes muestras aleatorias de puntajes:MUESTRA 1MUESTRA 2MUESTRA 312636528757536113.- Comprobar la significancia de las diferencias entre las medias de las siguientes muestras aleatorias de puntajes:MUESTRA 1 MUESTRA 2 MUESTRA 3 MUESTRA 4 1346 1246 3225 4125 2534 1536

Pruebas no paramtricasHasta ahora las pruebas que hemos visto cubre los casos en que podemos hacer estudios paramtricos. Es decir que nuestra muestra se encuentra distribuida normalmente, y nuestros valores deben ser de tipo cardinales(un nivel de medicin por intervalos)Estudiaremos cada caso con sus correspondientes ejerciciosES IMPORTANTE DECIR QUE LA RIGIDEZ DE NUESTRA COMPROBACION DISMINUYE, ASI COMO LA RIGIDEZ DE LA HIPOTESIS NULA. POR LO TANTO STA YA NO HARA AFIRMACIONES BASADOS EN EL NUMERO DE CASOS SINO CATEGORIZANDOLOSChi cuadradaAhora tenemos la primera de nuestras pruebas no paramtricas.

En esta prueba lo que se compara es la diferencia que existe entre las frecuencias de nuestras muestras(2 diferentes) con datos nominales

REQUISITOS PARA EL USO DE LA JI O CHI CUADRADA1.- Una comparacin entre dos o ms muestras: como se describi e ilustr en el presente captulo, la prueba Chi cuadrada se emplea para hacer comparaciones entre dos o ms muestras independientes. Esto requiere que tengamos por lo menos una tabla 2 x 2 (por lo menos 2 renglones y 2 columnas). La suposicin de independencia indica que Chi cuadrada no puede aplicarse a una sola muestra colocada en un diseo de panel antes/despus. Deben obtenerse por lo menos dos muestras de entrevistados.2.- Los datos nominales: slo se requieren las frecuencias.3- El muestreo aleatorio: debimos haber extrado nuestras muestras aleatoriamente de una poblacin determinada.4- Las frecuencias esperadas por casilla no deben ser demasiado pequeas: el tamao exacto de fe depende de la naturaleza del problema. Para un problema 2 x 2, ninguna frecuencia esperada deber ser menor que 5. Adems, la frmula corregida de Yates deber usarse para un problema 2 x 2 en el cual una frecuencia esperada por casilla es menor que 10. para una situacin en la cual se estn comparando varios grupos (digamos un problema 3 x 3 o 4 x 5), no existe ninguna regla rpida y rgida respecto al mnimo de frecuencias por casilla, aunque debemos de tener cuidado de ver que pocas casillas contengan menos de 5 casos. En cualquier evento, las frecuencias esperadas para todas las casillas combinadas ( fe) deben ser siempre iguales a las frecuencias obtenidas para todas las casillas combinadas ( fo).

REQUISITOS PARA EL USO DE LA PRUEBA DE LA MEDIANA1.-Una comparacin entre dos o ms medianas independientes: la prueba de la mediana se emplea para hacer comparaciones entre dos o ms medianas de las muestras independientes.2-Los datos ordinales: para realizar la prueba de la mediana, suponemos por lo menos el nivel ordinal de medicin. Los datos nominales no se pueden usar.3-El muestreo aleatorio: debimos haber extrado nuestras muestras sobre una base aleatoria de una poblacin dada.

REQUISITOS PARA EL USO DEL ANLISI DE VARIANZAS EN DOS DIRECCIONES POR RANGOS DE FRIEMAN 1.-Una comparacin de una sola muestra medida bajo dos o ms condiciones: el procedimiento de Friedman no se puede aplicar para contrastar diferencias entre muestras independientes, sino que supone que la misma muestra de entrevistados se ha medido por lo menos dos veces (o que los miembros de dos o ms muestras se han comparando sobre variables apropiadas).2.-Los datos ordinales: slo se requieren datos que puedan colocarse por rangos.3.-El nmero de entrevistados no debe ser demasiado pequeo: el requisito mnimo exacto para N depende del nmero de condiciones (k) a las que se va a exponer a los entrevistados. Por ejemplo, N debe ser igual o mayor que 10 cuando k = 3; en tanto que N debe ser igual o mayor que 5 cuando k = 4.

REQUISITOS PARA EL USO DEL ANLISIS DE VARIANZA EN UNA DIRECCIN DE KRUSKAL WALLIS1.-Una comparacin de tres o ms muestras independientes: el anlisis de varianza en una direccin no se puede aplicar para contrastar diferencias dentro de una sola muestra de entrevistados que se midi ms de una vez.2.-Los datos ordinales: slo se requieren datos que puedan colocarse por rangos.3.-Cada muestra debe contener por lo menos 6 casos: cuando hay ms de 5 entrevistados en cada grupo, la significancia de H puede determinarse por medio del valor correspondiente de Chi cuadrada en la Tabla E. para comparar las diferentas entre muestras ms pequeas, recomendamos al lector las tablas especiales de Siegel (1956).

PROBLEMAS 1.- Realizar una prueba de significancia Chi cuadrada aplicando la correccin de Yates al siguiente problema 2 x 2.

Realizar una prueba de significancia Chi cuadrada aplicando la correccin de Yates al siguiente problema 2 x 2.8167112.- Realizar una prueba de significancia Chi cuadrada para el siguiente problema 2 x 3:

81015121093.- Aplicando la prueba de la mediana, determinar si existe una diferencia significativa entre las medianas de las siguientes muestras de puntajes:X1X2794897375326922783679448775994479546649234.- Aplicando el anlisis de varianza en dos direcciones por rangos de Friedman, determinar si existe una diferencia significativa entre los puntajes de los tiempos 1, 2 y 3 de la siguiente muestra de 11 entrevistados:

Entrevistado Tiempo 1 Tiempo 2 Tiempo 3A606264B535450C596571D656668E556361F717476G575863H777679I636570J545962K636265

5.- Los investigadores probaron la alineacin poltica entre muestras de estudiantes que se especializan en artes liberales, ingeniera y bellas artes. Se obtuvieron los siguientes resultados por muestra (los puntajes ms altos indican mayor alineacin):

X1(liberales)(Artes X2(ingenieria )X3 (bellas artes)10010197110909895929993100100106901041029610392