La estadística aplicada en la elaboración de una tesis aplicando el método correlacional
Click here to load reader
-
Upload
juanchojuancho -
Category
Education
-
view
7.571 -
download
2
Transcript of La estadística aplicada en la elaboración de una tesis aplicando el método correlacional
Desarrollado por jfgt , desarrollado por jfgt, desarrollado por jfgt
Estadística aplicada en la elaboración de una tesis empleando
el método correlacional.
Plantear un problema de investigación , significa orientar previamente la correcta formulación de los objetivos e hipótesis, diseñar los instrumentos para recolectar la información , establecer las técnicas y los procesos metodológicos a utilizarse.. En la recolección de la información uno de los factores que contribuye al investigador para demostrar sus hipótesis y sustentar su tesis es la Estadística que se refiere a datos estadísticos obtenidos en un determinado período de tiempo y que explican las características cuantitativas de los fenómenos investigados..
• La necesidad de saber el método a aplicar para tal o cual desarrollo de una
tesis hace para muchos tesistas un factor prácticamente difícil de resolver.
Razones? Muchas, desde un cabal desconocimiento de la estadística hasta un
conocimiento poco sólido sobre el mismo.
• Si se recurre a la bibliografía, se puede encontrar una variedad de autores
mayormente con conocimientos estadísticos “ puristas” que utilizan términos
estadísticos difíciles de entender para un principiante.
• Bajo el enfoque cuantitativo las hipótesis de investigación se clasifican :
- Hipótesis que establecen
simplemente relación Bibariadas
Hipótesis correlacionales entre las variables Multivariadas
- Hipótesis que establecen
Cómo es la relación Bibariadas
Entre las variables
( hipótesis direccionales) Multivariadas.
• Veamos : si Ud. Plantea un problema de investigación cuantitativa. Es decir,
los objetivos que persigue la investigación, las preguntas de investigación, la
justificación de la investigación, viabilidad del estudio y la valuación de las
deficiencias en el conocimiento del problema. 1 . Generalmente proponen
relaciones entre variables con la finalidad de arribar a proposiciones precisas
y hacer recomendaciones. Según M.A. Rothery ( Grinnell 1977) se fundamenta
en el método hipotético – deductivo, considerando las siguientes premisas:
- se delinea teorías y de ellas se deriva hipótesis
1
Desarrollado por jfgt , desarrollado por jfgt, desarrollado por jfgt
( 1 ) Hernández, Fernández y Baptista (2010) metodología de la investigación p.87
- Las hipótesis se someten a prueba utilizando los diseños de
investigación apropiados.
- Si los resultados corroboran las hipótesis o son consistentes con éstas, se
aporta evidencia en su favor. Si se refutan, se descartan en busca de
mejores explicaciones e hipótesis.
En los estudios cuantitativos se establecen una o varias hipótesis.
Centrémonos ahora en las hipótesis. Como se sabe, una hipótesis por lo
general surgen de los objetivos y las preguntas de investigación ( como resultado del
planteamiento del problema) aquí surge el problema que son difíciles de resolver
para algunos tesistas. Pues bien, veamos :
• Las hipótesis correlacionales. Se caracterizan por la asociación entre dos
variables ( X --- Y ), asocia variables mediante un patrón predecible para un
grupo o población.
Frases como :
- A mayor exposición por parte de los adolescentes al Internet con alto
contenido sexual, aumenta las tasa de natalidad.
- A mayor motivación intrínseca mayor compromiso del personal
- El incremento del vandalismo en Lima se relaciona con la escasez de
puestos de trabajo.
- A mayor educación existe mayores posibilidades de encontrar un
puesto de trabajo bien remunerado.
- El incremento en la venta de autos en Bs.Aires aumenta la
contaminación ambiental.
La existencia de dos variables y su asociación en todas los ejemplos de hipótesis
formuladas líneas arriba establece no sólo una relación son también cómo es la
relación. Es conveniente indicar que las hipótesis de correlación , el orden en que
colocamos las variables no es importante ( del ejemplo anterior : - la escasez de
puestos de trabajo se relaciona con el incremento del vandalismo en Lima ).
Lo que se trata es de demostrar que la hipótesis que se formula se comprueba
con los datos reales que vamos a obtener. Para ello existe :
2
Desarrollado por jfgt , desarrollado por jfgt, desarrollado por jfgt
- Elaboración de un instrumento para medir ( cuestionario o entrevistas) o
- aplicación de un cuestionario o prueba diseñada en otro contexto, será necesario
adaptarla y aplicar pruebas piloto para calcular su validez y confiabilidad 2
Una vez que ha considerado los dos aspectos anteriores. Nos interesa la aplicación
del instrumento. ¿ Que hacemos?. Como va a medir variables, recurrimos a la
estadística ( que nos permite clasificar, calcular, analizar y resumir información
numérica que se obtiene de manera sistemática) cuenta con métodos para conocer
esas variables.
1.- se trata de un estudio cuantitativo descriptivo correlacional, se consideran ( por lo
general) el método paramétrico regresión lineal y el coeficiente de correlación de
Pearson.
Por lo tanto, las hipótesis formuladas deben de coincidir con estos métodos. Las
variables deben estar dirigidos a este fin. Ejemplo.
H1 :El incremento del vandalismo en Lima se relaciona con la escasez de
puestos de trabajo.
Las variables serán :
Variable Independiente : vandalismo en Lima
Variable dependiente : puestos de trabajo
2.- La operacionalización de variables, permitirá conocer como se va a medir cada
una de las variables. Del ejemplo anterior.
Variable : vandalismo en Lima ( contar con datos estadísticos sobre el tema,
estudios realizados, por las universidades, datos estadísticos que arroja la policía de
manera periódica.)
Variable : puestos de Trabajo ( datos estadísticos que emiten el ministerio de
trabajo, el instituto nacional de estadística, el gremio empresarial, libros que tratan
sobre el tema )
Otro ejemplo :
Variable : clima organizacional ( Cuestionario multidimensional de …)
Variable : satisfacción ( cuestionario multidimensional administrado de…)
Como se puede observar, con el método correlacional y un manejo estadístico va
a admitir conocer la relación existente entre las dos variables y su tipo de relación,
que nos permitirá dar respuesta a las hipótesis planteadas.
3
Desarrollado por jfgt , desarrollado por jfgt, desarrollado por jfgt
( 2 ) Idem p. 435.
3.- Población o muestra, Seleccionar una muestra significa relacionarla con las
técnicas estadísticas a utilizar, con los instrumentos para la recolección de los datos.
De acuerdo a su Plan Ud. a considerado la población a encuestar ( es
recomendable que los estudios motivacionales , se considere a toda la población
( empleados si es una empresa) para evitar que los excluidos piensen que su opinión
no se toma en cuenta. Es recomendable recurrir a la literatura para hallar la
muestra probalistica, ahora existen manuales, programas estadísticos ( SPSS, STATS)
e inclusive on line para hallar la muestra.
Para una muestra probalistica se necesita dos cosas.
3. 1.- El tamaño de la muestra.
3. 2.- Seleccionar los elementos muestrales , de manera que todos tengan la
misma posibilidad de ser elegidos.( procedimiento de selección)
Si ya conoce el tamaño de la muestra ( la cantidad de personas a encuestar o
entrevistar) y, el lugar donde realizara la encuesta es una organización que cuenta
con categorías como :
Técnicos, empleados administrativos, obreros etc. ( procedimiento de selección ) la
muestra se complica porque tiene que saber a cuantos técnicos o empleados va a
encuestar del total. (ver muestra probalistica estratificada) Todo depende de cómo a
planteado sus objetivos e hipótesis. Puede darse el caso que para su estudio, considere
una muestra probalistica simple, que se caracteriza por que cualquier persona
( técnico, administrativo, obrero) tiene la misma posibilidad de ser elegidos. entonces
puede obviar las categorías.
Como vemos en el enfoque cuantitativo ( como es éste el caso) el proceso de
selección es muy importante , si bien sabemos que los elementos se eligen
aleatoriamente ¿ como se hace? Existe varios métodos, a saber :
- tómbola
- Números aleatorios
- Selección sistemática de elementos muestrales.
(Si se quiere profundizar más al respecto, revisar literatura estadística)
Pues bien, hasta este punto ya se cuenta con la cantidad de personas a encuestar y
la manera de selección.
4.- Trabajo de campo, los instrumentos y técnicas de investigación, como vemos en
la parte 2 cuando se hace la operacionalización de variables contamos con
4
Desarrollado por jfgt , desarrollado por jfgt, desarrollado por jfgt
cuestionarios, elaborados por expertos o desarrollados por el investigador. Ahora es
cuando se utiliza el instrumento ( cuestionario) que le va a servir para recabar los
datos “reales” (que le permitirán contrastar su hipótesis planteada en su
investigación y la obtenida en el campo). Es redundante señalar los pasos que se debe
realizar para diseñar un cuestionario y los requisitos que debe cumplir ( validez y
confiabilidad) , si no se ha familiarizado con este tema, revise literatura como,
metodología de la investigación, o libros de estadística / manuales.
Además, la técnica es mediante la encuesta.
5.- Recolección de datos. Se hace mediante el cuestionario En este caso
( correlacional) considerando que generalmente lo que se mide son actitudes,
existe 3 métodos, a saber: escalamiento tipo Likert, el diferencial semántico
y la escala de Guttman.
La más conocida es el método tipo likert, que se caracteriza porque no son
preguntas, sino afirmaciones ( positivas y negativas). La forma, construcción y
puntuaciones esta en cualquier libro de estadística de CC.SS. o “metodología de la
investigación” ( Sampieri). Conocido lo anterior, Ud. Debe saber previamente algo
mas, Los estudios correlacionales cuantitativos se caracterizan porque miden cada
variable y su grado de relación o asociación entre ellas.
No debe olvidar que, la recolección de datos implica:
- Seleccionar el instrumento o método de recolección de los datos
- Aplicar ese instrumento o método para recolectar datos.
- Preparar observaciones, registros y mediciones obtenidas.
El instrumento de medición debidamente validado, diseñado para medir
actitudes ( predisposición aprendida para responder de manera favorable o
desfavorable ante un objeto o símbolo)
5.- Una vez que los datos se han codificado, transferido a una matriz y guardado en
un archivo se procede a analizarlo. El análisis de los datos (en este caso análisis
cuantitativo) depende de factores como :
- el nivel de medición de las variables.
- La manera como se haya formulado la hipótesis
- El interés del investigador
5
Desarrollado por jfgt , desarrollado por jfgt, desarrollado por jfgt
Se busca describir sus datos y posteriormente efectuar análisis estadísticos para
relacionar sus variables. La estadística descriptiva ( ver literatura) permite describir
los datos , los valores o las puntuaciones obtenidos para cada variable.
a) uno de ellos es la distribución de frecuencias , especialmente cuando se utliliza
la frecuencia relativa puede presentarse en forma de histograma o gráficas de otro
tipo.
Por ejemplo:
- la distribución de frecuencias : mediante los intervalos obtenidos como :
muy favorable, favorable, neutral, desacuerdo, totalmente en
desacuerdo ( característica del método likert), Ud. Contabiliza a todos
sus encuestados ( valores del 1 al 5 ) si encuestó a 20 personas
4 respondieron ---- muy favorable ( 5)
2 “ favorable ( 4)
5 “ neutral ( 3)
6 “ desacuerdo ( 2)
3 “ totalmente en desacuerdo ( 1 )
Si aplica el histograma , puede colocar en la columna (Y ) los porcentajes de las
personas que respondieron la afirmación. En la horizontal ( X) se colocan las
categorías o los intervalos. Del ejemplo anterior podemos inferir que :
6/ 20 x 100 = 30% de encuestados están en desacuerdo.
También se puede usar las gráficas circulares , expresados en porcentajes
para cada afirmación. La que le permitirá hacer un análisis descriptivo en cada
afirmación.
Ejemplo :
La variable : Vandalismo en Lima ( se ha hecho 6 afirmaciones escala
tipo likert) con 20 encuestados.
Se realiza el histograma o la grafica circular. Luego se añade ( del ejemplo anterior)
. El 30% de los encuestados esta en desacuerdo, el 20% esta muy de acuerdo,
el 10% muestra una actitud favorable, el 15% calificó de manera muy desfavorable ..
b) Si Ud, cree necesario ( según su análisis) puede recurrir las medidas de
tendencia central ( moda, mediana, promedio) , Es común usar el promedio ( la
cantidad de afirmaciones realizadas en el cuestionario con la cantidad de
participantes que respondieron dicha afirmación) del ejemplo anterior:
6
Desarrollado por jfgt , desarrollado por jfgt, desarrollado por jfgt
- De la primera afirmación se obtuvo ( de los 20 participantes)
4+3+5+2+5+3+2+1+2+3+4+4+5+3+1+1+2+3+1+2 = 2.9 promedio
. se añade frases como: La actitud muestra una inclinación desfavorable ,
en promedio, los encuestados se ubican en 2.9 ( desfavorable)
Nota : se puede añadir la moda y mediana en dicha INTERPRETACIÓN
DESCRIPTIVA. ( revisar : metodología de la Investigación – F.H y Baptista) la forma de
obtener las puntuaciones en la escala de Likert se suman los valores alcanzados con
respecto a cada frase ( afirmación) y se divide entre el número de frases
(afirmaciones) del cuestionario.
( * ) Como en el caso de frecuencias, Ud. puede hacer un análisis descriptivo de cada
frase o afirmación.
¡ IMPORTANTE! Si el instrumento esta constituido por dimensiones el promedio será
: la suma de los valores promedio de cada dimensión y dividirlos entre la cantidad
de dimensiones. ( usar Excel o SPSS)
Una vez obtenido los promedios, como resultados de aplicar su cuestionario. Existe
dos procedimientos para dar respuesta a sus hipótesis. Dependiendo de la
cantidad de variables.
• Análisis de regresión lineal, En un análisis de regresión (aplicado en la
correlación) el primer paso que hay que efectuar es la representación grafica
de la nube definida por las parejas de valores de X e Y ( BIVARIADAS) . Así,
se podrá tener una idea geométrica de la intensidad de la asociación entre las
variables que se estén estudiando y, en caso de un análisis de regresión, sí hay
una relación causa-efecto significativa entre las variables
• se utilizan también en el método correlacional, porque estima el efecto de
una variable sobre la otra . ejemplo.
H 1 = Existe una relación positiva y significativa entre la educación y
posibilidades de encontrar un puesto de trabajo bien remunerado.
Se encuentra un valor correlacional “ r “ conocido como coeficiente de
Pearson ( aplicable para variables relacionadas de manera lineal) su
interpretación es importante.
Este modelo matemático es : Y = aX + b
7
Desarrollado por jfgt , desarrollado por jfgt, desarrollado por jfgt
Así, se puede ver si la pendiente (la tendencia) de la línea es ascendente o
descendente.
Lo que nos indica esta ecuación es : la variación de X término independiente
( educación , según el resultado del instrumento aplicado) variará Y término
dependiente ( posibilidades de encontrar un puesto de trabajo bien remunerado)
El valor “ r2 “ expresa ( para muchos investigadores) el grado de asociación
entre las dos variables ( ver bibliografía al respecto) en términos porcentuales.
* Si en sus hipótesis ha planteado temas como el Clima laboral, compromiso
organizacional etc. que esta conformado por dimensiones y le es preciso conocer
cada una de los componentes de X con relación a las de Y. o también utiliza más de
dos variables haga uso de la matriz de correlaciones de Pearson ( el más usado
para hallar las correlaciones) cuyos resultados le permitirán interpretar el grado de
correlación.
X ---- Y ----- Z ( MULTIVARIADAS)
6.- Resultados: se lleva a cabo la contrastación de hipótesis.
Volvamos al ejemplo anterior, H1 = Existe una relación positiva y significativa
entre una mejor educación y posibilidades de encontrar un puesto de trabajo bien
remunerado. Se analiza los resultados obtenidos en el gráfico y se concluye y se
acepta o no la hipótesis planteada por el tesista. para lo cual se debe considerar un
factor importante Dentro de una hipótesis es frecuente utilizar el grado de
significación.( *) que si usa el SPSS o el Excel de manera automática se obtiene
el valor “ r”.
Veamos : si la recta obtenida en el grafico es positiva , es factible considerar que a
mayor educación existe mayores posibilidades de encontrar un puesto de trabajo…
porque tanto el valor X como Y varían de manera positiva. Ahora es significativa?
Para ello Ud, tiene que tener pleno conocimiento sobre el tema. sin embargo, aquí
algunos apuntes al respecto.
(*) El grado de significación, es el nivel de confianza , es habitual encontrar el 0,05 ó 0,01
, por lo general se interpreta que “ dado un experimento que se repite 100 veces, existe la
posibilidad de encontrar el valor de “ r” en 95 veces o 99 veces.” Porque se considera
significativo? A menor error, es poco probable que se presente el error tipo I y II. ( que
8
Desarrollado por jfgt , desarrollado por jfgt, desarrollado por jfgt
corresponde análisis estadístico de hipótesis) consiste en el riesgo de equivocarnos al
rechazar la hipótesis nula. Porque no existe la confianza absoluta que nuestras
proposiciones son verdaderas. Por lo tanto, existe la posibilidad que 5 veces o 1 vez
cometamos el error de no encontrar “r” y por lo tanto no consideremos la hipótesis
verdadera y optemos alguna otra ( ver literatura al respecto) eso lo hace significativo ( para
algunos investigadores) menor porcentaje menor riesgo de equivocarse. Pero no indica que exista una asociación entre las dos variables.
Un valor elevado del coeficiente de correlación será casi siempre significativo (a no ser que
n fuese muy pequeña), pero un coeficiente bajo (por ejemplo; 0,3) también puede serlo
(cuando n es muy grande).
Es el valor de r el que indicará si la asociación lineal es importante. Se considera que
esto es lo que ocurre si r < 0,7 , si r está comprendida entre 0,5 y 0,7 hay una asociación
moderada; entre 0,25 y 0,5 la asociación es débil y, por debajo de 0,25no se puede considerar que haya asociación. ¡ Y todo ello, independientemente de que el
valor de p asociado a la r sea inferior a 0,05 !
Por lo expuesto, es necesario tener un conocimiento pleno al respecto para evitar
dudas o mal interpretaciones , es recomendable leer manuales de estadística o revisar
tesis que utilicen dichos valores.
Bien, una vez que interpretó la recta como corresponde (que sea positiva) .
Asimismo, el grado de significación ( si el valor obtenido es significativo ). Si ambas
variables cumplen de acuerdo a la hipótesis formulada, entonces Ud. esta en el cabal
conocimiento de afirmar su hipótesis; si uno o ambos valores no cumplen, entonces
rechaza la hipótesis que formuló en su tesis, y considere la hipótesis NULA H0 = No
existe una relación positiva y significativa entre una mejor educación y
posibilidades de encontrar un puesto de trabajo bien remunerado.
Es menester señalar la existencia de la “ rs “ Spearman , el procedimiento e
interpretación es similar a la de Pearson , pero se opta por la “rs “ de Spearman
cuando:
- las variables son ordinales, los individuos u objetos pueden ordenarse
por rangos ( jerarquías). Ejemplo, el sabor y el envase de un producto
cualquiera , puede ordenarse de mayor a menor. La inteligencia y la
aptitud de mando. Etc.
Obtenido los resultados “ reales” , se realiza la contrastación de hipótesis donde
la Hipótesis que Ud. planteó en su investigación como producto de un buen sustento
teórico y lo obtenido en la práctica, razón por la cual le permitirá aceptar o no dicha
9
Desarrollado por jfgt , desarrollado por jfgt, desarrollado por jfgt
hipótesis planteada. Asimismo, le servirá para desarrollar las conclusiones y
recomendaciones que diera lugar.
10