jose martinez
-
Upload
alejandro-martinez -
Category
Presentations & Public Speaking
-
view
191 -
download
0
Transcript of jose martinez
COEFICIENTES DE CORRELACION DE
PEARSON Y DE SPEARMAN
REPÚBLICA BOLIVARIANA DE VENEZUELAINSTITUTO UNIVERSITARIO POLITÉCNICO
“SANTIAGO MARIÑO”EXTENSIÓN BARCELONA
Autor: Martínez José Alejandro
Barcelona, Febrero de 2016
COEFICIENTES DE CORRELACION DE PEARSON
El coeficiente de correlación de Pearson, pensado para variables cuantitativas (escala mínima de intervalo), es un índice que se utiliza para medir el grado de covariación entre distintas variables relacionadas linealmente.
Tiene como objetivo medir la fuerza o grado de asociación entre dos variables aleatorias cuantitativas que poseen una distribución normal bivariada conjunta.
COEFICIENTES DE CORRELACION DE PEARSON
El coeficiente de Pearson (también llamado coeficiente de correlación del producto-momento), se representa con el símbolo ‘r’ y proporciona una medida numérica de la correlación entre dos variables. El coeficiente se define por la siguiente fórmula:
Donde:r = coeficiente de correlación de Pearson.∑xy = sumatoria de los productos de ambas variables.∑ x = sumatoria de los valores de la variable independiente.∑ y = sumatoria de los valores de la variable dependiente.∑ x2 = sumatoria de los valores al cuadrado de la variable independiente.∑ y2 = sumatoria de los valores al cuadrado de la variable dependiente.N = tamaño de la muestra en función de parejas.
COEFICIENTES DE CORRELACION DE PEARSON
INTERPRETACION.
El coeficiente de correlación de Pearson (r) se mide en una escala de 0 a 1, tanto en dirección positiva como negativa. Un valor de “0” indica que no hay relación lineal entre las variables. Un valor de “1” o “–1” indica, respectivamente, una correlación positiva perfecta o negativa perfecta entre dos variables. Normalmente, el valor de se ubicará en alguna parte entre 0 y 1 o entre 0 y –1.
COEFICIENTES DE CORRELACION DE PEARSON
Un coeficiente de correlación se dice que es significativo si se puede afirmar, con una cierta probabilidad, que es diferente de cero. Más estrictamente, en términos estadísticos, preguntarse por la significación de un cierto coeficiente de correlación no es otra cosa que preguntarse por la probabilidad de que tal coeficiente proceda de una población cuyo valor sea de cero. A este respecto, como siempre, tendremos dos hipótesis posibles:
H0: rxy = 0 El coeficiente de correlación obtenido procede de una población ⇒cuya correlación es cero ( ρ = 0 ).
H1: rxy = 0 El coeficiente de correlación obtenido procede de una población ⇒cuyo coeficiente de correlación es distinto de cero ( 0 ρ ≠ ).
VENTAJAS Y DESVENTAJAS DE LOS COEFICIENTES DE CORRELACION DE
PEARSON
VENTAJAS:
• Es un índice de fácil ejecución e, igualmente, de fácil interpretación.
• Sus valores absolutos oscilan entre 0 y 1.• Es apropiada para examinar la relación entre datos cuantificables
significativos. • Es independiente de la escala de medidas de las variables• Brinda piezas vitales de información y determina si la relación es
positiva o negativa • Mientras mas grande sea la muestra mas exacta será la
estimación.
• Requiere que las dos variables hayan sido medidas hasta un nivel cuantitativo continuo y que la distribución de ambas sea semejante a la de la curva normal.
• Cuando las variables X y Y son independientes, el numerador se anula y el coeficiente de correlación poblacional tiene el valor cero.
• El valor 0 representa falta de correlación
DESVENTAJAS:
USOS DE ENFOQUES PEARSON EN PROBLEMAS ESTADISTICOS
PASOS.
• Ordenar los valores de la variable dependiente (Y) con respecto a los valores de la variable independiente (X).
• Elevar al cuadrado cada valor X y de Y.• Obtener los productos de X y Y, para lo cual se deben multiplicar
independientemente ambos valores.• Efectuar las sumatorias ∑x, ∑ y, ∑ x2, ∑ y2, y ∑ xy.• Calcular el tamaño de la muestra en función de parejas de X y Y.• Aplicar la ecuación.• Calcular los grados de libertad (gl): gl = N parejas -1.• Comparar el valor de r calculado en la tabla de valores críticos de t de Kendall en
función de la probabilidad.• Decidir si se acepta o rechaza la hipótesis.
Ejemplo:Elección de la prueba estadística para medir la asociación o correlación. Las edades en días están en escala de tipo intervalo, tenemos dos variables, entonces aplicamos esta prueba.
Objetivo: Conocer que grado de asociación existe entre la edad y peso corporal de niños de edades desde el nacimiento hasta los 6 meses.
Hipótesis:Ha. Entre las observaciones de edad de los niños y peso corporal existe correlación significativa.Ho. Entre las observaciones de edad de los niños y pero corporal no existe correlación significativa.
gl = 21 - 2 = 19 = 0.05
rc = 0.91rt = 0.444rc > rt : se rechaza Ho. Entre las variables edad del niño y el peso corporal existe una correlación muy significativa. Elevando r al cuadrado obtenemos el error existente r2 = 0.8281 = 0.83, donde el 83% de los cambios observados en el peso de los niños se debe a los incrementos de la edad, sin embargo, el 17% se ignora..
COEFICIENTES DE CORRELACION DE SPEARMAN
El coeficiente de correlación de Spearman (rs) es un coeficiente no paramétrico alternativo al coeficiente de correlación de Pearson cuando este no cumple los supuestos . Charles Spearman contribuyó al análisis del factor, a la teoría de la inteligencia, elaboró una prueba de la teoría mental. Se define el coeficiente de correlación de rangos de Spearman como el coeficiente de correlación lineal.
Permite identificar si dos variables se relacionan en una función monótona (es decir, cuando un número aumenta, el otro también o viceversa). Se emplea cuando una o ambas escalas de medidas de las variables son ordinales.
COEFICIENTES DE CORRELACION DE SPEARMAN
El coeficiente de correlación de Spearman se rige por las reglas de la correlación simple de Pearson, y las mediciones de este índice corresponden de + 1 a - 1, pasando por el cero, donde este último significa no correlación entre las variables estudiadas, mientras que los dos primeros denotan la correlación máxima.
La ecuación utilizada en este procedimiento, cuando en el ordenamiento de los rangos de las observaciones no hay datos empatados o ligados, es la siguiente:
Donde:rs = coeficiente de correlación de Spearman.d2 = diferencias existentes entre los rangos de las dos variables, elevadas al cuadrado.N = tamaño de la muestra expresada en parejas de rangos de las variables.∑ = sumatoria.
VENTAJAS Y DESVENTAJAS DE LOS COEFICIENTES DE CORRELACION DE
SPEARMAN
VENTAJAS:
• Al ser una técnica no paramétrica es libre de distribución probabilística
• Los supuestos son menos estrictos. • Permite ciertos desvíos del patrón normal. La manifestación de
una relación causa-efecto es posible sólo a través de la comprensión de la relación natural que existe entre las variables y no debe manifestarse sólo por la existencia de una fuerte correlación
• No está afectada por los cambios en las unidades de medida.• Su cálculo es muy sencillo.
• El coeficiente de correlación no debe utilizarse para comparar dos métodos que intentan medir el mismo evento.
• El coeficiente de correlación mide el grado de asociación entre dos cantidades, pero no mira el nivel de acuerdo o concordancia.
• El coeficiente de correlación de Spearman es recomendable utilizarlo cuando los datos presentan valores extremos, ya que dichos valores afectan mucho el coeficiente de correlación de Pearson, o ante distribuciones no normales.
DESVENTAJAS:
USOS DE ENFOQUES SPEARMAN EN PROBLEMAS ESTADISTICOS
PASOS.
• Clasificar en rangos cada medición de las observaciones.• Obtener las diferencias de las parejas de rangos de las variables estudiadas y
elevadas al cuadrado.• Efectuar la sumatoria de todas las diferencias al cuadrado.• Aplicar la ecuación.• Calcular los grados de libertad (gl). gl = número de parejas - 1. Solo se utilizará
cuando la muestra sea mayor a 10.• Comparar el valor r calculado con respecto a los valores críticos de la tabla de
valores críticos de t de Kendall en función de probabilidad.• Decidir si se acepta o rechaza la hipótesis.
La función de la correlación de Spearman es determinar si existe una relación lineal entre dos variables a nivel ordinal y que esta relación no sea debida al azar; es decir, que la relación sea estadísticamente significativa. Si una de las variables es intercalar y la otra ordinal también se utiliza Spearman.
La mayoría de los estadísticos actuales confluye en el siguiente algoritmo de trabajo: Los valores de los rangos se colocan según el orden numérico de los datos de la variable. Por ejemplo, si tenemos las siguientes variables:
TALLA PESO
1,68 68
1,89 70
1,75 80
1,56 45
1,48 48
Al convertirlas en una escala ordinal, obtendríamos los resultados:
TALLA PESO3 3
5 4
4 5
2 1
1 2
El primer valor de talla (en este caso 1,68) se convierte en 3, porque el 1,68 es el tercer valor más pequeño de la talla. El valor en peso de 45 se convierte en 1, porque es el menor. Luego se calculan las diferencias de rangos:
X Y d = x-y d2 = (x-y) 2
3 3 0 0
5 4 1 1
4 5 -1 1
2 1 1 1
1 2 -1 1
∑d2 =4
Sustituyendo :
Interpretación: En la muestra observada los valores de talla y peso tienen una correlación entre fuerte y perfecta, lo que se traduce que en la medida que aumentan los valores de la talla también aumentan los del peso y viceversa.
BIBLIOGRAFIA
• http://www.cca.org.mx/cca/cursos/estadistica/html/m14/coef_pearson.htm
• http://www.ray-design.com.mx/psicoparaest/index.php?option=com_content&view=article&id=256:coeficiente-pearson&catid=54:coeficiente-correla&Itemid=75
• http://personal.us.es/vararey/adatos2/correlacion.pdf
• http://www.monografias.com/trabajos85/coeficiente-correlacion-rangos-spearman/coeficiente-correlacion-rangos-spearman.shtml#ixzz3zYD5EakN
• http://www.ray-design.com.mx/psicoparaest/index.php?option=com_content&view=article&id=253:coeficiente-spearman&catid=54:coeficiente-correla&Itemid=75
• http://rccp.udea.edu.co/index.php/ojs/article/viewFile/274/271