jose martinez

17
COEFICIENTES DE CORRELACION DE PEARSON Y DE SPEARMAN REPÚBLICA BOLIVARIANA DE VENEZUELA INSTITUTO UNIVERSITARIO POLITÉCNICO “SANTIAGO MARIÑO” EXTENSIÓN BARCELONA Autor: Martínez José Alejandro Barcelona, Febrero de 2016

Transcript of jose martinez

Page 1: jose martinez

COEFICIENTES DE CORRELACION DE

PEARSON Y DE SPEARMAN

REPÚBLICA BOLIVARIANA DE VENEZUELAINSTITUTO UNIVERSITARIO POLITÉCNICO

“SANTIAGO MARIÑO”EXTENSIÓN BARCELONA

Autor: Martínez José Alejandro

Barcelona, Febrero de 2016

Page 2: jose martinez

COEFICIENTES DE CORRELACION DE PEARSON

El coeficiente de correlación de Pearson, pensado para variables cuantitativas (escala mínima de intervalo), es un índice que se utiliza para medir el grado de covariación entre distintas variables relacionadas linealmente.

Tiene como objetivo medir la fuerza o grado de asociación entre dos variables aleatorias cuantitativas que poseen una distribución normal bivariada conjunta.

Page 3: jose martinez

COEFICIENTES DE CORRELACION DE PEARSON

El coeficiente de Pearson (también llamado coeficiente de correlación del producto-momento), se representa con el símbolo ‘r’ y proporciona una medida numérica de la correlación entre dos variables. El coeficiente se define por la siguiente fórmula:

Donde:r = coeficiente de correlación de Pearson.∑xy = sumatoria de los productos de ambas variables.∑ x = sumatoria de los valores de la variable independiente.∑ y = sumatoria de los valores de la variable dependiente.∑ x2 = sumatoria de los valores al cuadrado de la variable independiente.∑ y2 = sumatoria de los valores al cuadrado de la variable dependiente.N = tamaño de la muestra en función de parejas.

Page 4: jose martinez

COEFICIENTES DE CORRELACION DE PEARSON

INTERPRETACION.

El coeficiente de correlación de Pearson (r) se mide en una escala de 0 a 1, tanto en dirección positiva como negativa. Un valor de “0” indica que no hay relación lineal entre las variables. Un valor de “1” o “–1” indica, respectivamente, una correlación positiva perfecta o negativa perfecta entre dos variables. Normalmente, el valor de se ubicará en alguna parte entre 0 y 1 o entre 0 y –1.

Page 5: jose martinez

COEFICIENTES DE CORRELACION DE PEARSON

Un coeficiente de correlación se dice que es significativo si se puede afirmar, con una cierta probabilidad, que es diferente de cero. Más estrictamente, en términos estadísticos, preguntarse por la significación de un cierto coeficiente de correlación no es otra cosa que preguntarse por la probabilidad de que tal coeficiente proceda de una población cuyo valor sea de cero. A este respecto, como siempre, tendremos dos hipótesis posibles:

H0: rxy = 0 El coeficiente de correlación obtenido procede de una población ⇒cuya correlación es cero ( ρ = 0 ).

H1: rxy = 0 El coeficiente de correlación obtenido procede de una población ⇒cuyo coeficiente de correlación es distinto de cero ( 0 ρ ≠ ).

Page 6: jose martinez

VENTAJAS Y DESVENTAJAS DE LOS COEFICIENTES DE CORRELACION DE

PEARSON

VENTAJAS:

• Es un índice de fácil ejecución e, igualmente, de fácil interpretación.

• Sus valores absolutos oscilan entre 0 y 1.• Es apropiada para examinar la relación entre datos cuantificables

significativos. • Es independiente de la escala de medidas de las variables• Brinda piezas vitales de información y determina si la relación es

positiva o negativa • Mientras mas grande sea la muestra mas exacta será la

estimación.

• Requiere que las dos variables hayan sido medidas hasta un nivel cuantitativo continuo y que la distribución de ambas sea semejante a la de la curva normal.

• Cuando las variables X y Y son independientes, el numerador se anula y el coeficiente de correlación poblacional tiene el valor cero.

• El valor 0 representa falta de correlación

DESVENTAJAS:

Page 7: jose martinez

USOS DE ENFOQUES PEARSON EN PROBLEMAS ESTADISTICOS

PASOS.

• Ordenar los valores de la variable dependiente (Y) con respecto a los valores de la variable independiente (X).

• Elevar al cuadrado cada valor X y de Y.• Obtener los productos de X y Y, para lo cual se deben multiplicar

independientemente ambos valores.• Efectuar las sumatorias ∑x,  ∑ y,  ∑ x2,  ∑ y2, y  ∑ xy.• Calcular el tamaño de la muestra en función de parejas de X y Y.• Aplicar la ecuación.• Calcular los grados de libertad (gl): gl = N parejas -1.• Comparar el valor de r calculado en la tabla de valores críticos de t de Kendall en

función de la probabilidad.• Decidir si se acepta o rechaza la hipótesis.

Page 8: jose martinez

Ejemplo:Elección de la prueba estadística para medir la asociación o correlación. Las edades en días están en escala de tipo intervalo, tenemos dos variables, entonces aplicamos esta prueba.

Objetivo: Conocer que grado de asociación existe entre la edad y peso corporal de niños de edades desde el nacimiento hasta los 6 meses.

Hipótesis:Ha. Entre las observaciones de edad de los niños y peso corporal existe correlación significativa.Ho. Entre las observaciones de edad de los niños y pero corporal no existe correlación significativa.

Page 9: jose martinez

gl = 21 - 2 = 19 = 0.05

rc = 0.91rt = 0.444rc > rt : se rechaza Ho. Entre las variables edad del niño y el peso corporal existe una correlación muy significativa. Elevando r al cuadrado obtenemos el error existente r2 = 0.8281 = 0.83, donde el 83% de los cambios observados en el peso de los niños se debe a los incrementos de la edad, sin embargo, el 17% se ignora..

Page 10: jose martinez

COEFICIENTES DE CORRELACION DE SPEARMAN

El coeficiente de correlación de Spearman (rs)  es un coeficiente no paramétrico alternativo al coeficiente de correlación de Pearson cuando este no cumple los supuestos . Charles Spearman contribuyó al análisis del factor, a la teoría de la inteligencia, elaboró una prueba de la teoría mental. Se define el coeficiente de correlación de rangos de Spearman como el coeficiente de correlación lineal.

Permite identificar si dos variables se relacionan en una función monótona (es decir, cuando un número aumenta, el otro también o viceversa). Se emplea cuando una o ambas escalas de medidas de las variables son ordinales.

Page 11: jose martinez

COEFICIENTES DE CORRELACION DE SPEARMAN

El coeficiente de correlación de Spearman se rige por las reglas de la correlación simple de Pearson, y las mediciones de este índice corresponden de + 1 a - 1, pasando por el cero, donde este último significa no correlación entre las variables estudiadas, mientras que los dos primeros denotan la correlación máxima.

La ecuación utilizada en este procedimiento, cuando en el ordenamiento de los rangos de las observaciones no hay datos empatados o ligados, es la siguiente:

Donde:rs = coeficiente de correlación de Spearman.d2 = diferencias existentes entre los rangos de las dos variables, elevadas al cuadrado.N = tamaño de la muestra expresada en parejas de rangos de las variables.∑ = sumatoria.

Page 12: jose martinez

VENTAJAS Y DESVENTAJAS DE LOS COEFICIENTES DE CORRELACION DE

SPEARMAN

VENTAJAS:

• Al ser una técnica no paramétrica es libre de distribución probabilística

• Los supuestos son menos estrictos. • Permite ciertos desvíos del patrón normal. La manifestación de

una relación causa-efecto es posible sólo a través de la comprensión de la relación natural que existe entre las variables y no debe manifestarse sólo por la existencia de una fuerte correlación

• No está afectada por los cambios en las unidades de medida.• Su cálculo es muy sencillo.

• El coeficiente de correlación no debe utilizarse para comparar dos métodos que intentan medir el mismo evento.

• El coeficiente de correlación mide el grado de asociación entre dos cantidades, pero no mira el nivel de acuerdo o concordancia. 

• El coeficiente de correlación de Spearman es recomendable utilizarlo cuando los datos presentan valores extremos, ya que dichos valores afectan mucho el coeficiente de correlación de Pearson, o ante distribuciones no normales.

DESVENTAJAS:

Page 13: jose martinez

USOS DE ENFOQUES SPEARMAN EN PROBLEMAS ESTADISTICOS

PASOS.

• Clasificar en rangos cada medición de las observaciones.• Obtener las diferencias de las parejas de rangos de las variables estudiadas y

elevadas al cuadrado.• Efectuar la sumatoria de todas las diferencias al cuadrado.• Aplicar la ecuación.• Calcular los grados de libertad (gl). gl = número de parejas - 1. Solo se utilizará

cuando la muestra sea mayor a 10.• Comparar el valor r calculado con respecto a los valores críticos de la tabla de

valores críticos de t de Kendall en función de probabilidad.• Decidir si se acepta o rechaza la hipótesis.

Page 14: jose martinez

La función de la correlación de Spearman es determinar si existe una relación lineal entre dos variables a nivel ordinal y que esta relación no sea debida al azar; es decir, que la relación sea estadísticamente significativa. Si una de las variables es intercalar y la otra ordinal también se utiliza Spearman.

La mayoría de los estadísticos actuales confluye en el siguiente algoritmo de trabajo: Los valores de los rangos se colocan según el orden numérico de los datos de la variable. Por ejemplo, si tenemos las siguientes variables:

TALLA PESO

1,68 68

1,89 70

1,75 80

1,56 45

1,48 48

Page 15: jose martinez

Al convertirlas en una escala ordinal, obtendríamos los resultados:

TALLA PESO3 3

5 4

4 5

2 1

1 2

El primer valor de talla (en este caso 1,68) se convierte en 3, porque el 1,68 es el tercer valor más pequeño de la talla. El valor en peso de 45 se convierte en 1, porque es el menor. Luego se calculan las diferencias de rangos:

X Y d = x-y d2 = (x-y) 2

3 3 0 0

5 4 1 1

4 5 -1 1

2 1 1 1

1 2 -1 1

∑d2 =4

Page 16: jose martinez

Sustituyendo :

Interpretación: En la muestra observada los valores de talla y peso tienen una correlación entre fuerte y perfecta, lo que se traduce que en la medida que aumentan los valores de la talla también aumentan los del peso y viceversa.

Page 17: jose martinez

BIBLIOGRAFIA

• http://www.cca.org.mx/cca/cursos/estadistica/html/m14/coef_pearson.htm

• http://www.ray-design.com.mx/psicoparaest/index.php?option=com_content&view=article&id=256:coeficiente-pearson&catid=54:coeficiente-correla&Itemid=75

• http://personal.us.es/vararey/adatos2/correlacion.pdf

• http://www.monografias.com/trabajos85/coeficiente-correlacion-rangos-spearman/coeficiente-correlacion-rangos-spearman.shtml#ixzz3zYD5EakN

• http://www.ray-design.com.mx/psicoparaest/index.php?option=com_content&view=article&id=253:coeficiente-spearman&catid=54:coeficiente-correla&Itemid=75

• http://rccp.udea.edu.co/index.php/ojs/article/viewFile/274/271