Post on 08-Jul-2018
8/19/2019 Analisis de Correlación (Uso de Excel)
1/19
ANÁLISIS DE CORRELACIÓN EMPLEANDO EXCEL
Cuando se estudian en forma conjunta dos características (variables estadísticas) deuna población o muestra, se dice que estamos analizando una variable estadística
bidimensional. La correlación es el grado de relación que existe entre ambas
características, la regresión es la forma de expresar matem!ticamente dic"a relación.
#ado dos variables, la correlación permite "acer estimaciones del valor de una de ellasconociendo el valor de la otra variable.
1) Diagrama de dispersión
Los diagramas de dispersión son planos cartesianos en los que se marcan los puntos
correspondientes a los pares ordenados ($, %) de los valores de las variables.
2) Clasii!a!ión de la !"rrela!ión
2#1) Seg$n la rela!ión en%re &aria'les
- C"rrela!ión lineal( &e representa mediante una línea recta.- C"rrela!ión n" lineal( &e representa con una línea curva.
2#2) Seg$n el n$mer" de &aria'les
- C"rrela!ión simple( La variable dependiente act'a sobre la variable independiente.- C"rrela!ión m$l%iple( Cuando la variable dependiente act'a sobre varias variables
independientes.- C"rrela!ión par!ial( Cuando la relación que existe entre una variable dependiente
una independiente es de tal forma que los dem!s factores permanezcan constantes.
2#) Seg$n el &al"r !*an%i%a%i&"
- C"rrela!ión pere!%a( l valor del coeficiente de correlación es - C"rrela!ión impere!%a( l coeficiente de correlación es menor a sea en sentido
positivo o negativo#- C"rrela!ión n*la( l coeficiente de correlación es *. +o existe correlación entre las
variables.
2#+) Seg$n el sign"
- C"rrela!ión p"si%i&a#, #os variables tiene correlación positiva cuando al aumentar odisminuir el valor de una de ellas entonces el valor correspondiente a la otra
aumentar! o disminuir! respectivamente, es decir, cuando las dos variables aumentanen el mismo sentido. jemplo La cantidad de carbo"idratos que consume peso de
una persona.
- C"rrela!ión nega%i&a#, #os variables tiene correlación negativa cuando al aumentar odisminuir el valor de una de ellas entonces el valor de la otra disminuir! o aumentar!
respectivamente, es decir, una variable aumenta otra disminue o viceversa.
jemplo +'mero de ítems incorrectos el rendimiento en la evaluación.
8/19/2019 Analisis de Correlación (Uso de Excel)
2/19
) C"ei!ien%es de !"rrela!ión
Los coeficientes de correlación son medidas que indican la situación relativa de los
mismos sucesos respecto a las dos variables, es decir, son la expresión num-rica quenos indica el grado de relación existente entre las variables en qu- medida se
relacionan. &on n'meros que varían entre los límites / 0. &u magnitud indica elgrado de asociación entre las variables1 el valor r 2 * indica que no existe relación entre
las variables1 los valores 3 son indicadores de una correlación perfecta positiva (alcrecer o decrecer $, crece o decrece %) o negativa (4l crecer o decrecer $, decrece o
crece %).
+o existe correlación
Correlación 5ositiva
8/19/2019 Analisis de Correlación (Uso de Excel)
3/19
Correlación +egativa
5ara interpretar el coeficiente de correlación utilizamos la siguiente escala
-al"r Signii!ad"
0 Correlación negativa grande
perfecta
0*,6 a 0*,66 Correlación negativa mu alta
0*,7 a 0*,86 Correlación negativa alta
0*,9 a 0*,:6 Correlación negativa moderada
0*, a 0*,;6 Correlación negativa baja
0*,* a
0*,6
Correlación negativa mu baja
* Correlación nula
*,* a *,6 Correlación positiva mu baja
*, a *,;6 Correlación positiva baja
*,9 a *,:6 Correlación positiva moderada
*,7 a *,86 Correlación positiva alta
*,6 a *,66 Correlación positiva mu alta
Correlación positiva grande perfecta
#1) COE.ICIEN/E DE CORRELACIÓN DE PEARSON
Llamando tambi-n coeficiente de correlación producto0momento.
a) Para da%"s n" agr*pad"s se !al!*la apli!and" la sig*ien%e e!*a!ión(
n donde r 2 Coeficiente producto0momento de correlación lineal
8/19/2019 Analisis de Correlación (Uso de Excel)
4/19
E0empl" il*s%ra%i&"(
Con los datos sobre las temperaturas en dos días diferentes en una ciudad, determinar el tipo de correlación que existe entre ellas mediante el coeficiente de 5earson.
$ 8 7 < : 9 6 < : 9 : 8 =$ 28*
% ; < 9 ; 6 * 8 ; ; * 8 =%2 ;8
S"l*!ión(
&e calcula la media aritm-tica
5ara $
5ara %
&e llena la siguiente tabla
8 ; ; ,< 6 9,< ,<7 < ;,< 9 7 ,<
< 9 * ,< * * :,<
: ; ,< ,< ,<
9 6 0 0,< ,< :,<
* 0; 0,< 6 9,< ,<
6 8 0: 0;,< ;: ,<
< ; * ,< * * ,<
: *,< *,< *,<
9 ; 0 ,< 0,< ,<
: * 0,< 0,< ,<
8 8 ; 0;,< 6 0*,< ,<
1 1 32 2 4
&e aplica la fórmula
n consecuencia, existe una correlación moderada.
8/19/2019 Analisis de Correlación (Uso de Excel)
5/19
8/19/2019 Analisis de Correlación (Uso de Excel)
6/19
El diagrama de dispersión en Excel se realiza de la siguiente manera:
a) &eleccionar los datos en men' Inser%ar6Diagrama de dispersión e insertar
diagrama de dispersión.
b) n diagrama dispersión, escoger el primero.
8/19/2019 Analisis de Correlación (Uso de Excel)
7/19
5ara que ver las coordenadas escoger el dise>o +? 7.
@orrar &erie , las líneas "orizontales verticales ("aciendo clic suprimir en cada
objeto).
n título del gr!fico escribir #iagrama de dispersión.
8/19/2019 Analisis de Correlación (Uso de Excel)
8/19
Clic en el eje x, luego clic derec"o para dar formato al eje.
5oner en la casilla unidad maor para ver los n'meros de en en el eje x.
c) Clic en Cerrar para culminar la elaboración del diagrama de dispersión, aunque se lepuede seguir "aciendo m!s mejoras.
8/19/2019 Analisis de Correlación (Uso de Excel)
9/19
') Para da%"s agr*pad"s9 el !"ei!ien%e de C"rrela!ión de Pears"n se !al!*laapli!and" la sig*ien%e órm*la(
#onde
2 n'mero de datos.
2 frecuencia de celda.
2 frecuencia de la variable $. 2 frecuencia de la variable %.
2 valores codificados o cambiados para los intervalos de la variable $, procurando
que al intervalo central le corresponda 2 *, para que se "agan m!s f!ciles los
c!lculos.
2 valores codificados o cambiados para los intervalos de la variable $, procurandoque al intervalo central le corresponda 2 *, para que se "agan m!s f!ciles losc!lculos.
E0empl" il*s%ra%i&"(
Con los siguientes datos sobre los Coeficientes Antelectuales ($) de las calificacionesen una prueba de conocimiento (%) de
8/19/2019 Analisis de Correlación (Uso de Excel)
10/19
8; ;7 6 ;
; 8; ;8 6; ;;
9 8; ; ;6 6; ;<
< 89 < 9* 6; 9
: 89 9 69 9*
7 89 < 9 6: ;<
8 8< ; 9; 67 ;:
6 8< ;< 99 68 9*
* 8: : 9< 66 ;;
8: ;* 9: **
8/19/2019 Analisis de Correlación (Uso de Excel)
11/19
Califcaciones (Y )
n la variable %
Calculando el Dango se obtiene
Calculando el n'mero de intervalos se obtiene
Calculando el anc"o se obtiene
N"%a( 5ara la variable $ se tomar! un anc"o de intervalo igual a < para la variable %un anc"o de intervalo igual a 8 para obtener un n'mero de intervalos igual a : para cadavariable.
Contando las frecuencias de celda para cada par de intervalos de las variables $ % se
obtiene la siguiente tabla de frecuencias de dos variables
Coeficientes Antelectuales ($)
7:08* 808< 8:06* 606< 6:0** *0*<
8/19/2019 Analisis de Correlación (Uso de Excel)
12/19
N"%a(
Los n'meros de las esquinas de cada celda en la anterior tabla representan el producto
fEdxEd, así por ejemplo, para obtener el n'mero el n'mero 08 de los intervalos 7:08* en$ 9;0
8/19/2019 Analisis de Correlación (Uso de Excel)
13/19
xiste una correlación positiva moderada
N"%a( videntemente, resulta m!s f!cil "acer los an!lisis pertinentes a trav-s de tablasno agrupadas
#2) COE.ICIEN/E DE CORRELACIÓN POR RAN;OS DE SPEARMAN
ste coeficiente se emplea cuando una o ambas escalas de medidas de las variables
son ordinales, es decir, cuando una o ambas escalas de medida son posiciones.
jemplo Grden de llegada en una carrera peso de los atletas.
&e calcula aplicando la siguiente ecuación
( )
2
2
61
1 s
d r
n n= −
−
∑
r s 2 Coeficiente de correlación por rangos de &pearman
d 2 #iferencia entre los rangos ($ menos %) HDango posiciónI
n 2 +'mero de datos
N"%a( Los datos "a que traducirlos u ordenarlos, de maor a menor, en rangos. 4 lospuntajes m!s elevados le asignamos el rango al siguiente el rango así
sucesivamente. &i se repiten dos puntajes o m!s se calculan las medias aritm-ticas.
E0empl" il*s%ra%i&" N< 1( La siguiente tabla muestra el rango u orden obtenido en la
primera evaluación ($) el rango o puesto obtenido en la segunda evaluación (%) de 8estudiantes universitarios en la asignatura de stadística. Dealizar el diagrama dedispersión calcular el coeficiente de correlación por rangos de &pearman.
studiante
#iana ;
lizabet" 9
Jario ;
Grlando 9 <
Jatías < :
Kosu- :
4nita 7 8
Lucía 8 7
8/19/2019 Analisis de Correlación (Uso de Excel)
14/19
N"%a Gbservar que la tabla a describe los rangos correspondientes a cada variable.
S"l*!ión(
l diagrama de dispersión "ec"o en xcel se muestra en la siguiente figura
5ara calcular el coeficiente de correlación por rangos de &pearman de se llena la
siguiente tabla
studiante
#iana ; 0 9
lizabet" 9 0 9
Jario ; 9
Grlando 9 < 0
Jatías < : 0
Kosu- : 9 :
4nita 7 8 0
Lucía 8 7
&e aplica la fórmula
5or lo tanto existe una correlación positiva moderada entre la primera segundaevaluación de los 8 estudiantes.
n xcel se calcula de la siguiente manera
8/19/2019 Analisis de Correlación (Uso de Excel)
15/19
a) &e inserta la función COE.#DE#CORREL pulsar en A!ep%ar .
b) n el cuadro de argumentos de la función, en el recuadro de la Ma%ri8 1 seleccionar lasceldas de $, en el recuadro de la Ma%ri8 2 seleccionar las celdas de %.
c) 5ulsar en 4ceptar.
8/19/2019 Analisis de Correlación (Uso de Excel)
16/19
E0empl" il*s%ra%i&" N< 2
La siguiente tabla muestra las calificaciones de 8 estudiantes universitarios en las
asignaturas de Jatem!tica stadística. Calcular el coeficiente de correlación por rangos de &pearman realizar el diagrama de dispersión.
+? studiante Jatem!tica stadística
#iana * 8
lizabet" 6 :
; Jario 8 *
9 Grlando 7 6< Jatías 7 8
: Kosu- : 7
7 4nita : :
8 Lucía 9 6
N"%a( La tabla, a diferencia del ejemplo anterior, brinda puntuaciones directas para cadaestudiante.
S"l*!ión(
5ara calcular el coeficiente de correlación por rangos de &pearman se procede a
clasificar u ordenar los datos en rangos ($ para Jatem!tica % para stadística)tomando en cuenta las siguientes observaciones
n la asignatura de Jatem!tica se observa
#iana tiene la m!s alta calificación, ocupando el primer puesto, por lo que su rango es
lizabet" ocupa el segundo puesto, por lo que su rango es Jario se encuentra ubicado en el tercer lugar, por lo que su rango es ; Grlando Jatías ocupan el cuarto quinto puesto, por lo que su rango es la media
aritm-tica de 9 < que da por resultado 9,
8/19/2019 Analisis de Correlación (Uso de Excel)
17/19
Kosu- 4nita ocupan el sexto s-ptimo lugar, por lo que su rango es la mediaaritm-tica de : 7 que da por resultado :,<
Lucía se encuentra ubicada en el octavo lugar, por lo que su rango es 8
n la asignatura de stadística se observa
Jario tiene la m!s alta calificación, ocupando el primer puesto, por lo que su rangoes
Grlando Lucía ocupan el segundo tercer puesto, por lo que su rango es la mediaaritm-tica de ; que da por resultado ,<
#iana Jatías ocupan el cuarto quinto puesto, por lo que su rango es la media
aritm-tica de 9 < que da por resultado 9,< Kosu- se encuentra ubicado en el sexto lugar, por lo que su rango es : lizabet" 4nita ocupan el s-ptimo octavo lugar, por lo que su rango es la media
aritm-tica de 7 8 que da por resultado 7,<
Los rangos $ % se presentan en la siguiente tabla
+? studiante Jatem!tica stadística $ %
#iana * 8 9,<
lizabet" 6 : 7,<
; Jario 8 * ;
9 Grlando 7 6 9,< ,<
< Jatías 7 8 9,< 9,<
: Kosu- : 7 :,< :
7 4nita : : :,< 7,<
8 Lucía 9 6 8 ,<
Calculando se obtiene los siguientes resultados
+? studiante Jatem!tica stadística $ % d2 $0% d2($0%)
#iana * 8 9,< 0;,< ,<
lizabet" 6 : 7,< 0
8/19/2019 Analisis de Correlación (Uso de Excel)
18/19
+) COE.ICIEN/E DE DE/ERMINACIÓN
Devela qu- porcentaje del cambio en % se explica por un cambio en $. &e calcula
elevando al cuadrado el coeficiente de correlación.
r 2 Coeficiente de correlación de 5earson
#e donde coeficiente de determinación 2 D 2 r
E0empl" il*s%ra%i&"
Con los datos de la tabla sobre las temperaturas (ejemplo anteriormente resuelto),
calcular el coeficiente de determinación.
$ 8 7 < : 9 6 < : 9 : 8
% ; < 9 ; 6 * 8 ; ; * 8
S"l*!ión(
&e sabe que coeficiente de 5earson es r 2 *,9:
levando al cuadrado coeficiente de 5earson queda calculado el coeficiente de
determinación.
Coeficiente de determinación 2
sto establece que 7M de los cambios en la variable % puede ser explicado a trav-sde los cambios en la variable $.
N"%a(
l valor tiene significado sólo para las relaciones lineales. #os variables pueden tener sin embargo estar relacionadas en sentido curvilíneo. l valor de no se
interpreta como si la variable % fuera causado por un cambio de la variable $, a que lacorrelación no significa causa.
n xcel se calcula elevando al cuadrado el coeficiente de correlación o insertando la
función =COE.ICIEN/E#R2 como muestra la siguiente figura
8/19/2019 Analisis de Correlación (Uso de Excel)
19/19