Estatística Não Paramétrica ANOVA de Kruskal-Wallis Ivan Balducci FOSJC / Unesp.
Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )
Transcript of Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )
![Page 1: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/1.jpg)
Prof. Ivan Balducci
FOSJC / Unesp
CORRELAÇÃO linear de Pearson
( r )
![Page 2: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/2.jpg)
Correlação: Há um Relacionamento entre as variáveis?
Elas vão juntas? Aumentando uma variável, então aumenta também a outra?
Exº de variáveis
X ... Horas de estudo
Y ... Notas na Prova
![Page 3: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/3.jpg)
Exemplo 1: Notas vs Horas de estudo
• Variável independente é o número de horas estudadas.
• A nota do aluno é a var. dependente.
• A nota do aluno depende do nº de horas que ele estuda?
• Essas variáveis se relacionam?
752F
683E
885D
571C
632B
826A
NotaHoras estudadas
Aluno
![Page 4: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/4.jpg)
Diagrama de Dispersão
• Por convenção, a variável independente é considerada no eixo horizontal x.
• A dependente é considerada no eixo vertical y.
![Page 5: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/5.jpg)
Exemplo de Diagrama de Dispersão
Horas Notas
1 57
2 63
2 75
3 68
5 88
6 82
C1
C2
6543210
90
85
80
75
70
65
60
55
50
75
68
88
57
63
82
Diagrama de Dispersão: Notas vs Horas de Estudo
C1: Horas de Estudo ; C2: Notas dos Alunos
![Page 6: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/6.jpg)
Correlação Positiva Linear
x x
yy y
x(a) Positiva (b) Forte
positiva(c) Perfeita positiva
![Page 7: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/7.jpg)
Correlação Negativa Linear
x x
yy y
x(d) Negative (e) Strong
negative(f) Perfect
negative
![Page 8: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/8.jpg)
Correlação Não Linear
x x
yy
(g) Nenhuma Correlação (h) Correlação Não linear
![Page 9: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/9.jpg)
Exemplos Quanto à Intensidade do Relacionamento
![Page 10: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/10.jpg)
Definição:
Coeficiente Correlação Linear r
• Mede a força do relacionamento linear entre valores pareados x e y na amostra
![Page 11: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/11.jpg)
nxy – (x)(y)
n(x2) – (x)2 n(y2) – (y)2r =
•Calculadoras Científicas (estatística)
podem calcular r
Fórmula do Coeficiente de Correlação Linear
![Page 12: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/12.jpg)
Notação: Coeficiente de Correlação Linear
n número de pares de dados presentes.
soma.
x soma de todos os valores de x.
x2 indica que cada x deve ser elevado ao quadrado e então aqueles quadrados somados.
(x)2 indica que x deve ser somado e o total é elevado ao quadrado.
xy indica que cada x deve ser primeiro multiplicadopor seu
correspondente y. Após obter todos os produtos, somamos.
r coeficiente correlação linear para a amostra
![Page 13: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/13.jpg)
Exemplo 2: Idade vs Pressão
• Dados de idade e pressão sanguínea.
• Calculamos: x, y, xy, x2 e y2.
2310449001064015270F
1124432039947634819345Soma
198814489944714167E
204493721872314361D
182253136756013556C
144002304576012048B
163841849550412843A
BP2age2Age*BP
Blood Pressure
AgeAluno
![Page 14: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/14.jpg)
Exemplo 2: Cálculo de r
• Substituímos na fórmula e resolvemos para r:r= {(6*47634)-(345*819)}/{[(6*20399)-3452]
[(6*112443)-8192]}0.5.
r= 0.897 = 0.90 aprox.
• O coeficiente de correlação sugere um relacionamento forte positivo entre a idade e a pressão sanguínea.
![Page 15: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/15.jpg)
interpretação do “r”
• A correlação é 0.9• Há um
relacionamento positivo e forte
• entre idade e pressão sanguínea
AgeBlood Pressure 0.90
![Page 16: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/16.jpg)
Propriedades de r
1. –1 r 1
2. Valor de r não muda se todos os valores de ambas variáveis mudam (são convertidos) para a diferentes escalas
3. Trocando todos os valores x e y não mudarão r
4. r mede a força de um relacionamento linear
![Page 17: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/17.jpg)
Erros Comuns sobre Correlação
1. Evite concluir que uma correlação entre duas variáveis implica em causalidade.
2. Nenhum relacionamento linear não implica nenhum relacionamento. Há uma
possibilidade de um relacionamento não linear.
![Page 18: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/18.jpg)
Correlação
O que se pode dizer sobre a intensidade do relacionamento entre x e y ?
A magnitude refere-se à força de associação entre x e y. Por exemplo:
Correlação Interpretação
r = 0.00 Não há relacionamento entre x e y
r = 0.20 Baixo, relacionamento entre x e y
r = 0.40 Moderado relacianamento entre x e y
r = 0.70 Alto relacionamento entre x e y
r = 1.00 Perfeita correspondência entre x e y
![Page 19: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/19.jpg)
Correlação
Quanto à direção da relação entre x e y ?
A direção se refere ao como os altos e baixos valores em x e y estão associados. Por exemplo:
Positiva Negativa NenhumaCorrelação Correlação Correlação r = +1.0 r = -1.0 r = 0.00
x x x
yyy
![Page 20: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/20.jpg)
RegressãoRegressão
![Page 21: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/21.jpg)
Regressão
• Analisa o relacionamento entre uma dependente variável e uma
independente variável. • Tenta explicar o relacionamento por
ajustar uma linha (relacionamento linear).
• É estabelecida uma equação: Y = a + bx
dependente independente
![Page 22: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/22.jpg)
Linha de Regressão e Equação de RegressãoV
ariá
vel D
epen
den
te (
Y)
Variável Independente (X)
Intercepto = a
Inclinação = b
Regressão equação:
Y = a + b.X
![Page 23: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/23.jpg)
Modelo Regressão Linear
Uma linha reta que melhor ajusta ou descreve os dados é dada pela equação:
Y = a + bX
a = é o intercepto em Y (valor de Y quando X = 0)
b = é a inclinação da linha (taxa de mudança)
![Page 24: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/24.jpg)
Exemplo 1: nº de Frangos vs Batata frita
Predizer o consumo french fries em função do nº de frangos consumidos
Jantar nº Frangos nº fries 1 1 152 3 303 7 404 2 295 4 356 3 32
![Page 25: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/25.jpg)
Exemplo 1: nº de Frangos vs Batata frita
a = 18,34b = 3,55
r = 0,87
0
10
20
30
40
50
0 1 2 3 4 5 6 7 8
Frangos
fri
es
![Page 26: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/26.jpg)
Exemplo 2: Relacionamento
Altura e Teor da droga das folhas
Y: variável Dependente – teor da droga
X: variável Independente – altura da folha
![Page 27: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/27.jpg)
Equação de Regressão
Pode-se predizer o teor da droga a partir da posição
da folha
variável Dependente
Independente
teor da droga posição da folha
![Page 28: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/28.jpg)
X: Altura (m) Y:Droga (mg/g folha seca)
1.3 811.9 652.4 612.6 693.0 773.7 444.1 454.3 464.9 395.6 496.2 316.8 287.0 467.4 318.6 38
Exemplo 2: Altura das folhas e o teor das drogas
![Page 29: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/29.jpg)
Avaliação
Gráfica Inicial
Fazemos um gráfico para garantir que não estamos
diante de algum relacionamento não linear
![Page 30: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/30.jpg)
É Importante Traçar o Diagrama de Dispersão
![Page 31: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/31.jpg)
Quarteto de AnscombeEm todos os 4 casos:
Y =3+0,5X e rxy=0,816
![Page 32: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/32.jpg)
987654321
80
70
60
50
40
30
Height
Dru
gTeor da droga versus Altura
da folhaD
rog
a
( m
g/g
)
Altura (m)
É razoável considerar linear
Exemplo 2
![Page 33: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/33.jpg)
987654321
80
70
60
50
40
30
20
10
Height
Dru
gEscolhendo a linha de melhor
ajuste
Desvio do ponto à linha
![Page 34: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/34.jpg)
Equação de Regressão
Teor (mg/g) = 79,3 - 6,30 x Altura (m)
987654321
80
70
60
50
40
30
Height
Dru
g
O sinal menos indica um negativo relacionamento entre concentração da droga e altura. A figura apresenta uma inclinação negativa
Exemplo 5
![Page 35: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/35.jpg)
Predizendo o teor da droga
Predizer a concentração da droga em uma folha situada a uma altura de 5 m da árvore …
Teor = 79,3 - 6,30 x Altura
= 79,3 - 6,30 x 5
= 79,3 - 31,5
= 47,8
Concentração Prevista da droga = 47,8 mg/g
Exemplo 2
![Page 36: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/36.jpg)
Extrapolação
Predizer o teor da droga em uma folha colhida a 15 m da árvore …
Teor da droga = 79,3 - 6,30 x Altura
= 79,3 - 6,30 x 15
= 79,3 - 94,5
= -15,2 mg/g !?!?!
resultado sem sentido
Exemplo 2
![Page 37: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/37.jpg)
121086420
100
90
80
70
60
50
40
30
20
10
0
Height
Dru
g
Interpolação ExtrapolaçãoExtrapolação
Interpolação versus Extrapolação
Exemplo 2
![Page 38: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/38.jpg)
Interpolação vs Extrapolação
A Interpolação, em geral, é muito segura.
A Extrapolação só é válida quando pode-se garantir relacionamento linear além da região de observação.
Exemplo 2 (os teores seriam negativos em qualquer folha acima
de 12 m)
![Page 39: Prof. Ivan Balducci FOSJC / Unesp CORRELAÇÃO linear de Pearson ( r )](https://reader034.fdocuments.net/reader034/viewer/2022042601/552fc0f8497959413d8b5fbb/html5/thumbnails/39.jpg)
Correlaçãobaixa
moderada
forte
Termos que devem ser familiares
Regressão Linearinclinação
interpolação
extrapolação
Diagrama de dispersão