1/37 Regressão Modelagem Estatística. 2/37 Regressão l Estudo da forma do relacionamento entre...
-
Upload
stefany-manso -
Category
Documents
-
view
217 -
download
2
Transcript of 1/37 Regressão Modelagem Estatística. 2/37 Regressão l Estudo da forma do relacionamento entre...
1/37
Regressão
ModelagemEstatística
2/37
Regressão
Estudo da forma do relacionamento entre variáveis quantitativas.
Exemplos:– Peso e altura.– Renda familiar e número de filhos.– Renda e consumo.– Volume de produção e custos.– Risco e rentabilidade de ações.– Gastos com prevenção de defeitos e falhas
nos produtos.
3/37
Regressão - Objetivos
Predizer (estimar) uma variável dependente (Y) em função de uma variável independente (X).
Conhecer o quanto variações de X podem afetar Y.
4/37
Exemplos
Variável independente, X
Variável dependente, Y
Temperatura do forno (0C) Resistência mecânica da cerâmica (MPa)
Quantidade de aditivo (%) Octanagem da gasolina
Renda (R$) Consumo (R$)
Memória RAM do computador (Gb)
Tempo de resposta do sistema (s)
Área construída do imóvel (m2)
Preço do imóvel (R$)
5/37
Exemplo de Regressão
A Agência Meteorológica Japonesa ganhou o prêmio IgNobel de Física (1994) por causa de um estudo de sete anos verificando se terremotos são causados por peixes (catfish) balançando seus rabos.
6/37
Exemplo 11.2:
X = % de aditivo
Y = Índice de octanagem da gasolina
X Y1 80,52 81,63 82,14 83,75 83,96 85,0
Resultados de n = 6 ensaios experimentais:
7/37
Exemplo 11.2:
80,0
81,0
82,0
83,0
84,0
85,0
86,0
0 1 2 3 4 5 6 7
quantidade de aditivo (%)
índi
ce d
e oc
tana
gem
8/37
Regressão - Modelo
Y =Predito por X, se-gundo uma função Efeito aleatório+
yi .xi ei Regressão
LinearSimples
Parâmetros
9/37Modelo de regressão linear
simples
Em termos das variáveis: XYE
Em termos dos dados: Yi = + xi + i
Suposições:– os termos de erro (1, 2, ..., n) são variáveis
aleatórias independentes;– E{i} = 0;– V{i} = 2; e i tem distribuição normal (i = 1, 2, ..., n).
10/37
Pressupostos
Para qualquer valor de xi, os erros (ei) são independentes e variam aleatoriamente segundo uma distribuição (normal) com média zero e variância constante.
yi .xi ei
11/37
Método dos Mínimos QuadradosY
X
ponto iyi
xi
y = a +b.x^
yi
ei
O método dos míni-mos quadrados sele-ciona os valores de a e b de tal forma que o somatório dos quadrados dos erros (ei
2) é minimizado.
reta de regressão estimada:
12/37
Método dos mínimos quadrados para
estimar e
Minimizar em relação a e :
yi
xi
i
22iii xYS
0S
0S
13/37
Resultado das derivadas parciais:
22
ii
iiii
x xn.
yx yxn.b =
nxby
a = ii
Estimativa de :
Estimativa de :
Reta de regressão construída com os dados:
bxay ˆ
Método dos mínimos quadrados para
estimar e
14/37
Exemplo
i xi yi i xi yi 1 20 96 11 30 109 2 20 92 12 30 100 3 20 106 13 35 112 4 20 100 14 35 105 5 25 98 15 35 118 6 25 104 16 35 108 7 25 110 17 40 113 8 25 101 18 40 112 9 30 116 19 40 127 10 30 106 20 40 117
idadetempo de reação a certo estímulo
15/37
Regressão Linear Simples
70
107,5
10 30X
Ydiagrama de dispersão
16/37
Regressão Linear Simples
70
107,5
10 30X
Yreta de regressãoestimaday = 80,5 + 0,9x^
17/37
Teste para o Parâmetro
Ho: = o H1: = o
Distribuição de referência: t de Student, com (n-2) graus de liberdade.
Estatística: t =(a - o)
Sa
(yi - a - bxi)2
n - 2( 1
n+ X2
(xi - )2X)Sa =
Valor especificado pelo pesquisador
18/37
Teste para o Parâmetro
Ho: = o H1: = o
Distribuição de referência: t de Student, com (n-2) graus de liberdade.
Estatística: Valor especificado pelo pesquisadort =
(b - o)Sb
(yi - a - bxi)2
(n - 2) [ (xi - )2 ]XSb =
19/37
Qualidade do ajuste
Ajustou-se uma equação de regressão entre X e Y. E a qualidade do ajuste?
– análise de variância do modelo– análise dos resíduos
20/37
Reta de regressão e resíduos Valores preditos:
Resíduos:
ii bxay ˆ
iii yye ˆ
yi
xi
ei
iy bxay ˆ
21/37Análise de
variância do modelo
yi
xi
eidi bxay ˆ
y
yyd ii
iii yye ˆ
Desvio em relação à média aritmética:
Desvio em relação à reta de regressão(resíduo da regressão):
22/37
Somas de quadrados
SQT
variação total
SQR
variação explicada
pela equação de
regressão
SQE
variação nãoexplicada
2yyi = 2ˆ yyi + 2ˆ ii yy
23/37
Somas de quadrados
ny
yyySQT iii
222
iiiiii yxbyayyySQE 22ˆ
SQESQTSQR
Coeficiente de determinação:SQTSQE
SQTSQR
R 12
24/37
Medida da qualidade do
ajuste:Coeficiente de determinação (R2)
R2 = Variação
total
Variaçãoexplicada
= (yi - y)2
(yi - y)2^
0 R2 1 Matematicamente, R2 é o quadrado do Coef. de Correlaçãode Pearson.
25/37Teste de significância do
modelo
H0: = 0 e H1: 0 Distribuição de referência para a
razão f : distribuição F com gl = 1 no numerador e gl = n – 2 no denominador.
XYE .
26/37
Análise da Variância
fonte de somas de quadrados razão nível de variação quadrados GL médios F probab.Regressão 810,000 1 810,0000 25,897 ,000077Residuo 563,000 18 31,2778Total 1373,000
r2 = 0,59
27/37
Regressão Linear Simples
70
107,5
10 30X
Y
r2 = 0,59
reta de regressãoestimaday = 80,5 + 0,9x^
28/37
Suposições do modelo
– os termos de erro (1, 2, ..., n) são variáveis aleatórias independentes;
– E{i} = 0;– V{i} = 2; e i tem distribuição
normal (i = 1, 2, ..., n).
Modelo: Yi = + xi + i
x
E{Y}= +x y
29/37
Exercício Analisar cada conjunto de dados (X,Y)
X1 Y1 X2 Y2 X3 Y3 X4 Y410 8,04 10 9,14 10 7,46 8 6,588 6,95 8 8,14 8 6,77 8 5,76
13 7,58 13 8,74 13 12,74 8 7,719 8,81 9 8,77 9 7,11 8 8,84
11 8,33 11 9,26 11 7,81 8 8,4714 9,96 14 8,1 14 8,84 8 7,046 7,24 6 6,13 6 6,08 8 5,254 4,26 4 3,1 4 5,39 19 12,5
12 10,84 12 9,13 12 8,15 8 5,567 4,82 7 7,26 7 6,42 8 7,915 5,68 5 4,74 5 5,73 8 6,89
30/37
Análise dos resíduos:um diagnóstico das
suposições do modelo
Valores preditos:ii bxay ˆ
iii yye ˆ
Resíduos:
yi
xi
ei
iy bxay ˆ
31/37Análise dos resíduos
x
y e
x
Gráfico dos dados:(xi, yi)
Gráfico dos resíduos:(xi, ei)
As suposições do modelo parecem satisfeitas?
32/37Análise dos resíduos
As suposições do modelo parecem satisfeitas?
Gráfico dos dados:(xi, yi)
x
y
Gráfico dos resíduos:(xi, ei)
resíduo
0x
33/37Análise dos resíduos
Gráfico dos dados:(xi, yi)
Gráfico dos resíduos:(xi, ei)
As suposições do modelo parecem satisfeitas?
x
y e
0x
34/37Análise dos resíduos
Gráfico dos resíduos: (xi, ei)
As suposições do modelo parecem satisfeitas?
resíduo
0 x
35/37Análise dos resíduos
Gráfico dos dados:(xi, yi)
Gráfico dos resíduos:(xi, ei)
As suposições do modelo parecem satisfeitas?
x
y e
0x
36/37
RegressãoModelos Linearizáveis
y = + log(x) y = + .log(x)
y
x log(x)
y
37/37
RegressãoModelos Linearizáveis
y = .x log(y) = log( + log(.x
y
x x
log(y)