Probabilidade e Estatística -...
Transcript of Probabilidade e Estatística -...
Probabilidade e Estatística
Prof. Dr. Narciso Gonçalves da Silva http://paginapessoal.utfpr.edu.br/ngsilva
Análise de Variância
Introdução
A análise de variância (Anova) é utilizada para comparar médias de três ou mais populações.
Ho:
H1: pelo menos uma das médias é diferente das outras
Premissas da Anova:
• As populações têm a mesma variância;
• As amostras são retiradas de populações com
distribuição normal;
• As amostras são aleatórias e independentes.
An
ális
e d
e V
ari
ân
cia
As hipóteses são:
Experimentos com um fator
Valores para ANOVA com um fator
Observações Grupos (Tratamentos)
1 2 3 … … k
1 x11 x21 x31 … … x1
2 x12 x22 x32 … … xk2
3 x13 x23 x33 … … xk3
... … … … … … …
Total T1 T2 T3 Tk
An
ális
e d
e V
ari
ân
cia
O objetivo da análise de variância para experimentos com um fator é comparar a variação devida aos tratamentos (entre os grupos) com a variação devida ao acaso (dentro do grupo, também chamado de variação residual). A variação entre os grupos tem o objetivo de verificar se as amostras de cada grupo são provenientes de populações diferentes.
An
ális
e d
e V
ari
ân
cia
Experimentos com um fator
Experimentos com um fator
Supõe-se que cada resposta xij é dada pelo
modelo matemático:
xij = μ + αk + εij
Onde:
μ é a média
αk é o efeito do grupo k (variação devida aos
tratamentos)
εij é o resíduo (erro aleatório, por exemplo,
erro de medida)
An
ális
e d
e V
ari
ân
cia
Procedimentos:
1º) Enunciar as hipóteses Ho e H1
2º) Fixar o nível de significância α
Fcrit
α
3º) Determinar Fcrit na distribuição F com (k – 1)
graus de liberdade no numerador e (N – k)
graus de liberdade no denominador
k = no total de grupos
N = no total de observações
Experimentos com um fator
An
ális
e d
e V
ari
ân
cia
N
Tx=SQT ∑∑
k
=i
n
=jij
i 2
1 1
2 -
N
T
n
T=SQE ∑
k
=i i
i2
1
2
-
∑k
=iin=N
1
∑k
=iiT=T
1
SQR = SQT - SQE
4º) Determinar a soma quadrática total
5º) Determinar a soma quadrática entre os grupos
6º) Determinar a soma quadrática dentro dos
grupos (resíduos)
Experimentos com um fator
An
ális
e d
e V
ari
ân
cia
Fonte de
variação
Graus de
liberdade
Soma
quadrática Quadrado médio Fcalc
Entre os grupos k – 1 SQE QME = SQE/(k – 1) QME/QMR
Dentro do grupo
(Resíduos) N – k SQR QMR = SQR/(N – k)
Total N – 1 SQT
7º) Montar o quadro para Anova
8º) Se Fcalc < Fcrít aceitar a hipótese Ho
Experimentos com um fator
An
ális
e d
e V
ari
ân
cia
repetições Máquinas (Grupos)
∑ 1 2 3 4
1 25 31 22 33
2 26 25 26 29
3 20 28 28 31
4 23 27 25 34
5 21 24 29 28
∑ 115 135 130 155 535
No rep. 5 5 5 5 20
Média 23 27 26 31
Exemplo 1 A tabela abaixo apresenta o tempo (em minutos) que 4 máquinas levou
para realizar um determinado serviço. Supondo que os tempos das
máquinas estão normalmente distribuídos e que as variâncias são
iguais, é possível afirmar ao nível de significância de 5% que os
tempos médios das máquinas são significativamente diferentes?
Exp
eri
men
tos c
om
um
fa
tor
repetições Máquinas (Grupos)
∑ 1 2 3 4
1 625 961 484 1089
2 676 625 676 841
3 400 784 784 961
4 529 729 625 1156
5 441 576 841 784
∑ 2671 3675 3410 4831 14587
Tabela de xij2
Exemplo 1
Ho: as médias são iguais
H1: pelo menos uma das médias é diferente das outras
Exp
eri
men
tos c
om
um
fa
tor
Exemplo 1
Fonte de
variação
Graus de
liberdade
Soma
quadrática
Quadrado
médio Fcalc
Entre os grupos 4 – 1 = 3 163,75 QME = 54,55 7,79
Dentro do grupo
(Resíduos) 20 – 4 = 16 112,00 QMR = 7,00
Total 20 – 1 = 19 275,75
Quadro para Anova
Com 3 graus de liberdade no numerador, 16 graus de
liberdade no denominador e α = 5% tem-se Fcrit = 3,24.
Como Fcalc > Fcrit, rejeita Ho, ou seja, existe pelo menos um
tempo médio diferente, ao nível de 5% de significância.
Exp
eri
men
tos c
om
um
fa
tor
Exemplo 2
Uma loja de departamento está
interessada em saber se existe
diferença entre as quantias médias
faturadas, através de três formas de
pagamento: dinheiro (D), cheque (C)
e cartão de crédito (CC). Um
levantamento das vendas (em
milhares de reais), em um dado
período de tempo foi realizado com
os resultados apresentados na
tabela. Assumindo distribuição
normal e que as variâncias são
iguais para os três grupos, verifique
se existem diferenças significativas
entre as médias, ao nível de
confiança de 95%.
Formas de pagamento
D C CC
56,00 80,90 73,25
20,50 51,29 56,65
37,37 40,95 123,21
28,64 72,65 56,50
132,47 37,29
60,32 44,65
60,00 40,64
∑ 142,51 498,58 432,19
n1 = 4; n2= 7; n3= 7; N= 18
T1 = 142,51; T2= 498,58
T3 = 432,19; T= 1073,28
Exp
eri
men
tos c
om
um
fa
tor
Exemplo 2
Tabela de xij2
Forma de pagamento ∑
D C CC
3136,00 6544,81 5365,56
420,25 2630,66 3209,22
1396,52 1676,90 15180,70
820,25 5278,02 3192,25
17548,30 1390,54
3638,50 1993,62
3600,00 1651,61
∑ 5773,02 40917,19 31983,50 78673,73
SQT = 14677,63
SQE = 3273,91
SQR = 11470,71
QME = 16,15
QMR = 456,03
Fcalc= 0,03
Fcrit = 3,68 (α = 5%)
Aceita Ho
Exp
eri
men
tos c
om
um
fa
tor
Exemplo 3 Foi utilizado três lubrificantes diferentes em máquinas para produção de
peças. A tabela apresenta as perdas de massa (em miligramas) das
peças por atrito para cada lubrificante. Supondo que os dados estão
distribuidos normalmente e que as variâncias são iguais, ao nível de
significância de 1%, as diferenças entre as médias são significativas?
Lubrificantes
∑ A B C
10 9 12
13 8 7
12 12 7
10 9 13
14 8 9
8 11 8
12 7 14
13 6 10
8 6
11
9
∑ 92 98 86 276
Exp
eri
men
tos c
om
um
fa
tor
Exemplo 3
Lubrificantes
∑ A B C
100 81 144
169 64 49
144 144 49
100 81 169
196 64 81
64 121 64
144 49 196
169 36 100
- 64 36
- 121 -
- 81 -
∑ 1086 906 888 2880
Tabela de xij2
SQT = 159,43
SQE = 32,30
SQR = 127,13
MQE = 32,30/2 = 16,15
MQR = 127,13/25 = 5,08
Fcal = 16,15/3,18 = 3,18
Fcrit = 5,57 (α = 1%)
Aceita Ho
Exp
eri
men
tos c
om
um
fa
tor
Exemplo 4
A tabela abaixo apresenta a resistência de ruptura
realizada em amostras de duas marcas diferentes
de fio dental.
Considerando que os dados estão normalmente
distribuídos e que as variâncias são iguais, pode-
se afirmar, ao nível de 2,5% de significância, que a
resistência média do fio dental da marca A é
significativamente superior à resistência média da
marca B?
Marca Resistência (Pa)
1 2 3 4 5 6 7 8 9 10 Média
A 20,2 23,0 24,2 19,4 21,4 20,8 - - - - 21,5
B 22,3 17,4 21,6 18,8 22,2 20,6 16,4 20,4 18,0 20,8 19,9
Exp
eri
men
tos c
om
um
fa
tor
Experimentos com dois fatores
São considerados, agora, dois tratamentos.
Este tipo de experimentos também recebe o
nome de delineamento de blocos aleatórios,
pois as unidades experimentais são obtidas
aleatoriamente para cada combinação de
tratamentos
An
ális
e d
e V
ari
ân
cia
Experimentos com dois fatores
Valores para ANOVA com dois fatores
Fator A Fator B
Total Nível 1 Nível 2 Nível 3 … Nível b
Nível 1 x11 x12 x13 … x1b A1
Nível 2 x21 x22 x23 … x2b A2
Nível 3 x31 x32 x33 … x3b A3
... … … … … … …
Nível a xa1 xa2 xa3
… xab Aa
Total B1 B2 B3 … Bb T
An
ális
e d
e V
ari
ân
cia
O modelo matemático é:
xij = μ + αi + βj + εij
Onde:
xij é o valor esperado com o efeito do i-ésimo
nível do fator A e do j-ésimo nível do fator B
μ é a média (constante)
αi é o efeito do i-ésimo nível do fator A
βj é o efeito do j-ésimo nível do fator B
εij é o resíduo (efeito do erro aleatório)
Experimentos com dois fatores
An
ális
e d
e V
ari
ân
cia
As hipóteses são:
Experimentos com dois fatores
0≠ um menos pelo H
====H
i
ao
:
0...:
1
21
0≠ um menos pelo H
====H
j
bo
:
0...:
1
21
1) Efeito do Fator A:
2) Efeito do Fator B:
An
ális
e d
e V
ari
ân
cia
Experimentos com dois fatores
Fonte de
variação
Graus de
liberdade
Soma
quadrática Quadrado médio Fcalc
Fator A a – 1 SQA QMA= SQA/(a – 1) QMA/QMR
Fator B b – 1 SQB QMB = SQB/(b – 1) QMB/QMR
Resíduos (a – 1).(b – 1) SQR QMR = SQR/(a – 1).(b – 1)
Total ab – 1 SQT -
Quadro para ANOVA com dois fatores
An
ális
e d
e V
ari
ân
cia
Experimentos com dois fatores
Os valores para cálculo são:
ab
Tx=SQ ∑∑
a
=i
b
=jijT
2
1 1
2 - ∑a
=iiA=Tsendo
1
:
ab
TA
b=SQ ∑
a
=jjA
2
1
2 -1
ab
TB
a=SQ ∑
b
=iiB
2
1
2 -1
SQR = SQT – SQA – SQB
An
ális
e d
e V
ari
ân
cia
Exemplo
A tabela abaixo apresenta o número de peças defeituosas
produzidas por quatro operários trabalhando em três máquinas
diferentes. Faça uma análise de variância considerando os dois
fatores (máquinas e operários) utilizando 5% de significância.
Máquinas Operários
Total B1 B2 B3 B4
A1 35 38 41 32 146
A2 31 40 38 31 140
A3 36 35 43 25 139
Total 102 113 122 88 425
Exp
eri
men
tos c
om
do
is f
ato
res
Exemplo
Máquinas Operários
Total B1 B2 B3 B4
A1 1225 1444 1681 1024 5374
A2 961 1600 1444 961 4966
A3 1296 1225 1849 625 4995
Total 3482 4269 4974 2610 15335
Tabela de xij2
92,28212
425-15335-
22
1 1
2 ==ab
Tx=SQ ∑∑
a
=i
b
=jijT
17,712
425-)139140146(
4
1-
1 2222
2
1
2 =++=ab
TA
b=SQ ∑
a
=jjA
92,21412
425-)88122113102(
3
1-
1 22222
2
1
2 =+++=ab
TB
a=SQ ∑
b
=iiB
SQR = SQT – SQA – SQB = 282,92 – 7,17 – 214,92 = 60,83
Exp
eri
men
tos c
om
do
is f
ato
res
Exemplo
Fonte de
variação
Graus de
liberdade
Soma
quadrática
Quadrado
médio Fcalc Fcrítico
Máquinas
(Fator A) 3 – 1 = 2 7,17 3,58
3,58/10,14 =
0,35
5,14
Operários
(Fator B) 4 – 1 = 3 214,92 71,64
71,64/10,14 =
7,06
4,76
Resíduos 2.3 = 6 60,83 10,14 - -
Total 11 282,92 - - -
Quadro para ANOVA com dois fatores
Como Fcalc = 0,35 < Fcrit = 5,14 conclui-se que o fator
máquina não influencia ao nivel de significância de 5% na
igualdade das médias
Como Fcalc = 7,06 > Fcrit = 4,76 conclui-se que o fator
operários influencia ao nível de significância de 5% na
igualdade das médias
Exp
eri
men
tos c
om
do
is f
ato
res
Experimentos com dois fatores repetidos
O modelo matemático é:
xij = μ + αi + βj + (αβ)ij + εij
Onde:
xij é o valor esperado com o efeito do i-ésimo
nível do fator A e do j-ésimo nível do fator B
μ é a média (constante)
αi é o efeito do i-ésimo nível do fator A
βj é o efeito do j-ésimo nível do fator B
(αβ)ij é o efeito da interação entre αi e βj
εij é o resíduo (efeito do erro aleatório)
An
ális
e d
e V
ari
ân
cia
Experimentos com dois fatores repetidos
O modelo matemático das médias é:
( )ijjiij
ijijij
β+β++μ=μ
ε+μ=x
An
ális
e d
e V
ari
ân
cia
Experimentos com dois fatores repetidos
As hipóteses são:
0):
0)(:
≠( um menos pelo H
ji, todo para =H
ij1
ijo
0≠ um menos pelo H
====H
i
ao
:
0...:
1
21
0≠ um menos pelo H
====H
j
bo
:
0...:
1
21
1) Efeito do Fator A:
2) Efeito do Fator B:
3) Efeito da interação:
An
ális
e d
e V
ari
ân
cia
Fator A Fator B
Total Nível 1 Nível 2 Nível 3 … Nível b
Nível 1
x111 x121 x131
…
x1b1
A1 … … … …
x11r x12r x13r x1br
Nível 2
x211 x221 x231
…
x2b1
A2 … … … …
x21r x22r x23r x2br
... … … … … … …
Nível a
xa11 xa21 xa31
…
xab1
Aa … … … …
xa1r xa2r xa3r xabr
Total B1 B2 B3 … Bb T
Experimentos com dois fatores repetidos
An
ális
e d
e V
ari
ân
cia
Fonte de
variação
Graus de
liberdade
Soma
quadrática Quadrado médio Fcalc
Fator A a – 1 SQA QMA= SQA/(a – 1) QMA/QMR
Fator B b – 1 SQB QMB = SQB/(b – 1) QMB/QMR
Interação (a – 1).(b – 1) SQI QMI = SQI/(a – 1).(b – 1) QMI/QMR
Resíduos a.b.(r – 1) SQR QMR = SQR/a.b.(r – 1) -
Total a.b – 1 SQT - -
Quadro para ANOVA
Experimentos com dois fatores repetidos
An
ális
e d
e V
ari
ân
cia
Experimentos com dois fatores repetidos
Os valores para cálculo são:
abr
Tx=SQ ∑∑∑
a
=i
b
=jijk
r
=kT
2
1 1
2
1
-
abr
TA
br=SQ ∑
a
=jjA
2
1
2 -1
abr
TB
ar=SQ ∑
b
=iiB
2
1
2 -1
SQR = SQT – SQA – SQB – SQR
BA
a
=i
b
=jijI SQSQ
abr
TS
r=SQ ∑∑ ---
1 2
1 1
2∑
r
=kijkij x=S
1
sendo:
An
ális
e d
e V
ari
ân
cia
Exemplo Consumo
de cimento (kg/m3) – A
Tipo de areia - B ∑
Natural Britada
260
3,62 4,23
40,16
3,69 4,96
3,64 4,13
3,69 4,24
3,69 4,27
220
1,63 1,55
15,77
1,73 1,44
1,66 1,57
1,64 1,48
1,49 1,58
180
0,57 1,01
8,31
0,56 1,04
0,58 1,13
0,55 1,19
0,56 1,12
∑ 29,30 34,94 64,24
A tabela apresenta as
resistências à compressão
(MPa) para argamassas
produzidas com dois tipos
de areia e com três
consumos de cimento
diferentes. Avaliar a
influência das variáveis na
média das resistências ao
nível de significância de
5%.
Ex
pe
rim
en
tos
co
m d
ois
fa
tore
s r
ep
eti
do
s
Exemplo Tabela de xij
2
Consumo de cimento (kg/m3) – A
Tipo de areia - B ∑
Natural Britada
260
13,10 17,89
13,62 24,60
13,25 17,06
13,62 17,98
13,62 18,23
220
2,66 2,40
2,99 2,07
2,76 2,46
2,69 2,19
2,22 2,50
180
0,32 1,02
0,31 1,08
0,34 1,28
0.30 1,42
0,31 1,25
∑ 81,81 113,43 195,24 Ex
pe
rim
en
tos
co
m d
ois
fa
tore
s r
ep
eti
do
s
Exemplo
68,5730
24,64-24,195-
22
2
1 1
2
1
==abr
Tx=SQ ∑∑∑
a
=i
b
=jijk
r
=kT
50,5530
24,64-)31,877,1516,40(
10
1-
1 2222
2
1
2 =++=abr
TA
br=SQ ∑
a
=jjA
06,130
24,64-)94,3430,29(
15
1-
1 222
2
1
2 =+=abr
TB
ar=SQ ∑
b
=iiB
SQR = SQT – SQA – SQB – SQR = 0,21
=SQSQabr
TS
r=SQ BA
a
=i
b
=jijI ∑∑ ---
1 2
1 1
2
91,006,1-50,55-30
24,64-)49,582,262,715,883,2133,18(
5
1 2222222 =+++++=SQI
Ex
pe
rim
en
tos
co
m d
ois
fa
tore
s r
ep
eti
do
s
Exemplo
Fonte de
variação
Graus de
liberdade
Soma
quadrática
Quadrado
médio Fcalc Fcrit
Fator A 2 55,50 QMA= 27,75 3171,43 3,40
Fator B 1 1,06 QMB = 1,06 121,14 4,26
Interação 2 0,91 QMI = 0,45 51,43 3,40
Resíduos 24 0,21 QMR = 0,00875 -
Total 29 57,68 - -
Logo, o tipo de areia, o consumo de cimento e a
interação do tipo de areia e consumo de cimento
influenciam no resultado da resistência à compressão.
Quadro para ANOVA
Ex
pe
rim
en
tos
co
m d
ois
fa
tore
s r
ep
eti
do
s