Matemática Integrada_Unidade II(1)
Transcript of Matemática Integrada_Unidade II(1)
-
8/18/2019 Matemática Integrada_Unidade II(1)
1/110
81
MATEMÁTICA INTEGRADA
Unidade II
5 TESTES DE HIPÓTESES
Prezado aluno, considerado atualmente um dos principais assuntos da estatística, a inferênciaestatística é dividida em dois tópicos: a estimação de parâmetros, que você acabou de estudar, e os testesde hipóteses. Esses métodos estatísticos foram desenvolvidos com as primeiras técnicas de inferência, asquais faziam diversas hipóteses sobre a natureza da população da qual se extraíam os dados. Uma vezque os valores relacionados com a população são denominados parâmetros , essas técnicas estatísticasforam denominadas de paramétricas.
Saiba mais
O jornalista Santos (2003), da Folha.com, disponibilizou sites com índiceseconômicos, estatísticas e dados demográficos que podem ser utilizadosem projetos de pesquisa. Acesse:
.
Testes de hipóteses são, portanto, definidos como suposições feitas sobre os parâmetros de umapopulação em estudo. Essas hipóteses ou suposições podem ou não ser verdadeiras. Veja, a seguir, comoelas são interpretadas:
5.1 Hipóteses nulas e alternativas
a) Hipótese nula (Ho): é qualquer hipótese a ser testada, ou seja, a ser validada pelo teste.
b) Hipótese alternativa (H1): é qualquer hipótese diferente da nula, complementar à H
o.
O teste tem por finalidade colocar a hipótese nula em contradição com a hipótese alternativa. Assim,o teste poderá aceitar ou rejeitar a hipótese nula. A hipótese alternativa (H
1), que é contrária à (H
o), será
aceita se a hipótese nula (Ho) for rejeitada.
Vamos supor que a média populacional µ seja o parâmetro que você deseja testar.
As hipóteses nula (Ho
) e alternativa (H1
) são geralmente representadas como a seguir:
-
8/18/2019 Matemática Integrada_Unidade II(1)
2/110
82
Unidade II
1º Tipo
a) Ho: µ = µo
H1: µ ≠ µo
Quando efetuamos esse teste, o gráfico será sempre como a seguir: bilateral, com duasregiões de rejeição ou regiões críticas. Os valores que delimitam as áreas de aceitação e rejeiçãode todos os gráficos nos testes de hipóteses são obtidos das tabelas correspondentes de cadaestudo.
RC RC
RA
Figura 22 - Gráfico de distribuição bilateral, com duas áreas de rejeição
Sendo:
RA a região de aceitação (da hipótese nula (Ho)) e RC é a região crítica ou região de rejeição.Essas regiões, de aceitação e rejeição, são delimitadas por um valor tabelado obtido da Tabela dadistribuição normal (tabela 16) ou da Tabela da Distribuição t-Student (tabela 21), como veremosmais à frente.
2º Tipo
b) Ho: µ ≤ µo
H1: µ > µo
RC
RA
Figura 23 - Gráfico de distribuição, com área de rejeição à direita
-
8/18/2019 Matemática Integrada_Unidade II(1)
3/110
83
MATEMÁTICA INTEGRADA
3º Tipo
c) Ho: µ ≥ µo
H1: µ < µo
RC
RA
Figura 24 - Gráfico de distribuição, com área de rejeição à esquerda
Observação
Veja que, na hipótese nula (Ho), sempre temos uma igualdade (=) e na
hipótese alternativa (H1), uma desigualdade (≤, ≥ ou ≠).
As hipóteses testadas em a (1o tipo) envolvem um teste bilateral, enquanto em b e c (2o e 30 tipos), testes unilaterais. Isso é justificado pelo fato de que nas hipóteses testadas no 1 o tipo há
duas regiões de rejeição (os dois extremos do gráfico); portanto, será bilateral ou bicaudal . Poroutro lado, nos 2o e 3o tipos só há uma região de rejeição; portanto, o teste será unilateral ou unicaudal.
Lembrete
Os valores tabelados que delimitam as regiões de aceitação e rejeiçãodo gráfico são retirados das tabelas de distribuição normal ou t-Student ,como já foi explicado anteriormente.
5.2 Teste de hipótese para a média de uma população, amostra grande epequena
Para decidir o valor tabelado que será utilizado como fronteira entre as regiões de rejeição e aceitação,analise a tabela a seguir:
-
8/18/2019 Matemática Integrada_Unidade II(1)
4/110
84
Unidade II
Tabela 29
Tamanho daamostra
Se a variânciapopulacional (σ
2)
Uso a distribuição
GRANDE (n ≥ 30) conhecida Normal
GRANDE (n ≥ 30) desconhecida Normal
PEQUENA (n < 30) conhecida Normal
PEQUENA (n < 30) desconhecida T de Student
Importante! Observe que só se utiliza a distribuição t de Student quando as amostras são pequenas,ou seja, o número de elementos for inferior a 30 e a variância populacional for desconhecida. Casoa amostra seja grande (a partir de 30 elementos), não importará ser conhecida ou não a variânciapopulacional, e será usada a tabela da distribuição normal para encontrar o valor Z. Portanto, namaior parte dos casos usaremos a distribuição normal, pois necessita que uma das condições seja
atendida: amostra grande (n ≥ 30) ou variância populacional conhecida.
Lembrete
Por outro lado, para usar a distribuição t de Student, duas condiçõesterão de acontecer ao mesmo tempo: amostra pequena (n < 30) e variânciapopulacional desconhecida.
Para procedermos ao teste, temos que conhecer o valor tabelado Z da distribuição normal ou de t da
distribuição t de Student . Além dos valores tabelados, que irão delimitar as áreas de aceitação e rejeição, temos que encontrar
os valores calculados (ZCALC ou tCALC) para efetuar o teste, que serão nossas estatísticas de testes. São
esses valores que serão analisados se estão na área de aceitação ou de rejeição do gráfico, delimitadospelos valores tabelados, para aceitarmos ou não a hipótese a ser testada.
1. Se o desvio padrão populacional (σ) for conhecido, a estatística de teste será:
Z x
n
calc =
− µ
σ
ou,
se a amostra for grande (n ≥ 30) e não soubermos o valor do desvio padrão populacional (σ),usaremos o desvio padrão amostral (S), e a estatística teste será:
-
8/18/2019 Matemática Integrada_Unidade II(1)
5/110
85
MATEMÁTICA INTEGRADA
Z x
s
n
calc =
− µ
2. No caso de a amostra ser pequena (n < 30) e o desvio padrão populacional desconhecido, usaremosa Distribuição t de Student , e a estatística de teste será:
t x
s
n
calc =
− µ
Vamos supor que usaremos a distribuição normal padrão (Z):
Para o teste bilateral:
RC RC
RA
Figura 25 - Gráfico de distribuição bilateral, com duas áreas de rejeição
Se:
• Zcalc
estiver na região RA (região de aceitação), ou seja, Se - Ztab
< Zcalc
-
8/18/2019 Matemática Integrada_Unidade II(1)
6/110
86
Unidade II
• Se ZCALC < Z
TAB, aceita-se H
o.
• Se ZTAB
< ZCALC, rejeita-se Ho.
b) Para quando o teste for unilateral à esquerda
RC
RA
Figura 27 - Gráfico de distribuição, com área de rejeição à esquerda
• Se - ZTAB
< ZCALC
, aceita-se Ho.
• Se ZCALC
< ZTAB
, rejeita-se Ho.
Observação
Você usará o mesmo raciocínio para os casos em que se tratar dedistribuição t-Student , com a diferença de que compararemos t
calc.com t
tab.,
ao invés de ZCALC.
com ZTAB.
Para ajudá-lo(a) na análise da teoria, observe a resolução de exercícios de teste de hipóteses.
Vamos aplicá-lo em alguns exemplos:
1o Estabelecer a hipótese Nula (H0) e a hipótese alternativa (H
1) de acordo com o enunciado do
problema.2o Também de acordo com os dados do enunciado do problema, definir a distribuição que deve ser
utilizada (distribuição normal ou t-Student ).
3o Consulte a tabela normal padrão ou a tabela t-Student para encontrar o valor de ZTAB ou tTAB.
4o Desenhe a curva, plotando no eixo das abscissas o valor tabelado, que será o limite entre a áreade aceitação (RA) e a(s) área(s) de rejeição (RC-Região Crítica).
5o Calcule a estatística de teste (ZCALC
ou tCALC
), utilizando uma das fórmulas dadas anteriormente.
-
8/18/2019 Matemática Integrada_Unidade II(1)
7/110
87
MATEMÁTICA INTEGRADA
6o Compare o valor calculado com o valor tabelado e conclua se deverá ser aceita ou rejeitada ahipótese nula.
Observação
Agora que você já tem um roteiro para seguir na execução dos testesde hipóteses, deverá ficar bem mais fácil a sua realização. Mas, antes depassarmos para os exemplos, vamos praticar um pouco o uso das tabelascom os principais níveis de significância (α) que geralmente são adotados,como listados a seguir.
A) I Na Tabela da Distribuição Normal (Tabela 16)
Para o teste bilateral:
a) Se α = 1%, teremos α/2 = 0,5% = 0,005 (para cada lado da curva) e a área de aceitação será de99% (0,99), sendo 0,495 à esquerda e 0,495 à direita do ponto máximo da curva.
Lembrete
A distribuição normal é simétrica!
Consultando a tabela normal, temos 0,4949 para uma abscissa de 2,57 e 0,4951 para uma abscissa de2,58. Logo, por interpolação, a abscissa correspondente à área de 0,495 será a média das duas abscissas,ou seja, 2,575. Para facilitar, adotaremos, no teste bilateral, quando α = 1%, Z
TAB= 2,58. Vejamos o
gráfico da curva normal:
0,005-Z
TAB= -2,58 +Z
TAB= +2,580,005
Áreas de aceitação
0,495 0,495
Figura 28 - Gráfico de distribuição normal, com duas áreas de rejeição
Nesse caso, Hosó será aceita caso o valor de Z
CALC estiver entre -2,58 e 2,58.
b) Se α = 5%, teremos α/2 = 2,5% = 0,025 (para cada lado) e a área de aceitação será de 95% (0,95),sendo 0,475 à esquerda e 0,475 à direita. Verificamos, na tabela normal, que uma área de 0,475
-
8/18/2019 Matemática Integrada_Unidade II(1)
8/110
-
8/18/2019 Matemática Integrada_Unidade II(1)
9/110
89
MATEMÁTICA INTEGRADA
+ZTAB
= +2,330,01
Áreas de aceitação
0,50 0,49
Figura 31 - Gráfico de distribuição normal, com área de rejeição à direita
e) Se α = 5% (0,05), teremos área de aceitação = 0,95 à esquerda. Consultaremos, na tabela normal,a área de 0,45 (0,95 - 0,50), que corresponde à abscissa de 1,65. Portanto, no teste unilateral à direita,
quando α = 5%, então ZTAB = 1,65, e no teste unilateral à esquerda para o mesmo α, -ZTAB = -1,65. Vejamos o gráfico da curva normal:
+ZTAB
= +1,650,05
Áreas de aceitação
0,50 0,45
Figura 32 - Gráfico de distribuição normal, com área de rejeição à direita
f) Seα = 10% (0,10), área de aceitação = 0,90 à esquerda. Na tabela normal, o valor mais próximo de0,40 (0,90 – 0,50) é de 0,3997, que corresponde à abscissa de 1,28. Portanto, no teste unilateral à direita,para α = 10%, Z
TAB= 1,28 e no teste unilateral à esquerda, -Z
TAB= -1,28.
Vendo o gráfico da curva normal:
+ZTAB
= +1,280,10
Áreas de aceitação
0,50 0,40
Figura 33 - Gráfico de distribuição normal, com área de rejeição à direita
-
8/18/2019 Matemática Integrada_Unidade II(1)
10/110
90
Unidade II
B) II Tabela da distribuição t-Student (Tabela 20)
Nesse teste, temos que utilizar dois parâmetros para a consulta da tabela t-Student : α (alfa), que éo nível de significância, e (g.l.), que é o número de graus de liberdade dado por: n (número de elementosda amostra) menos 1 unidade, ou seja: g.l. = n – 1.
Temos que avaliar também o tipo de tabela, que pode ser: bilateral ou unilateral. Aqui, usaremos atabela bilateral, como pode ser notado no desenho da curva na própria tabela. Assim, no teste bilateral,o α da tabela será o próprio α utilizado no teste. Mas, para o teste unilateral, teremos que procurar,nessa tabela, o dobro do α.
a) Teste bilateral: suponha uma amostra de 25 elementos (n = 25). Portanto, g.l. = 25 – 1, g.l. = 24.
Para um α = 5%, vemos na tabela que a célula interseção de α = 0,05 e g.l. = 24 nos fornece 2,064.
Portanto: tTAB = 2,064 para α = 5% e n = 25.
Tabela 30 - Tabel t (de Student )
gl/P 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001
01 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619
02 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,598
03 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,541 12,924
04 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610
05 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869
20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850
21 0,127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819
22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792
23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,767
24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745
25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,726
26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707
27 0,127 0,256 0,389 0,531 0,684 0,856 1,057 1,314 1,703 2,052 2,473 2,771 3,690
Observe o gráfico:
0,025 0,025
2,064
Figura 34 - Gráfico de distribuição t de Student , teste bilateral
-
8/18/2019 Matemática Integrada_Unidade II(1)
11/110
91
MATEMÁTICA INTEGRADA
Observe que para um teste unilateral com o mesmo tamanho de amostra e o mesmo α: não serápossível obter diretamente a interseção de α = 0,05 com g.l.= 24, pois o valor fornecido é para um testebilateral. Nesse caso, busca-se a interseção de g.l. = 24 com α = 0,10.
Lembrete
Não se esqueça de que, na tabela (bilateral), α = 0,05 corresponde a0,025 de cada lado. Por essa razão, será adotadoα = 0,10, que corresponderáa 0,05 de cada lado. Assim, a célula interseção de α = 0,10 com g.l.= 24fornecerá t
TAB= 1,711.
Veja o gráfico:
0,05
1,711
Figura 35 - Gráfico de distribuição t de Student , teste unilateral
Exemplo de aplicação
Exercícios resolvidos de teste para a média populacional utilizando a distribuição normal
1. A nota média em um curso de graduação era da ordem de 61 pontos. Atualmente existemmonitores à disposição dos alunos para orientação nas disciplinas de maior dificuldade.Deseja-se saber se a nota média do curso aumentou após a introdução da monitoria. Para isso,selecionaram-se 40 alunos do curso atual, e a média de notas encontradas foi de 66 pontos, comum desvio padrão de 3 pontos. Ao nível de significância de 5%, pode-se concluir que a nota
média aumentou?Solução:
Dados:
µ = 61 pontosN = 40x = 66 pontosS = 3 pontos
α = 5%
-
8/18/2019 Matemática Integrada_Unidade II(1)
12/110
92
Unidade II
Primeiramente, você deverá calcular a estatística de teste:
Cálculo da estatística de teste
Z xs
n
Z
Z
Z
Z
calc
calc
calc
calc
calc
= −
=−
=
=
=
µ
66 61
3
40
5
3
6 32
5
0 47
10 6
,
,
, 44
→estatística de teste
Após o cálculo da estatística teste, devemos formular as hipóteses a serem testadas:
Ho: µ = 61 pontos
H1: µ ≠ 61 pontos
Valores tabelados: serão obtidos a partir da tabela de distribuição normal (Tabela 16), com α = 5%e teste bilateral (bicaudal).
0- zc = -1,96 + zc = 1,96
1 α = 95%1
2
95
247 5 0 475
−= = =
α, % ,
1
2
95
247 5 0 475
−= = =
α, % ,
Figura 36 - Diagrama de distribuição Normal, para nível de significânciade 5% (ou seja, confiança de 90%)
-
8/18/2019 Matemática Integrada_Unidade II(1)
13/110
93
MATEMÁTICA INTEGRADA
Tabela 31
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.07530.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
Procure no corpo da tabela o valor 0,4750, siga a linha e a coluna correspondente e obterá:
Ztab = ±196,
R R
Área de aceitação
- zTAB = -1,96 + zTAB = +1,96
Figura 37- Distribuição normal, para nível de significância de 5% (teste bilateral)
-
8/18/2019 Matemática Integrada_Unidade II(1)
14/110
94
Unidade II
As regiões abaixo de -1,96 e acima de +1,96 são de rejeição e a região entre -1,96 e +1,96 é deaceitação.
Como Zcalc = 10,64 está acima de + 1,96, está na área de rejeição, portanto rejeita-se Ho.
Deve-se efetuar, portanto, um novo teste:
Ho: µ = 61 pontos
H1: µ ≥ 61 pontos
Valor tabelado: será obtido a partir da tabela de distribuição normal, com α = 5% e teste unilateral(unicaudal).
Lembrete: utilize o valor de α dobrado, ou seja: α = 10%.
0- ztab = -1,645
1 - α = 90%
1
2
90
245 0 45
−= = =
α% ,
Figura 38 - Diagrama de distribuição normal, para nível de significância de 5% (ou seja, confiança de 90%)
Tabela 32
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.11410.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
-
8/18/2019 Matemática Integrada_Unidade II(1)
15/110
95
MATEMÁTICA INTEGRADA
Lembrete
Procure, no corpo da tabela, o valor 0,450, siga a linha e a coluna
correspondente para valores de z aproximados. No entanto, se for ocaso de um cálculo mais rigoroso, é necessário estabelecer a médiaaritmética em relação aos valores encontrados para Z em torno de0,450.
ztab =+
=1 64 1 65
21645
, ,,
No entanto, na situação de exercício, vamos utilizar:
Z
ou
tab = −
+
165
165
,
,
Como a região de aceitação está à direita, utilizaremos o valor positivo de ZTAB = +1,65.
R
Área de aceitação
- zTAB = -1,65
Figura 39 - Diagrama de distribuição normal, teste unilateralpara nível de significância de 5%
Uma vez que Zcalc = 10,64, está, portanto, na região de aceitação, aceita-se H1, então:
H1: µ = > 61 pontos. Como µ = 61 pontos, já havia sido rejeitado no primeiro teste, então o que está
sendo aceito agora é só µ > 61 pontos.
Resposta:
Como a hipótese aceita é de µ > 61 pontos, ao nível de significância de 5%, pode-se concluir que anota média aumentou.
-
8/18/2019 Matemática Integrada_Unidade II(1)
16/110
96
Unidade II
2. O peso médio de embalagens de suco de uva em uma linha de produção está sendo investigado. Opadrão prevê um conteúdo médio de 1000 ml por embalagem. Sabe-se que o desvio padrão é de 10 ml eque a variável tem distribuição normal. Ao nível de 1% de significância com 4 unidades amostrais, e sendo oconteúdo médio da embalagem de 1012 ml, o que se pode concluir quanto ao padrão estar sendo respeitado?
Solução:
Dados:
µ = 1000 ml
σ = 10 ml
N = 4
x = 1012 ml
α = 1%
Cálculo da estatística de teste
Z x
n
Z
Z
Z
Z
calc
calc
calc
calc
calc
=−
=−
=
=
=
µ
σ
1012 1000
10
4
12
10
2
12
5
2 4, → estatística teste
Após o cálculo da estatística teste, devemos formular as hipóteses a serem testadas:
Ho: µ = 1000 ml
H1: µ ≠ 1000 ml
Valores tabelados: serão obtidos a partir da tabela de distribuição normal, com α = 1% e teste
bilateral (bicaudal) → Ztab = ± 2,58
-
8/18/2019 Matemática Integrada_Unidade II(1)
17/110
97
MATEMÁTICA INTEGRADA
Lembrete
O procedimento é similar ao do exercício anterior. Caso você tenha
dúvidas, retome a unidade I.
R R
Área de aceitação
- zTAB = -2,58 + zTAB = +2,58
Figura 40 - Diagrama de distribuição normal, teste bilateral para nível de significância de 1%
As regiões abaixo de -2,58 e acima de +2,58 são de rejeição e a região entre -2,58 e +2,58 é deaceitação.
Como Zcalc = 2,4 está entre –2,58 e +2,58, considerada região de aceitação, aceita-se Ho: µ = 1000 ml.
Resposta:
Uma vez que o padrão prevê um conteúdo médio de 1000 ml por embalagem, ao nível de 1%,podemos aceitar que o padrão está sendo respeitado.
3. A média de ganho de peso de crianças amamentadas com leite materno é de 25 g, com umdesvio padrão de 5 g durante certo período observado nos primeiros meses de vida. Para uma amostrade 35 crianças observadas durante o mesmo período, alimentadas com leite de vaca, observou-se umganho de peso médio de 30 g. Podemos afirmar, ao nível de 1%, que a amamentação com leite maternocontribui mais para o ganho de peso nos primeiros meses de vida?
Solução:Dados:
µ = 25 g
σ = 5 g
N = 35
x = 30
α = 1%
-
8/18/2019 Matemática Integrada_Unidade II(1)
18/110
98
Unidade II
Cálculo da estatística teste
Z x
n
Z
Z
Z
Z
calc
calc
calc
calc
calc
=−
=−
=
=
=
µ
σ
30 25
5
35
5
5
5 92
5
0 84
5 95
,
,
, → estatística de teste
Após o cálculo da estatística de teste, devemos formular as hipóteses a serem testadas:
Ho: µ = 30 g
H1: µ ≠ 30 g
Valores tabelados: serão obtidos a partir da tabela de distribuição normal (Tabela 16).
Lembrete
O procedimento é similar ao dos exercícios anteriores. Caso você tenhadúvidas, retome a unidade I.
Com α = 1% e teste bilateral (bicaudal) → Ztab = + 2,58
R R
Área de aceitação
- zTAB = -2,58 + zTAB = +2,58
Figura 41 - Diagrama de distribuição normal, teste bilateral para nível de significância de 1%
-
8/18/2019 Matemática Integrada_Unidade II(1)
19/110
99
MATEMÁTICA INTEGRADA
As regiões abaixo de -2,58 e acima de +2,58 são de rejeição e a região entre - 2,58 e + 2,58 é deaceitação.
Como Zcalc = 5,95 está acima de +2,58, ou seja, está na área de rejeição, rejeita-se Ho.
Deve-se efetuar, portanto, um novo teste:
Ho: µ = 30 g
H1: µ ≥ 30 g
Valor tabelado: será obtido a partir da tabela de distribuição normal (Tabela 16).
com α = 1% e teste unilateral (unicaudal).
Lembrete
Como o teste unilateral só foi utilizado uma vez neste estudo, o cálculode z tabelado será feito de forma mais detalhada. Assim, não se esqueça deutilizar o valor de α dobrado: α = 2%.
0- ztab = -2,33
1 - α = 98%
1
2
98
249 0 49
−= = =
α% ,
Figura 42 - Diagrama de distribuição normal, para nível de significância de 1%, Teste Unilateral
-
8/18/2019 Matemática Integrada_Unidade II(1)
20/110
100
Unidade II
Tabela 33
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.07530.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.48172.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
Lembrete
Procure no corpo da tabela o valor 0,490, siga a linha e a colunacorrespondente para valores de z aproximados.
No entanto, na situação de exercício, vamos utilizar:
Z
ou
tab = −
+
2 33
2 33
,
,
-
8/18/2019 Matemática Integrada_Unidade II(1)
21/110
101
MATEMÁTICA INTEGRADA
Como a região de aceitação está à direita e a de rejeição à esquerda, utilizaremos o valor negativode Ztab = - 2,33.
R
Área de aceitação
- zTAB = -2,33
Figura 43 - Diagrama de distribuição normal, teste unilateral para nível de significância de 1%
Uma vez que Zcalc = 5,95 está na região de aceitação, pois é maior que 2,33, rejeita-se H 1. Então, a
hipótese a ser aceita seria o 2o tipo, ou seja, H: µ > 30 g.
Hipótese aceita: H1: µ > 30 g. Como µ = 30 gramas, já havia sido rejeitada no primeiro teste, entãoo que está sendo aceito agora é só µ > 30 g.
Resposta:
Como a hipótese aceita é de µ > 30 g, ao nível de significância de 1%, pode-se concluir que o ganhode peso com o leite de vaca é inferior nesse período, sendo superior o ganho de peso com leite materno.
4. Para verificar a eficácia de uma nova droga contra determinada doença, foram injetadas doses em15 ratos, e a média de ratos que adoeceram foi igual a 20, com desvio padrão de 6. Com a droga antiga,a média de ratos doentes era em torno de 23. Podemos afirmar ao nível de 1% que a nova droga trouxeresultados melhores na prevenção da doença?
Solução:
Dados:
µ =23 ratosN = 15x = 20 ratosS = 6 pontosα = 1%
Observação:
Como se trata de amostra pequena (N < 30) e desvio padrão populacional (σ) desconhecido, deve-se
aplicar o teste t de Student para a média populacional.
-
8/18/2019 Matemática Integrada_Unidade II(1)
22/110
102
Unidade II
Cálculo da estatística de teste:
t x
s
n
t
t
t
t
calc
calc
calc
calc
calc
=−
=−
=−
=−
=−
µ
20 23
6
15
3
6
15
3
63 87
3
1
,
,,
,
55
1 94tcalc = −
Após o cálculo da estatística teste, devemos formular as hipóteses a serem testadas:
Ho: µ = 23 ratos doentes
H1: µ ≠ 23 ratos doentes
Valores tabelados: serão obtidos a partir da tabela de distribuição t de Student (Tabela 20), com α = 1%, teste bilateral (bicaudal) e g.l. = N -1 = 15 – 1 = 14.
-
8/18/2019 Matemática Integrada_Unidade II(1)
23/110
103
MATEMÁTICA INTEGRADA
Tabela 34
gl/P 0,90 0,80 0,70 0,60 0,50 0,40 0,30 0,20 0,10 0,05 0,02 0,01 0,001
01 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619
02 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,59803 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,541 12,924
04 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610
05 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869
06 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959
07 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,365 3,499 5,408
08 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041
09 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781
10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587
11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437
12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318
13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221
14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140
15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073
Utilizando a linha de graus de liberdade 14 e a coluna referente a 1%, obtém-se t tab = 2,977.
0- ttab = -2,977 + ttab = 2,977
99%
g(t)
α
2
1
20 5 0 005= = =, % ,
α
2
1
20 5 0 005= = =, % ,
Figura 44 - Diagrama de distribuição t de Student
ttab = + 2,977
ttab = -2,977
-
8/18/2019 Matemática Integrada_Unidade II(1)
24/110
104
Unidade II
RCRC
ttab = -2,977 ttab = 2,977
RA
Figura 45 - Diagrama de distribuição, teste bilateral
Resposta:
Como a estatística de teste (tcalc = 1,94) está na região de aceitação do gráfico, aceita-se:
Ho: µ = 23 ratos doentes, o que significa que a média de ratos doentes não se modificou; logo, adroga não trouxe resultados melhores na prevenção da doença.
Conclusão
A droga não foi eficiente.
5. O tempo médio, por operário, para executar uma tarefa tem sido 100 minutos, com um desviopadrão de 15 minutos. Introduziu-se uma modificação para diminuir esse tempo e, após certo período,
sorteou-se uma amostra de 16 operários, medindo-se o tempo de execução de cada um. O tempo médioda amostra foi de 85 minutos. Esses resultados trazem evidências estatísticas da melhora desejada aonível de 5%?
Solução:
Dados:
µ = 100 minutos
N = 16
x = 85 minutos
σ = 15 minutos
α = 5%
Primeiramente, deveremos calcular a estatística de teste:
-
8/18/2019 Matemática Integrada_Unidade II(1)
25/110
105
MATEMÁTICA INTEGRADA
Cálculo da estatística de teste
Z x
n
Z
Z
Z
Z
calc
calc
calc
calc
calc
=−
=−
=−
=−
=
µ
σ
85 100
15
16
15
15
4
15
3 75,
−− →4 estatística de teste
Após o cálculo da estatística teste, devemos formular as hipóteses a serem testadas:
Ho: µ = 100 minutos
H1: µ ≠ 100 minutos
Valores tabelados: serão obtidos a partir da tabela de distribuição normal (Tabela 16), comα = 5% = 5% e teste bilateral (bicaudal) →
Ztab = + 1,96
Lembrete
O procedimento é similar ao dos exercícios anteriores. Caso você tenhadúvidas, retome a unidade I.
R R
Área de aceitação
- zTAB = -1,96 + zTAB = +1,96
Figura 46 - Diagrama de distribuição, teste bilateral
-
8/18/2019 Matemática Integrada_Unidade II(1)
26/110
106
Unidade II
As regiões abaixo de -1,96 e acima de +1,96 são de rejeição, e a região entre -1,96 e +1,96 é deaceitação.
Como Zcalc = -4 está abaixo de - 1,96, está na área de rejeição; portanto, rejeita-se Ho.
Deve-se efetuar, portanto, um novo teste:
Ho: µ = 100 minutos
H1: µ ≥ 100 minutos
Valor tabelado: será obtido a partir da tabela de distribuição normal, com α = 5% e teste unilateral(unicaudal).
Lembrete
O procedimento é similar ao dos exercícios anteriores. Caso você tenhadúvidas, retome a unidade I.
Como a região de aceitação está à direita, utilizaremos o valor positivo de Ztab = + 1,65.
R
Área de aceitação
- zTAB = -1,65
Figura 47 - Diagrama de distribuição, teste bilateral
Uma vez que Zcalc = -4, está, portanto, na região de rejeição, rejeita-se H1, então:
H1: µ ≤ 100 minutos. Como µ = 100 minutos, já havia sido rejeitado no primeiro teste; então, o que
está sendo aceito agora é só µ < 100 minutos.
Resposta:
Como a hipótese aceita é de µ < 100 minutos, ao nível de significância de 5%, pode-se concluir queesses resultados trazem evidências estatísticas da melhora desejada, ao nível de 5%.
-
8/18/2019 Matemática Integrada_Unidade II(1)
27/110
107
MATEMÁTICA INTEGRADA
5.3 Teste de hipóteses para a média de duas populações
O procedimento associado com o teste da diferença entre duas médias é similar ao utilizado noteste de um valor hipotético da média populacional, exceto que se utiliza o erro padrão da diferençaentre médias como base para determinar o valor da estatística de teste associada com os resultados dasamostras.
A hipótese nula H0 usualmente testada é a de que as duas amostras tenham sido obtidas de
populações com médias iguais, ou seja, (µ1 - µ
2) = 0.
A hipótese alternativa H1, chamada hipótese alternativa, é uma hipótese que só será considerada
verdadeira no caso de H0 ser considerada falsa.
O teste Z de duas amostras para verificar a diferença entre duas médias populacionais
Para a realização desse teste, três condições devem ser satisfeitas:
1) as amostras devem ser selecionadas de forma aleatória;
2) essas amostras devem ser independentes;
3) cada amostra deve ter um tamanho maior ou igual a 30. Se isso não ocorrer, cada populaçãoestudada deve apresentar distribuição normal e desvio padrão conhecido.
Caso essas condições não sejam satisfeitas, a distribuição amostral para a diferença entre as médiasamostrais ( x x
1 2− ) é uma distribuição normal com média e desvio padrão de:
µ µ µ µ µ
σ σ σ σ σ
x x x x
x x x x
e
n
_ _ _ _
( )
1 2 1 2
1 2
1 2
21
22
2 12
1
−
−
= − = −
= + = + 112
1 2
21
22
2 12
12
2
1 2
n
n nx x x x
= + = +
−σ σ σ
σ σ( )
( )
Observação
A variância da distribuição amostral σ( )x x1 2
2
− é a soma das variâncias
individuais das amostras para e χ χ1 2e .
-
8/18/2019 Matemática Integrada_Unidade II(1)
28/110
108
Unidade II
Lembrete
Sendo a distribuição amostral para χ χ1 2e normal, você poderá utilizaro teste z para testar as diferenças entre duas médias populacionais µ
1 e µ
2.
Nesse caso, a estatística de teste padronizada fica:
z = (diferença observada) - (diferença formulada por hipótese)erro padrão
Teste z de duas amostras para verificar a diferença entre médias populacionais
Quando se trata de amostras independentes ou de uma amostra grande (maior ou igual a 30), o teste
z de duas amostras poderá ser utilizado para testar a diferença entre duas médias populacionais. Nessecaso, a estatística teste será:
χ χ1 2
− e a estatística padronizada será:
zx x
n n
=−( ) − −( )
+
1 2 1 2
1
2
1
2
2
2
µ µ
σ σ
Observação
1) Caso as amostras sejam grandes, poderá ser usado S1 e S2 em vez deσ1 eσ2.
2) Caso as amostras não sejam grandes, ainda poderá ser usado umteste z de duas amostras, desde que os desvios padrões sejam conhecidos eas populações estejam normalmente distribuídas.
Procedimento para a realização do teste
1) Especifique as hipóteses nula (Ho) e alternativa (H
1).
2) Especifique o nível de significância (α).
3) Faça o esboço da distribuição amostral, obtendo os valores críticos a partir da tabela de distribuiçãonormal (Tabela 16).
4) Determine quais são as regiões de rejeição a partir desses valores tabelados.
-
8/18/2019 Matemática Integrada_Unidade II(1)
29/110
109
MATEMÁTICA INTEGRADA
5) Calcule a estatística de teste padronizada.
zx x
n n
=−( ) − −( )
+
1 2 1 2
1
2
1
2
2
2
µ µ
σ σ
6) Decida se a hipótese nula (Ho) deverá ser ou não rejeitada. Essa decisão será tomada da seguinte
maneira: caso z esteja na região de rejeição delimitada pelos valores tabelados, rejeite Ho. Caso
contrário, não deverá rejeitar Ho.
7) Decisão de acordo com o contexto.
Exemplo de aplicação
1) Num posto agrícola desejou-se testar o efeito de um fertilizante na produção de certo grão. Para isso,foram escolhidos 220 alqueires de terreno, 110 foram tratados com fertilizante e 110 sem o fertilizante (grupocontrole). Todas as outras condições foram mantidas. A produção média na área com fertilizante foi de 8,5 sacas,com desvio padrão de 0,50, enquanto na área sem o fertilizante a média foi de 7,9, com desvio padrão de 0,80.Pode-se concluir que há aumento significativo na média de produção com o uso do fertilizante ao nível de 5%?
Solução:
Dados:
n1 = 110
n2 = 110
x1 = 8,5 sacas
x2 = 7,9 sacas
S1 = 0,50 saca
S2 = 0,80 saca
α = 5%
Você deseja testar se existe realmente uma diferença significativa na média de produção quando seutiliza o fertilizante e quando não. Logo, as hipóteses nula (H
o) e alternativa (H
1) são:
Ho: µ
1 =µ
2
H1: µ
1 ≠ µ
2
Os valores críticos que irão delimitar as áreas de aceitação e rejeição serão obtidos na tabela doTabela 16, com as seguintes informações: teste bicaudal e nível de significância 5%. Os valores críticossão – 1,96 e + 1,96, ou seja, as regiões de rejeição serão z < - 1,96 e z > 1,96.
-
8/18/2019 Matemática Integrada_Unidade II(1)
30/110
110
Unidade II
Lembrete
Caso você tenha dúvida na obtenção desses valores, retome a Unidade I.
Como as amostras são grandes (n = 110 para as duas situações), você poderá usar S1 e S
2 para
calcular o erro padrão.
R RÁREA DE ACEITAÇÃO
- zTAB = -1,96 + zTAB = +1,96
Figura 48 - Diagrama de distribuição Normal
σ
σ
σ
( )
( )
( )
,
x x
x x
x x
s
n
s
n1 212
1
22
2
1 2
2
1 2
1100 80110
−
−
−
= +
= +
=
0,50
0,0
2
002 0,006
0,00
+
=
≈
−
−
σ
σ
( )
( ) ,
x x
x x
1 2
1 2
8
0 09
Utilizando o teste Z, a estatística teste padronizada é:
zx x
z
z
z
x x
=−( ) − −( )
=−( ) −
=
=
−( )
1 2 1 2
1 2
8 5 7 9 0
0 09
0 6
0 09
6 67
µ µ
σ
, ,
,
,
,
,
-
8/18/2019 Matemática Integrada_Unidade II(1)
31/110
111
MATEMÁTICA INTEGRADA
O gráfico anterior mostra as regiões de rejeição e aceitação delimitadas pelos valores críticosencontrados na tabela do Tabela 16. Como z = 6,67 está na região de rejeição, está acima de 1,96; então,devemos rejeitar a hipótese nula. Portanto, ao nível de 5%, existe uma diferença significativa na médiade produção com o uso do fertilizante.
2. Duas pesquisas independentes sobre salários de operadores de produtos químicos perigososem duas regiões revelaram para a área A uma média de R$10,50/h e desvio padrão de R$2,50/h,e para a área B uma média de R$11,00/h e desvio padrão de R$1,00/h. A amostra foi de 100operadores para ambos os casos. Pode-se concluir ao nível de 1% que os salários médios sejamiguais nas duas regiões?
As hipóteses nula (Ho) e alternativa (H
1) são:
Ho: µ
1 = µ
2
H1: µ
1 ≠ µ
2
Os valores críticos que irão delimitar as áreas de aceitação e rejeição serão obtidos na tabela doTabela 16, com as seguintes informações: teste bicaudal e nível de significância 1%. Os valores críticossão – 2,58 e + 2,58, ou seja, as regiões de rejeição serão z < - 2,58 e z > 2,58.
Lembrete
Caso você tenha dúvida na obtenção desses valores, retome a unidade I.
Como as amostras são grandes (n = 100 para as duas situações), você poderá usar S1 e S
2 para
calcular o erro padrão.
R R
Área de aceitação
- zTAB = -2,58 + zTAB = +2,58
Figura 49 - Diagrama de distribuição normal
-
8/18/2019 Matemática Integrada_Unidade II(1)
32/110
112
Unidade II
σ
σ
σ
( )
( )
( )
,
,
x x
x x
x x
s
n
s
n1 212
1
22
2
1 2
2 2
1 2
2 50
100
1
100
6 25
10
−
−
−
= +
= +
=
00
1
100
0 0625 0 01
0 0725
0 27
1 2
1 2
1 2
+
= +
=
≈
−
−
−
σ
σ
σ
( )
( )
( )
, ,
,
,
x x
x x
x x
Utilizando o teste Z, a estatística teste padronizada é:
zx x
z
z
z
x x
=−( ) − −( )
=−( ) −
=−
=
−( )
1 2 1 2
1 2
10 50 11 00 0
0 27
0 5
0 27
µ µ
σ
, ,
,
,
,−−1 85,
O gráfico anterior mostra as regiões de rejeição e aceitação delimitadas pelos valores críticosencontrados na tabela do Tabela 16. Como z = -1,85 está na região de aceitação, está acima de -2,58;então, não é possível rejeitar a hipótese nula. Portanto, a um nível de 1%, não existe evidência suficientepara confirmar a existência de uma diferença significativa entre as médias de salários. Pode-se, então,concluir que os salários médios são iguais nas duas regiões.
3. Duas preparações diferentes (A e B) para um mesmo suco foram desenvolvidas e deseja-secomparar, entre outros parâmetros, se existe diferença de pH entre elas. Foram, então, realizados osrespectivos ensaios, e os valores encontrados foram os seguintes: para uma amostra de seis sucos dapreparação A, o pH médio encontrado foi de 7,4 e para uma amostra de seis sucos da preparaçãoB, o pH médio encontrado foi de 7,54. Sendo os desvios padrões populacionais de 0,025 e 0,030,respectivamente, testar a hipótese de as médias serem iguais, contra a alternativa de serem diferentes,ao nível de significância de 5%.
-
8/18/2019 Matemática Integrada_Unidade II(1)
33/110
113
MATEMÁTICA INTEGRADA
Solução
As hipóteses nula (Ho) e alternativa (H
1) são:
Ho: µ
1 = µ
2
H1: µ
1 ≠ µ
2
Os valores críticos que irão delimitar as áreas de aceitação e rejeição serão obtidos da tabela(Tabela 16), com as seguintes informações: teste bicaudal e nível de significância 5%. Os valorescríticos são – 1,96 e + 1,96, ou seja, as regiões de rejeição serão z < - 1,96 e z > 1,96.
A seguir, devemos construir o gráfico com as respectivas áreas de aceitação e rejeição.
R R
Área de aceitação
- zTAB = -1,96 + zTAB = +1,96
Figura 50 - Diagrama de distribuição normal, teste bilateral para nível de significância de 5%
σ( )x x
s
n
s
n1 212
1
22
2−
= +
z x x
n n
x x
x x
=−( ) − −( )
+
= +−
−
1 2 1 2
12
1
22
2
1 2
2 2
1 2
0 025
6
0 03
6
µ µ
σ σ
σ
σ
( )
(
, ,
))
( )
( )
, ,
, ,
,
= +
= +
=
−
−
0 000625
6
0 0009
6
0 000104 0 00015
0 00
1 2
1 2
σ
σ
x x
x x 00254
0 021 2σ( ) ,x x− =
-
8/18/2019 Matemática Integrada_Unidade II(1)
34/110
114
Unidade II
Utilizando o teste Z, a estatística teste padronizada é:
zx x
z
z
z
x x
=−( ) − −( )
=−( ) −
=−
= −
−( )
1 2 1 2
1 2
7 4 7 54 0
0 02
0 14
0 02
7
µ µ
σ
, ,
,
,
,
O gráfico anterior mostra as regiões de rejeição e aceitação delimitadas pelos valores críticosencontrados na tabela do Tabela 16. Como z = -7 está na região de rejeição, está abaixo de -2,58,
rejeita-se, portanto, a hipótese nula. Logo, a um nível de 1%, existem evidências suficientes paraconfirmar a existência de uma diferença significativa entre as médias das preparações dos sucos.
4. Num estudo comparativo do tempo médio para realização de certa tarefa, uma amostra aleatóriade 50 homens e 50 mulheres de uma grande indústria encontrou os seguintes resultados:
Estatísticas Homens Mulheres
Médias 6 minutos 5 minutos
Desvios padrões 1 minuto 2 minutos
Pode-se dizer que existe diferença significativa entre o tempo médio para a realização da tarefa dehomens e mulheres ao nível de 5%.
Solução
Está sendo pedido para se testar a existência de diferença significativa na média de tempo entrehomens e mulheres na realização de certa tarefa. Logo, as hipóteses nula (H
o) e alternativa (H
1) são:
Ho: µ1 = µ2
H1: µ
1 ≠ µ
2
Os valores críticos que irão delimitar as áreas de aceitação e rejeição serão obtidos da tabela Tabela16, com as seguintes informações: teste bicaudal e nível de significância 5%. Os valores críticos são –1,96 e + 1,96, ou seja, as regiões de rejeição serão z < - 1,96 e z > 1,96. Como as amostras são grandes(n = 50 para as duas situações), para calcular o erro padrão serão utilizadas S
1 e S
2.
-
8/18/2019 Matemática Integrada_Unidade II(1)
35/110
115
MATEMÁTICA INTEGRADA
R R
Área de aceitação
- zTAB = -1,96 + zTAB = +1,96
Figura 51 - Diagrama de distribuição normal, teste bilateral para nível de significância de 5%
σ
σ
σ
( )
( )
( )
x x
x x
x x
s
n
s
n1 212
1
22
2
1 2
2
1 2
50
2
50
−
−
−
= +
= +
= +
1
0,02 0,08
2
σσ
σ
( )
( ) ,
x x
x x
1 2
1 2
1
0 32
−
−
=
≈
0,
Utilizando o teste Z, a estatística teste padronizada é:
zx x
x x
z
=−( ) − −( )
−
=−( ) −
1 2 1 2
1 2
6 5 0
0 32
µ µ
σ
,
z
z
=
=
1
0 32
3 13
,
,
Conclusão
O gráfico anterior mostra as regiões de rejeição e aceitação delimitadas pelos valores críticos encontrados natabela do Tabela 16. Como z = 3,13 está na região de rejeição, está acima de 1,96, devemos rejeitar a hipótese nula.
Resposta:
Logo, a um nível de 5%, existe uma diferença significativa na média de tempo gasto na execuçãoda tarefa pelos homens e pelas mulheres. Podemos concluir, portanto, que as mulheres levaram menostempo do que os homens na realização da tarefa, ao nível de 5%.
-
8/18/2019 Matemática Integrada_Unidade II(1)
36/110
116
Unidade II
5. O departamento de psicologia fez um estudo comparativo do tempo médio de recuperação apósum divórcio, com uma amostra de 80 mulheres com filhos e outra de 80 mulheres sem filhos, tomadosao acaso, de uma clínica, durante um ano. Os resultados estão mostrados na tabela a seguir. É possívelafirmar, ao nível de 5% de significância, que as mulheres com filhos levam mais tempo para se recuperardo que as sem filhos?
Estatísticas Mulheres com filhos Mulheres sem filhos
Médias 4 anos 2 anos
Desvios padrões 2 anos 1 ano
Solução
Você deseja testar se existe realmente uma diferença significativa na média de produção quando seutiliza o fertilizante e quando não. Logo, as hipóteses nula (Ho) e alternativa (H
1) são:
Ho: µ
1 = µ
2
H1: µ
1 ≠ µ2
Os valores críticos que irão delimitar as áreas de aceitação e rejeição serão obtidos da tabelado Tabela 16, com as seguintes informações: teste bicaudal e nível de significância 5%. Osvalores críticos são – 1,96 e + 1,96, ou seja, as regiões de rejeição serão z < - 1,96 e z > 1,96.
Como as amostras são grandes (n = 80 para as duas situações), para calcular o erro padrão serãoutilizadas S
1 e S
2.
R RÁrea de aceitação
- zTAB = -1,96 + zTAB = +1,96
Figura 52 - Diagrama de distribuição normal, teste bilateral para nível de significância de 5%
-
8/18/2019 Matemática Integrada_Unidade II(1)
37/110
117
MATEMÁTICA INTEGRADA
σ
σ
σ
σ
( )
( )
( )
(
x x
x x
x x
x
s
n
s
n1 212
1
22
2
1 2
2
1 2
1
80
1
80
80
1
80
−
−
−
= +
= +
= +
2
4
2
−−
−
−
= +
=
≈
x
x x
x x
2
1 2
1 2
0 05 0 0125
0 0625
0 25
)
( )
( )
, ,
,
,
σ
σ
Utilizando o teste Z, a estatística teste padronizada é
zx x
x x
z
z
z
=−( ) − −( )
−
=−( ) −
=
=
1 2 1 2
1 2
4 2 0
0 25
2
0 258
µ µ
σ
,
,
Conclusão
O gráfico anterior mostra as regiões de rejeição e aceitação delimitadas pelos valores críticos encontrados natabela do Tabela 16. Como z = 8 está na região de rejeição, está acima de 1,96, devemos rejeitar a hipótese nula.
Resposta:
A um nível de 5%, portanto, existe uma diferença significativa no tempo médio de adaptação à novavida após o divórcio das mulheres com filhos em relação às mulheres sem filhos. As mulheres sem filhosadaptam-se mais rapidamente do que as mulheres sem filhos.
6 TESTES NÃO PARAMÉTRICOS
6.1 Teste de qui-quadrado
Os dois testes estudados anteriormente são ditos testes paramétricos porque têm algumasexigências mínimas para serem utilizados, entre elas apresentar distribuição normal. Mas nem sempre é
-
8/18/2019 Matemática Integrada_Unidade II(1)
38/110
118
Unidade II
possível para o pesquisador atender a essas exigências, uma vez que os dados não apresentam sempre normalidade ou pode não haver independência entre os tratamentos, além de outras questões. Foram,então, desenvolvidos pelos estatísticos os testes não paramétricos, para situações em que não é possívela aplicação dos testes paramétricos.
O teste que vamos estudar agora, teste qui-quadrado , é um dos não paramétricos mais conhecidose utilizados, aplicado quando se deseja fazer a comparação de duas ou mais amostras.
Seja uma amostra de tamanho n dividida em k eventos, Eo1
, Eo2
, Eo3
, ... Ek, e as frequências observadas
dos eventos sejam respectivamente f o1
, f o2
, f o3
, ... f ok
e f e1
, f e2
, f e3
, .... f ek
, as frequências esperadas.
Vamos supor uma situação em que se deseja realizar um teste estatístico com o objetivo de verificarse existe adequação de ajustamento entre as frequências observadas e as frequências esperadas; ou seja,se as discrepâncias encontradas entre as frequências observadas e as frequências esperadas são devido
ao acaso ou se existe, na realidade, diferença significativa entre elas.
6.2 Teste de adequação de ajustamento
O procedimento utilizado nesse teste é similar ao que você utilizou nos testes anteriores. As etapasque deverá seguir são as seguintes:
Etapa 1
Estabelecer a hipótese nula (Ho) e a hipótese alternativa (H
1).
• A hipótese H0 afirmará não existir discrepância entre as frequências observadas e as frequências
esperadas.
• A hipótese H1 afirmará existir discrepância entre as frequências observadas e as frequências
esperadas.
Etapa 2
• Efetuar o cálculo das frequências esperadas baseado na afirmação da hipótese Ho (ou seja, quenão existe discrepância entre as frequências observadas e as frequências esperadas.
• Avaliar as frequências esperadas.
• Se existirem eventos que não satisfaçam a condição f e ≥ 5, as mesmas deverão se unir aos eventos
adjacentes, dando origem, assim, a novas categorias.
Etapa 3
• Estipular α e o nível de significância do teste.
-
8/18/2019 Matemática Integrada_Unidade II(1)
39/110
119
MATEMÁTICA INTEGRADA
A variável do teste será a χ2
, com g.l. = k – 1 ou g.l. = k – r -1 (para teste de aderência paraestimação de parâmetros), sendo k o número de eventos e r , o de parâmetros estimados.
Etapa 4
• Fazer o desenho da curva, plotando no eixo das abscissas o valor tabelado, que será o limiteentre a área de aceitação (RA) de H
o e a(s) área(s) de rejeição (RC), utilizando a tabela do χ
2
(Tabela 21).
Etapa 5
• Calcular o valor da estatística de teste por meio da amostra.
χcaloi ei
ei
f f
f
2
2
= −( )
∑
Etapa 6
Obter a conclusão:
• Se χ χcal tab2 2
< , não se pode rejeitar Ho; logo, as frequências observadas e esperadas não são
discrepantes ou a diferença entre elas não é significativa.
Se χ χcal tab2 2
> , rejeita-se Ho, e concluímos com uma margem de erro α que existe diferença entre asfrequências observadas e esperadas.
Exemplo
Com o intuito de verificar se o número de empréstimos de livros em uma biblioteca aberta, todos osdias se distribui igualmente pelos dias da semana, foram levantados os dados a seguir. Utilizar α = 5%.
Tabela 35
Dia dasemana
Número deempréstimos
Dom. 33
Seg. 26
Ter. 21
Qua. 22
Qui. 17
Sex. 20
Sáb. 36
TOTAL 175
-
8/18/2019 Matemática Integrada_Unidade II(1)
40/110
120
Unidade II
Solução
1) Formulação das hipóteses: H
o: as frequências de empréstimos são iguais todos os dias da semana.
H1: as frequências de empréstimos são diferentes.
2) Escolher a variável de teste:
χ2
com: g.l. = k – 1 = 7 – 1 = 6
Observação
k = 7, porque são sete dias da semana que serão avaliados, uma vez quea biblioteca está aberta todos os dias.
Consultando, portanto, a tabela de distribuição χ2
(Tabela 21) com g.l. = 6 e α = 5%, encontramosχ
212 592tab = , .
Lembrete
Vamos relembrar como fazer essa busca?
χ2
tabelado (Tabela 21) será:
-
8/18/2019 Matemática Integrada_Unidade II(1)
41/110
121
MATEMÁTICA INTEGRADA
Tabela 36
P(χ2
com n graus de liberdade > valor do tabelado) = α
α
GL 0,999 0,995 0,99 0,975 0,95 0,9 0,75 0,5 0,25 0,1 0,05 0,025 0,01 0,005
1 0,000 0,000 0,000 0,001 0,004 0,016 0,102 0,455 1,323 2,706 3,841 5,024 6,635 7,879
2 0,002 0,010 0,020 0,051 0,103 0,211 0,575 1,386 2,773 4,605 5,991 7,378 9,210 10,597
3 0,024 0,072 0,115 0,216 0,352 0,584 1,213 2,366 4,108 6,251 7,815 9,348 11,345 12,838
4 0,091 0,207 0,297 0,484 0,711 1,064 1,923 3,357 5,385 7,779 9,488 11,143 13,277 14,860
5 0,210 0,412 0,554 0,831 1,145 1,610 2,675 4,351 6,626 9,236 11,070 12,833 15,086 16,750
6 0,381 0,676 0,872 1,237 1,635 2,204 3,455 5,348 7,841 10,645 12,592 14,449 16,812 18,548
7 0,598 0,989 1,239 1,690 2,167 2,833 4,255 6,346 9,037 12,017 14,067 16,013 18,475 20,278
8 0,857 1,344 1,646 2,180 2,733 3,490 5,071 7,344 10,219 13,362 15,507 17,535 20,090 21,955
9 1,152 1,735 2,088 2,700 3,325 4,168 5,899 8,343 11,389 14,684 16,919 19,023 21,666 23,589
10 1,479 2,156 2,558 3,247 3,940 4,865 6,737 9,342 12,549 15,987 18,307 20,483 23,209 25,188
11 1,834 2,603 3,053 3,816 4,575 5,578 7,584 10,341 13,701 17,275 19,675 21,920 24,725 26,757
12 2,214 3,074 3,571 4,404 5,226 6,304 8,438 11,340 14,845 18,549 21,026 23,337 26,217 28,300
13 2,617 3,565 4,107 5,009 5,892 7,042 9,299 12,340 15,984 19,812 22,362 24,736 27,688 29,819
14 3,041 4,075 4,660 5,629 6,571 7,790 10,165 13,339 17,117 21,064 23,685 26,119 29,141 31,319
15 3,483 4,601 5,229 6,262 7,261 8,547 11,037 14,339 18,245 22,307 24,996 27,488 30,578 32,801
16 3,942 5,142 5,812 6,908 7,962 9,312 11,912 15,338 19,369 23,542 26,296 28,845 32,000 34,267
17 4,416 5,697 6,408 7,564 8,672 10,085 12,792 16,338 20,489 24,769 27,587 30,191 33,409 35,718
18 4,905 6,265 7,015 8,231 9,390 10,865 13,675 17,338 21,605 25,989 28,869 31,526 34,805 37,15619 5,407 6,844 7,633 8,907 10,117 11,651 14,562 18,338 22,718 27,204 30,144 32,852 36,191 38,582
20 5,921 7,434 8,260 9,591 10,851 12,443 15,452 19,337 23,828 28,412 31,410 34,170 37,566 39,997
21 6,447 8,034 8,897 10,283 11,591 13,240 16,344 20,337 24,935 29,615 32,671 35,479 38,932 41,401
22 6,983 8,643 9,542 10,982 12,338 14,041 17,240 21,337 26,039 30,813 33,924 36,781 40,289 42,796
23 7,529 9,260 10,196 11,689 13,091 14,848 18,137 22,337 27,141 32,007 35,172 38,076 41,638 44,181
24 8,085 9,886 10,856 12,401 13,848 15,659 19,037 23,337 28,241 33,196 36,415 39,364 42,980 45,559
25 8,649 10,520 11,524 13,120 14,611 16,473 19,939 24,337 29,339 34,382 37,652 40,646 44,314 46,928
3) Determinar as regiões de aceitação (RA) e rejeição (RC).
4) Cálculo do valor de χcal2 .
Como o número de empréstimos foi 175; logo, a quantidade por dia será:
ƒ ƒ
ƒ
ƒ
eo
e
e
N=
=
=
∑
175
7
25
-
8/18/2019 Matemática Integrada_Unidade II(1)
42/110
122
Unidade II
Dessa forma, a tabela inicial será ampliada para:
Tabela 37
Dias da semana f o
f e
Dom. 33 25
Seg. 26 25
Ter. 21 25
Qua. 22 25
Qui. 17 25
Sex. 20 25
Sáb. 36 25
TOTAL 175 175
χcal
oi ei
ei
f f
f
22
= −( )∑
χcal
2
2 2 2 2 233 25
25
26 25
25
21 25
25
22 25
25
17 25=
−( )+
−( )+
−( )+
−( )+
−( )225
20 25
25
36 25
2512
12
2 2
2
+
−( )+
−( )=
=χcal
Como o valor obtido de
χ2
12 592tab = , ,
então:
5) Uma vez que χcal2
12 592< , , não podemos rejeitar Ho com nível de significância de 5%.
7 TESTE QUI-QUADRADO DE ADERÊNCIA
7.1 Teste para a normalidade
Você poderá decidir, baseado em resultados encontrados com o teste qui-quadrado, se uma variávelapresenta distribuição normal. As hipóteses para o teste para a normalidade serão sempre estas a seguir:
Ho: a variável apresenta distribuição normal.
H1: a variável não apresenta distribuição normal.
-
8/18/2019 Matemática Integrada_Unidade II(1)
43/110
123
MATEMÁTICA INTEGRADA
Exemplo:
Verificar se os dados a seguir apresentam distribuição normal, utilizando α = 5%. Os dados sãoreferentes à altura de 100 estudantes do sexo feminino.
Tabela 38
Alturas (cm) No estudantes (f oi)
150|--156 4
156|--162 12
162|--168 22
168|--174 40
174|--180 20
180|--186 2
Total 100Solução:
Uma vez que a distribuição normal depende dos parâmetros média e desvio padrão para adeterminação das frequências esperadas, será necessário obtê-los primeiramente.
Hipóteses:
Ho: a variável altura apresenta distribuição normal.
H1: a variável altura não apresenta distribuição normal.
Tabela 39
Alturas (cm) No estudantes (f oi) Pmi Pmi . ƒi150|--156 4 153 612
156|--162 12 159 1908
162|--168 22 165 3630
168|--174 40 171 6840
174|--180 20 177 3540180|--186 2 183 366
Total 100 16896
A média aritmética para essas estaturas será dada por:
xPmifi
f
x cm
i
=
=
∑∑
168 96,
-
8/18/2019 Matemática Integrada_Unidade II(1)
44/110
124
Unidade II
Tabela 40
Alturas (cm) No estudantes (f oi) P
mi(x
i - x) (x
i - x)2 (x
i - x)2
. ƒi
150|--156 4 153 15,96 254,72 1018,88
156|--162 12 159 9,96 99,20 1190,40162|--168 22 165 3,96 15,68 344,96
168|--174 40 171 2,04 4,16 166,40
174|--180 20 177 8,04 64,64 1292,80
180|--186 2 183 14,04 197,12 394,24
Total 100 4407,68
E a variância por:
2
2
1sx x
ni=
−
( )−∑ . ƒ
2
2
4407 68
100 1
44 5220
6 6725
s
sS
=−
=
=
,
,
,
Porém:
z
x x x
s
=−
=−µ
σ
por estimativa.
Por exemplo: para a classe 156|--162
Para xi =156
z x x
s=
−
=
−
= −
156 168 96
6 67251 94
,
,,
Para xi =162
z x x
s=
−
=
−
= −
162 168 96
6 67251 04
,
,,
-
8/18/2019 Matemática Integrada_Unidade II(1)
45/110
125
MATEMÁTICA INTEGRADA
Tabela 41
z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.07530.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
Da tabela (Tabela 16) para
z = 1,94
A = 0,4738
Da tabela (Tabela 16) para
z = 1,04 A = 0,3508 0,4738 - 0,3508 = 0,1230
-
8/18/2019 Matemática Integrada_Unidade II(1)
46/110
126
Unidade II
• Portanto, para a classe 156|--162, obtiveram-se os valores como sendo 1,94|---1,04.
• Na tabela do Tabela 16, encontrou-se probabilidade (área da curva normal entre os dois valores)igual a 0,1230.
• Multiplicado esse valor pelo número total de elementos da amostra, obtém-se:
fe = n.p = 100.0,1230 = 12,30
Complemente a tabela a partir do que foi feito anteriormente, como exemplo para a segunda classe.O resultado será:
Tabela 42
Alturas (cm) No estudantes (f oi) Valores em z P F
ei(n.p)
150|--156 4 -2,84|-- -1,94 0, 0239 2,39156|--162 12 -1,94|-- -1,04 0,1230 12,30
162|--168 22 -1,04|-- -0,14 0,2951 29,51
168|--174 40 -0,14|--0,76 0,3321 33,21
174|--180 20 0,76|-- 1,65 0,1741 17,41
180|--186 2 1,65|-- 2,55 0,4410 4,41
Total 100
A tabela ficará, então, da seguinte maneira:
Tabela 43
f oi f oi f ei f ei4 16 2,39 14,69
12 22 12,30 29,51
22 40 29,51 33,21
40 22 33,21 21,82
20 17,41
2 4,41
Importante:
Você percebeu que houve uma redução no número de frequências? Isso ocorreu porque tivemosdois valores menores do que 5, e como já havíamos afirmado no teste de ajustamento, caso existissemeventos que não satisfizessem a condição de f
e≥ 5, essas frequências deveriam ser unidas aos eventos
adjacentes, dando origem, assim, a novas categorias, o que foi feito anteriormente.
Utilizando a fórmula, obtemos o χcalc2
:
-
8/18/2019 Matemática Integrada_Unidade II(1)
47/110
127
MATEMÁTICA INTEGRADA
χcalcoi ei
ei
f f
f
2
2 2 216 14 69
14 69
22 29 51
29 51
40=
−( )=
−( )+
−( )+∑
,
,
,
,
−−( )+
−( )
= + + +
33 21
33 21
22 2182
2182
0
2 2
2
,
,
,
,
, , ,χcalc 12 1 91 1 39 10 00
3 422
,
,χcalc =
Encontramos o valor do χcalc2
na tabela (Tabela 21), com g.l. = k – r – 1
Sendo:
r = número de parâmetros estimados (nesse caso, são dois, a média e o desvio padrão).
Logo, g.l. = 4 – 2 -1 = 1 e α = 5%. O valor de χcalc2 será 3,841.
Tabela 44 - P(χ2
com n graus de liberdade > valor do tabelado) = α
α
GL 0,999 0,995 0,99 0,975 0,95 0,9 0,75 0,5 0,25 0,1 0,05 0,025 0,01 0,005
1 0,000 0,000 0,000 0,001 0,004 0,016 0,102 0,455 1,323 2,706 3,841 5,024 6,635 7,879
2 0,002 0,010 0,020 0,051 0,103 0,211 0,575 1,386 2,773 4,605 5,991 7,378 9,210 10,597
3 0,024 0,072 0,115 0,216 0,352 0,584 1,213 2,366 4,108 6,251 7,815 9,348 11,345 12,838
4 0,091 0,207 0,297 0,484 0,711 1,064 1,923 3,357 5,385 7,779 9,488 11,143 13,277 14,860
5 0,210 0,412 0,554 0,831 1,145 1,610 2,675 4,351 6,626 9,236 11,070 12,833 15,086 16,750
6 0,381 0,676 0,872 1,237 1,635 2,204 3,455 5,348 7,841 10,645 12,592 14,449 16,812 18,548
7 0,598 0,989 1,239 1,690 2,167 2,833 4,255 6,346 9,037 12,017 14,067 16,013 18,475 20,278
8 0,857 1,344 1,646 2,180 2,733 3,490 5,071 7,344 10,219 13,362 15,507 17,535 20,090 21,955
9 1,152 1,735 2,088 2,700 3,325 4,168 5,899 8,343 11,389 14,684 16,919 19,023 21,666 23,589
10 1,479 2,156 2,558 3,247 3,940 4,865 6,737 9,342 12,549 15,987 18,307 20,483 23,209 25,188
11 1,834 2,603 3,053 3,816 4,575 5,578 7,584 10,341 13,701 17,275 19,675 21,920 24,725 26,757
12 2,214 3,074 3,571 4,404 5,226 6,304 8,438 11,340 14,845 18,549 21,026 23,337 26,217 28,300
13 2,617 3,565 4,107 5,009 5,892 7,042 9,299 12,340 15,984 19,812 22,362 24,736 27,688 29,819
14 3,041 4,075 4,660 5,629 6,571 7,790 10,165 13,339 17,117 21,064 23,685 26,119 29,141 31,319
15 3,483 4,601 5,229 6,262 7,261 8,547 11,037 14,339 18,245 22,307 24,996 27,488 30,578 32,80116 3,942 5,142 5,812 6,908 7,962 9,312 11,912 15,338 19,369 23,542 26,296 28,845 32,000 34,267
17 4,416 5,697 6,408 7,564 8,672 10,085 12,792 16,338 20,489 24,769 27,587 30,191 33,409 35,718
18 4,905 6,265 7,015 8,231 9,390 10,865 13,675 17,338 21,605 25,989 28,869 31,526 34,805 37,156
19 5,407 6,844 7,633 8,907 10,117 11,651 14,562 18,338 22,718 27,204 30,144 32,852 36,191 38,582
20 5,921 7,434 8,260 9,591 10,851 12,443 15,452 19,337 23,828 28,412 31,410 34,170 37,566 39,997
21 6,447 8,034 8,897 10,283 11,591 13,240 16,344 20,337 24,935 29,615 32,671 35,479 38,932 41,401
22 6,983 8,643 9,542 10,982 12,338 14,041 17,240 21,337 26,039 30,813 33,924 36,781 40,289 42,796
23 7,529 9,260 10,196 11,689 13,091 14,848 18,137 22,337 27,141 32,007 35,172 38,076 41,638 44,181
24 8,085 9,886 10,856 12,401 13,848 15,659 19,037 23,337 28,241 33,196 36,415 39,364 42,980 45,559
25 8,649 10,520 11,524 13,120 14,611 16,473 19,939 24,337 29,339 34,382 37,652 40,646 44,314 46,928
-
8/18/2019 Matemática Integrada_Unidade II(1)
48/110
128
Unidade II
Área de aceitação
Rχcalc2
= 3,421
Figura 53 - Diagrama de distribuição Teste χ2
para nível de significância de 5%
Uma vez que χcalc2
= 3,421, concluímos que esse valor é menor que χtab2
= 3,841, estando,portanto, na região da aceitação do gráfico. Logo, podemos aceitar H
o ao nível de significância
de 5%.
Resposta:
Concluímos que a variável altura do sexo feminino segue a distribuição normal.
8 TESTE DE QUI-QUADRADO PARA INDEPENDÊNCIA
O teste qui-quadrado tem especial importância porque nos permite verificar a associação oudependência entre duas variáveis em estudo. Um dos objetivos do teste é, portanto, verificar se essasvariáveis são estatisticamente independentes.
Veja só, quando realiza uma pesquisa, você pode fazer uma estatística dos dados coletados, limitando-se acalcular as porcentagens referentes a cada pergunta realizada ou a cada item pesquisado. Essas porcentagensvão auxiliar você em algumas conclusões, mas não darão subsídios para descobrir se uma variável pesquisadatem relação com a outra. Por exemplo, ao final da pesquisa, você poderá mostrar que uma maior porcentagemde pessoas da amostra entrevistada é do gênero feminino. Mas será que esse fato tem alguma associaçãocom a preferência por determinado sabor de alimento? Essa associação, ou não, você poderá verificar pormeio do teste qui-quadrado de independência ou associação, que estudaremos a seguir.
Você deverá saber:
• como utilizar uma tabela de contingência para a obtenção das frequências esperadas;
• como utilizar uma distribuição qui-quadrado para verificar se duas variáveis em estudo sãoindependentes.
Lembrete
Duas variáveis são consideradas independentes quando a ocorrênciade uma delas não afeta a probabilidade de ocorrência da outra.
-
8/18/2019 Matemática Integrada_Unidade II(1)
49/110
129
MATEMÁTICA INTEGRADA
Um exemplo do lembrete anterior seria um nutricionista que deseja estudar se existe associaçãoentre a classe social que o paciente pertence e o hábito de consumir frutas e legumes. Será que nessecaso as variáveis são independentes? Ou seja, o hábito alimentar independe da classe social? O testequi-quadrado para independência nos permite verificar questões como essa.
Por onde devemos começar, então? Primeiramente, usaremos dados amostrais que deverão estarorganizados em uma tabela de contingência.
Mas o que é mesmo uma tabela de contingência?
Definição
Tabela de contingência é uma tabela de dupla entrada, ou seja, numa entrada, linha, teremosuma variável (por exemplo, classe social) e na outra entrada, coluna, a outra variável (hábito ou não de
consumir frutas e legumes), em que as frequências observadas se distribuem nas linhas (r ) e colunas (K ),como mostrado a seguir:
Tabela 45
y/x x1
x2
... xk
Totais
y1 Fo11 Fo12 ... Fo1k L1
y2 Fo21 Fo22 ... Fo2k L2... ...
yr For1 For2 ... fork Lk
Totais C1 C2 ... Ck N
Sendo:
C1= soma da primeira coluna
C2 = soma da segunda coluna
L1 = soma da primeira linha
L2 = soma da segunda linha
N = soma de todas as frequências da tabela
Exemplo de aplicação
1. A tabela a seguir é de contingência do tipo 3 x 3, ou seja, tem três linhas e 3 colunas, e representaos resultados de uma pesquisa aleatória de 586 pessoas classificadas por idade e preferência musical.Analisando a tabela, observamos que 105 entrevistados, com 20 anos ou menos, preferem músicaeletrônica e 23 da mesma faixa etária preferem música clássica. Da mesma maneira, observamos que120 entrevistados, com idade entre 21 e 31 anos, preferem MPB; enquanto 48 da mesma faixa etáriapreferem música clássica, e assim por diante.
-
8/18/2019 Matemática Integrada_Unidade II(1)
50/110
130
Unidade II
Tabela 46
Preferência musical/faixa etária 20 ou menos 21------ 31 32 ou mais
MPB 45 120 65
Clássica 23 48 100Eletrônica 105 60 20
Lembrete
Veja que temos a dupla entrada mencionada anteriormente, ou seja,faixa etária e preferência musical.
Atenção:
Observe que, em uma tabela de contingência, fer,k representa a frequência esperada para a célula na linha r
e na coluna k . Na tabela anterior, fe2,3 representa a frequência esperada para a célula na linha 2 e na coluna 3.
Com essa observação e supondo que as duas variáveis em estudo numa tabela de contingênciasão independentes, você poderá usar essas informações para obter as correspondentes frequênciasesperadas de cada uma das células.
Para o cálculo da frequência esperada de cada célula, é utilizada a fórmula a seguir:
ƒ erk =(soma da linha r) x (soma da linha k)
NOnde:
ƒ erk = frequência esperada Vamos analisar a seguir um exemplo de obtenção de frequências esperadas:
A partir dos dados da tabela (que foi nosso exemplo anterior), obter a frequência esperada para cada
célula de contingência a seguir. Para tanto, vamos supor que as variáveis, a faixa etária e a preferênciamusical sejam independentes.
Tabela 47
Preferência musical/faixa etária 20 ou menos 21------ 31 32 ou mais Total
MPB 45 120 65 230
Clássica 23 48 100 171
Eletrônica 105 60 20 185
Total 173 228 185 586
-
8/18/2019 Matemática Integrada_Unidade II(1)
51/110
131
MATEMÁTICA INTEGRADA
Solução:
Vamos utilizar a fórmula indicada anteriormente para o cálculo das frequências esperadas:
ƒ erk =(soma da linha r) x (soma da linha k)
N
Substituindo as correspondentes somatórias das linhas e das colunas, teremos:
ƒ
ƒ
ƒ
ƒ
ƒ
er k
N
e
e
e
e
=
= ( )
=
= ( )
=
∑∑ .
.
,
.
11
11
12
12
230 173
586
67 90
230 228
586
889 49
230 185
586
72 62
171 173
586
13
13
21
,
.
,
.
ƒ
ƒ
ƒ
e
e
e
= ( )
=
= ( )
ƒ
ƒ
ƒ
ƒ
ƒ
e
e
e
e
e
21
22
22
23
23
50 48
171 228
586
66 53
171 185
586
=
= ( )
=
= ( )
,
.
,
.
==
= ( )
=
= ( )
=
53 98
185 173
586
54 62
185 228
586
71
31
31
32
32
,
.
,
.
ƒ
ƒ
ƒ
ƒ
e
e
e
e ,,
.
,
98
185 185
586
58 40
33
33
ƒ
ƒ
e
e
= ( )
=
-
8/18/2019 Matemática Integrada_Unidade II(1)
52/110
132
Unidade II
Temos, portanto, com esses resultados a tabela com as respectivas frequências esperadas:
Tabela 48
Preferência musical/faixa
etária 20 ou menos 21------ 31 32 ou maisMPB 67,90 89,49 72,61
Clássica 50,48 66,53 53,98
Eletrônica 54,62 71,98 58,40
Agora que você já sabe calcular as frequências esperadas, pode se utilizar do teste qui-quadradode independência ou da associação para testar a independência de variáveis pesquisadas.
Restrições do uso do teste qui-quadrado χ2
Por razões teóricas:
• os testes vistos aplicam-se sem restrições se todas as frequências esperadas forem maiores ou iguais a 5;
• quando o grau de liberdade for igual a 1, cada frequência esperada não deve ser inferior a 5;
• quando o grau de liberdade for maior do que 1, o teste χ2
não deve ser usado se mais de 20%das frequências esperadas forem inferiores a 5, ou se qualquer frequência esperada for inferior a1. Se essas condições não se verificam, eventualmente, podem-se juntar categorias adjacentes, demodo a aumentar as frequências esperadas;
• os testes somente devem ser aplicados aos dados observados, e nunca com as proporções ouporcentagens oriundas desses.
Você irá utilizar o seguinte procedimento para efetuar o teste:
Etapa 1
Inicialmente estabelecer as hipóteses:H
o: as variáveis são independentes ou não existe associação entre elas;
H1: as variáveis são dependentes ou existe associação entre elas.
Etapa 2
Calcular as frequências esperadas.
ƒ erk =
(soma da linha r) x (soma da linha k)
N
-
8/18/2019 Matemática Integrada_Unidade II(1)
53/110
133
MATEMÁTICA INTEGRADA
Etapa 3
Fixar α (nível de significância).
Etapa 4
Determinar o número de graus de liberdade, g.l. = (r -1). (k -1).
Onde r = número de linhas da tabela. k = número de colunas.
Etapa 5
Determinar RA e RC, usar a tabela do Tabela 21.
Etapa 6
Identificar a área de rejeição.
Área de aceitação
R
χtab2
Figura 54 - Diagrama de distribuição para se identificar área de rejeição. Teste χ2
para nível de significância dado
χtab2
= Tabela de distribuição χ2
Com
α (nível de significância)
e
g.l. = (r -1).(k -1)
Sendo:
r = número de linhas da tabela de frequências observadas;
k = número de colunas da tabela de frequências observadas.
-
8/18/2019 Matemática Integrada_Unidade II(1)
54/110
134
Unidade II
Etapa 7
Calcular a estatística de teste:
χ
χ
cal oi ei
ei
caloi ei
ei
f 2
2
2
2 245 67 90
67 90
= −
( )
= −( )
= −( )
+
∑
∑
ƒ ƒ
ƒ ƒ
ƒ
,
,
1120 89 49
89 49
65 72 61
72 61
23 50 48
50 48
48 66
2
2 2
−( )+
−( )+
−( )+
−
,
,
,
,
,
,
,,
,
,
,
,
,
,
53
66 53
100 53 98
53 98
105 54 62
54 62
60 71 98
2 2
2
( )+
−( )+
−( )+
−( ))+
−( )
= + + + + +7198
20 58 40
58 400 0 0 0
2 2
2,
,
,, , , , ,χcal 7 72 1 4 8 14 96 5 16 339 23 46 47 1 99 25 2, , , ,
,
+ + +
=
0
151932χcal
Etapa 8
Conclusão
Se χ χcal tab2 2
< , Ho não é rejeitada, ou seja, não podemos dizer que as variáveis são dependentes.
Se χ χcal tab2 2
> , Ho é rejeitada, concluindo-se, portanto, que as variáveis são dependentes ou existe
associação entre elas.
Exemplo de aplicação
Vamos colocar em prática, então, a teoria que você acabou de aprender sobre teste qui-quadrado deindependência, resolvendo exercícios.
1. A tabela a seguir mostra os resultados de uma pesquisa feita com uma amostra aleatória de 529crianças classificadas por classe social e a presença ou não de obesidade. Testar ao nível de 1% se existedependência entre a classe social e a obesidade em crianças.
Tabela 49
Classe social/presençade obesidade Sim Não Total
A 150 80 230
B 50 90 140
C 59 100 159
Total 259 270 N= 529
-
8/18/2019 Matemática Integrada_Unidade II(1)
55/110
135
MATEMÁTICA INTEGRADA
Solução:
A tabela anterior representa as frequências observadas (f o) na pesquisa. Precisamos agora encontrar
as frequências esperadas (f e).
Sabemos que as frequências esperadas são dadas por:
ƒ er k
N= ∑∑ .
Sendo:
∑r = soma da linha que se deseja calcular a f e.
∑k = soma da coluna que se deseja calcular a f e.
N = soma de todas as frequências da tabela de frequências observadas.
Dessa maneira, podemos calcular todas as frequências esperadas (f e) correspondentes.
ƒ
ƒ
e
e
11
11
230 259
529
112 61
= ( )
=
.
,
ƒ
ƒ
ƒ
ƒ
ƒ
e
e
e
e
e
12
12
21
21
2
230 270
529
117 39
140 259
529
68 54
= ( )
=
= ( )
=
.
,
.
,
22
22
31
31
32
140 270
529
7146
159 259
529
77 85
1
= ( )
=
= ( )
=
=
.
,
.
,
ƒ
ƒ
ƒ
ƒ
e
e
e
e559 270
529
811532
.
,
( )
=ƒ e
C