1 ESTATÍSTICA. 2 UDIII - Inferência Básica Ass 01: Teste de Hipóteses ESTATÍSTICA.
Transcript of 1 ESTATÍSTICA. 2 UDIII - Inferência Básica Ass 01: Teste de Hipóteses ESTATÍSTICA.
1
ESTATÍSTICA
2
UDIII - Inferência Básica
Ass 01: Teste de Hipóteses
ESTATÍSTICA
3
OBJETIVOS ESPECÍFICOS
• Testar hipóteses estatísticas utilizando intervalos de confiança.
• Determinar o valor-p ( unilateral )
4
SUMÁRIO
1- Teste de Hipóteses Utilizando Intervalos de Confiança.
2. Valor-p ( Unilateral ).
5
1. Teste de Hipóteses Utilizando Intervalos de Confiança
a ) Um Tratamento Moderno
Uma Hipótese Estatística é uma afirmação acerca de uma população, que pode ser testada mediante extração de uma amostra aleatória.
6
Exemplo: Em uma grande universidade americana, selecionaram-se independentemente, em 1969, 10 professores e 5 professoras, registrando-se seus salários anuais conforme abaixo ( em milhares de dólares):
Homens ( )1X Mulheres ( )2X
12 20 911 14 12
19 17 8
16 14 10
22 15 16
16X1 11X2
7
Estas médias amostrais dão uma estimativa aproximada das médias populacionais 1 e 2.
Talvez possam ser usadas para resolver uma disputa: Um marido alega que não há diferença entre os salários dos homens (1) e os das mulheres (2).
Em outras palavras, denotando a diferença por = 1- 2, ele alega que: = 0.
Sua esposa, entretanto, afirma que a diferença chega a 7 mil dólares: = 7.
8
Resolva a questão construindo um intervalo de 95% de confiança.
Solução:
21p025,021
nns t)XX(
11
)1n()1n(
)XX()XX(s
21
222
2112
p
g.l.= ( n1 - 1 ) + ( n2 - 1 )
9
9,01,0 ou 0,40,5
)87,1(16,20,551013
15216,2)11-61(
11
Assim, com 95% de confiança, podemos estimar entre 1,0 e 9,0. A alegação do marido (=0) parece implausível, porque está fora do intervalo de confiança. Já a alegação da esposa (=7) se afigura mais plausível, pois está dentro do intervalo.
10
Um intervalo de confiança pode ser encarado como o conjunto de hipóteses aceitáveis
Conclusão: A hipótese =0 é rejeitada ao nível de erro de 5%.
Se estamos utilizando um intervalo de 95% de confiança, é natural dizermos que a hipótese está sendo testada ao nível de confiança de 95%. Entretanto, de acordo com a tradição, fala-se em geral de um teste ao nível de erro de () de 5% (complemento de 95%).
11
Em outras palavras, coletamos suficiente evidência amostral para podermos discernir uma diferença entre os salários dos homens e os das mulheres. Dizemos então que a diferença é estatisticamente discernível ou estatisticamente significativa, ao nível de erro de 5%.
Observação: A conclusão apresentada não mostra necessariamente uma discriminação.
12
Outro Exemplo: Suponhamos que o intervalo de confiança tenha-se baseado em uma amostra menor, sendo, por conseguinte, mais vago . Especificamente, suponhamos calculado o intervalo de confiança:
133- ou 85
Como a hipótese =0 está dentro do intervalo, ela não pode ser rejeitada. Ou seja, estes resultados não são mais estatisticamente discerníveis: chamamo-los estatisticamente indiscerníveis ou estatisticamente não-significativos, ao nível de erro de 5%.
13
b ) O Tratamento Tradicional
A hipótese =0 tem interesse especial. Como ela não representa diferença alguma, costuma chamar-se hipótese nula H0.
Ao rejeitá-la, por estar fora do intervalo de confiança, estabelecemos o fato importante de que existe realmente uma diferença entre as rendas dos homens e a das mulheres. Tal resultado costuma-se chamar-se tradicionalmente estatisticamente significativo ao nível de significância de 5%.
14
A expressão “significância estatística” é uma expressão técnica significando simplesmente que foram coletados dados suficientes para afirmar que existe uma diferença. Não significa que a diferença seja necessariamente importante.
15
Por exemplo, se tivéssemos extraído grandes amostras de populações quase idênticas, o intervalo de 95% de confiança ao invés de:
= 5,0 4,0 ..............(1)
poderia ser: = 0,005 0,004
Esta diferença é tão pequena que poderíamos desprezá-la como não tendo significado real, embora estatisticamente, seja tão significativa quanto (1).
16
SUMÁRIO
1- Teste de Hipóteses Utilizando Intervalos de Confiança.
2. Valor-p ( Unilateral ).
17
2. Valor-p ( UNILATERAL)
a ) Que é Valor-p?
Vimos anteriormente uma técnica simples para testar qualquer hipótese, examinando se ela está ou não dentro do intervalo de confiança.
Adotamos agora uma nova perspectiva, concentrando-nos em apenas uma hipótese, a hipótese nula H0. Calcularemos apenas o grau de apoio que ela tem dos dados.
18
Exemplo: Um processo tradicional de fabricação tem produzido milhões de válvulas de TV, com vida média =1200 horas e desvio padrão =300 horas. Um novo processo, recomendado pelo departamento de engenharia como sendo melhor, produz uma amostra de 100 válvulas com média =1265. Conquanto esta amostra faça com que o novo processo pareça melhor, é isto apenas uma conseqüência do acaso? É possível que o novo processo não seja realmente melhor do que o processo tradicional e que tenhamos obtido uma amostra não representativa?
X
19
Para especificar melhor o problema, formulemos a hipótese nula: o novo processo produziria uma população que não é diferente da anterior, isto é, H0: = 1200. Costuma-se escrever abreviadamente: 0 = 1200.A alegação do departamento de engenharia é chamada hipótese alternativa, H1: >1200
Quão consistente é a média amostral ¯ =1265 com a hipótese nula 0 = 1200? Especificamente, se a hipótese nula fosse verdadeira, qual seria a probabilidade de ¯ tomar o valor de 1265?
X
X
20
Solução:
Pelo Teorema Central do Limite, a distribuição é normal, com média 0=1200 e desvio padrão /¯:n
015,0)17,2z(P)1265X(P
30
12001265
X de EP
XP)1265X(P
30100
300
nX de EP
0
21
Conclusão: Se, de fato, o novo processo não é melhor (ou seja, se H0 é verdadeira, haveria apenas uma chance de 1,5% de observar um tão elevado como 1265.X
1,5% é o que chamamos de valor-p de H0 ( em inglês, prob-value ( valor de prova ).
Neste exemplo os dados parecem não apoiar H0.
22
Valor-p = P( ser tão grande quanto o valor observado, no caso de H0 ser verdadeira )
X
X12650=1200
obsX
Valor-p=1,5%
23
O valor-p na figura anterior é calculado na cauda direita, porque a hipótese alternativa está do lado direito ( > 1200).
Por outro lado, se a hipótese alternativa estivesse à esquerda ( < 1200), então o valor-p seria calculado na cauda esquerda, isto é,
Valor-p = P( ser tão pequena quanto o valor observado, no caso de H0 ser verdadeira )
X
24
Quer se situe à direta ou à esquerda, o valor-p é um excelente instrumento para resumir o que os dados dizem sobre a credibilidade de H0.
Quanto maior o valor-p, maior a credibilidade de H0.
25
2. Valor-p ( UNILATERAL)
b ) Utilização da Distribuição t
Vimos como foi padronizada de modo que pudéssemos utilizar a tábua normal. A estatística chave calculada foi
X
n
Xz 0
26
Em geral não se conhece , que deve ser estimado pelo desvio padrão amostral s. Tem-se então a estatística t, em lugar de z:
n
sX
t 0
27
Exemplo: Uma amostra de n=5 notas acusou
= 65 e s =11,6. Suponha a legação de que a média populacional é apenas 50. Qual o valor-p neste caso?
X
Solução:
89,2t5
6,115065
n
sX
t 0
Valor-p<0,025
28
p(t)
t
tobs=2,89tobs=2,89t0,025=2,776
0,025
0 1 2 3 4 5
Valor-p<0,025
Vemos que o valor observado de t, 2,89, está além de t0,025=2,776. Isto significa que a probabilidade da cauda é inferior a 0,025.
29
Como o valor-p é uma medida da credibilidade de H0, um valor tão baixo leva-nos a concluir sobre a implausibilidade de H0.
Em outras palavras, se H0 fosse verdadeira ( média populacional = 50 ), haveria menos de 2,5 chances em 100 de obter uma média tão elevada quanto à média 65 efetivamente observada.
30
Pode-se generalizar facilmente o uso de t para abranger outros testes de hipóteses:
padrão erro
nula hipóteseestimativat
padrão erro
estimativat
Freqüentemente a hipótese nula é 0: neste caso, a equação acima toma a forma extremamente simples:
31
Exemplo: Uma amostra aleatória de salários de 10 professores acusou média anual de 16 mil dólares; uma amostra de salários de 5 professoras acusou média anual de apenas 11 mil dólares. A variância conjunta (pooled) foi 11,7. Calculando-se um intervalo unilateral de 95% de confiança para mostrar a diferença entre os salários dos homens e das mulheres, obtemos:
(1- 2)>1700 dólares
A hipótese nula (H0: 1- 2 =0) não é plausível porque está fora do intervalo de confiança. Para indicar quão pouca credibilidade os dados a H0, calcule seu valor-p.
32
Solução:
A hipótese nula é 1- 2 = 0, de modo que a equação abaixo é adequada:
67,2
51
101
771,1
1116t
n1
n1
s
XX
EP
XX
padrão erro
estimativat
21p
2121
g.l.=13tobs(2,67) está além de t0,010=2,650. Assim, Valor-p<0,010 (muito baixa credibilidade).
33
Exemplo: Para investigar se as crianças negras de uma geração passada apresentavam conscientização racial e preconceito antinegro, Clark e Clark (1958) estudaram um grupo de 252 crianças negras. A cada uma pediu-se que escolhesse uma boneca de um grupo de quatro – duas brancas e duas não-brancas. 169 dentre as 252 crianças escolheram boneca branca.
Qual o valor-p da hipótese nula, de que as crianças ignoram a cor? (A hipótese alternativa é que as crianças têm preconceito contra os negros, sendo a favor dos brancos.
34
Solução:
Suponhamos que as 252 crianças possam ser encaradas como uma amostra aleatória de uma grande população de crianças negras (é uma mera suposição). De qualquer forma, a hipótese nula é de que a proporção populacional que escolhe boneca branca é 50-50, isto é, 0=0,50.
A proporção amostral observada é P=169/252=0,67. Seu erro padrão é dado por:
35
Solução ( continuação):
(utilizamos o valor nulo =0,50 porque o valor-p baseia-se sempre na hipótese nula). Assim:
)/n-(1P de EP
40,5t252/)50,0(50,0
50,067,0t
padrão erro
nula hipóteseestimativat
36
Solução ( continuação):
Como a amostra é suficientemente grande, podemos aplicar a distribuição normal z em lugar de t:
Valor-p = P(Z>5,40) < 0,000000287
Com tão minúsculo valor-p, a credibilidade da hipótese nula é praticamente zero. Assim – tanto quanto a nossa amostra reflita as propriedades de uma amostra aleatória – pode-se concluir que, há uma geração passada, mesmo as crianças negras tinham preconceito em favor das brancas.
37
PRATIQUE COM OS
EXERCÍCIOS .
BOA SORTE!