1 ESTATÍSTICA. 2 UDIII - Inferência Básica Ass 01: Teste de Hipóteses ESTATÍSTICA.

1

ESTATÍSTICA

2

UDIII - Inferência Básica

Ass 01: Teste de Hipóteses

ESTATÍSTICA

3

OBJETIVOS ESPECÍFICOS

• Testar hipóteses estatísticas utilizando intervalos de confiança.

• Determinar o valor-p ( unilateral )

4

SUMÁRIO

1- Teste de Hipóteses Utilizando Intervalos de Confiança.

2. Valor-p ( Unilateral ).

5

1. Teste de Hipóteses Utilizando Intervalos de Confiança

a ) Um Tratamento Moderno

Uma Hipótese Estatística é uma afirmação acerca de uma população, que pode ser testada mediante extração de uma amostra aleatória.

6

Exemplo: Em uma grande universidade americana, selecionaram-se independentemente, em 1969, 10 professores e 5 professoras, registrando-se seus salários anuais conforme abaixo ( em milhares de dólares):

Homens ( )1X Mulheres ( )2X

12 20 911 14 12

19 17 8

16 14 10

22 15 16

16X1 11X2

7

Estas médias amostrais dão uma estimativa aproximada das médias populacionais 1 e 2.

Talvez possam ser usadas para resolver uma disputa: Um marido alega que não há diferença entre os salários dos homens (1) e os das mulheres (2).

Em outras palavras, denotando a diferença por = 1- 2, ele alega que: = 0.

Sua esposa, entretanto, afirma que a diferença chega a 7 mil dólares: = 7.

8

Resolva a questão construindo um intervalo de 95% de confiança.

Solução:

21p025,021

nns t)XX(

11

)1n()1n(

)XX()XX(s

21

222

2112

p

g.l.= ( n1 - 1 ) + ( n2 - 1 )

9

9,01,0 ou 0,40,5

)87,1(16,20,551013

15216,2)11-61(

11

Assim, com 95% de confiança, podemos estimar entre 1,0 e 9,0. A alegação do marido (=0) parece implausível, porque está fora do intervalo de confiança. Já a alegação da esposa (=7) se afigura mais plausível, pois está dentro do intervalo.

10

Um intervalo de confiança pode ser encarado como o conjunto de hipóteses aceitáveis

Conclusão: A hipótese =0 é rejeitada ao nível de erro de 5%.

Se estamos utilizando um intervalo de 95% de confiança, é natural dizermos que a hipótese está sendo testada ao nível de confiança de 95%. Entretanto, de acordo com a tradição, fala-se em geral de um teste ao nível de erro de () de 5% (complemento de 95%).

11

Em outras palavras, coletamos suficiente evidência amostral para podermos discernir uma diferença entre os salários dos homens e os das mulheres. Dizemos então que a diferença é estatisticamente discernível ou estatisticamente significativa, ao nível de erro de 5%.

Observação: A conclusão apresentada não mostra necessariamente uma discriminação.

12

Outro Exemplo: Suponhamos que o intervalo de confiança tenha-se baseado em uma amostra menor, sendo, por conseguinte, mais vago . Especificamente, suponhamos calculado o intervalo de confiança:

133- ou 85

Como a hipótese =0 está dentro do intervalo, ela não pode ser rejeitada. Ou seja, estes resultados não são mais estatisticamente discerníveis: chamamo-los estatisticamente indiscerníveis ou estatisticamente não-significativos, ao nível de erro de 5%.

13

b ) O Tratamento Tradicional

A hipótese =0 tem interesse especial. Como ela não representa diferença alguma, costuma chamar-se hipótese nula H0.

Ao rejeitá-la, por estar fora do intervalo de confiança, estabelecemos o fato importante de que existe realmente uma diferença entre as rendas dos homens e a das mulheres. Tal resultado costuma-se chamar-se tradicionalmente estatisticamente significativo ao nível de significância de 5%.

14

A expressão “significância estatística” é uma expressão técnica significando simplesmente que foram coletados dados suficientes para afirmar que existe uma diferença. Não significa que a diferença seja necessariamente importante.

15

Por exemplo, se tivéssemos extraído grandes amostras de populações quase idênticas, o intervalo de 95% de confiança ao invés de:

= 5,0 4,0 ..............(1)

poderia ser: = 0,005 0,004

Esta diferença é tão pequena que poderíamos desprezá-la como não tendo significado real, embora estatisticamente, seja tão significativa quanto (1).

16

SUMÁRIO

1- Teste de Hipóteses Utilizando Intervalos de Confiança.

2. Valor-p ( Unilateral ).

17

2. Valor-p ( UNILATERAL)

a ) Que é Valor-p?

Vimos anteriormente uma técnica simples para testar qualquer hipótese, examinando se ela está ou não dentro do intervalo de confiança.

Adotamos agora uma nova perspectiva, concentrando-nos em apenas uma hipótese, a hipótese nula H0. Calcularemos apenas o grau de apoio que ela tem dos dados.

18

Exemplo: Um processo tradicional de fabricação tem produzido milhões de válvulas de TV, com vida média =1200 horas e desvio padrão =300 horas. Um novo processo, recomendado pelo departamento de engenharia como sendo melhor, produz uma amostra de 100 válvulas com média =1265. Conquanto esta amostra faça com que o novo processo pareça melhor, é isto apenas uma conseqüência do acaso? É possível que o novo processo não seja realmente melhor do que o processo tradicional e que tenhamos obtido uma amostra não representativa?

X

19

Para especificar melhor o problema, formulemos a hipótese nula: o novo processo produziria uma população que não é diferente da anterior, isto é, H0: = 1200. Costuma-se escrever abreviadamente: 0 = 1200.A alegação do departamento de engenharia é chamada hipótese alternativa, H1: >1200

Quão consistente é a média amostral ¯ =1265 com a hipótese nula 0 = 1200? Especificamente, se a hipótese nula fosse verdadeira, qual seria a probabilidade de ¯ tomar o valor de 1265?

X

X

20

Solução:

Pelo Teorema Central do Limite, a distribuição é normal, com média 0=1200 e desvio padrão /¯:n

015,0)17,2z(P)1265X(P

30

12001265

X de EP

XP)1265X(P

30100

300

nX de EP

0

21

Conclusão: Se, de fato, o novo processo não é melhor (ou seja, se H0 é verdadeira, haveria apenas uma chance de 1,5% de observar um tão elevado como 1265.X

1,5% é o que chamamos de valor-p de H0 ( em inglês, prob-value ( valor de prova ).

Neste exemplo os dados parecem não apoiar H0.

22

Valor-p = P( ser tão grande quanto o valor observado, no caso de H0 ser verdadeira )

X

X12650=1200

obsX

Valor-p=1,5%

23

O valor-p na figura anterior é calculado na cauda direita, porque a hipótese alternativa está do lado direito ( > 1200).

Por outro lado, se a hipótese alternativa estivesse à esquerda ( < 1200), então o valor-p seria calculado na cauda esquerda, isto é,

Valor-p = P( ser tão pequena quanto o valor observado, no caso de H0 ser verdadeira )

X

24

Quer se situe à direta ou à esquerda, o valor-p é um excelente instrumento para resumir o que os dados dizem sobre a credibilidade de H0.

Quanto maior o valor-p, maior a credibilidade de H0.

25

2. Valor-p ( UNILATERAL)

b ) Utilização da Distribuição t

Vimos como foi padronizada de modo que pudéssemos utilizar a tábua normal. A estatística chave calculada foi

X

n

Xz 0

26

Em geral não se conhece , que deve ser estimado pelo desvio padrão amostral s. Tem-se então a estatística t, em lugar de z:

n

sX

t 0

27

Exemplo: Uma amostra de n=5 notas acusou

= 65 e s =11,6. Suponha a legação de que a média populacional é apenas 50. Qual o valor-p neste caso?

X

Solução:

89,2t5

6,115065

n

sX

t 0

Valor-p<0,025

28

p(t)

t

tobs=2,89tobs=2,89t0,025=2,776

0,025

0 1 2 3 4 5

Valor-p<0,025

Vemos que o valor observado de t, 2,89, está além de t0,025=2,776. Isto significa que a probabilidade da cauda é inferior a 0,025.

29

Como o valor-p é uma medida da credibilidade de H0, um valor tão baixo leva-nos a concluir sobre a implausibilidade de H0.

Em outras palavras, se H0 fosse verdadeira ( média populacional = 50 ), haveria menos de 2,5 chances em 100 de obter uma média tão elevada quanto à média 65 efetivamente observada.

30

Pode-se generalizar facilmente o uso de t para abranger outros testes de hipóteses:

padrão erro

nula hipóteseestimativat

padrão erro

estimativat

Freqüentemente a hipótese nula é 0: neste caso, a equação acima toma a forma extremamente simples:

31

Exemplo: Uma amostra aleatória de salários de 10 professores acusou média anual de 16 mil dólares; uma amostra de salários de 5 professoras acusou média anual de apenas 11 mil dólares. A variância conjunta (pooled) foi 11,7. Calculando-se um intervalo unilateral de 95% de confiança para mostrar a diferença entre os salários dos homens e das mulheres, obtemos:

(1- 2)>1700 dólares

A hipótese nula (H0: 1- 2 =0) não é plausível porque está fora do intervalo de confiança. Para indicar quão pouca credibilidade os dados a H0, calcule seu valor-p.

32

Solução:

A hipótese nula é 1- 2 = 0, de modo que a equação abaixo é adequada:

67,2

51

101

771,1

1116t

n1

n1

s

XX

EP

XX

padrão erro

estimativat

21p

2121

g.l.=13tobs(2,67) está além de t0,010=2,650. Assim, Valor-p<0,010 (muito baixa credibilidade).

33

Exemplo: Para investigar se as crianças negras de uma geração passada apresentavam conscientização racial e preconceito antinegro, Clark e Clark (1958) estudaram um grupo de 252 crianças negras. A cada uma pediu-se que escolhesse uma boneca de um grupo de quatro – duas brancas e duas não-brancas. 169 dentre as 252 crianças escolheram boneca branca.

Qual o valor-p da hipótese nula, de que as crianças ignoram a cor? (A hipótese alternativa é que as crianças têm preconceito contra os negros, sendo a favor dos brancos.

34

Solução:

Suponhamos que as 252 crianças possam ser encaradas como uma amostra aleatória de uma grande população de crianças negras (é uma mera suposição). De qualquer forma, a hipótese nula é de que a proporção populacional que escolhe boneca branca é 50-50, isto é, 0=0,50.

A proporção amostral observada é P=169/252=0,67. Seu erro padrão é dado por:

35

Solução ( continuação):

(utilizamos o valor nulo =0,50 porque o valor-p baseia-se sempre na hipótese nula). Assim:

)/n-(1P de EP

40,5t252/)50,0(50,0

50,067,0t

padrão erro

nula hipóteseestimativat

36

Solução ( continuação):

Como a amostra é suficientemente grande, podemos aplicar a distribuição normal z em lugar de t:

Valor-p = P(Z>5,40) < 0,000000287

Com tão minúsculo valor-p, a credibilidade da hipótese nula é praticamente zero. Assim – tanto quanto a nossa amostra reflita as propriedades de uma amostra aleatória – pode-se concluir que, há uma geração passada, mesmo as crianças negras tinham preconceito em favor das brancas.

37

PRATIQUE COM OS

EXERCÍCIOS .

BOA SORTE!

1 ESTATÍSTICA. 2 UDIII - Inferência Básica Ass 01: Teste de Hipóteses ESTATÍSTICA.

Documents

Transcript of 1 ESTATÍSTICA. 2 UDIII - Inferência Básica Ass 01: Teste de Hipóteses ESTATÍSTICA.