Metodologia de Pesquisa · Dois professores, João e Maria, acham que têm o melhor método de...
Transcript of Metodologia de Pesquisa · Dois professores, João e Maria, acham que têm o melhor método de...
Metodologia de PesquisaMétodos quantitativos: teste de hipótese
Agenda● Estatística descritiva● Medidas de disopersão● Universo e Amostra● Testes paramétricos● Testes não paramétricos
Estatística descritiva
● Média aritmética● Moda● Mediana● Valor máximo e mínimo ● Amplitude
Estatística descritiva● Média aritmética
○ Soma de todos os elementos da amostra dividido pelo numero de elementos■ Ex.: 5,3,6,8,4,5,7,5,9■ (5 + 3 + 6 + 8 + 4 + 5 + 7 + 5 + 9) / 9 = 5,77
Estatística descritiva
● Média aritmética● Moda
○ Valor que ocorre mais vezes○ Ex.: 5,3,6,8,4,5,7,5,9○ Moda=5
Estatística descritiva● Média aritmética● Moda● Mediana
○ A mediana é determinada ordenando-se os dados de forma crescente ou decrescente e determinando o valor central da série
○ Ex.5,3,6,8,4,5,7,5,9○ 9,8,7,6,5,5,5,4,3○ Mediana será 5
Estatística descritiva
Média aritmética
ModaMedianaValor máximo e mínimo Amplitude
Estatística descritiva● Média aritmética● Moda● Mediana● Valor máximo e mínimo ● Amplitude
○ Valor entre máximo e mínimo○ Ex.5,3,6,8,4,5,7,5,9○ máximo= 9; mínimo=3○ Amplitude será 6
Exercício● Calcular média, moda, mediana, valor máximo, valor mínimo, amplitude, desvio
em relação à média, variância, desvio padrão e coeficiente de variação○ idade média da turma, ○ peso médio da turma, ○ altura média da turma, ○ número de filhos médio da turma,○ número de alunos por orientador na turma,○ período,○ distância até aqui (onde mora até UNIRIO)○ ocupação (estudante, profissional liberal, servidor público, servidor
privado)
Estatística: medidas de dispersão
● Desvio em relação à média○ Diferença entre valor observado e a média
○ Fornece uma noção da variabilidade dos dados em torno da média
○ DM= xi-x
Estatística: medidas de dispersão
● Desvio em relação à média
Estatística: medidas de dispersão
● Desvio em relação à média● Variância da amostra
○ Somatória do quadrado do desvio em relação à média, dividida pela quantidade de elementos da série menos 1
Estatística: medidas de dispersão
● Desvio em relação à média● Variância
da amostra
Estatística: medidas de dispersão
● Desvio em relação à média● Variância da amostra● Desvio padrão
○ Raiza da variância○ Grau de dispersão dos dados em
relação à média
Estatística: medidas de dispersão
● Desvio em relação à média● Variância da amostra● Desvio padrão● Coeficiente de variação
○ Permite comparar variáveis diferentes
Comparando variáveis
Hipótese
Uma hipótese é uma afirmativa sobre uma propriedade da população
Um teste de hipótese (ou teste de significância) é um procedimento padrão para testar uma afirmativa sobre uma propriedade da população.
Exemplo
Médicos afirmam que a temperatura normal do corpo humano é de 37oC
A afirmativa é que a temperatura = 37oC
Se temperatura temperatura = 37oC for falso
Então temperatura = 37oC é verdadeiro
Exemplo
A proporção de motoristas que afirmam ultrapassar o sinal vermelho é >50%
A afirmativa é que a proporção é p > 50%
Se p>50% for falso, Então p=50% é verdadeiro
Tomaremos p=50% coo hipótese nula e p>50% como hipótese alternativa (que queremos mostrar)
Exemplo
Hum,, estou desconfiada da balança do supermercado X. Comprei um pacote de tomates que dizia 227g e só tinha 225g
A diferença se deve ao acaso ou a máquina está com problemas
Tópico: aferição de balanças
Passo 1: Determinação da hipótese
Minha hipótese é de que “A balança do supermercado X está mal aferida”
Se “A balança do supermercado X está mal aferida” for falso
Então “A balança do supermercado X está bem aferida”
ExemploDois professores, João e Maria, acham que têm o melhor método de ensino para ensinar alunos de MBA sobre conceitos de teste de hipótese. Maria requer que os alunos assistam a 1 aula teórica e participem de 1 apresentação por semana. João acha que 1 aula basta. Este é o primeiro semestre que Maria vai aplicar o método. Como dá muito trabalho, ela quer ter certeza que funciona.
Tópico: eficácia de métodos de ensino
Passo 1: Determinação da hipótese
H1: Quando alunos participam de um seminário, além das classes convencionais, sua performance aumenta.
Hipótese alternativa: Não faz diferença
Exemplo
1- Qual o melhor algoritmo disponível para classificação de clientes em relação a serem bons pagadores
2- Desempenho de um novo algoritmo
Foco em alguma(s) medida(s) que capturem a capacidade do algoritmo em solucionar o problema.
Exemplo
A altura média dos brasileiros é no máximo 1,80 m
�brasileiro < 1,80 m
Se �brasileiro < 1,80 m for falso
Então �brasileiro > 1,80 m
Tomamos �brasileiro > 1,80 m como hipótese alternativa e
�brasileiro = 1,80 m como hipótese nula
Conceitos: Identificação das hipóteses
● Hipótese nula (Representada por Ho) ○ Afirmativa de que o valor do parâmetro populacional é
igual a algum valor especificado.
● Hipótese alternativa (Representada por H1 ou Ha) ○ Afirmativa de que o parâmetro tem um valor que, de
alguma forma, difere da hipótese nula.
Conceitos: Identificação das hipóteses
1. Identifique a afirmativa ou hipótese específica a ser testada e expresse-a em forma simbólica.
2. Dê a forma simbólica que tem que ser verdadeira quando a afirmativa original é falsa
3. Hipótese alternativa é a que não contém a igualdade, e a hipótese nula iguala o parâmetro ao valor fixo sendo considerado
Estatística de teste
Calculado a partir dos dados amostrais
Usada para mostrar a rejeição da hipótese nula
Conceitos importantes
Valor crítico
Qualquer valor que separa a região crítica (onde rejeitamos a hipótese nula) dos valores da estatística de teste que não levam a rejeição da hipótese nula.
Valor P
O valor P (ou valor de Probabilidade) é a probabilidade de se obter um valor da estatística de teste que seja no mínimo tão extremo quanto o que representa os dados amostrais, supondo que a hipótese nula seja verdadeira.
Em geral 5%, 1% 0.5%
Região crítica
Conjunto de todos os valores da estatística de teste que nos faz rejeitar a hipótese nula
Nível de Significância
O nível de significância (representado por α) é probabilidade de que a estatística de teste cairá na região crítica quando a hipótese nula for realmente verdadeira.
Intervalo de Confiança
Como uma estatística de intervalo de confiança de um parâmetro populacional contém os valores prováveis do parâmetro, rejeite uma afirmativa de que o parâmetro populacional tenha um valor que não esteja incluído no intervalo de confiança
Região crítica
Considerando exemplo da balança e peso do tomate, isto é , H1:= ̸227 g, espera-se que a média amostral seja inferior ou superior a 227 gSuponha que equipe técnica tenha decidido adotar a seguinte regra:rejeitar Ho se X for maior que 235 g e ou menor que 220 g.
Rc ={ x > 235g ou x < 220g} Região de rejeição de Ho.
Rc = Ra = { 220 g< x >235g} Região de aceitação de Ho.
x�=227
Rejeitar H0Rejeitar H0Aceitar H0
Erros tipo I e tipoII
Exemplo:
H0: Aceitar o lote
H1: Não aceitar o lote
Erro tipo I: Rejeitar a hipótese nula quando ela é, de fato, verdadeira. O símbolo α (alfa) é usado para representar a probabilidade de um erro do tipo I.
Erro tipo II: O erro de deixar de rejeitar a hipótese nula quando ela é falsa. O símbolo β (Beta) é usado para representar a probabilidade de um erro tipo II.
Testes bilaterais e unilateraisSe a hipótese nula e alternativa de um teste de hipóteses são:
H0 :�=�0
H1 :�≄�0 (diferente)
onde �0 é constante conhecida, o teste é chamada de teste bilateral.
teste unilateral esquerdo.
H0 :�=�0
H1 : �<�0
teste unilateral esquerdo.
H0 :�=�0
H1 : �>�0
Método
1. Dada uma afirmativa, identificar a hipótese nula e a hipótese alternativa, e expressá-las, em forma simbólica.
2. Dados uma afirmativa e dados amostrais, calcular o valor da estatística de teste.
3. Dado um nível de significância, identificar o(s) valor(es) crítico(s).4. Dado um nível da estatística de teste, identificar o valor P.5. Estabelecer a conclusão de um teste de hipótese em termos simples.6. Identificar os erros tipo I e tipo II que podem ser cometidos ao se testar uma
dada afirmativa.7. Critério de Decisão: a decisão de rejeitar ou deixar de rejeitar a hipótese nula
é feita, em geral, usando o de teste de hipótese, o método do valor P, ou às vezes a decisão se baseia em intervalos de confiança.
Estatísticas de teste
A estatística de teste é um valor calculado a partir dos dados amostrais e é usada para se tomar uma decisão sobre a rejeição da hipótese nula.
Testes usualmente empregados
● Paramétricos● Não -paramétricos
Testes paramétricos
Requisitos para aplicação do teste
● a amostra ter sido extraída de uma população distribuída de acordo com distribuição normal (de Gauss);
● da escala de medida da variável aleatória ser contínua; e ● do tamanho da amostra ser maior do que 30 observações.
Métodos
● Teste Z● Teste T● Teste F (análise de variância)
Teste de hipotese para media populacional
Considere uma amostra aleatória de tamanho n de uma população normal com média (desconhecida) e variância �(conhecida) Inicialmente, considera-se o caso do teste unilateral esquerdo. Suponha que tem-se interesse em verificar as seguintes hipóteses:
A estatística do teste é a média amostral X . Se população é normal (ou se amostra é grande n 30, mesmo que a população não é normal) a distribuição de X é N e a variável aleatória sob H0
Teste Z para comparação de médias
AMOSTRAS GRANDES (N1 E N2>30)
Não é necessária qualquer suposição sobre os desvios padrão das amostras
S1 e s2 são as variâncias
X1 e X2 são as médias
Para pvalue=0.05 → Z=1,96
Teste Z (usando Excel)
Teste Z (usando Excel)
Teste Z (usando Excel)
Testes não paramétricos
Permitem trabalhar com pequenas amostras ou amostras das quais não se tenha certeza de que sejam provenientes de população com distribuição normal, assumindo poucas hipóteses sobre a distribuição de probabilidade da população.
Adequados para apoiar a tomada de decisão dentro das organizações em situações nas quais não seja atendido algum dos requisitos para a aplicação dos testes estatísticos paramétricos.
Testes não paramétricos
Teste dos sinais (Wilcoxon)
Teste de proporções
Testes do Qui-quadrado
Testes do Kolmogorovp-Smirnov
Testes de Mann-Witney
Teste de McNemar
Teste dos sinais (Wilcoxon pareado)
O teste de Wilcoxon pareado é utilizado para comparar se as medidas de posição de duas amostras são iguais no caso em que as amostras são dependentes.
Para isto, consideramos duas amostras dependentes de tamanho n vindas deduas populações P1 e P2, isto é, X1, ..., Xn e Y1, ..., Yn. Como neste caso asamostras são dependentes não podemos aplicar o Teste de Wilcoxon-Mann-Whitney.
Para realizar o Teste de Wilcoxon Pareado devemos primeiramente estabelecer as hipóteses:
TESTE se as populações diferem em localização ou não utilizando a seguinte idéia: se aceitarmos a hipótese nula, temos que a mediana da diferença é nula, ou seja, as populações não diferem em localização. Já, se a hipótese nula for rejeitada, ou seja, se a mediana da diferença não for nula, temos que as populações diferem em localização.
Exemplo
Consideremos duas amostras dependentes cujos dados estão na Tabela abaixo. Existem evidências de diferença entre as duas amostras?
TEMOS QUE A ESTATISTICA T+ QUE ´E A SOMA DOS POSTOS POSITIVOS
T+ = 2+3_4+5+6+7+8+9+10+11+12=77
Utilizando a distribuição exata da estatística de Wilcoxon para uma única amostra, temos que, para α = 5%, os valores críticos são t1 = 14 e t2= 64.
TEMOS QUE A ESTAT´ISTICA T+ QUE ´E A SOMA DOS POSTOS POSITIVOS
T+ = 2+3+4+5+6+7+8+9+10+11+12=77
Utilizando a distribuição exata da estatística de Wilcoxon para uma única amostra, temos que, para α = 5%, os valores críticos são t1 = 13 e t2= 65.
Exercício5 grupos (15 minutos cada)--Explicar o teste e apresentar resultado base de teste
● Ho= 2 distribuições são semelhantes● H1= Distribuição T (com medicamento) melhor distribuição N
Testes paramétricos
● Teste t● ANOVA
Testes não paramétricos
● Testes do Qui-quadrado● Testes do Kolmogorovp-Smirnov● Testes de Mann-Witney
Incluir a estatística descritivaExplicar o processo
1 a 2 páginas
Visão Geral
Teste para duas amostras
Teste para duas amostras-populações independentes
Teste duas amostras- populações independentes
Teste para duas amostras-populações independentes
Teste para duas amostras-populações independentes
Teste para duas amostras-populações independentes
Teste para duas amostras-populações independentes
Teste para duas amostras-populações independentes
Teste para duas amostras-populações independentes
Teste para duas amostras-populações independentes
Teste para duas amostras-populações independentes
Teste para duas amostras-populações independentes
Teste para duas amostras-populações independentes
Teste para duas amostras-populações independentes
Teste para duas amostras-populações independentes
Teste para duas amostras-populações independentes
Teste para duas amostras-populações relacionadas
Teste para duas amostras-populações relacionadas
Teste para duas amostras-populações relacionadas
Teste para duas amostras-populações relacionadas
Teste para duas amostras-populações relacionadas
Teste para duas amostras-populações relacionadas
Teste para duas amostras-populações relacionadas
Teste para duas amostras-populações relacionadas
Teste t
Teste z
Teste para duas amostras-populações relacionadas