Amostragem [modo de compatibilidade]
-
Upload
hilma-khoury -
Category
Science
-
view
122 -
download
3
Transcript of Amostragem [modo de compatibilidade]
INTRODUÇÃO À AMOSTRAGEM
Profa. Hilma Khoury
Psicóloga e Doutora em Psicologia
UFPA/IFCH/Faculdade de Psicologia
E-mail: [email protected]
Fones: (91) 98112-4808/ 98800-5762/ 3201-8057/ 3201-7695
A LÓGICA E A IMPORTÂNCIA
DA AMOSTRAGEM
Porque estudar amostras e não apopulação?
Estudar uma população pode demandar muito tempo e
dinheiro e, geralmente os cientistas lidam com prazos
e poucos recursos.
Até que ponto seria seguro tirarconclusões para a população a partir daamostra?
Se a amostra for representativa da população, pode-se
tirar conclusões, generalizar.
O que é uma Amostra Representativa?
Como garantir que a amostra seja uma minipopulação?
Como ter certeza de que na amostra queselecionamos estão representados todos osestratos existentes na população?
MINI POPULAÇÃO
Não há como ter certeza absoluta.
Se a amostra for grande o suficiente paraque se possa reduzir o erro amostral.
Se a amostra for selecionada de formaaleatória para que seja representativa davariabilidade que de fato existe napopulação.
Existe a probabilidade de estarmos mais ou
menos certos.
O que é uma amostra grande o suficiente?
O que é uma seleção aleatória?
O que é probabilidade?
Como conseguir uma amostra suficientemente grande?
Tamanhos de população
Tamanhos de Amostra
5% 10%50 44
100 81 51200 134 67500 222 83
1000 286 915000 370 98
10000 385 9920000 392 10050000 397 100100000 398 100
Extraído de Taylor-Powell (1998)
Dar a todos os elementos de uma população amesma chance (probabilidade) de serselecionado (escolhido).
SELEÇÃO ALEATÓRIA
Previsões futuras sobre acontecimentosque, na realidade, não podemos prever.
Sabemos, apenas, todas as hipótesespossíveis para esses acontecimentos.
PROBABILIDADE
Se jogo uma moeda uma vez, a face que cai para cima pode ser cara ou coroa, mas não temos nenhuma garantia sobre o que vai acontecer.
Posso fazer uma aposta, uma estimativa.
Se jogo uma moeda muitas vezes, há chance de 50% para cada uma das faces caírem para cima.
Se jogo um dado uma vez, a face que cai para cima pode ser ás, duque, terno, quadra, quina ou sena, mas não temos nenhuma garantia sobre o que vai acontecer.
Se jogo um dado muitas vezes, há chance de 16,67% para cada uma das faces caírem para cima.
AMOSTRAS ALEATÓRIAS
Probabilísticas
Providencia uma seleção randômica ouprobabilística.
Cada elemento tem a mesma chance(ou uma chance conhecida) de serselecionado.
Se há, por exemplo, 4500 estudantes em todas as escolas
de ensino médio de uma cidade e 1000 são concluintes, a
probabilidade de selecionar um concluinte como parte da
amostra é 1000/4500 ou 22%.
Amostras randômicas aumentam a
probabilidade de que a informação coletada
seja representativa dos grupos de onde foi
retirada (Taylor-Powell, 1998, p.3).
A seleção de uma amostra probabilística
requer uma moldura de amostragem: Lista
de elementos a partir dos quais é selecionada
a amostra.
Tipos de Amostras Aleatórias
Aleatória Simples
Cada elemento da lista recebe um número eprocede-se à seleção por meio de sorteio ou databela de números aleatórios. Lista.AmostragemAleatoria.doc
Gerador de números aleatórios.htm
Sistemática
Se a lista tem 1000 elementos, por exemplo, e oque se quer é uma amostra de 250, pode-seescolher 1 elemento a cada 4 para inclusão naamostra.
EstratificadaRetiram-se da lista quantidades apropriadas de
elementos a partir de subconjuntos homogêneos
da população (p.ex. gênero, faixas etárias etc.).
Se a lista tem 600 estudantes, sendo 70% do sexo feminino
e 30% do sexo masculino e preciso de uma amostra com
230 estudantes. Devo sortear 161 (70%) entre as mulheres e
69 (30%) entre os homens.
A amostragem estratificada visa aumentar o grau
de representatividade, reduzindo o provável erro
amostral.
O erro amostral é reduzido por dois fatores no
desenho da amostra: o tamanho da amostra e a
homogeneidade da população.
A amostragem estratificada se baseia nesse
segundo fator.
Por Conglomerados em múltiplas etapas
Amostram-se grupos de elementos (bairros, ruas) e, em seguida escolhem-se elementos em cada conglomerado selecionado.
É indicada quando a população de onde se pretenderetirar a amostra não pode ser facilmente listada.
Ex: População de uma cidade, universitários do país.
Nesse caso, A desvantagem é que o erro amostralaumenta em cada etapa.
AMOSTRAS NÃO-ALEATÓRIAS
Não Probabilísticas
Não há qualquer expectativa de que cada
elemento tenha uma chance igual de ser
incluído na amostra.
Uma vez que a amostra não pretende
representar a população, os achados não
deveriam ser generalizados para o todo.
Em algumas circunstâncias a amostra
aleatória pode ser impossível, desnecessária ou
mesmo não desejável.
Você pode querer selecionar casos ricos em
informação, a partir dos quais possa aprender muito
acerca dos assuntos importantes para o estudo.
Ou ainda, querer aprofundar um assunto específico.
Tipos de Amostras Não-Aleatórias
Por Quotas
Colhem-se dados de pessoas com todas ascaracterísticas de uma dada célula em uma matriz.
Parte-se de uma matriz descrevendo ascaracterísticas da população alvo, contendo aproporção de cada célula da matriz (moldura dascotas).
Conforme a PNAD/2004, em Belém/PA, havia120.482 aposentados, dos quais, 21.969 erameconomicamente ativos/ocupados (65,9% homens; 34,1%mulheres).
A amostra de 395 sujeitos precisaria conter 260 homens(65,9%) e 135 mulheres (34,1%) .
Intencional ou Por Julgamento
Utilizada em situações em que a natureza dosobjetivos da pesquisa necessita ou se satisfazcom espécies de juízes selecionados (p.ex.lideranças estudantis).
Conveniência
A amostra é selecionada conforme adisponibilidade ou acessibilidade às pessoasque compõem a população.
Só se justifica mediante a dificuldade de uma seleçãorandômica, “jamais deve ser desculpa para a preguiça”(Babbie, 1999, p.155).
Quem trabalha com amostras probabilísticas quer generalizar as
informações obtidas para a população de onde a amostra foi retirada.
M = 23 anos
M = 22 anos
PARÂMETROESTATÍSTICA
Média de idade dos estudantes do curso de psicologia da UFPA.
AMOSTRA
POPULAÇÃO
Em geral não conhecemos o parâmetro.
As amostras extraídas de uma população
fornecem estimativas do parâmetro
relativo a população total.
Qual a chance de acertar o parâmetro com base na estatística da amostra?
ERRO AMOSTRAL
Sempre haverá incerteza sobre quãorepresentativa da população a amostra érealmente.
Se calcularmos uma estatística, nuncaestaremos seguros sobre o quanto elapoderá diferir do parâmetro.
O grau com que a estatística amostral difere
do parâmetro populacional equivalente é
denominado de erro amostral.(Dancey & Reidy, 2006, p. 65)
Qual a chance da inferência sobre oparâmetro, por meio da estatística deuma amostra, estar correta?
Tudo vai depender de como selecionamos a
amostra.
A amostra deve ser grande o suficientepara que se possa reduzir o erro
amostral.
A amostra deve ser selecionada de formaaleatória para que seja representativa davariabilidade que de fato existe napopulação.
Se muitas amostras aleatórias são extraídas de uma mesma população, as estatísticas
fornecidas por estas amostras estarão distribuídas em torno do parâmetro
populacional de uma forma conhecida.
(Exercício)
Se há tanta variabilidade, como saber oparâmetro real?
Qual desses valores representa oparâmetro existente na população?
Embora haja uma ampla faixa deestimativas, a maioria está mais próximado ponto médio do eixo de ordenadas.
Portanto, o valor real do parâmetro dapopulação está próximo a esse valormédio.
Por isso se fala em distribuição normalpadrão.
-3 -2 -1 0 1 2 3
A teoria da probabilidade nos diz
Quão próximo as estatísticas dasamostras estão aglomeradas em torno dovalor real (parâmetro);
Quanto elas se desviam do valor real -erro padrão ou margem de erro.
Erro Padrão e Desvio Padrão
O erro padrão estima a variabilidade entre amostras.
O desvio padrão mede a variabilidade em uma única amostra.
O erro padrão da média estima a variabilidade entre médias amostrais que você obteria se coletasse diversas amostras da mesma população.
68% das amostras (34 +34) terão estimativas
dentro de + ou - 5% do parâmetro de 100.
Estimativas entre 100 e 105 (1 erro padrão acima).
Entre 100 e 95 (1 erro padrão abaixo).
95% das amostras estarão dentro de (+ ou -) 2
erros padrão do valor verdadeiro.
99,9% das amostras estarão dentro de (+ ou -) 3
erros padrão.
Desvio do valor real = 5%
Nível de Confiança
95% das amostras estarão dentro de 2 errospadrões do parâmetro. Assim, uma amostra aleatóriatem probabilidade de 95% de estar dentro desta faixa.
Há 95% de confiança de que a estatística daamostra esteja dentro de 2 desvios padrões doparâmetro.
Consequentemente, 5% de chance de que ainterpretação esteja errada e 95% de chance de que asconclusões reflitam de forma precisa o que acontecena população (Taylor-Powell, 1998).
Risco de estarmos errados
dentro da margem de erro especificada
Referências e Bibliografia Consultada
Babbie, E. (1999). Métodos de Pesquisas de Survey. Belo Horizonte: UFMG
Dancey, C. P., & Reidy, J. (2006). Estatística sem matemática
para psicologia, 5ª Ed. Porto Alegre/RS: Penso, 606pp.
Field, A. (2009). Descobrindo a estatística usando o SPSS. Porto Alegre/RS: Artmed.
Khoury, H. T. T. (2010). Introdução à amostragem nas
pesquisas sociais. Disponível em http://profahilmakhoury.blogspot.com.br/
Salkind, N. J. (2012). Exploring Research, 8a Ed. Pearson, 407pp.
Taylor-Powell, E. (1998). Sampling: Program development and
evaluation. Cooperative Extension Publications. University of Wisconsin, 10pp.