Amostragem [modo de compatibilidade]

INTRODUÇÃO À AMOSTRAGEM

Profa. Hilma Khoury

Psicóloga e Doutora em Psicologia

UFPA/IFCH/Faculdade de Psicologia

E-mail: [email protected]

Fones: (91) 98112-4808/ 98800-5762/ 3201-8057/ 3201-7695

A LÓGICA E A IMPORTÂNCIA

DA AMOSTRAGEM

Porque estudar amostras e não apopulação?

Estudar uma população pode demandar muito tempo e

dinheiro e, geralmente os cientistas lidam com prazos

e poucos recursos.

Até que ponto seria seguro tirarconclusões para a população a partir daamostra?

Se a amostra for representativa da população, pode-se

tirar conclusões, generalizar.

O que é uma Amostra Representativa?

Como garantir que a amostra seja uma minipopulação?

Como ter certeza de que na amostra queselecionamos estão representados todos osestratos existentes na população?

MINI POPULAÇÃO

Não há como ter certeza absoluta.

Se a amostra for grande o suficiente paraque se possa reduzir o erro amostral.

Se a amostra for selecionada de formaaleatória para que seja representativa davariabilidade que de fato existe napopulação.

Existe a probabilidade de estarmos mais ou

menos certos.

O que é uma amostra grande o suficiente?

O que é uma seleção aleatória?

O que é probabilidade?

Como conseguir uma amostra suficientemente grande?

Tamanhos de população

Tamanhos de Amostra

5% 10%50 44

100 81 51200 134 67500 222 83

1000 286 915000 370 98

10000 385 9920000 392 10050000 397 100100000 398 100

Extraído de Taylor-Powell (1998)

Dar a todos os elementos de uma população amesma chance (probabilidade) de serselecionado (escolhido).

SELEÇÃO ALEATÓRIA

Previsões futuras sobre acontecimentosque, na realidade, não podemos prever.

Sabemos, apenas, todas as hipótesespossíveis para esses acontecimentos.

PROBABILIDADE

Se jogo uma moeda uma vez, a face que cai para cima pode ser cara ou coroa, mas não temos nenhuma garantia sobre o que vai acontecer.

Posso fazer uma aposta, uma estimativa.

Se jogo uma moeda muitas vezes, há chance de 50% para cada uma das faces caírem para cima.

Se jogo um dado uma vez, a face que cai para cima pode ser ás, duque, terno, quadra, quina ou sena, mas não temos nenhuma garantia sobre o que vai acontecer.

Se jogo um dado muitas vezes, há chance de 16,67% para cada uma das faces caírem para cima.

AMOSTRAS ALEATÓRIAS

Probabilísticas

Providencia uma seleção randômica ouprobabilística.

Cada elemento tem a mesma chance(ou uma chance conhecida) de serselecionado.

Se há, por exemplo, 4500 estudantes em todas as escolas

de ensino médio de uma cidade e 1000 são concluintes, a

probabilidade de selecionar um concluinte como parte da

amostra é 1000/4500 ou 22%.

Amostras randômicas aumentam a

probabilidade de que a informação coletada

seja representativa dos grupos de onde foi

retirada (Taylor-Powell, 1998, p.3).

A seleção de uma amostra probabilística

requer uma moldura de amostragem: Lista

de elementos a partir dos quais é selecionada

a amostra.

Tipos de Amostras Aleatórias

Aleatória Simples

Cada elemento da lista recebe um número eprocede-se à seleção por meio de sorteio ou databela de números aleatórios. Lista.AmostragemAleatoria.doc

Gerador de números aleatórios.htm

Sistemática

Se a lista tem 1000 elementos, por exemplo, e oque se quer é uma amostra de 250, pode-seescolher 1 elemento a cada 4 para inclusão naamostra.

EstratificadaRetiram-se da lista quantidades apropriadas de

elementos a partir de subconjuntos homogêneos

da população (p.ex. gênero, faixas etárias etc.).

Se a lista tem 600 estudantes, sendo 70% do sexo feminino

e 30% do sexo masculino e preciso de uma amostra com

230 estudantes. Devo sortear 161 (70%) entre as mulheres e

69 (30%) entre os homens.

A amostragem estratificada visa aumentar o grau

de representatividade, reduzindo o provável erro

amostral.

O erro amostral é reduzido por dois fatores no

desenho da amostra: o tamanho da amostra e a

homogeneidade da população.

A amostragem estratificada se baseia nesse

segundo fator.

Por Conglomerados em múltiplas etapas

Amostram-se grupos de elementos (bairros, ruas) e, em seguida escolhem-se elementos em cada conglomerado selecionado.

É indicada quando a população de onde se pretenderetirar a amostra não pode ser facilmente listada.

Ex: População de uma cidade, universitários do país.

Nesse caso, A desvantagem é que o erro amostralaumenta em cada etapa.

AMOSTRAS NÃO-ALEATÓRIAS

Não Probabilísticas

Não há qualquer expectativa de que cada

elemento tenha uma chance igual de ser

incluído na amostra.

Uma vez que a amostra não pretende

representar a população, os achados não

deveriam ser generalizados para o todo.

Em algumas circunstâncias a amostra

aleatória pode ser impossível, desnecessária ou

mesmo não desejável.

Você pode querer selecionar casos ricos em

informação, a partir dos quais possa aprender muito

acerca dos assuntos importantes para o estudo.

Ou ainda, querer aprofundar um assunto específico.

Tipos de Amostras Não-Aleatórias

Por Quotas

Colhem-se dados de pessoas com todas ascaracterísticas de uma dada célula em uma matriz.

Parte-se de uma matriz descrevendo ascaracterísticas da população alvo, contendo aproporção de cada célula da matriz (moldura dascotas).

Conforme a PNAD/2004, em Belém/PA, havia120.482 aposentados, dos quais, 21.969 erameconomicamente ativos/ocupados (65,9% homens; 34,1%mulheres).

A amostra de 395 sujeitos precisaria conter 260 homens(65,9%) e 135 mulheres (34,1%) .

Intencional ou Por Julgamento

Utilizada em situações em que a natureza dosobjetivos da pesquisa necessita ou se satisfazcom espécies de juízes selecionados (p.ex.lideranças estudantis).

Conveniência

A amostra é selecionada conforme adisponibilidade ou acessibilidade às pessoasque compõem a população.

Só se justifica mediante a dificuldade de uma seleçãorandômica, “jamais deve ser desculpa para a preguiça”(Babbie, 1999, p.155).

Quem trabalha com amostras probabilísticas quer generalizar as

informações obtidas para a população de onde a amostra foi retirada.

M = 23 anos

M = 22 anos

PARÂMETROESTATÍSTICA

Média de idade dos estudantes do curso de psicologia da UFPA.

AMOSTRA

POPULAÇÃO

Em geral não conhecemos o parâmetro.

As amostras extraídas de uma população

fornecem estimativas do parâmetro

relativo a população total.

Qual a chance de acertar o parâmetro com base na estatística da amostra?

ERRO AMOSTRAL

Sempre haverá incerteza sobre quãorepresentativa da população a amostra érealmente.

Se calcularmos uma estatística, nuncaestaremos seguros sobre o quanto elapoderá diferir do parâmetro.

O grau com que a estatística amostral difere

do parâmetro populacional equivalente é

denominado de erro amostral.(Dancey & Reidy, 2006, p. 65)

Qual a chance da inferência sobre oparâmetro, por meio da estatística deuma amostra, estar correta?

Tudo vai depender de como selecionamos a

amostra.

A amostra deve ser grande o suficientepara que se possa reduzir o erro

amostral.

A amostra deve ser selecionada de formaaleatória para que seja representativa davariabilidade que de fato existe napopulação.

Se muitas amostras aleatórias são extraídas de uma mesma população, as estatísticas

fornecidas por estas amostras estarão distribuídas em torno do parâmetro

populacional de uma forma conhecida.

(Exercício)

Se há tanta variabilidade, como saber oparâmetro real?

Qual desses valores representa oparâmetro existente na população?

Embora haja uma ampla faixa deestimativas, a maioria está mais próximado ponto médio do eixo de ordenadas.

Portanto, o valor real do parâmetro dapopulação está próximo a esse valormédio.

Por isso se fala em distribuição normalpadrão.

-3 -2 -1 0 1 2 3

A teoria da probabilidade nos diz

Quão próximo as estatísticas dasamostras estão aglomeradas em torno dovalor real (parâmetro);

Quanto elas se desviam do valor real -erro padrão ou margem de erro.

Erro Padrão e Desvio Padrão

O erro padrão estima a variabilidade entre amostras.

O desvio padrão mede a variabilidade em uma única amostra.

O erro padrão da média estima a variabilidade entre médias amostrais que você obteria se coletasse diversas amostras da mesma população.

68% das amostras (34 +34) terão estimativas

dentro de + ou - 5% do parâmetro de 100.

Estimativas entre 100 e 105 (1 erro padrão acima).

Entre 100 e 95 (1 erro padrão abaixo).

95% das amostras estarão dentro de (+ ou -) 2

erros padrão do valor verdadeiro.

99,9% das amostras estarão dentro de (+ ou -) 3

erros padrão.

Desvio do valor real = 5%

Nível de Confiança

95% das amostras estarão dentro de 2 errospadrões do parâmetro. Assim, uma amostra aleatóriatem probabilidade de 95% de estar dentro desta faixa.

Há 95% de confiança de que a estatística daamostra esteja dentro de 2 desvios padrões doparâmetro.

Consequentemente, 5% de chance de que ainterpretação esteja errada e 95% de chance de que asconclusões reflitam de forma precisa o que acontecena população (Taylor-Powell, 1998).

Risco de estarmos errados

dentro da margem de erro especificada

Referências e Bibliografia Consultada

Babbie, E. (1999). Métodos de Pesquisas de Survey. Belo Horizonte: UFMG

Dancey, C. P., & Reidy, J. (2006). Estatística sem matemática

para psicologia, 5ª Ed. Porto Alegre/RS: Penso, 606pp.

Field, A. (2009). Descobrindo a estatística usando o SPSS. Porto Alegre/RS: Artmed.

Khoury, H. T. T. (2010). Introdução à amostragem nas

pesquisas sociais. Disponível em http://profahilmakhoury.blogspot.com.br/

Salkind, N. J. (2012). Exploring Research, 8a Ed. Pearson, 407pp.

Taylor-Powell, E. (1998). Sampling: Program development and

evaluation. Cooperative Extension Publications. University of Wisconsin, 10pp.

Amostragem [modo de compatibilidade]

Science

Transcript of Amostragem [modo de compatibilidade]