Aula 4 estatistica
-
Upload
carlos-alberto-de-albuquerque -
Category
Education
-
view
35 -
download
0
Transcript of Aula 4 estatistica
Professor: Carlos Alberto de Albuquerque
Blog: http://professorcarlosaa.blogspot.com.br/
Email:
ESTATÍSTICA BÁSICA
RESUMOS E GRÁFICOS DE DADOS
O PROBLEMA DO CAPÍTULO
Com 26 anos de idade, Terri Schiavo era casada
e estava pretendendo ter um filho, quando sofreu
um colapso por problemas respiratórios e
cardíacos.
Tentativas para revivê-la foram inúteis e ela
entrou em coma.
Declarou-se que ela estava em um estado
vegetativo persistente, no qual ela parecia estar
acordada, mas estava inconsciente.
RESUMOS E GRÁFICOS DE DADOS
Ela permaneceu nesse estado durante 15 anos,
incapaz de se comunicar ou cuidar de si mesma.
Ela foi mantida viva através da inserção de um
tubo de alimentação.
Houve intensos debates sobre sua situação, com
alguns argumentando que se devia deixá-la
morrer sem o tubo de alimentação, enquanto
outros argumentavam que sua vida devia ser
preservada.
RESUMOS E GRÁFICOS DE DADOS
Depois de várias batalhas judiciais, o tubo de
alimentação foi removido e Terri Schiavo morreu
13 dias depois, com a idade de 41 anos.
Embora houvesse muitas opiniões diferentes e
fortes sobre o tratamento médico de Terri, havia
uma simpatia geral por ela.
Em meio aos muitos debates sobre a remoção do
tubo de alimentação, houve uma pesquisa de
opinião CNN/USA Today/Gallup, na qual fazia-se
a seguinte pergunta aos entrevistados:
RESUMOS E GRÁFICOS DE DADOS
“Com base no que você ouviu ou leu sobre o
caso, você concorda com a decisão da corte
de permitir a remoção do tudo de
alimentação?”
A sondagem foi realizada por telefone e houve
909 respostas de adultos americanos.
Perguntava-se, também, aos respondentes,
sua filiação partidária, e um gráfico de barras
foi colocado no site da CNN.
RESUMOS E GRÁFICOS DE DADOS
A figura ao lado mostra os
resultados da pesquisa,
dividida por partidos
políticos.
Com base na figura, parece
que as respostas dos
Democratas eram
substancialmente diferentes
das dos Republicanos e
independentes.
RESUMOS E GRÁFICOS DE DADOS
Não abordaremos os problemas humanos
relacionados à remoção do tubo, embora isso
suscite questões importantes que todos devem
considerar cuidadosamente.
Em vez disso, focalizaremos o gráfico .
Nossa compreensão de gráficos e da informação
que eles transmitem nos ajudará a responder esta
questão: Esse gráfico representa de maneira
justa os resultados da pesquisa?
CARACTERÍSTICAS DOS DADOS
CENTRO: Um valor representativo ou médio, que
indica onde se localiza o meio do conjunto de
dados.
VARIAÇÃO: Uma medida de quanto os valores
dos dados variam entre eles.
DISTRIBUIÇÃO: A natureza ou forma da
distribuição dos dados no conjunto de valores (tal
como em forma de sino, uniforme ou assimétrica).
CARACTERÍSTICAS DOS DADOS
OUTLIERS OU VALORES DISCREPATNTES OU
VALORES ATÍPICOS: Valores amostrais que se
localizam muito longe da maioria dos outros
valores amostrais.
TEMPO: Características dos dados que mudam
com o tempo.
DISTRIBUIÇÕES DE FREQUÊNCIAS
CONCEITO-CHAVE
Ao se trabalhar com grandes conjunto de
dados, em geral é útil organizá-los e resumi-
los em uma tabela, chamada DISTRIBUIÇÃO
DE FREQUÊNCIA, definida a seguir.
Em particular, uma distribuição de
frequência nos ajuda a entender a natureza
da DISTRIBUIÇÃO de um conjunto de dados.
DISTRIBUIÇÕES DE FREQUÊNCIAS
DEFINIÇÃO
Uma distribuição de frequência (ou tabela
de frequência) mostra como o conjunto de
dados é dividido entre todas as várias
categorias (ou classes), listando todas as
categorias juntamente com o número de
valores de dados em cada uma delas.
DISTRIBUIÇÕES DE FREQUÊNCIAS
A Tabela 2-2 é uma
distribuição de frequência que
resume as taxas de pulsação de
mulheres listadas na
Tabela 2-1.
DISTRIBUIÇÕES DE FREQUÊNCIAS
A frequência de uma classe
particular é o número dos
valores originais que caem
dentro daquela classe.
A primeira classe tem uma
frequência de 12, o que
indica que 12 das taxas de
pulsação originais estão
entre 60 e 69 batimentos por
minuto.
DISTRIBUIÇÕES DE FREQUÊNCIAS
A seguir, definimos alguns termos
padrão utilizados na discussão e
construção de distribuições de
frequência.
DISTRIBUIÇÕES DE FREQUÊNCIAS
DEFINIÇÃO
Limites Inferiores de classe
são os menores números que
podem pertencer às
diferentes classes.
A Tabela 2-2 tem limites
inferiores de classe de 60,
70, 80, 90, 100, 110 e 120.
DISTRIBUIÇÕES DE FREQUÊNCIAS
DEFINIÇÃO
Limites Superiores de classe
são os maiores números que
podem pertencer às diferentes
classes.
A Tabela 2-2 tem limites
superiores de classe de 69,
79, 89, 99, 109, 119 e 129
DISTRIBUIÇÕES DE FREQUÊNCIAS
DEFINIÇÃO
Fronteiras de classe são os números usados
para separar as classes, mas sem os saltos
criados pelos limites de classe.
A Figura 2-2 mostra as lacunas criadas pelos
limites de classe da Tabela 2-2.
DISTRIBUIÇÕES DE FREQUÊNCIAS
Vemos aí que os valores 69,5; 79,5; ... ; 119,5
estão no centro dessas lacunas.
Esses números são chamados de fronteiras de
classes.
DISTRIBUIÇÕES DE FREQUÊNCIAS
Seguindo-se o padrão estabelecido, vemos que a
menor fronteira de classe é 59,5 e a maior é
129,5.
Assim, a lista completa das fronteiras de classe é
59,5; 69,5; ... ; 119,5; 129,5.
DISTRIBUIÇÕES DE FREQUÊNCIAS
DEFINIÇÃO
Pontos Médios das classes
são os valores no meio da
classe.
A Tabela 2-2 tem pontos
médios 64,5; 74,5; ... ; 124,5.
DISTRIBUIÇÕES DE FREQUÊNCIAS
Cada ponto médio de classe
pode ser encontrado
somando-se o limite inferior
de classe ao limite superior
de classe e dividindo-se a
soma por 2.
DISTRIBUIÇÕES DE FREQUÊNCIAS
DEFINIÇÃO
Amplitude de classe é a
diferença entre dois limites
inferiores de classe
consecutivos ou duas
fronteiras inferiores de
classe consecutivas em uma
distribuição de frequência.
A Tabela 2-2 usa uma
amplitude de classe de 10.
DISTRIBUIÇÕES DE FREQUÊNCIAS
ATENÇÃO
Tome cuidado para evitar o erro comum de se
considerar a amplitude de classe como a
diferença entre os limites superior e inferior de
classe.
DISTRIBUIÇÕES DE FREQUÊNCIAS
Veja a Tabela 2-2- e note que a amplitude de classe é
10 e não 9.
Podemos simplificar o processo para encontrar as
fronteiras de classe notando que elas, basicamente,
dividem a diferença entre o final de uma classe e o
início da seguinte, conforme ilustrada na Figura 2-2-.
DISTRIBUIÇÕES DE FREQUÊNCIAS
PROCEDIMENTO PARA CONSTRUÇÃO DE
UMA DISTRIBUIÇÃO DE FREQUÊNCIA
1 – Determine o número de classe desejado.
O número de classes deve estar entre 5 e 20,
e o número que você escolher deve ser
influenciado pela conveniência de se usar
números redondos.
DISTRIBUIÇÕES DE FREQUÊNCIAS
2 – Calcule a amplitude de classe
Arredonde esse resultado para obter um número
conveniente.
Em geral, arredonde para cima.
Se necessário, mude o número de classes de
modo que se usem números convenientes.
DISTRIBUIÇÕES DE FREQUÊNCIAS
3 – Escolha ou o valor mínimo dos dados, ou
um valor conveniente que seja um pouco menor
do que esse valor mínimo para ser o primeiro
limite inferior de classe.
4 – Usando o limite inferior da primeira classe e
a amplitude de classe, prossiga e liste os outros
limites inferiores.
5 – Liste os limites inferiores de classe em uma
coluna vertical e prossiga para preencher os
limites superiores de classe.
DISTRIBUIÇÕES DE FREQUÊNCIAS
6 – Percorra o conjunto de dados colocando
uma marca na classe apropriada para cada
valor dado.
Conte as marcas para encontrar a frequência
total para cada classe.
DISTRIBUIÇÕES DE FREQUÊNCIA RELATIVA
Uma variação da distribuição de frequência
básica é a distribuição de frequência relativa.
Em uma distribuição de frequência relativa, a
frequência de uma classe é substituída pela
frequência relativa (uma proporção) ou uma
frequência percentual.
Também pode ser chamada distribuição de
frequência percentual.
DISTRIBUIÇÕES DE FREQUÊNCIA RELATIVA
As frequências relativas são calculados como
segue:
As frequências percentuais são calculados
como segue:
DISTRIBUIÇÕES DE FREQUÊNCIA RELATIVA
Na Tabela 2-3, as frequências
reais da Tabela 2-2 são
substituídas pelas frequências
relativas correspondentes,
expressas como porcentuais.
1ª classe = 12/40 = 0,3 = 30%
2ª classe = 14/40 = 0,35 = 35%
A soma das frequências
relativas deve totalizar 1 (ou
100%)
DISTRIBUIÇÕES DE FREQUÊNCIA ACUMULADA
A frequência acumulada para uma classe é a
soma da frequência daquela classe mais as
frequências de todas as classes anteriores.
A distribuição de frequência acumulada
baseada na distribuição de frequência da
Tabela 2-2 é exibida na Tabela 2-4 a seguir.
INTRODUÇÃO À DISTRIBUIÇÕES NORMAL
Em estatística, estamos interessados na
distribuição dos dados e, em particular, em
saber se os dados tem uma distribuição normal,
que será visto com mais detalhes nas próximas
aulas.
Uma distribuição de frequência é, em geral,
uma das primeiras ferramentas que usamos na
análise de dados, e ela, quase sempre, revela
algumas características importantes deles.
INTRODUÇÃO À DISTRIBUIÇÕES NORMAL
Dados que tem uma distribuição de
frequência aproximadamente normal são
identificados por uma distribuição de
frequência com as seguintes características:
1) As frequências começam baixas, crescem
até uma frequência máxima e, depois
decrescem para uma frequência baixa.
INTRODUÇÃO À DISTRIBUIÇÕES NORMAL
2) A distribuição deve ser aproximadamente
simétrica, com as frequências que precedem
a frequência máxima sendo
aproximadamente uma imagem espelhada
das que seguem a frequência máxima.