Estatística parte2
-
Upload
aristoteles-lima -
Category
Documents
-
view
348 -
download
0
Embed Size (px)
Transcript of Estatística parte2

Estatística
4º Período ADS
Prof. Aristóteles Meneses Lima

Frequência e Histogramas
• Imagine que você estava lendo uma revista para descobrir o melhor lugar para se comer algo;
• Imagine que você goste de Lámen, com isso, você faz uma tabela de preços.
• Como será essa tabela?

PREÇOS DE LÁMEN NOS 50 MELHORES RESTAURANTES
RESTAURANTE PREÇO RESTAURANTE PREÇO
1 700 26 780
2 850 27 590
3 600 28 650
4 650 29 580
5 980 30 750
6 750 31 800
7 500 32 550
8 890 33 750
9 880 34 700
10 700 35 600
11 890 36 800
12 720 37 800
13 680 38 880
14 650 39 790
15 790 40 790
16 670 41 780
17 680 42 600
18 900 43 670
19 880 44 680
20 720 45 650
21 850 46 890
22 700 47 930
23 780 48 650
24 850 49 777
25 750 50 700

Como podemos tornar essa tabela mais significativa?
• Transformá-la em um gráfico; • Para fazer um gráfico primeiro temos que dividir os
preços em grupos. • Vamos supor que....• Há um shopping center gigante composto de 50
restaurantes de Lámen...e somente restaurantes de Lámen!
• Cada restaurante serve apenas um tipo de Lámen, e os restaurante são distribuídos em diferentes pisos de acordo com o preço do Lámen.
• Essa divisão de grupos é chamada de classe em Estatística.

Piso (Classe)Igual ou Maior que/Menor que
5P900-1000
5 18 47
4P800-900
37 38 462 8 9 11 19 21 24 31 36
3P700-800
26 30 33 34 39 40 41 49 50 1 6 10 12 15 20 22 23 25
4P600-700
43 44 45 483 4 13 14 16 17 28 35 42
1P500-600
7 27 29 32

GUIA DE PISOS
PISO NOME DO RESTAURANTE MÉDIA DA CLASSE
>= <
5P900-1000
XXX 950
4P800-900
XXXXXXXXXXXX
850
3P700-800
XXXXXXXXXXXXXXXXXX
750
2P600-700
XXXXXXXXXXXXX
650
1P500-600
XXXX 550
• EM CADA PISO, UMA PLACA INDICA O PREÇO CENTRAL DE CADA CLASSE.
• O SEGUNDO PISO É A CLASSE DO INTERVALO ENTRE 600 E 700, ONDE SE TEM UMA LOJA COM UMA PLACA DE 650.
• ISSO RECEBE O NOME PONTO MÉDIO DA CLASSE.

• Uma vez que este shopping center distribui cada loja em um piso diferente de acordo com o preço, o número de lojas em cada piso varia.
• O número de restaurantes em cada piso recebe o nome de frequência.
• Agora, tente calcular a frequência relativa de restaurantes no terceiro piso.
• Frequência Relativa é parecido com porcentagem, é a proporção em relação ao total, quando o total é considerado como 1.


TABELA DE FREQUÊNCIA DOS 50 MELHORES RESTAURANTES DE LÁMEN
CLASSE MÉDIA DA CLASSE FREQUÊNCIA FREQUÊNCIARELATIVA
500-600 550 4 0,08
600-700 650 13 0,26
700-800 750 18 0,36
800-900 850 12 0,24
900-1000 950 3 0,06
SOMA 50 1,00

• Agora se descrevermos tudo isso usando um gráfico de barras chamado HISTOGRAMA...
0
5
10
15
20
550 650 750 850 950
HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA)
HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA)

0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
550 650 750 850 950
HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA RELATIVA)
HISTOGRAMA (O EIXO VERTICAL É A FREQUÊNCIA RELATIVA)






Média (Valor Médio)
• Observe a tabela:
• Você sabe o que é Valor Médio?
RESULTADO DO TORNEIO DE BOLICHE
EQUIPE A EQUIPE B EQUIPE C
Jogadora Pontuação Jogadora Pontuação Jogadora Pontuação
LUY-LUY 86 KIMIKO 84 SHINOBU 229
JUN 73 MEGUME 71 YUKA 77
YUMI 124 YOSHIMI 103 SAKURA 59
SHIZUKA 111 MEI 85 KANAKO 95
TOUKO 90 KAORI 90 KUMIKO 70
KAEDE 38 YUKIKO 89 HIRONO 88


• O Valor Médio é chamado de Média em Estatística. E a média em questão agora é o que chamamos de MÉDIA ARITMÉTICA, para ser exato.
• Há outros tipos de Média, como MÉDIA GEOMÉTRICA e MÉDIA HARMÔNICA, você não precisa aprender as fórmulas agora, mas sugiro que se lembre desses nomes.

Mediana
RESULTADO DO TORNEIO DE BOLICHE
EQUIPE A EQUIPE B EQUIPE C
Jogadora Pontuação Jogadora Pontuação Jogadora Pontuação
LUY-LUY 86 KIMIKO 84 SHINOBU 229
JUN 73 MEGUME 71 YUKA 77
YUMI 124 YOSHIMI 103 SAKURA 59
SHIZUKA 111 MEI 85 KANAKO 95
TOUKO 90 KAORI 90 KUMIKO 70
KAEDE 38 YUKIKO 89 HIRONO 88
• VAMOS DEIXAR DE LADO AS EQUIPES A E B E PRESTAR ATENÇÃO À EQUIPE C.

• A Mediana é o valos central quando se coloca os valores em ordem do menor ao maior.
• Primeiro organizamos as pontuações de cada equipe.
Equipe A
38 73 86 90 111 124
Equipe B
71 84 85 89 90 103
Equipe C
59 70 77 88 95 229

Dedução
• Número de Valores = Ímpar
• Número de Valores=Par
-1041,6 -39,0 -5,7 60,4 77,3
MEDIANA
-0,4 35,2 37,8 42,2 46,1 910,3
A MEDIANA É O VALOR MÉDIO DESSES DOIS VALORES

Com isso....

Imagine
• Então, você já deve se perguntar porque a “Poupança Média” anunciada nos jornais e na tv é tão alta.
• A média é alta por causa de alguns milionários.
• Nesses casos, a Mediana está bem mais próxima das pessoas comuns.

Desvio-Padrão
• Equipes A e B
• Desenhe uma reta numérica e escreva os nomes dos jogadores de acordo com suas pontuações.
EQUIPE A
0 50 100
MÉDIA
KAEDE JUN TOUKO SHIZUKA
YUMI
LUY-LUY

EQUIPE B
0 50 100
MEGUMI
YUKIKO
MEI
KIMIKO
YOSHIMI
KAORI
MÉDIA

• Apesar de a pontuação média de cada equipe ser de 87....
• As tendências descritas pelas linhas numéricas são bem diferentes.
• O Desvio-Padrão é usado para descrever essa dispersão dos dados.
• Em resumo, Desvio-Padrão é um indicador que mostra a diferença da média de cada valor nesse conjunto.

• O desvio-padrão mínimo é o zero, e na medida que a “dispersão dos dados” aumenta, o mesmo ocorre com o desvio-padrão.
0 (mínimo)
Sem dispersão
(todos os valores dispersos
são iguais)

Agora responda...

Calculando...


De uma maneira geral...
• A primeira fórmula é aplicada quando se calcula o Desvio-padrão de uma população inteira.
• A segunda fórmula é usada quando se calcula o Desvio-padrão de uma amostra.

Recapitulando....
• Se você acha que algo não ficou claro em “Tabelas de distribuição de frequência e histogramas”. Vamos rever uma tabela apresentada.
TABELA DE FREQUÊNCIA DOS 50 MELHORES RESTAURANTES DE LÁMEN
CLASSE MÉDIA DA CLASSE FREQUÊNCIA FREQUÊNCIARELATIVA
500-600 550 4 0,08
600-700 650 13 0,26
700-800 750 18 0,36
800-900 850 12 0,24
900-1000 950 3 0,06
SOMA 50 1,00

• Como você pode ver, o intervalo de classe nessa tabela é 100.
• O intervalo não foi determinado de acordo com nenhum tipo padrão matemático – foi definido de forma subjetiva. Determinar o intervalo de classe cabe a quem está analisando os dados.
• Há um jeito de definir o intervalo de classe matematicamente.
• Usa-se a Regra de Sturges.


Exercício
• A tabela seguinte é o registro de corrida de 100m de várias meninas.
• Atleta Corrida de 100m • A 16,3• B 22,4• C 18,5• D 18,7• E 20,11. Qual o valor médio?2. Qual a mediana?3. Qual é o desvio-padrão?

Resumo• Para visualizar o panorama geral dos dados
intuitivamente, crie uma tabela de frequência ou desenhe um histograma;
• Ao fazer uma tabela de frequência, o intervalo de classe pode ser determinado pela regra de Sturges;
• Para visualizar os dados matematicamente, calcule a média, mediana e o desvio-padrão;
• Quando há um valor muito grande ou pequeno no conjunto de dados, é mais adequado utilizar a mediana que a média aritmética.
• Desvio-padrão é um índice para descrever “o grau de dispersão” dos dados.