Estatistica resumo

64

Transcript of Estatistica resumo

Page 1: Estatistica   resumo
Page 2: Estatistica   resumo

A Estatística é um ramo da Matemática que dispõe de processos apropriados para recolher, organizar, classificar, apresentar e interpretar determinados conjuntos de dados.

Page 3: Estatistica   resumo

A Estatística tem por objectivo extrair informação dos dados para obter uma melhor compreensão das situações que representam.

Na vida de todos os dias, cada vez mais é reconhecida a importância da estatística. Através do seu estudo e conhecimento é possível compreender a sociedade e o seu progresso e também potencializar a capacidade de cada indivíduo ser mais interveniente nesse próprio progresso.

A Importância da Estatística

No intuito de conhecerem melhor a população e as suas necessidades, os governos de quase todos os países, a partir do século XIX, recorrem à estatística.

Page 4: Estatistica   resumo

Variáveis estatísticas

Na figura ao lado observamos um conjunto de pessoas. Cada pessoa tem muitas características ou variáveis.

• a cor do cabelo;• a altura;• o sexo;• …

Page 5: Estatistica   resumo

Variáveis estatísticas. Variáveis quantitativas e variáveis qualitativas

Num estudo estatístico parte-se de um conjunto. Cada elemento desse conjunto (a unidade estatística) tem, provavelmente, muitos caracteres, características ou atributos a que chamamos variáveis.

Por exemplo:

Variáveis Valor observadoPeso de uma pessoa 65 kgMarca de um automóvel OpelVelocidade do carro 80 km/hCor dos olhos Azul

Tipos de dadosAo resultado de uma observação da variável chamamos dado estatístico ou simplesmente dado.

Os dados classificam-se em qualitativos ou quantitativos.

Page 6: Estatistica   resumo

Os dados qualitativos representam a informação que indica alguma qualidade, categoria ou característica não suscetível de medida, mas de classificação, assumindo várias modalidades.

Os dados quantitativos representam a informação resultante de características suscetíveis de serem medidas, apresentando-se com diferentes intensidades, que podem ser de natureza discreta – dados discretos – ou contínua – dados contínuos.

Page 7: Estatistica   resumo

A cor dos olhos, sexo, o desporto favorito, a comida favorita, … são variáveis qualitativas, porque não se podem medir.

Variáveis Estatísticas

A altura, o número de alunos, o peso, o número de irmãos, … são variáveis quantitativas, porque se podem medir.

A altura e o peso são variáveis contínuas (podem tomar valores não inteiros), enquanto o número de alunos e de irmãos são variáveis discretas (só podem tomar valores inteiros).

Variável estatística: propriedade ou característica que é observada nos elementos de uma população.

Page 8: Estatistica   resumo

Qualitativas(qualidades)

Quantitativas(quantidades)

Contínuas Discretas

Variáveis Estatísticas

Page 9: Estatistica   resumo

Variáveis qualitativas: ____________________________

Variáveis quantitativas

Contínuas: ______________________Discretas: _______________________

Exercício 3Num estudo feito numa escola, recolheram-se dados referentes às seguintes variáveis:      

(A) idade (D) número de irmãos (G) local de estudo

(B) ano de escolaridade (E) desporto preferido (H) tempo gasto diariamente no estudo

(C) sexo (F) distância de casa à escola (I) nota na disciplina de Matemática

A, B, D, I

C, E, G

F, H

Page 10: Estatistica   resumo

Organização e Tratamento de dadosRelativamente a uma amostra de 20 portugueses, com mais de 18 anos, obtiveram-se os seguintes dados relativos ao seu estado civil.

Solteiro Solteiro Casado Solteiro Solteiro

Divorciado Solteiro Viúvo Casado Divorciado

Solteiro Casado Solteiro Solteiro Casado

Casado Solteiro Solteiro Casado Divorciado

Page 11: Estatistica   resumo

Tabela de Frequências

Estado Civil

Frequência

Absoluta

Frequência Relativa

Decimal Percentagem (%)

Solteiro

Casado

Viúvo

DivorciadoTotal

1020

0,5

620

0,3

120

0,05

320

0,15

1000,5 50%

1000,3 30%

100,05 50 %

1000,15 15%

10

6

1

3

20 1 100%

Frequência absoluta de um acontecimento é o número de vezes que esse acontecimento se repete.

Frequência relativa de um acontecimento é o quociente entre a frequência absoluta e o número total de elementos.

Page 12: Estatistica   resumo

N.º de filhos por casal

Frequência absoluta

Frequência relativaDecimal Percentagem

(%)

TOTAL

Fez-se um inquérito a 15 casais sobre o número de filhos que tinham. As respostas foram as seguintes.

Exercício 4

a) Organiza os dados numa tabela de frequências absolutas e relativas.

Page 13: Estatistica   resumo

b) Quantos casais não têm filhos?

N.º de filhos por casal

Frequência absoluta

Frequência relativaDecimal Percentagem

(%)0 3 0,2 20%1 5 0,33 33%2 4 0,27 27%3 2 0,13 13%4 1 0,07 7%

TOTAL 15 1 100%

3 casais

Page 14: Estatistica   resumo

Medidas de Localização

Moda, Média e Mediana

Page 15: Estatistica   resumo

Moda

A moda de um conjunto de dados é o elemento mais frequente (ou seja, que se repete um maior número de vezes). A moda representa-se por Mo.

Exemplo:

Uma caixa dez pregos com os seguintes comprimentos:15; 10; 10; 5; 5; 10; 15; 15; 10; 10

Moda = Mo = 10, porque é o valor mais frequente.

Page 16: Estatistica   resumo

Média Aritmética

11 13 15 17Média X 144

Exemplo: Um casal tem quatro filhos com as idades: 11, 13, 15 e 17 anos.

A média (ou média aritmética) de um conjunto de valores é o quociente entre a soma de todos os valores e o número total de elementos. A média representa-se por .

X

Page 17: Estatistica   resumo

A mediana é o valor que ocupa a posição central da variável estatística.A mediana representa-se por .

X

Se o número de dados é ímpar, a mediana é o valor do dado que ocupa a posição central.

Mediana

Para se determinar a mediana deve-se começar por escrever os valores da variável por ordem crescente (ou decrescente).

Page 18: Estatistica   resumo

Se o número de dados é ímpar, a mediana é o valor do dado que ocupa a posição central.

Exemplo:Mediram-se as alturas de 7 soldadinhos de chumbo e obtiveram-se os resultados que depois de ordenados são:

Como o número total de dados é ímpar, há um valor central: 168.

~

Page 19: Estatistica   resumo

Como o número total de dados é par, há dois valores centrais: 168 e 170.

Mediram-se as alturas de 6 soldadinhos de chumbo e obtiveram-se os resultados que depois de ordenados são:

Exemplo:

Se o número de dados é par, a mediana é a média aritmética dos dois valores centrais.

~

Page 20: Estatistica   resumo

01234

410731

Número de filhos

Frequência

absoluta

A família do Sr. Alberto tem 25 casais. A tabela e o gráfico seguintes foram construídos com base no número de filhos do casais que constituem a família Sr. Alberto.

Exemplo:

Vamos determinar a média, a moda e a mediana quando os dados têm que ser lidos numa tabela ou num gráfico.

Page 21: Estatistica   resumo

01234

410731

Número de

filhos

Frequência

absoluta

Moda = _____

Média n.º total de filhosX n.º de casais

1

0 4 1 10 2 7 3 3 41,48

1 3725 25

O número de observações é ___________. Então a mediana ocupa o lugar número _____.

10 7 4

0, 0, 0, 0, 1, 1, …, 1, 1, 2, 2, …, 2, 2, 3, 3, 3, 4

ímpar

Mediana = _____1

13

posição 13

Page 22: Estatistica   resumo

Exercício 4:

b) Quantos casais não têm filhos?3 casais

c) Qual é o número de filhos mais frequente?1 filho

d) Qual é o número médio de filhos por casal?

e) Qual é a percentagem de casais que têm pelo menos dois filhos?27 + 13 + 7 = 47 %

0 3 1 5 2 4 3 2 4 1 231,5

15 15Média

Page 23: Estatistica   resumo

Tipos de Gráficos

Page 24: Estatistica   resumo

Gráfico de Barras

O gráfico de barras foi construído com as frequências absolutas.

O gráfico deve ter um título. Num dos eixos coloca-se a variável estatística. No outro eixo colocam-se as frequências absolutas ou relativas. As barras são rectângulos todos com a mesma largura. A distância ente as barras deve ser a mesma.A altura de cada barra corresponde à sua frequência. No gráfico de barras, a moda é o elemento que apresenta a maior barra.

Page 25: Estatistica   resumo

Gráfico de barras usando as frequências relativas em percentagem.

Page 26: Estatistica   resumo

Observe o gráfico.

Análise, representação e redução de dados

Qual é o título

do gráfico?

O título responde às questões: O quê; Quando;

Onde?

O gráfico tem linhas auxiliares? Qual é o papel das linhas auxiliares na

elaboração de um gráfico?

Fica completamente esclarecido com o gráfico apresentado? Justifique a

resposta.

Page 27: Estatistica   resumo

Gráfico de barras

Os gráficos de barras são fáceis de construir e de ler, por isso são os mais populares. Apresento quatro tipos de gráficos de barras.

Page 28: Estatistica   resumo

Gráfico de Linhas

O gráfico deve ter um título. Num dos eixos coloca-se a variável estatística. No outro eixo colocam-se as frequências absolutas ou relativas. O gráfico de linhas é um conjunto de pontos conectado por uma única linha. Cada ponto corresponde à sua frequência.

Page 29: Estatistica   resumo

Gráfico Circular

A frequência relativa de “Solteiros” é de 0,5.

0,5 360º 180º

Vamos determinar a amplitude do sector relativo aos portugueses com o estado civil “Solteiro”.

Page 30: Estatistica   resumo

Procedemos da seguinte forma:

I – Desenhávamos uma circunferência:

II – Marcávamos um raio:

III – A partir desse raio, marcávamos, com o transferidor , o ângulo de 180º:

IV – Escrever a percentagem respectiva:

Para representarmos 50% num gráfico circular, temos que marcar um ângulo de 180º.

Page 31: Estatistica   resumo

Para determinarmos a amplitude dos ângulos dos restantes Estados Civis efectuamos da mesma forma.

Ângulo = frequência relativa 360º

Nota: O total das amplitudes dos ângulos tem de ser 360º. Se assim não acontecer, deve-se proceder aos ajustamentos adequados nos valores dos ângulos.

Page 32: Estatistica   resumo

O gráfico deve ter um título. Um gráfico circular ou sectograma é representado através de um círculo dividido em sectores. A amplitude de cada sector é proporcional à frequência que representa. A legenda pode estar ao lado ou incluída no gráfico

Gráfico Circular

Page 33: Estatistica   resumo

Os gráficos circulares são uma

boa forma de mostrar como um

todo está repartido.

Gráficos circularesNa construção de um gráfico circular deve-se ter em conta que:• a amplitude de cada sector é proporcional à frequência que representa;• a legenda pode ser dispensada, inscrevendo-se os valores da variável e as suas frequências nos respectivos sectores circulares;• podem-se usar cores diferentes para os diferentes sectores;• o gráfico deve ter um título adequado.

Não é aconselhável construir um gráfico circular:• para variáveis que tenham mais de cinco ou seis modalidades;• para situações em que os sectores resultam aproximadamente com a mesma amplitude;• para sectores com amplitudes muito pequenas.Não é formalmente correcto apresentar gráficos com forma

de elipse ou com sectores separados.

Page 34: Estatistica   resumo

Muito antes de o homem primitivo inventar a escrita, conseguiu através de desenhos e símbolos deixar informações importantes.

Também nos nossos dias os desenhos e os símbolos são úteis para comunicar informações importantes que podem ser compreendidas por diferentes pessoas, mesmo que não falem a mesma língua.

Exemplos disso são os pictogramas que se utilizam muito em estatística.

Pictograma

Um pictograma é um gráfico em que os valores são apresentados por figuras, normalmente relacionadas com o tema em estudo.

Page 35: Estatistica   resumo

Indique um valor aproximado para o número de pessoas que participaram no inquérito.

PictogramasO pictograma seguinte refere-se à opinião recolhida, através de um inquérito, de um grupo de pessoas que acabou de assistir a um filme.

Page 36: Estatistica   resumo

  Os pictogramas são gráficos muito semelhantes aos gráficos de barras.

A principal diferença reside no facto de se utilizarem símbolos alusivos à situação concreta em estudo por forma a tornarem-se mais atraentes.

Na construção de um pictograma devem ter-se em atenção os seguintes aspectos:• Indicar no gráfico o significado de cada figura ou símbolo utilizados.• Utilizar símbolos ou figuras sugestivos em relação à variável estatística em estudo.• Utilizar sempre o mesmo símbolo ou símbolos.• Desenhar os símbolos em linhas ou colunas.• Espaçar igualmente os símbolos.• Expressar as diferentes frequências através de um maior ou menor número de símbolos, não aumentando ou diminuindo o tamanho do símbolo.• O gráfico deve ter um título adequado.

Page 37: Estatistica   resumo

Para efectuarmos um estudo sobre a altura dos alunos do 3.º ciclo da escola, escolheu-se uma amostra constituída por 23 alunos.

Os dados obtidos, em centímetros, foram os seguintes:

145 151 147 167 175 174 153 167 173 162 169 171

158 149 170 167 168 175 174 157 149 150 156

Como deveremos organizar este tipo de dados?

Agrupamento em classes

Page 38: Estatistica   resumo

Tabela de frequênciasClasses

(Altura dos alunos)

N.º de alunos

[145,151[ 5[151,157[ 3[157,163[ 3[163,169[ 4[169,175[ 8

Total 23

Para organizar estes dados vamos agrupá-los em classes. Tendo em conta o menor e o maior valor da tabela e que cada classe tem que ter a mesma amplitude, ou seja, a diferença entre o extremo superior e o extremo inferior da classe.

Na 1.ª classe estão incluídas as alturas maiores ou iguais a 145 e menores do que 151.

.

145 151 147 167 175 174 153 167 173 162 169 171

158 149 170 167 168 175 174 157 149 150 156

Page 39: Estatistica   resumo

Os gráficos das distribuições usando dados contínuos têm um aspecto diferente dos gráficos de barras das distribuições de dados discretos. Neste caso chamam-se histogramas.

Histograma é um gráfico de barras formado por um conjunto de rectângulos adjacentes (colados), tendo cada um deles por base um intervalo de classe e por altura a respectiva frequência.

Histograma

Page 40: Estatistica   resumo

Polígono de frequências

Se num histograma unires por segmentos de recta os pontos médios dos lados superiores de cada rectângulo do histograma, como se fez em baixo, obténs uma outra forma de apresentar a distribuição, que se chama polígono de frequências.

Nota: Para obtermos os pontos nos extremos da linha poligonal, devemos imaginar que existe uma classe com a mesma amplitude das restantes e frequência zero, determinar o ponto médio desta classe e uni-lo aos restantes.

Page 41: Estatistica   resumo

Nota: A média e a mediana apenas podem ser determinadas em dados quantitativos, a moda pode ser determinada em dados quantitativos e qualitativos.

Quando os dados estão agrupados por classes temos que:

A classe modal corresponde à classe com maior frequência.

A média de um conjunto de dados agrupados corresponde à média das marcas das classes (valor médio de cada classe), tendo em conta as frequências respectivas.

A classe mediana corresponde à classe que incluiu o valor central.

Page 42: Estatistica   resumo

Diagrama de Caule-e-folhas

Os resultados de 16 testes, numa escala de 0 a 100, foram os seguintes:

35, 78, 50, 63, 86, 73, 57, 82, 59, 75, 66, 79, 83, 71,

94, 59

Page 43: Estatistica   resumo

3 55 0 7 9 96 3 67 1 3 5 8 98 2 3 69 4

Esta representação chama-se diagrama de caule-e-folhas. O caule é a coluna com os números 3, 5, 6, 7, 8 e 9 que representam o algarismo das dezenas e as folhas que representam o algarismo das unidades de cada um dos dados.

Pode-se organizar este conjunto de dados utilizando uma representação gráfica do tipo seguinte:

35, 78, 50, 63, 86, 73, 57, 82, 59, 75, 66, 79, 83, 71,

94, 59

Page 44: Estatistica   resumo

35, 78, 50, 63, 86, 73, 57, 82,

59, 75, 66, 79, 83, 71, 94, 59

3 55 0 7 9 96 3 67 1 3 5 8 98 2 3 69 4

35

78, 73, 75, 79, 71Ordenando os algarismos das unidades vem:1, 3, 5, 8,9

Isto é:

Page 45: Estatistica   resumo

Representa os dados, separando cada valor em duas partes: o caule (valor à esquerda do traço vertical) e a folha (algarismo à direita do traço vertical). O valor a colocar no caule são das dezenas, centenas e milhares. O valor a colocar na folha são as unidades. Aqui repetimos as unidades quantas vezes o número aparece. Não é necessário construir previamente uma tabela de frequências.

Diagrama de Caule-e-folhas

Page 46: Estatistica   resumo

Diagrama de Extremos e Quartis

O Diagrama de extremos e quartis é uma representação gráfica onde se realçam algumas características da amostra. Para tal, começa-se por determinar as seguintes medidas da amostra: os extremos (o mínimo e o máximo), a mediana e o 1.º e 3.º quartis.

Page 47: Estatistica   resumo

Classificações dos testes de Matemática

Page 48: Estatistica   resumo

Vamos determinar o mínimo e o máximo, a mediana e o 1.º e 3.º quartis das classificações do António.

65, 70, 75, 75, 80, 85

Mínimo: 65 Máximo: 85

~

Page 49: Estatistica   resumo

A mediana divide a distribuição em duas partes iguais.

António:

Page 50: Estatistica   resumo

Os quartis são valores da variável que dividem a distribuição em 4 partes iguais, cada uma delas com 25% dos dados totais ordenados.

1.º Quartil 3.º Quartil2.º Quartil

Page 51: Estatistica   resumo

A mediana divide o conjunto de dados em duas partes com igual percentagem de elementos, 50%. Assim, para determinar os quartis, basta calcular a mediana de cada uma dessas duas partes, obtendo, desta forma, quatro partes com igual percentagem.

Page 52: Estatistica   resumo

65, 70, 75, 75, 80, 85

65, 70, 75

75, 80, 85

Vamos determinar os quartis para as classificações do António

80 33.ºQuartil Q7011.ºQuartil Q

Page 53: Estatistica   resumo

O primeiro quartil, Q1, separa os primeiro 25% dos dados ordenados dos restantes 75%.

O segundo quartil, Q2, corresponde ao valor da mediana.

O terceiro quartil, Q3, separa os primeiro 75% dos dados iniciais dos últimos 25%.

Page 54: Estatistica   resumo

Para construir o diagrama de extremos e quartis referente às classificações do António, basta proceder do seguinte modo:1.Traçar uma recta orientada na horizontal (ou vertical) que inclua o mínimo e o máximo do conjunto de dados.2.A par da recta orientada, desenhar um rectângulo entre o 1.º e o 3.º quartil e colocar um traço para assinalar a mediana. 3.Marcar dois segmentos de recta verticais ao lado do rectângulo correspondentes ao mínimo e máximo.4.Unir os pontos médios dos segmentos de recta do mínimo e do 1.º quartil e os pontos médios dos segmentos de recta do máximo e do 3.º quartil. Mín: 65

Máx: 85Med.: 75

Q1: 70Q3:80

Page 55: Estatistica   resumo

Diagrama de Extremos e Quartis

O Diagrama de Extremos e Quartis pode ser colocado na horizontal ou vertical. Este diagrama também é conhecido por diagrama de caixa e bigodes.

Page 56: Estatistica   resumo

Vamos construir o diagrama de extremos e quartis das classificações da Bárbara.

Page 57: Estatistica   resumo

73, 74, 75, 75, 76, 77

Mínimo: 73 Máximo: 77

Exercício da ficha de trabalho:

Vamos ordenar as classificações da Bárbara.

~

Page 58: Estatistica   resumo

73, 74, 75, 75, 76, 77

73, 74, 75

75, 76, 77

Vamos determinar os quartis para as classificações da Bárbara.

76 33.ºQuartil Q74 11.ºQuartil Q

Page 59: Estatistica   resumo

Diagrama de extremos e quartis das classificações da Bárbara.

Mín: 73 Máx: 77Med.: 75

Q1: 74Q3: 76

Page 60: Estatistica   resumo

A amplitude e a amplitude interquartis são medidas indicadas para estudar a dispersão dos dados.

A amplitude é a diferença entre o máximo e o mínimo do conjunto de dados (os extremos).

Amplitude e Amplitude Interquartis

A = máximo mínimo

A amplitude é muito dependente dos valores extremos do conjunto de dados, pelo que, em determinadas situações, pode não descrever correctamente a sua dispersão.

Page 61: Estatistica   resumo
Page 62: Estatistica   resumo

A amplitude interquartis é a diferença entre o 3.º quartil e o 1.º quartil.

AIQ = Q3 Q1

A amplitude interquartis fornece informação acerca da amplitude do intervalo que contém 50% dos dados centrais. Como é óbvio, quanto mais variados forem os dados, maior será a amplitude interquartis.

Page 63: Estatistica   resumo
Page 64: Estatistica   resumo

MédiaMedidas de localização

central

Medidas de localização

Medidas de dispersão

Mediana

Moda

Quartis

Amplitude

Amplitude interquartis