Apostila Descritiva.pdf

22
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 1 Fevereiro de 2014 INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO RIO GRANDE DO SUL CÂMPUS FARROUPILHA

Transcript of Apostila Descritiva.pdf

Page 1: Apostila Descritiva.pdf

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 1

Fevereiro de 2014

INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO RIO GRANDE DO SUL

CÂMPUS FARROUPILHA

Page 2: Apostila Descritiva.pdf

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 2

ESTATÍSTICA DESCRITIVA Sumário 1 Introdução .................................................................................................................................................. 3

1.1 Definições Básicas de Estatística ....................................................................................................... 3 2 Fases do Método Estatístico ...................................................................................................................... 4 3 Gráficos Estatísticos .................................................................................................................................. 4

3.1 Classificação dos gráficos .................................................................................................................. 5 3.1.1 Diagramas ................................................................................................................................... 5 3.1.2 Estereogramas ............................................................................................................................. 5 3.1.3 Pictogramas ................................................................................................................................ 5 3.1.4 Cartogramas ................................................................................................................................ 5

4 Distribuição de Frequências ...................................................................................................................... 5 4.1 Frequências absolutas (fi): .................................................................................................................. 5 4.2 Frequências relativas (fri): .................................................................................................................. 6 4.3 Frequência acumulada (F): ................................................................................................................. 6 4.4 Frequência relativa acumulada (Fr): .................................................................................................. 6 4.5 Regras para a elaboração de uma ....................................................................................................... 6 4.6 Representação gráfica de uma distribuição de frequências ................................................................ 6

4.6.1 Histograma .................................................................................................................................. 6 4.6.2 Polígono de frequência: .............................................................................................................. 6 4.6.3 Polígono de frequência acumulada ............................................................................................. 6 4.6.4 Frequência absoluta acumulada de uma classe: .......................................................................... 7 4.6.5 Frequência relativa acumulada de uma classe: ........................................................................... 7 4.6.6 Curva de frequência (curva suavizada):...................................................................................... 7

4.7 Diagrama de Dispersão ...................................................................................................................... 7 4.7.1 Etapas na construção do Diagrama de Dispersão ....................................................................... 7 4.7.2 Interpretação do Diagrama de Dispersão .................................................................................... 7

5 Medidas de Posição ................................................................................................................................... 8 5.1 Média Aritmética ............................................................................................................................... 8

5.1.1 Média para dados não-agrupados ............................................................................................... 8 5.1.2 Média para dados agrupados (sem intervalos de classe) ............................................................ 9 5.1.3 Média para dados agrupados (com intervalos de classe) ............................................................ 9

5.2 Média Geométrica ............................................................................................................................ 10 5.2.1 Média Geométrica Simples ....................................................................................................... 10 5.2.2 Média Geométrica Ponderada ................................................................................................... 10

5.3 Média Harmônica ............................................................................................................................. 11 5.3.1 Média Harmônica Simples (para dados não agrupados)........................................................... 11 5.3.2 Média Harmônica Ponderada (para dados agrupados) ............................................................. 11

5.4 Mediana ............................................................................................................................................ 12 5.4.1 A Mediana para dados não-agrupados ...................................................................................... 12 5.4.2 A Mediana para dados agrupados ............................................................................................ 12

5.5 Moda ................................................................................................................................................ 13 5.5.1 A Moda quando os dados não estão agrupados ........................................................................ 13 5.5.2 A Moda quando os dados estão agrupados ............................................................................... 13

5.6 Quartis .............................................................................................................................................. 14 5.6.1 Quartis para dados não agrupados ............................................................................................ 14 5.6.2 Quartis para dados agrupados em classes ................................................................................. 15

5.7 Decis ................................................................................................................................................ 15 6 Medidas de Dispersão ............................................................................................................................. 16

6.1 Amplitude total ................................................................................................................................ 16 6.2 Desvio médio absoluto ..................................................................................................................... 17 6.3 Desvio-padrão .................................................................................................................................. 17 6.4 Variância .......................................................................................................................................... 18 6.5 Coeficiente de Variação ................................................................................................................... 18 6.6 Amplitude inter-quartílica ................................................................................................................ 19

Exercícios ................................................................................................................................................... 20 BIBLIOGRAFIA ........................................................................................................................................ 22

Page 3: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 3

1 Introdução

O raciocínio estatístico é amplamente utilizado em todas as áreas do conhecimento, tais

como, na indústria, na administração de empresas, na informática, na medicina, na biologia, na

meteorologia, na metrologia, etc. O conhecimento estatístico é necessário para tomarmos

decisões corretas e evitar conclusões errôneas por falsas evidências.

Estatística é a disciplina que engloba um conjunto de métodos científicos para a coleta,

organização, resumo, análise e apresentação de dados através do emprego de tabelas, gráficos e

medidas, bem como a obtenção de conclusões válidas que dêem suporte à tomada de decisões

baseadas em tais análises. A Estatística esta dividida em:

Estatística Descritiva: se ocupa com a organização e a apresentação de dados; inclui as

técnicas que dizem respeito à sintetização e à descrição de dados através de gráficos, tabelas e

medidas resumo.

Estatística Inferencial: com base na Teoria da Amostragem, Teoria das Probabilidades e

Estatística Descritiva permite fazer inferências (afirmações) sobre características de uma

população, a partir de resultados de uma ou mais amostras. Essas inferências constituem-se na

base para a tomada de decisão.

1.1 Definições Básicas de Estatística

Fenômeno Estatístico: é qualquer evento que se pretenda analisar, cujo estudo seja

possível a partir da aplicação dos métodos estatísticos.

Dado Estatístico: é um dado numérico e é considerado a matéria-prima sobre a qual

iremos aplicar os métodos estatísticos.

População: é o conjunto total de elementos portadores de, pelo menos, uma

característica comum.

Amostra: é uma parcela representativa da população que é examinada com o propósito

de tirarmos conclusões sobre essa população.

Parâmetros: são valores singulares que existem na população e que servem para

caracterizá-la. Para definirmos um parâmetro devemos examinar toda a população.

Estimativa: é um valor aproximado do parâmetro e é calculado com o uso de uma

amostra extraída da população.

Atributo: é uma qualidade associada a um elemento. Quando os dados estatísticos

apresentam um caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses

dados são designados genericamente de estatística de atributo.

Variável: é qualquer quantidade ou característica que pode assumir diferentes valores

numéricos ou não-numéricos. É o conjunto de resultados que pode ser associado a cada

elemento da população ou amostra. As variáveis podem ser classificadas como qualitativas e

quantitativas.

Variável Qualitativa: quando os valores da variável são expressos por características ou

atributos. A variável qualitativa pode ser classificada como: variável qualitativa nominal-

classificada por um tipo ou atributo que não permite ordenação; variável qualitativa ordinal-

classificada por uma característica ou atributo que permite ordenação.

Variável Quantitativa: quando os dados são de caráter nitidamente quantitativo e o

conjunto dos resultados possui uma estrutura numérica trata-se, portanto, de uma variável

quantitativa. As variáveis quantitativas se dividem em: variável quantitativa discreta - são

aquelas que assumem valores dentro de um espaço finito ou enumerável, seus valores são

expressos geralmente através de números inteiros não negativos; variável quantitativa contínua

- resulta normalmente de uma mensuração, e a escala numérica de seus possíveis valores

corresponde ao conjunto R dos números Reais, ou seja, podem assumir, teoricamente, qualquer

valor entre dois limites, são exemplos, o peso ou a altura de uma pessoa.

Page 4: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 4

2 Fases do Método Estatístico

Os métodos estatísticos devem ser usados de maneira eficiente a fim de produzir um

retorno apropriado para o custo de seu uso. Para atingir esse objetivo não é suficiente substituir

números em fórmulas. Todo processo deve incluir um planejamento cuidadoso da coleta e

análise dos dados para se obter as conclusões estatísticas confiáveis proporcionando uma boa

transição para a solução do problema técnico original.

1º- Definição do Problema: saber exatamente aquilo que se pretende pesquisar é o

mesmo que definir corretamente o problema.

2º- Planejamento: como levantar informações? Que dados deverão ser obtidos? Qual

levantamento a ser utilizado? Censitário? Por amostragem ? E o cronograma de atividades? Os

custos envolvidos? etc.

3º- Coleta de dados: fase operacional. É o registro sistemático de dados, com um

objetivo determinado. Os dados podem ser classificados em:

Dados primários: quando são publicados pelo próprio pesquisador ou organização que os

tenha coletado. Ex.: tabelas do censo demográfico do IBGE.

Dados secundários: quando são publicados por outra organização. Ex.: quando

determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE. Obs.: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz um risco de erros de transcrição.

Dados Brutos: quando os dados originais (coletados) ainda não se encontram prontos

para análise por não estarem numericamente organizados.

Rol de dados: é uma lista em que os valores estão organizados em uma determinada

ordem, crescente ou decrescente.

4º- Crítica dos dados: obtidos os dados, eles devem ser cuidadosamente criticados, à

procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de

certo vulto, que possam influir sensivelmente nos resultados.

5º- Apresentação dos dados: os dados devem ser apresentados sob a forma adequada

(tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento

estatístico.

6º- Análise dos dados: A última fase do trabalho estatístico é a mais importante e

delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade

principal é descrever o fenômeno (estatística descritiva), ou tirar conclusões sobre a população a

partir de informações fornecidas pela amostra (estatística inferencial).

3 Gráficos Estatísticos

São representações visuais dos dados estatísticos que devem corresponder, mas nunca

substituir as tabelas estatísticas. Os gráficos apresentam as seguintes características: uso de

escalas, sistema de coordenadas (eixo das abcissas e eixo das ordenadas), identificação do

gráfico (título), fonte de origem dos dados, identificação dos eixos e respectivas unidades de

medidas, uso de legendas quando necessário, simplicidade, clareza e veracidade.

Gráficos de informação: São gráficos destinados principalmente ao público em geral,

objetivando proporcionar uma visualização rápida e clara. São gráficos tipicamente expositivos,

dispensando comentários explicativos adicionais. As legendas podem ser omitidas, desde que as

informações desejadas estejam presentes.

Gráficos de análise: São gráficos que prestam-se melhor ao trabalho estatístico,

fornecendo elementos úteis à fase de análise dos dados sem deixar de ser também informativos.

Os gráficos de análise frequentemente vêm acompanhados de uma tabela estatística. Inclui-se,

muitas vezes um texto explicativo, chamando a atenção do leitor para os pontos principais

revelados pelo gráfico.

Page 5: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 5

3.1 Classificação dos gráficos

Os gráficos podem ser classificados de acordo com a forma em: diagramas,

estereogramas, pictogramas e cartogramas.

3.1.1 Diagramas

São gráficos geométricos dispostos em duas dimensões. São os mais usados na

representação de séries estatísticas. Eles podem ser :

a) Gráficos em barras horizontais

Usam-se, de preferência, os gráficos em barras horizontais quando as legendas não são

breves.

b) Gráficos em barras verticais (colunas)

Nesses gráficos os retângulos normalmente têm a mesma base e as alturas são

proporcionais as quantidades dos respectivos dados. Se a série for histórica, a ordem a ser

observada é a cronológica, se a série for geográfica ou categórica, a ordem a ser observada é a

decrescente.

c) Gráficos em barras compostas (múltiplas barras)

d) Gráficos em colunas sobrepostas (colunas empilhadas)

Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de

apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar

comparativamente dois ou mais atributos.

e) Gráficos em linhas ou lineares

São frequentemente usados para representação de séries cronológicas com um grande

número de períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem

intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um

mesmo gráfico.

f) Gráficos em setores

Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos

ressaltar a participação das partes em relação ao total. O total é representado pelo círculo, que

fica dividido em tantos setores quantas forem as partes. Os setores são tais que suas áreas são

respectivamente proporcionais aos dados da série. O gráfico em setores só deve ser empregado

quando há, no máximo, sete dados a serem apresentados.

3.1.2 Estereogramas

São gráficos geométricos dispostos em três dimensões, pois representam volume. São

usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de

gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem.

3.1.3 Pictogramas

São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo

de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e

sugestiva. Os símbolos devem ser auto-explicativos. A desvantagem dos pictogramas é que

apenas mostram uma visão geral do fenômeno, e não de detalhes minuciosos.

3.1.4 Cartogramas

São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de

apresentar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.

4 Distribuição de Frequências

É um tipo de tabela que condensa uma coleção de dados na qual os valores se apresentam

em correspondência com suas repetições, evitando-se, assim, que eles apareçam mais de uma vez

na tabela, como ocorre com o rol de dados.

4.1 Frequências absolutas (fi): são os valores que realmente representam o número de dados de

cada classe. A soma das frequências simples é igual ao número total dos dados da distribuição.

Page 6: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 6

4.2 Frequências relativas (fri): são os valores das razões entre as frequências absolutas de cada

classe e a frequência total da distribuição (fi/n). A soma das frequências relativas é igual a 1,00

ou (100 %).

4.3 Frequência acumulada (F): a frequência absoluta total de todos os valores inferiores ao

limite superior de uma dada classe é denominada frequência acumulada até aquela classe.

4.4 Frequência relativa acumulada (Fr): a frequência relativa total de todos os valores

inferiores ao limite superior de uma dada classe é denominada frequência relativa acumulada até

aquela classe.

4.5 Regras para a elaboração de uma distribuição de frequências com classes 1º - Organize os dados brutos em um rol;

2º - Calcule a amplitude total “R” minXXR máx ;

3º - Determine o número de classes (k), que será calculado usando as fórmulas

k=1+log2n ou k=1+3,32.log n ou ainda nk , obrigatoriamente o k deve estar compreendido

entre 5 a 20.

4º - Conhecido o número de classes k define-se a amplitude de cada classe pela fórmula:

k

Rh

4.6 Representação gráfica de uma distribuição de frequências - histograma, polígono de

frequência e polígono de frequência acumulada Em todos os gráficos acima utilizamos o primeiro quadrante do sistema de eixos

coordenados cartesianos ortogonais. Na linha horizontal (eixo das abcissas) colocamos os

valores da variável e na linha vertical (eixo das ordenadas), as frequências.

4.6.1 Histograma: é o gráfico formado por um conjunto de retângulos justapostos, cujas

bases se localizam sobre o eixo horizontal, de tal forma que seus pontos médios coincidam com

os pontos médios dos intervalos de classe. A área de um histograma é proporcional à soma das

frequências simples ou absolutas.

Um histograma ou uma distribuição de frequências representa a variabilidade dos dados

da variável estudada, ou seja, o padrão de variação de todos os resultados que podem ser gerados

pelo fenômeno em estudo.

O histograma é um gráfico de barras cujo eixo horizontal representa a variação total da

característica em estudo subdividida em vários pequenos intervalos;

Quando a característica em estudo é uma variável discreta, os intervalos são valores

inteiros;

Para cada um destes intervalos é construída uma barra vertical proporcional ao número de

observações na amostra pertencente ao respectivo intervalo.

O Histograma é uma ferramenta que permite resumir e visualizar a forma da distribuição

dos dados, a localização do valor central e a dispersão em torno desse valor.

4.6.2 Polígono de frequência: é um gráfico em linha, sendo as frequências marcadas

sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de

classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura,

ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da

posterior à última, da distribuição.

4.6.3 Polígono de frequência acumulada: é traçado marcando-se as frequências

acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos

limites superiores dos intervalos de classe.

Page 7: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 7

4.6.4 Frequência absoluta acumulada de uma classe: é o total das frequências

absolutas de todos os valores inferiores ao limite superior do intervalo de uma determinada classe.

4.6.5 Frequência relativa acumulada de uma classe: é o total das frequências relativas

de todos os valores inferiores ao limite superior do intervalo de uma determinada classe.

Exercício: com base na tabela abaixo construa o histograma, o polígono de frequência e o polígono de frequência

acumulada.

...Classe ......fi..... .....Xi..... .....fri..... .....Fi..... ......Fri.....

50 |------- 54 4 52 0,100 4 0,100

54 |------- 58 9 56 0,225 13 0,325

58 |------- 62 11 60 0,275 24 0,600

62 |------- 66 8 64 0,200 32 0,800

66 |------- 70 5 68 0,125 37 0,925

70 |------- 74 3 72 0,075 40 1,000

Total 40 1,000

Sendo fi= frequência absoluta; Xi = ponto médio de classe; Fi = frequência absoluta acumulada; fri =

frequência relativa e Fri = frequência relativa acumulada.

Obs: uma distribuição de frequências sem intervalos de classe é representada graficamente por um diagrama onde

cada valor da variável é representado por um segmento de reta vertical e de comprimento proporcional à respectiva

frequência.

4.6.6 Curva de frequência (curva suavizada): enquanto o polígono de frequência nos

dá a imagem real do fenômeno estudado, a curva de frequência nos dá a imagem tendencial. A

suavização (geometricamente, corresponde à eliminação dos vértices da linha poligonal) de um

polígono de frequência. A curva de frequência nos mostra como seria tal polígono com um

número maior de dados em amostras mais amplas.

4.7 Diagrama de Dispersão

O diagrama de dispersão é um gráfico onde pontos no espaço cartesiano XY são usados

para representar simultaneamente os valores de duas variáveis quantitativas medidas em cada

elemento do conjunto de dados. O Diagrama de Dispersão é um gráfico utilizado para a

visualização do tipo de relacionamento existente entre duas variáveis.

Pode ser usado para detectar se existe uma relação de causa e efeito entre duas variáveis.

É comum o eixo horizontal representar um parâmetro do processo (causa), enquanto que o eixo

vertical representa uma característica de qualidade de interesse (efeito).

O Diagrama de Dispersão também pode ser usado para a investigação da relação

existente entre duas características de qualidade (efeitos), ou entre dois parâmetros do processo

(causas).

4.7.1 Etapas na construção do Diagrama de Dispersão

- Colete as observações em pares (x, y) das variáveis entre as quais você deseja estudar as

relações, e organize-as em uma tabela;

- Determine os valores máximo e mínimo para x e y;

- Defina as escalas do eixo horizontal e vertical de forma que ambos os comprimentos

sejam aproximadamente iguais;

- Registre as observações nos gráficos.

- Identifique o diagrama adicionando título, período, denominação e unidade de medida

de cada eixo.

4.7.2 Interpretação do Diagrama de Dispersão

- Examine a presença de dados atípicos, outliers. Um dado outlier é uma observação

extrema que não é condizente com o restante da massa dos dados.

- A identificação dos outliers e a análise das causas que levaram ao seu aparecimento

podem resultar em atuações sobre processo.

Page 8: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 8

O gráfico de dispersão poderá indicar um padrão:

- correlação positiva

- correlação negativa

- ausência de correlação

- correlação não linear

- A existência de uma correlação entre duas variáveis não implica na existência de um

relacionamento de causa e efeito entre elas.

- A correlação entre duas variáveis depende do intervalo de variação.

- Os diagramas de dispersão podem não ser válidos para a realização de extrapolações

fora do intervalo de variação das variáveis consideradas no estudo.

- Em muitos casos a análise de um diagrama de dispersão permite a descoberta da causa

do problema.

5 Medidas de Posição

São os índices estatísticos que representam uma série de dados orientando-nos quanto à

posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência.

As medidas de posições mais importantes são as medidas de tendência central (verifica-se

uma tendência dos dados observados ao se agruparem em torno dos valores centrais).

As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana.

Outras medidas de tendência central menos usados são as médias: geométrica, harmônica,

quadrática, cúbica e biquadrática.

As outras medidas de posição são as separatrizes, que englobam: a própria mediana, os

quartis, os decis e os percentis.

5.1 Média Aritmética

A média aritmética do conjunto de dados X1, X2,..., Xn representada por X é igual ao

quociente entre a soma dos valores Xi do conjunto de dados e o número total dos valores

observados é calculada por:

n

X

X

n

i

i 1 ......onde: Xi são os valores da variável e n o número de valores do grupo de dados.

5.1.1 Média para dados não-agrupados

Quando desejamos conhecer a média dos dados não-agrupados em tabelas de frequências,

determinamos a média aritmética simples.

Exemplo:

Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15,

16, 18 e 12 kg, temos, para venda média diária na semana de:

X .= (10+14+13+15+16+18+12)/7 = 14 kg

Desvio em relação à média: é a diferença entre cada elemento de um conjunto de valores e a

média aritmética, ou seja:. XXd ii

No exemplo temos sete desvios:... d1 = 10-14 = -4 , ...d2 = 14-14 = 0 , ...d3 = 13-4 = -1 , d4 = 15-14 = 1 ,... d5

= 16-14 = 2 ,... d6 = 18-14 = 4 ...e... d7 = 12-14 = -2.

Propriedades da média

1ª propriedade: A soma algébrica dos desvios em relação à média é nula.

No exemplo: d1+d2+d3+d4+d5+d6+d7 = 0

2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de

uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante.

Se no exemplo original somarmos a constante 2 a cada um dos valores da variável temos:

KgY 167/)141817151612( ou

KgXY 162142

Page 9: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 9

3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma

constante (c), a média do conjunto fica multiplicada (ou dividida) por essa constante.

Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da variável temos:

KgY 427/)36544845394230( ou

KgXY 423.143.

5.1.2 Média para dados agrupados (sem intervalos de classe)

Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável

o número de filhos do sexo masculino. Calcularemos a quantidade média de meninos por

família:

nº de meninos frequência = fi

0 2

1 6

2 10

3 12

4 4

Total 34

Como as frequências são números indicadores da intensidade de cada valor da variável,

elas funcionam como fatores de ponderação (pesos) representados po Wi, o que nos leva a

calcular a média aritmética ponderada, dada pela fórmula, onde as frequências absolutas

representam os pesos de cada valor da variável:

i

ii

W

WXX

.

Xi fi fi.Xi

0 2 0

1 6 6

2 10 20

3 12 36

4 4 16

Total 34 78

onde: 3,234

78X meninos por família

5.1.3 Média para dados agrupados (com intervalos de classe)

Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo

de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por

meio da fórmula:

i

ii

f

XfX

. ,..onde: fi é a frequência da classe índice i e Xi é o ponto médio da classe índice i.

Exemplo:

Calcular a estatura média de bebês conforme a tabela abaixo.

Estaturas (cm) frequência = fi ponto médio = Xi Xi.fi.

50 |------------ 54 4 52 208

54 |------------ 58 9 56 504

58 |------------ 62 11 60 660

62 |------------ 66 8 64 512

66 |------------ 70 5 68 340

70 |------------ 74 3 72 216

Total 40 2.440

Aplicando a fórmula acima temos: 6140

2440X cm

Page 10: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 10

5.2 Média Geométrica

A média geométrica dos valores positivos: X1, X2,..., Xn representada por gX é a raiz n-

ésima do produto de todos os valores de X .

5.2.1 Média Geométrica Simples

A média geométrica simples é calculada por:

nng XXXX .... 21

Exemplo:

Calcular a média geométrica dos seguintes conjuntos de números:E

a) {10, 60, 360}... 0,60360.60.103 gX ........

b) {2, 2, 2}........ .... 0,22.2.23 gX

c) {1, 4, 16, 64}........ 0,864.16.4.14 gX ....

5.2.2 Média Geométrica Ponderada

A média geométrica ponderada do conjunto de valores positivos: X1, X2,...,Xk, com pesos

w1, w2, ..., wk representada por gpX é calculada por:

i kW w

n

ww

gp XXXX ..... 21

21

Exemplo:

Calcular a média geométrica dos valores da tabela abaixo:

Xi fi

1 2

3 4

9 2

27 1

total 9

Obs.: Para o cálculo das médias de uma distribuição de frequênicias as frequências absolutas são

consideradas com pesos de ponderação.

8,327.9.3.19 1242 gX

Propriedades da Média Geométrica

1ª propriedade: O produto dos quocientes de cada valor de um conjunto de números pela

média geométrica do conjunto é igual a 1, ou seja, 1...... 321 g

n

ggg X

X

X

X

X

X

X

X

Exemplo:

Comprovar a 1ª propriedade da média geométrica com os dados {10, 60, 360}

gX 60... onde: 10/60 x 60/60 x 360/60 = 1

2ª propriedade: Séries que apresentam o mesmo número de elementos com o mesmo

produto têm a mesma média geométrica.

Exemplo - Comprovar a 2ª propriedade da média geométrica com os dados:

a = {8 e 12,5}.........b = {2 e 50}

gX 10 ..................... gX 10

3ª propriedade: A média geométrica é menor ou igual a média aritmética.

A desigualdade . XX g sempre se verifica, quando os valores da série forem positivos e

nem todos iguais. Se entre eles houver um ou mais zeros, a média geométrica será nula. A

igualdade XX g .só ocorrerá quando todos os valores da série forem iguais.

4ª propriedade: Quanto maior for a diferença entre os valores originais maior será a

diferença entre as médias aritmética e geométrica.

Page 11: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 11

Veja na tabela abaixo:

conjunto média aritmética média geométrica

Xi = {2, 2} 2,0 2,0

Yi = {14, 16} 15,0 14,97

Wi = {8, 12} 10,0 9,8

Zi = {2, 50} 26,0 10,0

5.3 Média Harmônica

A média harmônica dos valores positivos X1, X2,...,Xk, representada por hX é o inverso da

média aritmética dos inversos.

5.3.1 Média Harmônica Simples.(para dados não agrupados)..

A média harmônica simples é calculada por:

in

h

n

h

X

n

XXX

nX

n

XXX

X1

Xou 1

...11

1

...11

1h

2121

Exemplo:

Calcular a média harmônica simples dos seguintes conjuntos de números:

a) {10, 60, 360}. Resp:.. 3/(1/10+1/60+1/360) = 25,12

b) {2, 2, 2, 2} . Resp:... . 4/(1/2+1/2+1/2+1/2) = 2,0....

5.3.2 Média Harmônica Ponderada (para dados agrupados)

A média harmônica do conjunto de valores positivos X1, X2,...,Xk,com pesos w1, w2, ..., wk

representada por hpX é calculada por:

..

i

i

i

hp

X

w

wX

Exemplo:

Calcular a média harmônica dos valores da tabela abaixo:

classes fi Xi fi/Xi

1 |--------- 3 2 2 2/2 = 1,00

3 |--------- 5 4 4 4/4 = 1,00

5 |--------- 7 8 6 8/6 = 1,33

7 |--------- 9 4 8 4/8 = 0,50

9 |---------11 2 10 2/10 = 0,20

total 20 4,03

Propriedades da Média Harmônica

A média harmônica é menor que a média geométrica para valores da variável diferentes

de zero.

gh XX e por extensão de raciocínio podemos escrever :. XXX gh .

Obs.: A média harmônica não aceita valores iguais a zero como dados de uma série.

A igualdade XXX gh ..só ocorrerá quando todos os valores da série forem iguais.

Obs: Quando os valores da variável não forem muito diferentes, verifica-se aproximadamente a seguinte relação:

2

)( hg

XXX

Demonstraremos a relação acima com os seguintes dados: X = {10,1; 10,1; 10,2; 10,4; 10,5}

Média aritmética: 2600,105

30,51X

Média harmônica: 2574,10487451,0

5hX

96,403,4

20hX

Page 12: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 12

Média geométrica: 2857,105,10.4,10.2,10.1,10.1,105 gX

Comprovando a relação: 2587,102/)2574,102600,10( gX (média geométrica)

5.4 Mediana

A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou

decrescente), é o valor situado de tal forma no conjunto de dados, que o separa em dois

subconjuntos de mesmo número de elementos, ou seja, a mediana, é uma medida de localização

do centro da distribuição dos dados. Símbolo da mediana: md

5.4.1 A Mediana para dados não-agrupados

Dada uma série de valores como, por exemplo: {5, 2, 6, 13, 9, 15, 10}

De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação

(crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15}

O valor que divide a série acima em duas partes iguais é igual a 9, logo a md = 9.

Método prático para a determinação da Mediana

Se a série dada conter um número ímpar de termos:

O valor mediano será o termo central do conjunto de dados, que pode ser o termo de

ordem dado pela fórmula : 2

1n

Exemplo: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 2, 5}

1º - ordenar a série {0, 0, 1, 1, 2, 2, 3, 4, 5}

n = 9 logo (n + 1)/2 é dado por (9+1)/2 = 5, ou seja, o 5º termo da série ordenada será a mediana.

A mediana será o 5º termo = 2

Se a série dada apresentar um número par de termos:

O valor mediano será a média aritmética entre os dois termos centrais da série, cujos

termos de ordem são dados pelas fórmulas: n/2 e n/2+1.. Obs.: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos pelo valor correspondente.

Exemplo:

Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}

1º - ordenar a série {0, 0, 1, 1, 2, 3, 3, 4, 5, 6}

n = 10 logo os termos serão: 10/2=5 e 10/2+1=6;

logo os termos centrais são: 5º termo e 6º termo;

5º termo = 2

6º termo = 3

A mediana será = (2+3)/2 ou seja, md = 2,5 . A mediana no exemplo será a média

aritmética do 5º e 6º termos da série.

5.4.2 A Mediana para dados agrupados

a) Sem intervalos de classe: neste caso, é o bastante identificar a frequência acumulada

imediatamente superior à metade da soma das frequências. A mediana será aquele valor da

variável que corresponde a tal frequência acumulada.

b) Com intervalos de classe: para este caso, devemos seguir os seguintes passos:

1º) Determinamos as frequências acumuladas;

2º) Calculamos 2/n ;

3º) Marcamos a classe correspondente à frequência acumulada que contém o termo de

ordem 2/n . Esta classe será a classe mediana;

4º) Identificamos a frequência absoluta acumulada até a classe anterior à classe mediana

( 1iF );

5º) Identificamos a amplitude da classe mediana;

6º) Calculamos a mediana pela seguinte fórmula:..

Page 13: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 13

i

i

iidf

Fn

hlim1

2

onde:

lii = limite inferior da classe mediana;

hi = amplitude do intervalo da classe mediana;

n/2 = valor da metade do número de dados;

Fi-1 = frequência acumulada absoluta da classe anterior à classe mediana;

fi = frequência absoluta da classe mediana.

5.5 Moda

A moda de um conjunto de valores, anotada por mo é definida como sendo o valor ou os

valores do conjunto de dados que mais se repete. A moda ao contrário da mediana e da média

pode não ser única, isto é, um conjunto de dados pode ser bimodal, trimodal, etc. Ou mesmo

amodal (sem moda).

Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum,

isto é, o salário recebido pelo maior número de empregados dessa fábrica.

5.5.1 A Moda quando os dados não estão agrupados

Exemplo:

Na série {7 , 8 , 9 , 10 , 10 , 10 , 11 , 12} a moda é igual a 10.

Há séries nas quais não existe valor modal, isto é, nas quais nenhum valor apareça mais

que outros.

Exemplo: {3 , 5 , 8 , 10 , 12} não apresenta moda, a série é amodal. Em outros casos, pode haver

dois ou mais valores repetidos. Dizemos, então, que a série tem dois ou mais valores modais.

Exemplo:

{2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9} apresenta duas modas: 4 e 7. A série é bimodal.

5.5.2 A Moda quando os dados estão agrupados

a) Sem intervalos de classe: uma vez agrupados os dados, é possível determinar

imediatamente a moda: basta fixar o valor da variável de maior frequência.

Exemplo:

Qual a temperatura mais comum medida no mês abaixo:

Temperaturas frequência

0º C 3

1º C 9

2º C 12

3º C 6

Resp.: mo=2º C é a temperatura modal, pois é a de maior frequência.

b) Com intervalos de classe: a moda de uma distribuição de frequências com intervalos

de classes é dada pelas seguntes expressões:

11

1

ii

iiio

ff

fhlim , denominada de moda de King, ou

2 11

1

iii

iiiio

fff

ffhlim , denominada de moda de Kzuber, onde:

lii = limite inferior da classe modal, isto é, a classe de maior frequência;

hi = amplitude do intervalo da classe modal;

fi = frequência absoluta da classe modal;

Page 14: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 14

fi-1 = frequência absoluta da classe anterior à classe modal;

fi+1 = frequência absoluta da classe posterior á classe modal.

Notas:

- Quando o número de elementos da série estatística for ímpar, haverá coincidência da

mediana com um dos elementos da série.

- Quando o número de elementos da série estatística for par, poderá haver coincidência da

mediana com um dos elementos da série. A mediana será sempre a média aritmética dos 2

elementos centrais da série.

- Em uma série: a mediana, a média e a moda não têm, necessariamente, o mesmo valor.

- A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa

é uma das diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos

valores extremos). Vejamos:

Em {5, 7, 10, 13, 15} a média = 10 e a mediana = 10

Em {5, 7, 10, 13, 65} a média = 20 e a mediana = 10

isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos

valores extremos, ao passo que a mediana permanece a mesma.

Emprego da Mediana

- Quando desejamos obter o valor que divide a distribuição em duas partes iguais.

- Quando há valores extremos que afetam de maneira acentuada a média aritmética.

Exemplo:

Calcule a média, a mediana e a moda para os dados da tabela abaixo:

classes frequência = fi Freq. acumulada=Fi

acumulada=Fi 50 |------------ 54 4 4

54 |------------ 58 9 13

58 |------------ 62 11 24

62 |------------ 66 8 32

66 |------------ 70 5 37

70 |------------ 74 3 40

total 40

5.6 Quartis

Denominamos quartis os valores de uma série que a dividem em quatro partes iguais.

Precisamos, portanto, de 3 quartis (Q1 , Q2 e Q3) para dividir a série em quatro partes iguais.

O 1o quartil (Q1) corresponde a 25% dos dados;

O 2o quartil (Q2) corresponde a 50% dos dados;

O 3o quartil (Q3) orresponde a 75% dos dados

25% 50% 75% !---------!---------!---------!---------!

Q1 Q2 Q3

Obs.: O 2o quartil (Q2) sempre será igual a mediana da série.

5.6.1 Quartis para dados não agrupados

O método mais prático é utilizar o princípio do cálculo da mediana para os 3 quartis. Na

realidade serão calculadas "3 medianas " em uma mesma série.

Exemplo 1:

Calcule os quartis da série: {5, 2, 6, 9, 10, 13, 15}

O primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores:

{2, 5, 6, 9, 10, 13, 15}

O valor que divide a série acima em duas partes iguais é igual a 9, logo a md = 9 que será = Q2.

Temos agora {2, 5, 6} e {10, 13, 15} como sendo os dois grupos de valores iguais

proporcionados pela mediana (2o quartil). Para o cálculo do 1

o e 3

o quartis basta calcular as

medianas das partes iguais provenientes da verdadeira mediana da série (2o quartil).

Logo em {2, 5, 6} a mediana é = 5 , ou seja: será o 1o quartil

Page 15: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 15

em {10, 13, 15} a mediana é =13, ou seja: será o 3o quartil

Exemplo 2:

Calcule os quartis da série: {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13}

A série já está ordenada, então calcularemos o 2o quartil = md = (5+6)/2 = 5,5

O 1o quartil será a mediana da série à esquerda de md: {1, 1, 2, 3, 5, 5} Q1 = (2+3)/2 = 2,5

O 3o quartil será a mediana da série à direita de md: {6, 7, 9, 9, 10, 13} Q3 = (9+9)/2 = 9

Passos para a determinação dos quartis

1o - Partindo de uma amostra de tamanho n, colocar os valores em ordem crescente;

2o - Calcular o primeiro quartil usando a fórmula:

4)(,

4

1)(:,

2

)()(

1

ntopoj

nbaseionde

XXQ

ji

, onde i e j são as ordens dos valores

3o - Calcular o terceiro quartil usando a fórmula:

4

3)(,

4

)1(3)(:,

2

)()(

3

ntopoj

nbaseionde

XXQ

ji

5.6.2 Quartis para dados agrupados em classes

O método para determinar os 3 quartis para dados agrupados em classes segue a mesma

lógica da determinação da mediana:

1º) Determinamos as frequências acumuladas;

2º) Identificamos a frequência absoluta acumulada até a classe anterior à classe do quartil

( 1iQ );

3º) Calculamos 4/n para Q1 e 3n/4 para Q3;

5º) Identificamos a amplitude da classe que se encontra o iQ ;

6º) Calculamos o iQ utilizando as seguintes fórmulas:..

1

11

1114

Q

Q

QQf

Fn

hliQ

3

13

3334

3

Q

Q

QQf

Fn

hliQ

onde:

liQi = limite inferior da classe do quartil;

hQi = amplitude do intervalo da classe do quartil;

n/4, 3n/4 = ordem de ¼ e ¾ do número de dados;

fQi = frequência absoluta da classe do quartil;

FQi-1 = frequência acumulada absoluta da classe anterior à classe do quartil.

5.7 Decis

Os decis são os valores que dividem a série de dados em 10 partes iguais. Precisamos,

portanto, de 9 quartis (D1 , D2 ,..., D9) para dividir a série em dez partes iguais.

10% 20% 30% 40% 50% 60% 70% 80% 90%

!---!---!---!---!---!---!---!---!---!---!

D1 D2 D3 D4 D5 D6 D7 D8 D9

Para determinar os decis seguimos os seguintes passos:

1º) Calculamos 10

.ni, onde: i = 1, 2, 3, 4, 5, 6, 7,8 e 9

2º) Identificamos a classe Di pela frequência absoluta acumulada;

3º) Aplicamos a fórmula:

Di

Di

DiDiif

Fni

hlD1

10

.

Page 16: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 16

onde:

liDi = limite inferior da classe do decil;

hDi = amplitude do intervalo da classe do decil;

n = tamanho da amostra;

fQi = frequência absoluta da classe do decil;

FDi-1 = frequência acumulada absoluta da classe anterior à classe do decil;

6 Medidas de Dispersão

É a maior ou menor diversificação dos valores de uma variável em torno de um valor de

tendência central (média ou mediana) tomado como ponto de comparação.

A média - ainda que considerada como um número que tem a faculdade de representar

uma série de valores - não pode, por si mesma, destacar o grau de homogeneidade ou

heterogeneidade que existe entre os valores que compõem o conjunto.

Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z:

X = {70, 70, 70, 70, 70}

Y = {68, 69, 70, 71, 72}

Z = {5, 15, 50, 120, 160}

Observamos então que os três conjuntos apresentam a mesma média aritmética

705

350X , entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e

Z, já que todos os valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que

o conjunto Z, pois há menor diversificação entre cada um de seus valores e a média

representativa.

Concluímos então que o conjunto X apresenta dispersão nula e que o conjunto Y

apresenta uma dispersão menor que o conjunto Z.

6.1 Amplitude total

É uma medida de dispersão que não tem na média o ponto de referência. Quando os

dados não estão agrupados a amplitude total é a diferença entre o maior e o menor valor

observado: mínimomáximo XXR

Exemplo:

Para os valores 40, 45, 48, 62 e 70 a amplitude total será: R = 70 - 40 = 30

Quando os dados estão agrupados sem intervalos de classe ainda temos: mínimomáximo XXR

Exemplo: Xi fi

0 2

1 6

3 5

4 3

R = 4 - 0 = 4

Com intervalos de classe a amplitude total é a diferença entre o limite superior da última

classe e o limite inferior da primeira classe. Então: mínimomáximo LLR

Exemplo: Classes fi

4 |-------- 6 6

6 |-------- 8 2

8 |-------- 10 3

R = 10 - 4 = 6

A amplitude total tem o inconveniente de só levar em consideração os dois valores

extremos da série, descuidando do conjunto de valores intermediários. Faz-se uso da amplitude

total quando se quer determinar a amplitude da temperatura em um dia, ou no controle de

qualidade como uma medida de cálculo rápido sem muita exatidão.

Page 17: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 17

6.2 Desvio médio absoluto

É a média aritmética dos valores absolutos dos desvios tomados em relação a uma das

seguintes medidas de tendência central: média ou mediana. Símbolo = dma

Fórmula : para a média : n

XXdma

i e para a mediana:

n

mXdma

di

As barras verticais indicam que são tomados os valores absolutos, prescindindo do sinal

dos desvios.

Exemplo:

Calcular o desvio médio do conjunto de números {- 4 , - 3 , - 2 , 3 , 5}

Pela média : dma = 16,8 / 5 = 3,36

Pela mediana : dma = 15/5 = 3 Obs.: Apesar de o desvio médio expressar aceitavelmente a dispersão de uma amostra, não é tão frequentemente

empregado como o desvio-padrão. O desvio médio despreza o fato de alguns desvios serem negativos e outros

positivos, pois essa medida os trata como se fossem todos positivos.

6.3 Desvio-padrão

É a medida de dispersão mais empregada, pois leva em consideração a totalidade dos

valores da variável em estudo. É um indicador de variabilidade bastante estável. O desvio-padrão

baseia-se nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida

como: a raiz quadrada da média aritmética dos quadrados dos desvios em relação à média e é

representada por ou S.

n

XX i

2

ou 2

2

Xn

X i

(população)

n

XXS

i

2

ou 2

2

Xn

XS

i

(amostra)

As fórmulas acima são empregadas quando tratamos de uma população ou de uma

amostra de dados não-agrupados.

Exemplo:

Calcular o desvio-padrão da população representada por - 4 , -3 , -2 , 3 , 5

Xi X XX i 2XX i

- 4 - 0,2 - 3,8 14,44

- 3 - 0,2 - 2,8 7,84

- 2 - 0,2 - 1,8 3,24

3 - 0,2 3,2 10,24

5 - 0,2 5,2 27,04

62,8

Sabemos que n = 5 e 8,62)( 2 XX i ; logo 56,125

8,62

A raiz quadrada de 12,56 é o desvio-padrão: 54,3

Obs: Quando nosso interesse não se restringe à descrição dos dados mas, partindo da amostra, visamos tirar

inferências válidas para a respectiva população, convém efetuar uma modificação, que consiste em usar o divisor n-

1 em lugar de n, quando o tamanho da amostra for inferior a 30. A fórmula ficará então:

1

2

n

XXS

i

Se os dados - 4 , -3 , -2 , 3 , 5 representassem uma amostra o desvio-padrão amostral seria

a raiz quadrada de 62,8 / (5 -1) = 3,96

O desvio-padrão goza de algumas propriedades, dentre as quais destacamos:

1ª propriedade: Somando-se (ou subtraindo-se) uma constante a todos os valores de uma

variável, o desvio-padrão não se altera.

2ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por

uma constante (diferente de zero), o desvio-padrão fica multiplicado (ou dividido) por essa

constante.

Page 18: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 18

Quando os dados estão agrupados (temos a presença de frequências) a fórmula do desvio-

padrão ficará :

n

XXf

f

XXfS

ii

i

ii

22..

Exemplo:

Calcule o desvio-padrão populacional da tabela abaixo:

Xi fi ii fX . X XX i

2)( XX i ii fXX .)( 2

0 2 0 2,1 -2,1 4,41 8,82

1 6 6 2,1 -1,1 1,21 7,26

2 12 24 2,1 -0,1 0,01 0,12

3 7 21 2,1 0,9 0,81 5,67

4 3 12 2,1 1,9 3,61 10,83

Total 30 63 32,70

Sabemos que 70,32).( 2XXf ii e n=30, logo 044,109,1

30

70,32

Obs: Nas tabelas de frequências com intervalos de classe a fórmula a ser utilizada é a mesma do exemplo anterior.

6.4 Variância

É o desvio-padrão elevado ao quadrado e é simbolizado por 2 ou S2. A variância é uma

medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante

na inferência estatística e em combinações de amostras.

Exercícios:

1- Considere os seguintes conjuntos de números:

A = {10, 20, 30, 40, 50} B = {100, 200, 300, 400, 500}

Que relação existe entre os desvios-padrão dos dois conjuntos de números ?

2- Dados os conjuntos de números:

A = {220, 230, 240, 250, 260} B = {20, 30, 40, 50, 60}

Que relação existe entre os desvios padrões dos dois conjuntos de números ?

3- Dados os conjuntos de números: A = {-2, -1, 0, 1, 2} B = {220, 225, 230, 235,

240}

Podemos afirmar, de acordo com as propriedades do desvio-padrão, que o desvio-padrão de B é

igual:

a) ao desvio-padrão de A;

b) ao desvio-padrão de A, multiplicado pela constante 5;

c) ao desvio-padrão de A, multiplicado pela constante 5, e esse resultado somado a 230;

d) ao desvio-padrão de A mais a constante 230.

6.5 Coeficiente de Variação

Um desvio-padrão pode ser considerado grande ou pequeno dependendo da ordem de

grandeza da variável. Uma maneira de se expressar a variabilidade dos dados tirando a influência

da ordem de grandeza da variável é através do coeficiente de variação (CV). O coeficiente de

variação é uma medida relativa de dispersão útil para a comparação em termos relativos do grau

de concentração em torno da média de séries distintas e é dada por:

100.X

CV

ou 100.X

SCV , o coeficiente de variação é expresso em porcentagem.

Sua vantagem é caracterizar a dipersão dos dados em termos relativos ao seu valor médio.

Assim uma pequena dispersão absoluta pode ser na verdade, considerável quando comparada

com a ordem de grandeza dos valores da variável e vice-versa.

Além disso, por ser adimensional, o coeficiente de variação fornece uma maneira de se

comparar as dispersões de variáveis cujas unidades são irredutíveis.

Page 19: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 19

Exemplo:

Considere a tabela abaixo que contém as estaturas e os pesos de um mesmo grupo de

indivíduos e responda: qual das medidas (estatura ou peso) possui maior homogeneidade?

média desvio-padrão

Estaturas 175,0 cm 5,0 cm

Pesos 68,0 kgf 2,0 kgf

Resposta:

Como não é possível responder a essa pergunta utilizando o desvio-padrão, pois é uma medida de dispersão

absoluta, teremos que calcular o CVe da estatura e o CVp do peso. A série que apresentar a menor variação, ou seja, o

menor valor do coeficiente CV, será a série de maior homogeneidade.

Utilizando a fórmula do coeficiente CV, temos:

%86,2100.0,175

0,5eCV

%94,2100.0,168

0,2pCV

Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os pesos.

6.6 Amplitude inter-quartílica

Valores que dividem o conjunto de dados em quatro partes iguais são representados por Q1,

Q2, Q3, e denominam-se primeiro, segundo e terceiro quartis, respectivamente. A amplitude

inter-quartílica é definida como a amplitude do intervalo entre o primeiro e o terceiro quartis, ou

seja: Q = Q3 - Q1

A amplitude inter-quartílica é uma medida de variabilidade bastante robusta, que é pouco

afetada pela presença de dados atípicos e guarda a seguinte relação aproximada com o desvio-

padão: Q = (4/3) x desvio-padrão.

Box-Plot

O Box-Plot é um gráfico no formato de caixa, cujos limites são o 1º quartil e o 3º quartil,

que representam 25% e 75% dos dados respectivamente. Esta caixa é dividida por uma linha, a

mediana, que significa 50% dos dados. Existem também dois eixos, ou "bigodes", ligados à

caixa estendendo-se no máximo a 1,5 vezes o tamanho da caixa, excluindo os valores

discrepantes (outliers). De um extremo ao outro, temos o espalhamento dos dados. O Box-Plot é

especialmente útil para mostrar as medidas de tendência central, dispersão, assimetria, caudas e

valores discrepantes de um grupo de dados, bem como, as diferenças de variabilidade, tendência

central e assimetria que existem entre grupos.

Construção do Box plot:

Tamanho da caixa: Q3 – Q1

Haste da caixa: até 1,5 x tamanho da caixa

Exemplo:

O Box-Plot a seguir compara as notas finais das três turmas de Probabilidade e Estatística.

Comparação das notas das três turmas de

Probabilidade e Estatística

0,0

1,02,0

3,04,0

5,0

6,07,0

8,09,0

10,0

C.comp. Eng. Elétrica Eng. Civil

Cursos

No

tas F

inais Primeiro Quartil

M ínimo

M ediana

M áximo

Terceiro Quartil

Page 20: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 20

Exercícios 1 - Classifique as variáveis abaixo:

(a) Tempo para fazer um teste

(b) Número de alunos aprovados por turma

(c) Nível sócio-econômico

(d) Sexo

(e) Gastos com alimentação

(f) Opinião com relação à pena de morte

(g) Religião

(h) Valor de um imóvel

(i) Conceitos em certa disciplina

(j) Classificação em um concurso

2 - Construa um diagrama de setores, percentual, correspondente aos empregados da ADR Ltda que possui a

seguinte distribuição por área de trabalho: Diretoria (3 pessoas), Assessoria (6 pessoas), Transporte (18 pessoas),

Administração (5 pessoas), Área técnica (15 pessoas) e Área operacional (33 pessoas).

3 - Na administração de um sistema escolar de certo município 70% da despesa vai para o ensino, 12% para a

administração e manutenção e 18% para órgãos auxiliares, encargos fixos e despesas ocasionais. Qual o gráfico que

melhor representaria essa situação? Se o valor total da despesa é de 10.000 unidades monetárias, qual é o valor

gasto com administração e manutenção?

4 - Os dados a seguir referem-se ao número de livros adquiridos, no ano passado, pelos 40 alunos da turma de

Probabilidade e Estatística:

4 2 1 0 3 1 2 0 2 1

0 2 1 1 0 4 3 2 3 5

8 0 1 6 5 3 2 1 6 4

3 4 3 2 1 0 2 1 0 3

(a) Classifique a variável.

(b) Organize os dados em uma tabela adequada.

(c) Qual o percentual de alunos que adquiriram menos do que 3 livros?

(d) Qual o percentual de alunos que adquiriram pelo menos 4 livros?

(e) A partir do item (b), quantos livros foram adquiridos pelos 40 alunos?

5- Os dados a seguir foram coletados em um processo de produção de fibras sintéticas. Plote um gráfico de

dispersão (X e Y) e conclua a respeito.

X: Espaçamento entre rolos 5,1 5,5 4,8 1,2 1,8 4,2 3,5 1,0 1,5 5,2

Y: Resistência 11,8 12,8 13,0 13,0 13,5 14,3 14,4 14,6 13,6 12,5

6 - Considere os dados abaixo referentes ao consumo de água, em m3, de 75 contas da CORSAN:

32 6 22 11 34 40 16 26 23 31 27 10 38 17 13

45 25 50 18 23 35 22 30 14 18 20 13 24 35 29

33 48 20 12 31 39 17 58 19 16 12 21 15 12 20

51 12 19 15 41 29 25 13 23 32 14 27 43 37 21

28 37 26 44 11 53 38 46 17 36 28 49 56 19 11

(a) Organize os dados numa distribuição de frequências com 9 classes de amplitudes iguais, sendo Li = 6.

(b) A partir da distribuição de frequências construída no item anterior, determine e interprete: f3; fr4; F5; Fr6,

(Fr5-Fr2)

7) A tabela abaixo representa os salários pagos a 100 operários da empresa Fras-le:

no de salários mínimos (Xi) n

o de operários (fi)

0 2 40

2 4 30

4 6 10

6 8 15

8 10 5

Page 21: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 21

Determinar:

a) Frequência Absoluta Acumulada (abaixo de), Frequência Simples Relativa e Frequência Simples Acumulada

(abaixo de, e acima de).

b) Quantos operários ganham até 2 salários mínimos?

c) Quantos operários ganham até 6 salários mínimos?

d) Qual a % de operários com salários entre 6 a 8 salários mínimos?

e) Qual a % de operários com salários inferior a 4 salários mínimos?

f) Calcule a média e o desvio-padrão salarial.

8- Em certa empresa trabalham 4 analistas de mercado, 2 supervisores, 1 chefe de seção e 1 gerente que ganham,

respectivamente: R$1.300,00; R$1.600,00; R$2.750,00, R$5.000,00. Qual o valor do salário médio desses

funcionários? Qual o desvio-padrão desses salários?

9 - Um estudo foi realizado por um professor em três turmas, obtendo a média e o desvio-padrão das notas de sua

disciplina, conforme abaixo. Qual a turma apresenta menor variabilidade (mais homogênea)? Justifique

adequadamente. Turma A B C

Média 6,5 8,0 8,0

Desvio-padrão 2,2 1,7 2,0

10 - Os operários de um setor industrial têm, em julho, um salário médio de 5 salários mínimos (s.m.) e desvio-

padrão de 2 s.m. Um acordo coletivo prevê, para agosto, um aumento de 60%, mais uma parte fixa correspondente a

0,7 s.m. Qual a média do número de salários mínimos e qual o desvio-padrão em agosto?

11 - A nota média dos alunos de uma classe foi 7,0 e das alunas 9,0. O número de alunos era 20 e das alunas 30.

Qual a nota média da classe toda?

12 - As notas de estatística de uma turma estão na tabela seguinte. Nota 1 2 3 4 5 6 7 8 9

Nº de alunos 2 6 9 12 14 9 5 4 1

(a) Calcule os valores da média, da mediana e da moda dessas notas.

(b) Calcule o valor da variância dessas notas.

13) Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos durante uma certa

semana : R$ 140, 140, 140, 140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190, 200, 205, 225, 230, 240.

Calcular a média, a mediana e a moda para este grupo de salários.

14 - Considere o polígono de frequências seguinte:

Salário Mensal dos Empregados da Empresa

AJK

0

5

10

15

20

25

30

35

40

45

450 550 650 750 850 950 1050 1150 1250 1350

Salários (R$)

Em

pre

gados

(a) Qual o percentual de funcionários que recebem mais de R$ 700,00 por mês?

Page 22: Apostila Descritiva.pdf

Cursos: Engenharia de Controle e Automação/Engenharia Mecânica

Disciplina: Probabilidade e Estatística

Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 22

(b) Qual o total de empregados da empresa?

(c) Determine os valores da média, da moda e da mediana dos salários da AJK.

(d) O que você pode afirmar quanto à simetria destes dados? Explique?

(e) Quantos empregados ganham acima de R$ 1.000,00?

15- Durante certo período de tempo as taxas de juros, em %, para dez ações foram as que a tabela abaixo registra:

Ação 01 02 03 04 05 06 07 08 09 10

Taxa 2,59 2,64 2,60 2,62 2,55 2,61 2,50 2,63 2,64 2,69

Calcule:

(a) a taxa média;

(b) a taxa mediana;

(c) a taxa modal;

(d) o desvio padrão das taxas;

(e) o coeficiente de variação das taxas.

16 - Considere o gráfico seguinte:

Salário Mensal dos Empregados da GHT Ltda

0

5

10

15

20

25

30

35

40

45

04 - 06 06 - 08 08 - 10 10 - 12 12 - 14 14 - 16 16 - 18 18 - 20

Salários (unidades monetárias)

Em

pre

gados

(a) Qual a denominação desse gráfico?

(b) Qual o intervalo que contém a mediana desses dados?

(c) Quantos desses empregados ganham menos que 12 unidades monetárias de salário mensal?

(d) Qual o salário médio desses empregados? Qual o salário mediano?

(e) Qual o percentual de empregados que ganha entre 9 e 16 unidades monetárias?

BIBLIOGRAFIA

COSTA NETO, P. L. O. Estatística. 2. ed. São Paulo: Edgard Blücher, 2002.

DOWING, D.; CLARK, J. Estatística aplicada. 2. ed. São Paulo: Saraiva, 2003.

FONSECA, J. S.; MARTINS, G. A. Curso de Estatística. 6. ed. São Paulo: Atlas, 1996.

FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. 9. ed. Porto

Alegre: Bookman, 2000.

MONTGOMERY, D. C., RUNGER, G. C., HUBELE, N.F., Estatística Aplicada à

Engenharia. Rio de Janeiro: LTC, 2004.

MORETIN, P. A.; BUSSAB, W. O. Estatística Básica. 5. ed. São Paulo: Saraiva, 2005.

TRIOLA, M. F. Introdução à Estatística. 7. ed. Rio de Janeiro: LTC, 1999.