Apostila Descritiva.pdf
-
Upload
everton-silveira -
Category
Documents
-
view
78 -
download
0
Transcript of Apostila Descritiva.pdf
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 1
Fevereiro de 2014
INSTITUTO FEDERAL DE EDUCAÇÃO, CIÊNCIA E TECNOLOGIA DO RIO GRANDE DO SUL
CÂMPUS FARROUPILHA
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 2
ESTATÍSTICA DESCRITIVA Sumário 1 Introdução .................................................................................................................................................. 3
1.1 Definições Básicas de Estatística ....................................................................................................... 3 2 Fases do Método Estatístico ...................................................................................................................... 4 3 Gráficos Estatísticos .................................................................................................................................. 4
3.1 Classificação dos gráficos .................................................................................................................. 5 3.1.1 Diagramas ................................................................................................................................... 5 3.1.2 Estereogramas ............................................................................................................................. 5 3.1.3 Pictogramas ................................................................................................................................ 5 3.1.4 Cartogramas ................................................................................................................................ 5
4 Distribuição de Frequências ...................................................................................................................... 5 4.1 Frequências absolutas (fi): .................................................................................................................. 5 4.2 Frequências relativas (fri): .................................................................................................................. 6 4.3 Frequência acumulada (F): ................................................................................................................. 6 4.4 Frequência relativa acumulada (Fr): .................................................................................................. 6 4.5 Regras para a elaboração de uma ....................................................................................................... 6 4.6 Representação gráfica de uma distribuição de frequências ................................................................ 6
4.6.1 Histograma .................................................................................................................................. 6 4.6.2 Polígono de frequência: .............................................................................................................. 6 4.6.3 Polígono de frequência acumulada ............................................................................................. 6 4.6.4 Frequência absoluta acumulada de uma classe: .......................................................................... 7 4.6.5 Frequência relativa acumulada de uma classe: ........................................................................... 7 4.6.6 Curva de frequência (curva suavizada):...................................................................................... 7
4.7 Diagrama de Dispersão ...................................................................................................................... 7 4.7.1 Etapas na construção do Diagrama de Dispersão ....................................................................... 7 4.7.2 Interpretação do Diagrama de Dispersão .................................................................................... 7
5 Medidas de Posição ................................................................................................................................... 8 5.1 Média Aritmética ............................................................................................................................... 8
5.1.1 Média para dados não-agrupados ............................................................................................... 8 5.1.2 Média para dados agrupados (sem intervalos de classe) ............................................................ 9 5.1.3 Média para dados agrupados (com intervalos de classe) ............................................................ 9
5.2 Média Geométrica ............................................................................................................................ 10 5.2.1 Média Geométrica Simples ....................................................................................................... 10 5.2.2 Média Geométrica Ponderada ................................................................................................... 10
5.3 Média Harmônica ............................................................................................................................. 11 5.3.1 Média Harmônica Simples (para dados não agrupados)........................................................... 11 5.3.2 Média Harmônica Ponderada (para dados agrupados) ............................................................. 11
5.4 Mediana ............................................................................................................................................ 12 5.4.1 A Mediana para dados não-agrupados ...................................................................................... 12 5.4.2 A Mediana para dados agrupados ............................................................................................ 12
5.5 Moda ................................................................................................................................................ 13 5.5.1 A Moda quando os dados não estão agrupados ........................................................................ 13 5.5.2 A Moda quando os dados estão agrupados ............................................................................... 13
5.6 Quartis .............................................................................................................................................. 14 5.6.1 Quartis para dados não agrupados ............................................................................................ 14 5.6.2 Quartis para dados agrupados em classes ................................................................................. 15
5.7 Decis ................................................................................................................................................ 15 6 Medidas de Dispersão ............................................................................................................................. 16
6.1 Amplitude total ................................................................................................................................ 16 6.2 Desvio médio absoluto ..................................................................................................................... 17 6.3 Desvio-padrão .................................................................................................................................. 17 6.4 Variância .......................................................................................................................................... 18 6.5 Coeficiente de Variação ................................................................................................................... 18 6.6 Amplitude inter-quartílica ................................................................................................................ 19
Exercícios ................................................................................................................................................... 20 BIBLIOGRAFIA ........................................................................................................................................ 22
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 3
1 Introdução
O raciocínio estatístico é amplamente utilizado em todas as áreas do conhecimento, tais
como, na indústria, na administração de empresas, na informática, na medicina, na biologia, na
meteorologia, na metrologia, etc. O conhecimento estatístico é necessário para tomarmos
decisões corretas e evitar conclusões errôneas por falsas evidências.
Estatística é a disciplina que engloba um conjunto de métodos científicos para a coleta,
organização, resumo, análise e apresentação de dados através do emprego de tabelas, gráficos e
medidas, bem como a obtenção de conclusões válidas que dêem suporte à tomada de decisões
baseadas em tais análises. A Estatística esta dividida em:
Estatística Descritiva: se ocupa com a organização e a apresentação de dados; inclui as
técnicas que dizem respeito à sintetização e à descrição de dados através de gráficos, tabelas e
medidas resumo.
Estatística Inferencial: com base na Teoria da Amostragem, Teoria das Probabilidades e
Estatística Descritiva permite fazer inferências (afirmações) sobre características de uma
população, a partir de resultados de uma ou mais amostras. Essas inferências constituem-se na
base para a tomada de decisão.
1.1 Definições Básicas de Estatística
Fenômeno Estatístico: é qualquer evento que se pretenda analisar, cujo estudo seja
possível a partir da aplicação dos métodos estatísticos.
Dado Estatístico: é um dado numérico e é considerado a matéria-prima sobre a qual
iremos aplicar os métodos estatísticos.
População: é o conjunto total de elementos portadores de, pelo menos, uma
característica comum.
Amostra: é uma parcela representativa da população que é examinada com o propósito
de tirarmos conclusões sobre essa população.
Parâmetros: são valores singulares que existem na população e que servem para
caracterizá-la. Para definirmos um parâmetro devemos examinar toda a população.
Estimativa: é um valor aproximado do parâmetro e é calculado com o uso de uma
amostra extraída da população.
Atributo: é uma qualidade associada a um elemento. Quando os dados estatísticos
apresentam um caráter qualitativo, o levantamento e os estudos necessários ao tratamento desses
dados são designados genericamente de estatística de atributo.
Variável: é qualquer quantidade ou característica que pode assumir diferentes valores
numéricos ou não-numéricos. É o conjunto de resultados que pode ser associado a cada
elemento da população ou amostra. As variáveis podem ser classificadas como qualitativas e
quantitativas.
Variável Qualitativa: quando os valores da variável são expressos por características ou
atributos. A variável qualitativa pode ser classificada como: variável qualitativa nominal-
classificada por um tipo ou atributo que não permite ordenação; variável qualitativa ordinal-
classificada por uma característica ou atributo que permite ordenação.
Variável Quantitativa: quando os dados são de caráter nitidamente quantitativo e o
conjunto dos resultados possui uma estrutura numérica trata-se, portanto, de uma variável
quantitativa. As variáveis quantitativas se dividem em: variável quantitativa discreta - são
aquelas que assumem valores dentro de um espaço finito ou enumerável, seus valores são
expressos geralmente através de números inteiros não negativos; variável quantitativa contínua
- resulta normalmente de uma mensuração, e a escala numérica de seus possíveis valores
corresponde ao conjunto R dos números Reais, ou seja, podem assumir, teoricamente, qualquer
valor entre dois limites, são exemplos, o peso ou a altura de uma pessoa.
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 4
2 Fases do Método Estatístico
Os métodos estatísticos devem ser usados de maneira eficiente a fim de produzir um
retorno apropriado para o custo de seu uso. Para atingir esse objetivo não é suficiente substituir
números em fórmulas. Todo processo deve incluir um planejamento cuidadoso da coleta e
análise dos dados para se obter as conclusões estatísticas confiáveis proporcionando uma boa
transição para a solução do problema técnico original.
1º- Definição do Problema: saber exatamente aquilo que se pretende pesquisar é o
mesmo que definir corretamente o problema.
2º- Planejamento: como levantar informações? Que dados deverão ser obtidos? Qual
levantamento a ser utilizado? Censitário? Por amostragem ? E o cronograma de atividades? Os
custos envolvidos? etc.
3º- Coleta de dados: fase operacional. É o registro sistemático de dados, com um
objetivo determinado. Os dados podem ser classificados em:
Dados primários: quando são publicados pelo próprio pesquisador ou organização que os
tenha coletado. Ex.: tabelas do censo demográfico do IBGE.
Dados secundários: quando são publicados por outra organização. Ex.: quando
determinado jornal publica estatísticas referentes ao censo demográfico extraídas do IBGE. Obs.: É mais seguro trabalhar com fontes primárias. O uso da fonte secundária traz um risco de erros de transcrição.
Dados Brutos: quando os dados originais (coletados) ainda não se encontram prontos
para análise por não estarem numericamente organizados.
Rol de dados: é uma lista em que os valores estão organizados em uma determinada
ordem, crescente ou decrescente.
4º- Crítica dos dados: obtidos os dados, eles devem ser cuidadosamente criticados, à
procura de possíveis falhas e imperfeições, a fim de não incorrermos em erros grosseiros ou de
certo vulto, que possam influir sensivelmente nos resultados.
5º- Apresentação dos dados: os dados devem ser apresentados sob a forma adequada
(tabelas ou gráficos), tornando mais fácil o exame daquilo que está sendo objeto de tratamento
estatístico.
6º- Análise dos dados: A última fase do trabalho estatístico é a mais importante e
delicada. Está ligada essencialmente ao cálculo de medidas e coeficientes, cuja finalidade
principal é descrever o fenômeno (estatística descritiva), ou tirar conclusões sobre a população a
partir de informações fornecidas pela amostra (estatística inferencial).
3 Gráficos Estatísticos
São representações visuais dos dados estatísticos que devem corresponder, mas nunca
substituir as tabelas estatísticas. Os gráficos apresentam as seguintes características: uso de
escalas, sistema de coordenadas (eixo das abcissas e eixo das ordenadas), identificação do
gráfico (título), fonte de origem dos dados, identificação dos eixos e respectivas unidades de
medidas, uso de legendas quando necessário, simplicidade, clareza e veracidade.
Gráficos de informação: São gráficos destinados principalmente ao público em geral,
objetivando proporcionar uma visualização rápida e clara. São gráficos tipicamente expositivos,
dispensando comentários explicativos adicionais. As legendas podem ser omitidas, desde que as
informações desejadas estejam presentes.
Gráficos de análise: São gráficos que prestam-se melhor ao trabalho estatístico,
fornecendo elementos úteis à fase de análise dos dados sem deixar de ser também informativos.
Os gráficos de análise frequentemente vêm acompanhados de uma tabela estatística. Inclui-se,
muitas vezes um texto explicativo, chamando a atenção do leitor para os pontos principais
revelados pelo gráfico.
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 5
3.1 Classificação dos gráficos
Os gráficos podem ser classificados de acordo com a forma em: diagramas,
estereogramas, pictogramas e cartogramas.
3.1.1 Diagramas
São gráficos geométricos dispostos em duas dimensões. São os mais usados na
representação de séries estatísticas. Eles podem ser :
a) Gráficos em barras horizontais
Usam-se, de preferência, os gráficos em barras horizontais quando as legendas não são
breves.
b) Gráficos em barras verticais (colunas)
Nesses gráficos os retângulos normalmente têm a mesma base e as alturas são
proporcionais as quantidades dos respectivos dados. Se a série for histórica, a ordem a ser
observada é a cronológica, se a série for geográfica ou categórica, a ordem a ser observada é a
decrescente.
c) Gráficos em barras compostas (múltiplas barras)
d) Gráficos em colunas sobrepostas (colunas empilhadas)
Eles diferem dos gráficos em barras ou colunas convencionais apenas pelo fato de
apresentar cada barra ou coluna segmentada em partes componentes. Servem para representar
comparativamente dois ou mais atributos.
e) Gráficos em linhas ou lineares
São frequentemente usados para representação de séries cronológicas com um grande
número de períodos de tempo. As linhas são mais eficientes do que as colunas, quando existem
intensas flutuações nas séries ou quando há necessidade de se representarem várias séries em um
mesmo gráfico.
f) Gráficos em setores
Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos
ressaltar a participação das partes em relação ao total. O total é representado pelo círculo, que
fica dividido em tantos setores quantas forem as partes. Os setores são tais que suas áreas são
respectivamente proporcionais aos dados da série. O gráfico em setores só deve ser empregado
quando há, no máximo, sete dados a serem apresentados.
3.1.2 Estereogramas
São gráficos geométricos dispostos em três dimensões, pois representam volume. São
usados nas representações gráficas das tabelas de dupla entrada. Em alguns casos este tipo de
gráfico fica difícil de ser interpretado dada a pequena precisão que oferecem.
3.1.3 Pictogramas
São construídos a partir de figuras representativas da intensidade do fenômeno. Este tipo
de gráfico tem a vantagem de despertar a atenção do público leigo, pois sua forma é atraente e
sugestiva. Os símbolos devem ser auto-explicativos. A desvantagem dos pictogramas é que
apenas mostram uma visão geral do fenômeno, e não de detalhes minuciosos.
3.1.4 Cartogramas
São ilustrações relativas a cartas geográficas (mapas). O objetivo desse gráfico é o de
apresentar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas.
4 Distribuição de Frequências
É um tipo de tabela que condensa uma coleção de dados na qual os valores se apresentam
em correspondência com suas repetições, evitando-se, assim, que eles apareçam mais de uma vez
na tabela, como ocorre com o rol de dados.
4.1 Frequências absolutas (fi): são os valores que realmente representam o número de dados de
cada classe. A soma das frequências simples é igual ao número total dos dados da distribuição.
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 6
4.2 Frequências relativas (fri): são os valores das razões entre as frequências absolutas de cada
classe e a frequência total da distribuição (fi/n). A soma das frequências relativas é igual a 1,00
ou (100 %).
4.3 Frequência acumulada (F): a frequência absoluta total de todos os valores inferiores ao
limite superior de uma dada classe é denominada frequência acumulada até aquela classe.
4.4 Frequência relativa acumulada (Fr): a frequência relativa total de todos os valores
inferiores ao limite superior de uma dada classe é denominada frequência relativa acumulada até
aquela classe.
4.5 Regras para a elaboração de uma distribuição de frequências com classes 1º - Organize os dados brutos em um rol;
2º - Calcule a amplitude total “R” minXXR máx ;
3º - Determine o número de classes (k), que será calculado usando as fórmulas
k=1+log2n ou k=1+3,32.log n ou ainda nk , obrigatoriamente o k deve estar compreendido
entre 5 a 20.
4º - Conhecido o número de classes k define-se a amplitude de cada classe pela fórmula:
k
Rh
4.6 Representação gráfica de uma distribuição de frequências - histograma, polígono de
frequência e polígono de frequência acumulada Em todos os gráficos acima utilizamos o primeiro quadrante do sistema de eixos
coordenados cartesianos ortogonais. Na linha horizontal (eixo das abcissas) colocamos os
valores da variável e na linha vertical (eixo das ordenadas), as frequências.
4.6.1 Histograma: é o gráfico formado por um conjunto de retângulos justapostos, cujas
bases se localizam sobre o eixo horizontal, de tal forma que seus pontos médios coincidam com
os pontos médios dos intervalos de classe. A área de um histograma é proporcional à soma das
frequências simples ou absolutas.
Um histograma ou uma distribuição de frequências representa a variabilidade dos dados
da variável estudada, ou seja, o padrão de variação de todos os resultados que podem ser gerados
pelo fenômeno em estudo.
O histograma é um gráfico de barras cujo eixo horizontal representa a variação total da
característica em estudo subdividida em vários pequenos intervalos;
Quando a característica em estudo é uma variável discreta, os intervalos são valores
inteiros;
Para cada um destes intervalos é construída uma barra vertical proporcional ao número de
observações na amostra pertencente ao respectivo intervalo.
O Histograma é uma ferramenta que permite resumir e visualizar a forma da distribuição
dos dados, a localização do valor central e a dispersão em torno desse valor.
4.6.2 Polígono de frequência: é um gráfico em linha, sendo as frequências marcadas
sobre perpendiculares ao eixo horizontal, levantadas pelos pontos médios dos intervalos de
classe. Para realmente obtermos um polígono (linha fechada), devemos completar a figura,
ligando os extremos da linha obtida aos pontos médios da classe anterior à primeira e da
posterior à última, da distribuição.
4.6.3 Polígono de frequência acumulada: é traçado marcando-se as frequências
acumuladas sobre perpendiculares ao eixo horizontal, levantadas nos pontos correspondentes aos
limites superiores dos intervalos de classe.
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 7
4.6.4 Frequência absoluta acumulada de uma classe: é o total das frequências
absolutas de todos os valores inferiores ao limite superior do intervalo de uma determinada classe.
4.6.5 Frequência relativa acumulada de uma classe: é o total das frequências relativas
de todos os valores inferiores ao limite superior do intervalo de uma determinada classe.
Exercício: com base na tabela abaixo construa o histograma, o polígono de frequência e o polígono de frequência
acumulada.
...Classe ......fi..... .....Xi..... .....fri..... .....Fi..... ......Fri.....
50 |------- 54 4 52 0,100 4 0,100
54 |------- 58 9 56 0,225 13 0,325
58 |------- 62 11 60 0,275 24 0,600
62 |------- 66 8 64 0,200 32 0,800
66 |------- 70 5 68 0,125 37 0,925
70 |------- 74 3 72 0,075 40 1,000
Total 40 1,000
Sendo fi= frequência absoluta; Xi = ponto médio de classe; Fi = frequência absoluta acumulada; fri =
frequência relativa e Fri = frequência relativa acumulada.
Obs: uma distribuição de frequências sem intervalos de classe é representada graficamente por um diagrama onde
cada valor da variável é representado por um segmento de reta vertical e de comprimento proporcional à respectiva
frequência.
4.6.6 Curva de frequência (curva suavizada): enquanto o polígono de frequência nos
dá a imagem real do fenômeno estudado, a curva de frequência nos dá a imagem tendencial. A
suavização (geometricamente, corresponde à eliminação dos vértices da linha poligonal) de um
polígono de frequência. A curva de frequência nos mostra como seria tal polígono com um
número maior de dados em amostras mais amplas.
4.7 Diagrama de Dispersão
O diagrama de dispersão é um gráfico onde pontos no espaço cartesiano XY são usados
para representar simultaneamente os valores de duas variáveis quantitativas medidas em cada
elemento do conjunto de dados. O Diagrama de Dispersão é um gráfico utilizado para a
visualização do tipo de relacionamento existente entre duas variáveis.
Pode ser usado para detectar se existe uma relação de causa e efeito entre duas variáveis.
É comum o eixo horizontal representar um parâmetro do processo (causa), enquanto que o eixo
vertical representa uma característica de qualidade de interesse (efeito).
O Diagrama de Dispersão também pode ser usado para a investigação da relação
existente entre duas características de qualidade (efeitos), ou entre dois parâmetros do processo
(causas).
4.7.1 Etapas na construção do Diagrama de Dispersão
- Colete as observações em pares (x, y) das variáveis entre as quais você deseja estudar as
relações, e organize-as em uma tabela;
- Determine os valores máximo e mínimo para x e y;
- Defina as escalas do eixo horizontal e vertical de forma que ambos os comprimentos
sejam aproximadamente iguais;
- Registre as observações nos gráficos.
- Identifique o diagrama adicionando título, período, denominação e unidade de medida
de cada eixo.
4.7.2 Interpretação do Diagrama de Dispersão
- Examine a presença de dados atípicos, outliers. Um dado outlier é uma observação
extrema que não é condizente com o restante da massa dos dados.
- A identificação dos outliers e a análise das causas que levaram ao seu aparecimento
podem resultar em atuações sobre processo.
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 8
O gráfico de dispersão poderá indicar um padrão:
- correlação positiva
- correlação negativa
- ausência de correlação
- correlação não linear
- A existência de uma correlação entre duas variáveis não implica na existência de um
relacionamento de causa e efeito entre elas.
- A correlação entre duas variáveis depende do intervalo de variação.
- Os diagramas de dispersão podem não ser válidos para a realização de extrapolações
fora do intervalo de variação das variáveis consideradas no estudo.
- Em muitos casos a análise de um diagrama de dispersão permite a descoberta da causa
do problema.
5 Medidas de Posição
São os índices estatísticos que representam uma série de dados orientando-nos quanto à
posição da distribuição em relação ao eixo horizontal do gráfico da curva de frequência.
As medidas de posições mais importantes são as medidas de tendência central (verifica-se
uma tendência dos dados observados ao se agruparem em torno dos valores centrais).
As medidas de tendência central mais utilizadas são: média aritmética, moda e mediana.
Outras medidas de tendência central menos usados são as médias: geométrica, harmônica,
quadrática, cúbica e biquadrática.
As outras medidas de posição são as separatrizes, que englobam: a própria mediana, os
quartis, os decis e os percentis.
5.1 Média Aritmética
A média aritmética do conjunto de dados X1, X2,..., Xn representada por X é igual ao
quociente entre a soma dos valores Xi do conjunto de dados e o número total dos valores
observados é calculada por:
n
X
X
n
i
i 1 ......onde: Xi são os valores da variável e n o número de valores do grupo de dados.
5.1.1 Média para dados não-agrupados
Quando desejamos conhecer a média dos dados não-agrupados em tabelas de frequências,
determinamos a média aritmética simples.
Exemplo:
Sabendo-se que a venda diária de arroz tipo A, durante uma semana, foi de 10, 14, 13, 15,
16, 18 e 12 kg, temos, para venda média diária na semana de:
X .= (10+14+13+15+16+18+12)/7 = 14 kg
Desvio em relação à média: é a diferença entre cada elemento de um conjunto de valores e a
média aritmética, ou seja:. XXd ii
No exemplo temos sete desvios:... d1 = 10-14 = -4 , ...d2 = 14-14 = 0 , ...d3 = 13-4 = -1 , d4 = 15-14 = 1 ,... d5
= 16-14 = 2 ,... d6 = 18-14 = 4 ...e... d7 = 12-14 = -2.
Propriedades da média
1ª propriedade: A soma algébrica dos desvios em relação à média é nula.
No exemplo: d1+d2+d3+d4+d5+d6+d7 = 0
2ª propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os valores de
uma variável, a média do conjunto fica aumentada (ou diminuída) dessa constante.
Se no exemplo original somarmos a constante 2 a cada um dos valores da variável temos:
KgY 167/)141817151612( ou
KgXY 162142
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 9
3ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma
constante (c), a média do conjunto fica multiplicada (ou dividida) por essa constante.
Se no exemplo original multiplicarmos a constante 3 a cada um dos valores da variável temos:
KgY 427/)36544845394230( ou
KgXY 423.143.
5.1.2 Média para dados agrupados (sem intervalos de classe)
Consideremos a distribuição relativa a 34 famílias de quatro filhos, tomando para variável
o número de filhos do sexo masculino. Calcularemos a quantidade média de meninos por
família:
nº de meninos frequência = fi
0 2
1 6
2 10
3 12
4 4
Total 34
Como as frequências são números indicadores da intensidade de cada valor da variável,
elas funcionam como fatores de ponderação (pesos) representados po Wi, o que nos leva a
calcular a média aritmética ponderada, dada pela fórmula, onde as frequências absolutas
representam os pesos de cada valor da variável:
i
ii
W
WXX
.
Xi fi fi.Xi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
Total 34 78
onde: 3,234
78X meninos por família
5.1.3 Média para dados agrupados (com intervalos de classe)
Neste caso, convencionamos que todos os valores incluídos em um determinado intervalo
de classe coincidem com o seu ponto médio, e determinamos a média aritmética ponderada por
meio da fórmula:
i
ii
f
XfX
. ,..onde: fi é a frequência da classe índice i e Xi é o ponto médio da classe índice i.
Exemplo:
Calcular a estatura média de bebês conforme a tabela abaixo.
Estaturas (cm) frequência = fi ponto médio = Xi Xi.fi.
50 |------------ 54 4 52 208
54 |------------ 58 9 56 504
58 |------------ 62 11 60 660
62 |------------ 66 8 64 512
66 |------------ 70 5 68 340
70 |------------ 74 3 72 216
Total 40 2.440
Aplicando a fórmula acima temos: 6140
2440X cm
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 10
5.2 Média Geométrica
A média geométrica dos valores positivos: X1, X2,..., Xn representada por gX é a raiz n-
ésima do produto de todos os valores de X .
5.2.1 Média Geométrica Simples
A média geométrica simples é calculada por:
nng XXXX .... 21
Exemplo:
Calcular a média geométrica dos seguintes conjuntos de números:E
a) {10, 60, 360}... 0,60360.60.103 gX ........
b) {2, 2, 2}........ .... 0,22.2.23 gX
c) {1, 4, 16, 64}........ 0,864.16.4.14 gX ....
5.2.2 Média Geométrica Ponderada
A média geométrica ponderada do conjunto de valores positivos: X1, X2,...,Xk, com pesos
w1, w2, ..., wk representada por gpX é calculada por:
i kW w
n
ww
gp XXXX ..... 21
21
Exemplo:
Calcular a média geométrica dos valores da tabela abaixo:
Xi fi
1 2
3 4
9 2
27 1
total 9
Obs.: Para o cálculo das médias de uma distribuição de frequênicias as frequências absolutas são
consideradas com pesos de ponderação.
8,327.9.3.19 1242 gX
Propriedades da Média Geométrica
1ª propriedade: O produto dos quocientes de cada valor de um conjunto de números pela
média geométrica do conjunto é igual a 1, ou seja, 1...... 321 g
n
ggg X
X
X
X
X
X
X
X
Exemplo:
Comprovar a 1ª propriedade da média geométrica com os dados {10, 60, 360}
gX 60... onde: 10/60 x 60/60 x 360/60 = 1
2ª propriedade: Séries que apresentam o mesmo número de elementos com o mesmo
produto têm a mesma média geométrica.
Exemplo - Comprovar a 2ª propriedade da média geométrica com os dados:
a = {8 e 12,5}.........b = {2 e 50}
gX 10 ..................... gX 10
3ª propriedade: A média geométrica é menor ou igual a média aritmética.
A desigualdade . XX g sempre se verifica, quando os valores da série forem positivos e
nem todos iguais. Se entre eles houver um ou mais zeros, a média geométrica será nula. A
igualdade XX g .só ocorrerá quando todos os valores da série forem iguais.
4ª propriedade: Quanto maior for a diferença entre os valores originais maior será a
diferença entre as médias aritmética e geométrica.
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 11
Veja na tabela abaixo:
conjunto média aritmética média geométrica
Xi = {2, 2} 2,0 2,0
Yi = {14, 16} 15,0 14,97
Wi = {8, 12} 10,0 9,8
Zi = {2, 50} 26,0 10,0
5.3 Média Harmônica
A média harmônica dos valores positivos X1, X2,...,Xk, representada por hX é o inverso da
média aritmética dos inversos.
5.3.1 Média Harmônica Simples.(para dados não agrupados)..
A média harmônica simples é calculada por:
in
h
n
h
X
n
XXX
nX
n
XXX
X1
Xou 1
...11
1
...11
1h
2121
Exemplo:
Calcular a média harmônica simples dos seguintes conjuntos de números:
a) {10, 60, 360}. Resp:.. 3/(1/10+1/60+1/360) = 25,12
b) {2, 2, 2, 2} . Resp:... . 4/(1/2+1/2+1/2+1/2) = 2,0....
5.3.2 Média Harmônica Ponderada (para dados agrupados)
A média harmônica do conjunto de valores positivos X1, X2,...,Xk,com pesos w1, w2, ..., wk
representada por hpX é calculada por:
..
i
i
i
hp
X
w
wX
Exemplo:
Calcular a média harmônica dos valores da tabela abaixo:
classes fi Xi fi/Xi
1 |--------- 3 2 2 2/2 = 1,00
3 |--------- 5 4 4 4/4 = 1,00
5 |--------- 7 8 6 8/6 = 1,33
7 |--------- 9 4 8 4/8 = 0,50
9 |---------11 2 10 2/10 = 0,20
total 20 4,03
Propriedades da Média Harmônica
A média harmônica é menor que a média geométrica para valores da variável diferentes
de zero.
gh XX e por extensão de raciocínio podemos escrever :. XXX gh .
Obs.: A média harmônica não aceita valores iguais a zero como dados de uma série.
A igualdade XXX gh ..só ocorrerá quando todos os valores da série forem iguais.
Obs: Quando os valores da variável não forem muito diferentes, verifica-se aproximadamente a seguinte relação:
2
)( hg
XXX
Demonstraremos a relação acima com os seguintes dados: X = {10,1; 10,1; 10,2; 10,4; 10,5}
Média aritmética: 2600,105
30,51X
Média harmônica: 2574,10487451,0
5hX
96,403,4
20hX
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 12
Média geométrica: 2857,105,10.4,10.2,10.1,10.1,105 gX
Comprovando a relação: 2587,102/)2574,102600,10( gX (média geométrica)
5.4 Mediana
A mediana de um conjunto de valores, dispostos segundo uma ordem (crescente ou
decrescente), é o valor situado de tal forma no conjunto de dados, que o separa em dois
subconjuntos de mesmo número de elementos, ou seja, a mediana, é uma medida de localização
do centro da distribuição dos dados. Símbolo da mediana: md
5.4.1 A Mediana para dados não-agrupados
Dada uma série de valores como, por exemplo: {5, 2, 6, 13, 9, 15, 10}
De acordo com a definição de mediana, o primeiro passo a ser dado é o da ordenação
(crescente ou decrescente) dos valores: {2, 5, 6, 9, 10, 13, 15}
O valor que divide a série acima em duas partes iguais é igual a 9, logo a md = 9.
Método prático para a determinação da Mediana
Se a série dada conter um número ímpar de termos:
O valor mediano será o termo central do conjunto de dados, que pode ser o termo de
ordem dado pela fórmula : 2
1n
Exemplo: Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 2, 5}
1º - ordenar a série {0, 0, 1, 1, 2, 2, 3, 4, 5}
n = 9 logo (n + 1)/2 é dado por (9+1)/2 = 5, ou seja, o 5º termo da série ordenada será a mediana.
A mediana será o 5º termo = 2
Se a série dada apresentar um número par de termos:
O valor mediano será a média aritmética entre os dois termos centrais da série, cujos
termos de ordem são dados pelas fórmulas: n/2 e n/2+1.. Obs.: n/2 e (n/2 + 1) serão termos de ordem e devem ser substituídos pelo valor correspondente.
Exemplo:
Calcule a mediana da série {1, 3, 0, 0, 2, 4, 1, 3, 5, 6}
1º - ordenar a série {0, 0, 1, 1, 2, 3, 3, 4, 5, 6}
n = 10 logo os termos serão: 10/2=5 e 10/2+1=6;
logo os termos centrais são: 5º termo e 6º termo;
5º termo = 2
6º termo = 3
A mediana será = (2+3)/2 ou seja, md = 2,5 . A mediana no exemplo será a média
aritmética do 5º e 6º termos da série.
5.4.2 A Mediana para dados agrupados
a) Sem intervalos de classe: neste caso, é o bastante identificar a frequência acumulada
imediatamente superior à metade da soma das frequências. A mediana será aquele valor da
variável que corresponde a tal frequência acumulada.
b) Com intervalos de classe: para este caso, devemos seguir os seguintes passos:
1º) Determinamos as frequências acumuladas;
2º) Calculamos 2/n ;
3º) Marcamos a classe correspondente à frequência acumulada que contém o termo de
ordem 2/n . Esta classe será a classe mediana;
4º) Identificamos a frequência absoluta acumulada até a classe anterior à classe mediana
( 1iF );
5º) Identificamos a amplitude da classe mediana;
6º) Calculamos a mediana pela seguinte fórmula:..
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 13
i
i
iidf
Fn
hlim1
2
onde:
lii = limite inferior da classe mediana;
hi = amplitude do intervalo da classe mediana;
n/2 = valor da metade do número de dados;
Fi-1 = frequência acumulada absoluta da classe anterior à classe mediana;
fi = frequência absoluta da classe mediana.
5.5 Moda
A moda de um conjunto de valores, anotada por mo é definida como sendo o valor ou os
valores do conjunto de dados que mais se repete. A moda ao contrário da mediana e da média
pode não ser única, isto é, um conjunto de dados pode ser bimodal, trimodal, etc. Ou mesmo
amodal (sem moda).
Desse modo, o salário modal dos empregados de uma fábrica é o salário mais comum,
isto é, o salário recebido pelo maior número de empregados dessa fábrica.
5.5.1 A Moda quando os dados não estão agrupados
Exemplo:
Na série {7 , 8 , 9 , 10 , 10 , 10 , 11 , 12} a moda é igual a 10.
Há séries nas quais não existe valor modal, isto é, nas quais nenhum valor apareça mais
que outros.
Exemplo: {3 , 5 , 8 , 10 , 12} não apresenta moda, a série é amodal. Em outros casos, pode haver
dois ou mais valores repetidos. Dizemos, então, que a série tem dois ou mais valores modais.
Exemplo:
{2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9} apresenta duas modas: 4 e 7. A série é bimodal.
5.5.2 A Moda quando os dados estão agrupados
a) Sem intervalos de classe: uma vez agrupados os dados, é possível determinar
imediatamente a moda: basta fixar o valor da variável de maior frequência.
Exemplo:
Qual a temperatura mais comum medida no mês abaixo:
Temperaturas frequência
0º C 3
1º C 9
2º C 12
3º C 6
Resp.: mo=2º C é a temperatura modal, pois é a de maior frequência.
b) Com intervalos de classe: a moda de uma distribuição de frequências com intervalos
de classes é dada pelas seguntes expressões:
11
1
ii
iiio
ff
fhlim , denominada de moda de King, ou
2 11
1
iii
iiiio
fff
ffhlim , denominada de moda de Kzuber, onde:
lii = limite inferior da classe modal, isto é, a classe de maior frequência;
hi = amplitude do intervalo da classe modal;
fi = frequência absoluta da classe modal;
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 14
fi-1 = frequência absoluta da classe anterior à classe modal;
fi+1 = frequência absoluta da classe posterior á classe modal.
Notas:
- Quando o número de elementos da série estatística for ímpar, haverá coincidência da
mediana com um dos elementos da série.
- Quando o número de elementos da série estatística for par, poderá haver coincidência da
mediana com um dos elementos da série. A mediana será sempre a média aritmética dos 2
elementos centrais da série.
- Em uma série: a mediana, a média e a moda não têm, necessariamente, o mesmo valor.
- A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa
é uma das diferenças marcantes entre mediana e média (que se deixa influenciar, e muito, pelos
valores extremos). Vejamos:
Em {5, 7, 10, 13, 15} a média = 10 e a mediana = 10
Em {5, 7, 10, 13, 65} a média = 20 e a mediana = 10
isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência dos
valores extremos, ao passo que a mediana permanece a mesma.
Emprego da Mediana
- Quando desejamos obter o valor que divide a distribuição em duas partes iguais.
- Quando há valores extremos que afetam de maneira acentuada a média aritmética.
Exemplo:
Calcule a média, a mediana e a moda para os dados da tabela abaixo:
classes frequência = fi Freq. acumulada=Fi
acumulada=Fi 50 |------------ 54 4 4
54 |------------ 58 9 13
58 |------------ 62 11 24
62 |------------ 66 8 32
66 |------------ 70 5 37
70 |------------ 74 3 40
total 40
5.6 Quartis
Denominamos quartis os valores de uma série que a dividem em quatro partes iguais.
Precisamos, portanto, de 3 quartis (Q1 , Q2 e Q3) para dividir a série em quatro partes iguais.
O 1o quartil (Q1) corresponde a 25% dos dados;
O 2o quartil (Q2) corresponde a 50% dos dados;
O 3o quartil (Q3) orresponde a 75% dos dados
25% 50% 75% !---------!---------!---------!---------!
Q1 Q2 Q3
Obs.: O 2o quartil (Q2) sempre será igual a mediana da série.
5.6.1 Quartis para dados não agrupados
O método mais prático é utilizar o princípio do cálculo da mediana para os 3 quartis. Na
realidade serão calculadas "3 medianas " em uma mesma série.
Exemplo 1:
Calcule os quartis da série: {5, 2, 6, 9, 10, 13, 15}
O primeiro passo a ser dado é o da ordenação (crescente ou decrescente) dos valores:
{2, 5, 6, 9, 10, 13, 15}
O valor que divide a série acima em duas partes iguais é igual a 9, logo a md = 9 que será = Q2.
Temos agora {2, 5, 6} e {10, 13, 15} como sendo os dois grupos de valores iguais
proporcionados pela mediana (2o quartil). Para o cálculo do 1
o e 3
o quartis basta calcular as
medianas das partes iguais provenientes da verdadeira mediana da série (2o quartil).
Logo em {2, 5, 6} a mediana é = 5 , ou seja: será o 1o quartil
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 15
em {10, 13, 15} a mediana é =13, ou seja: será o 3o quartil
Exemplo 2:
Calcule os quartis da série: {1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13}
A série já está ordenada, então calcularemos o 2o quartil = md = (5+6)/2 = 5,5
O 1o quartil será a mediana da série à esquerda de md: {1, 1, 2, 3, 5, 5} Q1 = (2+3)/2 = 2,5
O 3o quartil será a mediana da série à direita de md: {6, 7, 9, 9, 10, 13} Q3 = (9+9)/2 = 9
Passos para a determinação dos quartis
1o - Partindo de uma amostra de tamanho n, colocar os valores em ordem crescente;
2o - Calcular o primeiro quartil usando a fórmula:
4)(,
4
1)(:,
2
)()(
1
ntopoj
nbaseionde
XXQ
ji
, onde i e j são as ordens dos valores
3o - Calcular o terceiro quartil usando a fórmula:
4
3)(,
4
)1(3)(:,
2
)()(
3
ntopoj
nbaseionde
XXQ
ji
5.6.2 Quartis para dados agrupados em classes
O método para determinar os 3 quartis para dados agrupados em classes segue a mesma
lógica da determinação da mediana:
1º) Determinamos as frequências acumuladas;
2º) Identificamos a frequência absoluta acumulada até a classe anterior à classe do quartil
( 1iQ );
3º) Calculamos 4/n para Q1 e 3n/4 para Q3;
5º) Identificamos a amplitude da classe que se encontra o iQ ;
6º) Calculamos o iQ utilizando as seguintes fórmulas:..
1
11
1114
Q
Q
QQf
Fn
hliQ
3
13
3334
3
Q
Q
QQf
Fn
hliQ
onde:
liQi = limite inferior da classe do quartil;
hQi = amplitude do intervalo da classe do quartil;
n/4, 3n/4 = ordem de ¼ e ¾ do número de dados;
fQi = frequência absoluta da classe do quartil;
FQi-1 = frequência acumulada absoluta da classe anterior à classe do quartil.
5.7 Decis
Os decis são os valores que dividem a série de dados em 10 partes iguais. Precisamos,
portanto, de 9 quartis (D1 , D2 ,..., D9) para dividir a série em dez partes iguais.
10% 20% 30% 40% 50% 60% 70% 80% 90%
!---!---!---!---!---!---!---!---!---!---!
D1 D2 D3 D4 D5 D6 D7 D8 D9
Para determinar os decis seguimos os seguintes passos:
1º) Calculamos 10
.ni, onde: i = 1, 2, 3, 4, 5, 6, 7,8 e 9
2º) Identificamos a classe Di pela frequência absoluta acumulada;
3º) Aplicamos a fórmula:
Di
Di
DiDiif
Fni
hlD1
10
.
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 16
onde:
liDi = limite inferior da classe do decil;
hDi = amplitude do intervalo da classe do decil;
n = tamanho da amostra;
fQi = frequência absoluta da classe do decil;
FDi-1 = frequência acumulada absoluta da classe anterior à classe do decil;
6 Medidas de Dispersão
É a maior ou menor diversificação dos valores de uma variável em torno de um valor de
tendência central (média ou mediana) tomado como ponto de comparação.
A média - ainda que considerada como um número que tem a faculdade de representar
uma série de valores - não pode, por si mesma, destacar o grau de homogeneidade ou
heterogeneidade que existe entre os valores que compõem o conjunto.
Consideremos os seguintes conjuntos de valores das variáveis X, Y e Z:
X = {70, 70, 70, 70, 70}
Y = {68, 69, 70, 71, 72}
Z = {5, 15, 50, 120, 160}
Observamos então que os três conjuntos apresentam a mesma média aritmética
705
350X , entretanto, é fácil notar que o conjunto X é mais homogêneo que os conjuntos Y e
Z, já que todos os valores são iguais à média. O conjunto Y, por sua vez, é mais homogêneo que
o conjunto Z, pois há menor diversificação entre cada um de seus valores e a média
representativa.
Concluímos então que o conjunto X apresenta dispersão nula e que o conjunto Y
apresenta uma dispersão menor que o conjunto Z.
6.1 Amplitude total
É uma medida de dispersão que não tem na média o ponto de referência. Quando os
dados não estão agrupados a amplitude total é a diferença entre o maior e o menor valor
observado: mínimomáximo XXR
Exemplo:
Para os valores 40, 45, 48, 62 e 70 a amplitude total será: R = 70 - 40 = 30
Quando os dados estão agrupados sem intervalos de classe ainda temos: mínimomáximo XXR
Exemplo: Xi fi
0 2
1 6
3 5
4 3
R = 4 - 0 = 4
Com intervalos de classe a amplitude total é a diferença entre o limite superior da última
classe e o limite inferior da primeira classe. Então: mínimomáximo LLR
Exemplo: Classes fi
4 |-------- 6 6
6 |-------- 8 2
8 |-------- 10 3
R = 10 - 4 = 6
A amplitude total tem o inconveniente de só levar em consideração os dois valores
extremos da série, descuidando do conjunto de valores intermediários. Faz-se uso da amplitude
total quando se quer determinar a amplitude da temperatura em um dia, ou no controle de
qualidade como uma medida de cálculo rápido sem muita exatidão.
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 17
6.2 Desvio médio absoluto
É a média aritmética dos valores absolutos dos desvios tomados em relação a uma das
seguintes medidas de tendência central: média ou mediana. Símbolo = dma
Fórmula : para a média : n
XXdma
i e para a mediana:
n
mXdma
di
As barras verticais indicam que são tomados os valores absolutos, prescindindo do sinal
dos desvios.
Exemplo:
Calcular o desvio médio do conjunto de números {- 4 , - 3 , - 2 , 3 , 5}
Pela média : dma = 16,8 / 5 = 3,36
Pela mediana : dma = 15/5 = 3 Obs.: Apesar de o desvio médio expressar aceitavelmente a dispersão de uma amostra, não é tão frequentemente
empregado como o desvio-padrão. O desvio médio despreza o fato de alguns desvios serem negativos e outros
positivos, pois essa medida os trata como se fossem todos positivos.
6.3 Desvio-padrão
É a medida de dispersão mais empregada, pois leva em consideração a totalidade dos
valores da variável em estudo. É um indicador de variabilidade bastante estável. O desvio-padrão
baseia-se nos desvios em torno da média aritmética e a sua fórmula básica pode ser traduzida
como: a raiz quadrada da média aritmética dos quadrados dos desvios em relação à média e é
representada por ou S.
n
XX i
2
ou 2
2
Xn
X i
(população)
n
XXS
i
2
ou 2
2
Xn
XS
i
(amostra)
As fórmulas acima são empregadas quando tratamos de uma população ou de uma
amostra de dados não-agrupados.
Exemplo:
Calcular o desvio-padrão da população representada por - 4 , -3 , -2 , 3 , 5
Xi X XX i 2XX i
- 4 - 0,2 - 3,8 14,44
- 3 - 0,2 - 2,8 7,84
- 2 - 0,2 - 1,8 3,24
3 - 0,2 3,2 10,24
5 - 0,2 5,2 27,04
62,8
Sabemos que n = 5 e 8,62)( 2 XX i ; logo 56,125
8,62
A raiz quadrada de 12,56 é o desvio-padrão: 54,3
Obs: Quando nosso interesse não se restringe à descrição dos dados mas, partindo da amostra, visamos tirar
inferências válidas para a respectiva população, convém efetuar uma modificação, que consiste em usar o divisor n-
1 em lugar de n, quando o tamanho da amostra for inferior a 30. A fórmula ficará então:
1
2
n
XXS
i
Se os dados - 4 , -3 , -2 , 3 , 5 representassem uma amostra o desvio-padrão amostral seria
a raiz quadrada de 62,8 / (5 -1) = 3,96
O desvio-padrão goza de algumas propriedades, dentre as quais destacamos:
1ª propriedade: Somando-se (ou subtraindo-se) uma constante a todos os valores de uma
variável, o desvio-padrão não se altera.
2ª propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma variável por
uma constante (diferente de zero), o desvio-padrão fica multiplicado (ou dividido) por essa
constante.
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 18
Quando os dados estão agrupados (temos a presença de frequências) a fórmula do desvio-
padrão ficará :
n
XXf
f
XXfS
ii
i
ii
22..
Exemplo:
Calcule o desvio-padrão populacional da tabela abaixo:
Xi fi ii fX . X XX i
2)( XX i ii fXX .)( 2
0 2 0 2,1 -2,1 4,41 8,82
1 6 6 2,1 -1,1 1,21 7,26
2 12 24 2,1 -0,1 0,01 0,12
3 7 21 2,1 0,9 0,81 5,67
4 3 12 2,1 1,9 3,61 10,83
Total 30 63 32,70
Sabemos que 70,32).( 2XXf ii e n=30, logo 044,109,1
30
70,32
Obs: Nas tabelas de frequências com intervalos de classe a fórmula a ser utilizada é a mesma do exemplo anterior.
6.4 Variância
É o desvio-padrão elevado ao quadrado e é simbolizado por 2 ou S2. A variância é uma
medida que tem pouca utilidade como estatística descritiva, porém é extremamente importante
na inferência estatística e em combinações de amostras.
Exercícios:
1- Considere os seguintes conjuntos de números:
A = {10, 20, 30, 40, 50} B = {100, 200, 300, 400, 500}
Que relação existe entre os desvios-padrão dos dois conjuntos de números ?
2- Dados os conjuntos de números:
A = {220, 230, 240, 250, 260} B = {20, 30, 40, 50, 60}
Que relação existe entre os desvios padrões dos dois conjuntos de números ?
3- Dados os conjuntos de números: A = {-2, -1, 0, 1, 2} B = {220, 225, 230, 235,
240}
Podemos afirmar, de acordo com as propriedades do desvio-padrão, que o desvio-padrão de B é
igual:
a) ao desvio-padrão de A;
b) ao desvio-padrão de A, multiplicado pela constante 5;
c) ao desvio-padrão de A, multiplicado pela constante 5, e esse resultado somado a 230;
d) ao desvio-padrão de A mais a constante 230.
6.5 Coeficiente de Variação
Um desvio-padrão pode ser considerado grande ou pequeno dependendo da ordem de
grandeza da variável. Uma maneira de se expressar a variabilidade dos dados tirando a influência
da ordem de grandeza da variável é através do coeficiente de variação (CV). O coeficiente de
variação é uma medida relativa de dispersão útil para a comparação em termos relativos do grau
de concentração em torno da média de séries distintas e é dada por:
100.X
CV
ou 100.X
SCV , o coeficiente de variação é expresso em porcentagem.
Sua vantagem é caracterizar a dipersão dos dados em termos relativos ao seu valor médio.
Assim uma pequena dispersão absoluta pode ser na verdade, considerável quando comparada
com a ordem de grandeza dos valores da variável e vice-versa.
Além disso, por ser adimensional, o coeficiente de variação fornece uma maneira de se
comparar as dispersões de variáveis cujas unidades são irredutíveis.
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 19
Exemplo:
Considere a tabela abaixo que contém as estaturas e os pesos de um mesmo grupo de
indivíduos e responda: qual das medidas (estatura ou peso) possui maior homogeneidade?
média desvio-padrão
Estaturas 175,0 cm 5,0 cm
Pesos 68,0 kgf 2,0 kgf
Resposta:
Como não é possível responder a essa pergunta utilizando o desvio-padrão, pois é uma medida de dispersão
absoluta, teremos que calcular o CVe da estatura e o CVp do peso. A série que apresentar a menor variação, ou seja, o
menor valor do coeficiente CV, será a série de maior homogeneidade.
Utilizando a fórmula do coeficiente CV, temos:
%86,2100.0,175
0,5eCV
%94,2100.0,168
0,2pCV
Logo, nesse grupo de indivíduos, as estaturas apresentam menor grau de dispersão que os pesos.
6.6 Amplitude inter-quartílica
Valores que dividem o conjunto de dados em quatro partes iguais são representados por Q1,
Q2, Q3, e denominam-se primeiro, segundo e terceiro quartis, respectivamente. A amplitude
inter-quartílica é definida como a amplitude do intervalo entre o primeiro e o terceiro quartis, ou
seja: Q = Q3 - Q1
A amplitude inter-quartílica é uma medida de variabilidade bastante robusta, que é pouco
afetada pela presença de dados atípicos e guarda a seguinte relação aproximada com o desvio-
padão: Q = (4/3) x desvio-padrão.
Box-Plot
O Box-Plot é um gráfico no formato de caixa, cujos limites são o 1º quartil e o 3º quartil,
que representam 25% e 75% dos dados respectivamente. Esta caixa é dividida por uma linha, a
mediana, que significa 50% dos dados. Existem também dois eixos, ou "bigodes", ligados à
caixa estendendo-se no máximo a 1,5 vezes o tamanho da caixa, excluindo os valores
discrepantes (outliers). De um extremo ao outro, temos o espalhamento dos dados. O Box-Plot é
especialmente útil para mostrar as medidas de tendência central, dispersão, assimetria, caudas e
valores discrepantes de um grupo de dados, bem como, as diferenças de variabilidade, tendência
central e assimetria que existem entre grupos.
Construção do Box plot:
Tamanho da caixa: Q3 – Q1
Haste da caixa: até 1,5 x tamanho da caixa
Exemplo:
O Box-Plot a seguir compara as notas finais das três turmas de Probabilidade e Estatística.
Comparação das notas das três turmas de
Probabilidade e Estatística
0,0
1,02,0
3,04,0
5,0
6,07,0
8,09,0
10,0
C.comp. Eng. Elétrica Eng. Civil
Cursos
No
tas F
inais Primeiro Quartil
M ínimo
M ediana
M áximo
Terceiro Quartil
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 20
Exercícios 1 - Classifique as variáveis abaixo:
(a) Tempo para fazer um teste
(b) Número de alunos aprovados por turma
(c) Nível sócio-econômico
(d) Sexo
(e) Gastos com alimentação
(f) Opinião com relação à pena de morte
(g) Religião
(h) Valor de um imóvel
(i) Conceitos em certa disciplina
(j) Classificação em um concurso
2 - Construa um diagrama de setores, percentual, correspondente aos empregados da ADR Ltda que possui a
seguinte distribuição por área de trabalho: Diretoria (3 pessoas), Assessoria (6 pessoas), Transporte (18 pessoas),
Administração (5 pessoas), Área técnica (15 pessoas) e Área operacional (33 pessoas).
3 - Na administração de um sistema escolar de certo município 70% da despesa vai para o ensino, 12% para a
administração e manutenção e 18% para órgãos auxiliares, encargos fixos e despesas ocasionais. Qual o gráfico que
melhor representaria essa situação? Se o valor total da despesa é de 10.000 unidades monetárias, qual é o valor
gasto com administração e manutenção?
4 - Os dados a seguir referem-se ao número de livros adquiridos, no ano passado, pelos 40 alunos da turma de
Probabilidade e Estatística:
4 2 1 0 3 1 2 0 2 1
0 2 1 1 0 4 3 2 3 5
8 0 1 6 5 3 2 1 6 4
3 4 3 2 1 0 2 1 0 3
(a) Classifique a variável.
(b) Organize os dados em uma tabela adequada.
(c) Qual o percentual de alunos que adquiriram menos do que 3 livros?
(d) Qual o percentual de alunos que adquiriram pelo menos 4 livros?
(e) A partir do item (b), quantos livros foram adquiridos pelos 40 alunos?
5- Os dados a seguir foram coletados em um processo de produção de fibras sintéticas. Plote um gráfico de
dispersão (X e Y) e conclua a respeito.
X: Espaçamento entre rolos 5,1 5,5 4,8 1,2 1,8 4,2 3,5 1,0 1,5 5,2
Y: Resistência 11,8 12,8 13,0 13,0 13,5 14,3 14,4 14,6 13,6 12,5
6 - Considere os dados abaixo referentes ao consumo de água, em m3, de 75 contas da CORSAN:
32 6 22 11 34 40 16 26 23 31 27 10 38 17 13
45 25 50 18 23 35 22 30 14 18 20 13 24 35 29
33 48 20 12 31 39 17 58 19 16 12 21 15 12 20
51 12 19 15 41 29 25 13 23 32 14 27 43 37 21
28 37 26 44 11 53 38 46 17 36 28 49 56 19 11
(a) Organize os dados numa distribuição de frequências com 9 classes de amplitudes iguais, sendo Li = 6.
(b) A partir da distribuição de frequências construída no item anterior, determine e interprete: f3; fr4; F5; Fr6,
(Fr5-Fr2)
7) A tabela abaixo representa os salários pagos a 100 operários da empresa Fras-le:
no de salários mínimos (Xi) n
o de operários (fi)
0 2 40
2 4 30
4 6 10
6 8 15
8 10 5
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 21
Determinar:
a) Frequência Absoluta Acumulada (abaixo de), Frequência Simples Relativa e Frequência Simples Acumulada
(abaixo de, e acima de).
b) Quantos operários ganham até 2 salários mínimos?
c) Quantos operários ganham até 6 salários mínimos?
d) Qual a % de operários com salários entre 6 a 8 salários mínimos?
e) Qual a % de operários com salários inferior a 4 salários mínimos?
f) Calcule a média e o desvio-padrão salarial.
8- Em certa empresa trabalham 4 analistas de mercado, 2 supervisores, 1 chefe de seção e 1 gerente que ganham,
respectivamente: R$1.300,00; R$1.600,00; R$2.750,00, R$5.000,00. Qual o valor do salário médio desses
funcionários? Qual o desvio-padrão desses salários?
9 - Um estudo foi realizado por um professor em três turmas, obtendo a média e o desvio-padrão das notas de sua
disciplina, conforme abaixo. Qual a turma apresenta menor variabilidade (mais homogênea)? Justifique
adequadamente. Turma A B C
Média 6,5 8,0 8,0
Desvio-padrão 2,2 1,7 2,0
10 - Os operários de um setor industrial têm, em julho, um salário médio de 5 salários mínimos (s.m.) e desvio-
padrão de 2 s.m. Um acordo coletivo prevê, para agosto, um aumento de 60%, mais uma parte fixa correspondente a
0,7 s.m. Qual a média do número de salários mínimos e qual o desvio-padrão em agosto?
11 - A nota média dos alunos de uma classe foi 7,0 e das alunas 9,0. O número de alunos era 20 e das alunas 30.
Qual a nota média da classe toda?
12 - As notas de estatística de uma turma estão na tabela seguinte. Nota 1 2 3 4 5 6 7 8 9
Nº de alunos 2 6 9 12 14 9 5 4 1
(a) Calcule os valores da média, da mediana e da moda dessas notas.
(b) Calcule o valor da variância dessas notas.
13) Uma amostra de 20 operários de uma companhia apresentou os seguintes salários recebidos durante uma certa
semana : R$ 140, 140, 140, 140, 140, 140, 140, 140, 155, 155, 165, 165, 180, 180, 190, 200, 205, 225, 230, 240.
Calcular a média, a mediana e a moda para este grupo de salários.
14 - Considere o polígono de frequências seguinte:
Salário Mensal dos Empregados da Empresa
AJK
0
5
10
15
20
25
30
35
40
45
450 550 650 750 850 950 1050 1150 1250 1350
Salários (R$)
Em
pre
gados
(a) Qual o percentual de funcionários que recebem mais de R$ 700,00 por mês?
Cursos: Engenharia de Controle e Automação/Engenharia Mecânica
Disciplina: Probabilidade e Estatística
Prof. Jorge Matos Estatística Descritiva IFRS-Câmpus Farroupilha 22
(b) Qual o total de empregados da empresa?
(c) Determine os valores da média, da moda e da mediana dos salários da AJK.
(d) O que você pode afirmar quanto à simetria destes dados? Explique?
(e) Quantos empregados ganham acima de R$ 1.000,00?
15- Durante certo período de tempo as taxas de juros, em %, para dez ações foram as que a tabela abaixo registra:
Ação 01 02 03 04 05 06 07 08 09 10
Taxa 2,59 2,64 2,60 2,62 2,55 2,61 2,50 2,63 2,64 2,69
Calcule:
(a) a taxa média;
(b) a taxa mediana;
(c) a taxa modal;
(d) o desvio padrão das taxas;
(e) o coeficiente de variação das taxas.
16 - Considere o gráfico seguinte:
Salário Mensal dos Empregados da GHT Ltda
0
5
10
15
20
25
30
35
40
45
04 - 06 06 - 08 08 - 10 10 - 12 12 - 14 14 - 16 16 - 18 18 - 20
Salários (unidades monetárias)
Em
pre
gados
(a) Qual a denominação desse gráfico?
(b) Qual o intervalo que contém a mediana desses dados?
(c) Quantos desses empregados ganham menos que 12 unidades monetárias de salário mensal?
(d) Qual o salário médio desses empregados? Qual o salário mediano?
(e) Qual o percentual de empregados que ganha entre 9 e 16 unidades monetárias?
BIBLIOGRAFIA
COSTA NETO, P. L. O. Estatística. 2. ed. São Paulo: Edgard Blücher, 2002.
DOWING, D.; CLARK, J. Estatística aplicada. 2. ed. São Paulo: Saraiva, 2003.
FONSECA, J. S.; MARTINS, G. A. Curso de Estatística. 6. ed. São Paulo: Atlas, 1996.
FREUND, J. E. Estatística aplicada: economia, administração e contabilidade. 9. ed. Porto
Alegre: Bookman, 2000.
MONTGOMERY, D. C., RUNGER, G. C., HUBELE, N.F., Estatística Aplicada à
Engenharia. Rio de Janeiro: LTC, 2004.
MORETIN, P. A.; BUSSAB, W. O. Estatística Básica. 5. ed. São Paulo: Saraiva, 2005.
TRIOLA, M. F. Introdução à Estatística. 7. ed. Rio de Janeiro: LTC, 1999.