resumao estatistica

download resumao estatistica

of 33

Transcript of resumao estatistica

  • 8/4/2019 resumao estatistica

    1/33

    Resumo Estatstica Bsica

    RESUMO

    ESTATSTICABSICA

    Contedo

    1. Introduo pag. 022. Organizao de Dados Estatsticos pag. 033. Medidas de Posio pag. 144. Medidas de Disperso pag. 275. Medidas de Assimetria e Curtose pag. 32

    Alexandre Jos Granzotto Julho a Outubro / 2002

    1

  • 8/4/2019 resumao estatistica

    2/33

    Resumo Estatstica Bsica

    RESUMO - ESTATSTICA BSICA

    1. INTRODUO

    ESTATSTICA: ramo da matemtica aplicada.

    ANTIGUIDADE: os povos j registravam o nmero de habitantes, nascimentos, bitos.Faziam "estatsticas".

    IDADE MDIA: as informaes eram tabuladas com finalidades tributrias e blicas.

    SEC. XVI: surgem as primeiras anlises sistemticas, as primeiras tabelas e os nmerosrelativos.

    SEC. XVIII: a estatstica com feio cientfica batizada por GODOFREDO ACHENWALL.As tabelas ficam mais completas, surgem as primeiras representaes grficase os clculos de probabilidades. A estatstica deixa de ser uma simplestabulao de dados numricos para se tornar"O estudo de como se chegar aconcluso sobre uma populao, partindo da observao de partes dessa

    populao (amostra)".

    MTODO ESTATSTICO

    MTODO: um meio mais eficaz para atingir determinada meta.

    MTODOS CIENTFICOS: destacamos o mtodo experimental e o mtodo estatstico.

    MTODO EXPERIMENTAL: consiste em manter constante todas as causas,menos uma, que sofre variao para se observarseus efeitos, caso existam. Ex: Estudos daQumica, Fsica, etc.

    MTODO ESTATSTICO: diante da impossibilidade de manter as causasconstantes (nas cincias sociais), admitem todasessas causas presentes variando-as, registrandoessas variaes e procurando determinar, no

    resultado final, que influncias cabem a cada umadelas. Ex: Quais as causas que definem o preo deuma mercadoria quando a sua oferta diminui?

    Seria impossvel, no momento da pesquisa, manter constantes a uniformidade dossalrios, o gosto dos consumidores, nvel geral de preos de outros produtos, etc.

    A ESTATSTICA

    uma parte da matemtica aplicada que fornece mtodos para coleta,organizao, descrio, anlise e interpretao de dados e para a utilizao dosmesmos na tomada de decises.

    A coleta, a organizao ,a descrio dos dados, o clculo e a interpretao decoeficientes pertencem ESTATSTICA DESCRITIVA, enquanto a anlise e ainterpretao dos dados, associado a uma margem de incerteza, ficam a cargo daESTATSTICA INDUTIVA ou INFERENCIAL, tambm chamada como a medida daincerteza ou mtodos que se fundamentam na teoria da probabilidade.

    2

  • 8/4/2019 resumao estatistica

    3/33

    Resumo Estatstica Bsica

    .

    2. ORGANIZAO DE DADOS ESTATSTICOS

    FASES DO MTODO ESTATSTICO

    1 - DEFINIO DO PROBLEMA : Saber exatamente aquilo que se pretende pesquisar o mesmo que definir corretamente o problema.

    2 - PLANEJAMENTO : Como levantar informaes ? Que dados devero ser obtidos ?Qual levantamento a ser utilizado? Censitrio? Por amostragem?E o cronograma de atividades ? Os custos envolvidos ? etc.

    3 - COLETA DE DADOS: Fase operacional. o registro sistemtico de dados, comum objetivo determinado.

    Dados primrios: quando so publicados pela prpria pessoa ou organizao que

    os haja recolhido. Ex: tabelas do censo demogrfico do IBGE.

    Dados secundrios: quando so publicados por outra organizao. Ex: quandodeterminado jornal publica estatsticas referentes ao censodemogrfico extradas do IBGE.

    OBS: mais seguro trabalhar com fontes primrias. O uso da fontesecundria traz o grande risco de erros de transcrio.

    Coleta Direta: quando obtida diretamente da fonte. Ex: Empresa que realizauma pesquisa para saber a preferncia dos consumidores pela

    sua marca.

    coletacontnua: registros de nascimento, bitos, casamentos;coleta peridica: recenseamento demogrfico, censo industrial;coleta ocasional: registro de casos de dengue.Coleta Indireta: feita por dedues a partir dos elementos

    conseguidos pela coleta direta, por analogia,por avaliao,indcios ou proporcionalizao.

    4 - APURAO DOS DADOS: Resumo dos dados atravs de sua contagem eagrupamento. a condensao e tabulao de

    dados.5 - APRESENTAO DOS DADOS: H duas formas de apresentao, que no se

    excluem mutuamente. A apresentao tabular, ouseja uma apresentao numrica dos dados emlinhas e colunas distribudas de modo ordenado,segundo regras prticas fixadas pelo ConselhoNacional de Estatstica. A apresentao grfica dosdados numricos constitui uma apresentaogeomtrica permitindo uma viso rpida e clara dofenmeno.

    6 - ANLISE E INTERPRETAO DOS DADOS: A ltima fase do trabalho estatstico amais importante e delicada. Est ligadaessencialmente ao clculo demedidas e coeficientes, cuja finalidadeprincipal descrever o fenmeno(estatstica descritiva).

    3

  • 8/4/2019 resumao estatistica

    4/33

    Resumo Estatstica Bsica

    DEFINIES BSICAS DA ESTATSTICA.FENMENO ESTATSTICO: qualquer evento que se pretenda analisar, cujo estudo

    seja possvel a aplicao do mtodo estatstico. Sodivididos em trs grupos:

    Fenmenos de massa ou coletivo: so aqueles que no podem ser definidos poruma simples observao. A estatstica dedica-se ao estudo desses fenmenos. Ex: Anatalidade na Grande Vitria, O preo mdioda cerveja no Esprito Santo, etc.

    Fenmenos individuais: so aqueles que iro compor os fenmenos demassa. Ex: cada nascimento na Grande Vitria,cada preo de cerveja no Esprito Santo, etc.

    Fenmenos de multido: quando as caractersticas observadas para a massano se verificam para o particular.

    DADO ESTATSTICO: um dado numrico e considerado a matria-prima sobre aqual iremos aplicar os mtodos estatsticos.

    POPULAO: o conjunto total de elementos portadores de, pelo menos, umacaracterstica comum.

    AMOSTRA: uma parcela representativa da populao que EXAMINADA com opropsito de tirarmos concluses sobre a essa populao.

    PARMETROS: So valores singulares que existem na populao e que servem paracaracteriz-la. Para definirmos um parmetro devemos examinar toda apopulao. Ex: Os alunos do 2 ano da FACEV tm em mdia 1,70metros de estatura.

    ESTIMATIVA: um valor aproximado do parmetro e calculado com o uso daamostra.

    ATRIBUTO: quando os dados estatsticos apresentam um carter qualitativo, olevantamento e os estudos necessrios ao tratamento desses dados sodesignados genericamente de estatstica de atributo.

    VARIVEL: o conjunto de resultados possveis de um fenmeno.

    VARIVEL QUALITATIVA: Quando seu valores so expressos poratributos: sexo, corda pele,etc.

    VARIVEL QUANTITATIVA: Quando os dados so de carter nitidamentequantitativo, e o conjunto dos resultados possui umaestrutura numrica, trata-se portanto da estatstica devarivel e se dividem em :

    VARIVEL DISCRETA OU DESCONTNUA: Seus valores so expressosgeralmente atravs de nmeros inteiros no negativos. Resulta normalmentede contagens. Ex: N de alunos presentes s aulas de introduo estatsticaeconmica no 1 semestre de 1997: mar = 18 , abr = 30 , mai = 35 , jun = 36.

    4

  • 8/4/2019 resumao estatistica

    5/33

    Resumo Estatstica Bsica

    VARIVEL CONTNUA: Resulta normalmente de uma mensurao, e aescala numrica de seus possveis valores corresponde ao conjunto R dosnmeros Reais, ou seja, podem assumir, teoricamente, qualquer valor entredois limites. Ex.: Quando voc vai medir a temperatura de seu corpo com umtermmetro de mercrio o que ocorre o seguinte: O filete de mercrio, ao

    dilatar-se, passar por todas as temperaturas intermedirias at chegar natemperatura atual do seu corpo.

    Exemplos -. Cor dos olhos das alunas: qualitativa. ndice de liquidez nas indstrias capixabas: quantitativa contnua. Produo de caf no Brasil: quantitativa contnua. Nmero de defeitos em aparelhos de TV: quantitativa discreta. Comprimento dos pregos produzidos por uma empresa: quantitativa contnua. O ponto obtido em cada jogada de um dado: quantitativa discreta

    AMOSTRAGEM

    MTODOS PROBABILSTICOS Exige que cada elemento da populao possua determinada probabilidade de ser

    selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for otamanho da populao, a probabilidade de cada elemento ser selecionado ser 1/N.Trata-se do mtodo que garante cientificamente a aplicao das tcnicas estatsticasde inferncias. Somente com base em amostragens probabilsticas que se podemrealizar inferncias ou indues sobre a populao a partir do conhecimento da

    amostra. uma tcnica especial para recolher amostras, que garantem, tanto

    quanto possvel, o acaso na escolha.

    .AMOSTRAGEM CASUAL ou ALEATRIA SIMPLES o processo mais elementar e freqentemente utilizado. equivalente a um sorteio

    lotrico. Pode ser realizada numerando-se a populao de 1 a n e sorteando-se, aseguir, por meio de um dispositivo aleatrio qualquer, x nmeros dessa seqncia, osquais correspondero aos elementos pertencentes amostra.

    Ex: Vamos obter uma amostra, de 10%, representativa para a pesquisa daestatura de 90 alunos de uma escola:1 - numeramos os alunos de 1 a 90.2 - escrevemos os nmeros dos alunos, de 1 a 90, em pedaos iguais de papel,colocamos na urna e aps mistura retiramos, um a um, nove nmeros que formaro aamostra.OBS: quando o nmero de elementos da amostra muito grande, esse tipo de sorteiotorna-se muito trabalhoso. Neste caso utiliza-se uma Tabela de nmeros aleatrios,construda de modo que os algarismos de 0 a 9 so distribudos ao acaso nas linhas ecolunas.

    .

    .AMOSTRAGEM PROPORCIONAL ESTRATIFICADA: Quando a populao se divide em estratos (sub-populaes), convm que o sorteio

    dos elementos da amostra leve em considerao tais estratos, da obtemos oselementos da amostra proporcional ao nmero de elementos desses estratos.

    5

  • 8/4/2019 resumao estatistica

    6/33

    Resumo Estatstica Bsica

    Ex: Vamos obter uma amostra proporcional estratificada, de 10%, do exemploanterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. So

    portanto dois estratos (sexo masculino e sexo feminino). Logo, temos:

    SEXOPOPULAC

    O

    10 %AMOSTR

    AMASC. 54 5,4 5FEMIN. 36 3,6 4Total 90 9,0 9

    Numeramos ento os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas eprocedemos o sorteio casual com urna ou tabela de nmeros aleatrios.

    .

    AMOSTRAGEM SISTEMTICA: Quando os elementos da populao j se acham ordenados, no h necessidade de

    construir o sistema de referncia. So exemplos os pronturios mdicos de umhospital, os prdios de uma rua, etc. Nestes casos, a seleo dos elementos queconstituiro a amostra pode ser feita por um sistema imposto pelo pesquisador.

    Ex: Suponhamos uma rua com 900 casas, das quais desejamos obter uma amostraformada por 50 casas para uma pesquisa de opinio. Podemos, neste caso, usar oseguinte procedimento: como 900/50 = 18, escolhemos por sorteio casual um nmerode 01 a 18, o qual indicaria o primeiro elemento sorteado para a amostra; os demaiselementos seriam periodicamente considerados de 18 em 18. Assim, suponhamosque o nmero sorteado fosse 4 a amostra seria: 4 casa, 22 casa, 40 casa, 58 casa,76 casa, etc.

    AMOSTRAGEM POR CONGLOMERADOS (ou AGRUPAMENTOS) Algumas populaes no permitem, ou tornam extremamente difcil que se

    identifiquem seus elementos. No obstante isso, pode ser relativamente fcil identificaralguns subgrupos da populao. Em tais casos, uma amostra aleatria simplesdesses subgrupos (conglomerados) pode se colhida, e uma contagem completa deveser feita para o conglomerado sorteado. Agrupamentos tpicos so quarteires,famlias, organizaes, agncias, edifcios etc.

    Ex: Num levantamento da populao de determinada cidade, podemos dispor do

    mapa indicando cada quarteiro e no dispor de uma relao atualizada dos seusmoradores. Pode-se, ento, colher uma amostra dos quarteires e fazer a contagemcompleta de todos os que residem naqueles quarteires sorteados.

    MTODOS NO PROBABILSITCOS So amostragens em que h uma escolha deliberada dos elementos da amostra.

    No possvel generalizar os resultados das pesquisas para a populao, pois asamostras no-probabilsticas no garantem a representatividade da populao.

    AMOSTRAGEM ACIDENTAL Trata-se de uma amostra formada por aqueles elementos que vo aparecendo,que so possveis de se obter at completar o nmero de elementos da amostra.Geralmente utilizada em pesquisas de opinio, em que os entrevistados soacidentalmente escolhidos.

    Ex: Pesquisas de opinio em praas pblicas, ruas de grandes cidades;

    6

  • 8/4/2019 resumao estatistica

    7/33

    Resumo Estatstica Bsica

    AMOSTRAGEM INTENCIONAL De acordo com determinado critrio, escolhido intencionalmente um grupo de

    elementos que iro compor a amostra. O investigador se dirige intencionalmente agrupos de elementos dos quais deseja saber a opinio.

    Ex: Numa pesquisa sobre preferncia por determinado cosmtico, o pesquisador sedirige a um grande salo de beleza e entrevista as pessoas que ali se encontram.

    AMOSTRAGEM POR QUOTAS Um dos mtodos de amostragem mais comumente usados em levantamentos de

    mercado e em prvias eleitorais. Ele abrange trs fases:

    1 - classificao da populao em termos de propriedades que se sabe, ou presume,serem relevantes para a caracterstica a ser estudada;

    2 - determinao da proporo da populao para cada caracterstica, com base naconstituio conhecida, presumida ou estimada, da populao;

    3 - fixao de quotas para cada entrevistador a quem tocar a responsabilidade deselecionar entrevistados, de modo que a amostra total observada ou entrevistadacontenha a proporo e cada classe tal como determinada na 2 fase.

    Ex: Numa pesquisa sobre o "trabalho das mulheres na atualidade", provavelmentese ter interesse em considerar: a diviso cidade e campo, a habitao, o nmero defilhos, a idade dos filhos, a renda mdia, as faixas etrias etc.

    A primeira tarefa descobrir as propores (porcentagens) dessas caractersticas napopulao. Imagina-se que haja 47% de homens e 53% de mulheres na populao.Logo, uma amostra de 50 pessoas dever ter 23 homens e 27 mulheres. Ento o

    pesquisador receber uma "quota" para entrevistar 27 mulheres. A considerao devrias categorias exigir uma composio amostralque atenda ao n determinado es propores populacionais estipuladas.

    .

    SRIES ESTATSTICAS

    TABELA: um quadro que resume um conjunto de dados dispostos segundo linhas ecolunas de maneira sistemtica.

    De acordo com a Resoluo 886 do IBGE, nas casas ou clulas da tabela devemoscolocar :

    um trao horizontal ( - ) quando o valor zero; trs pontos ( ... ) quando no temos os dados; zero ( 0 ) quando o valor muito pequeno para ser expresso pela

    unidade utilizada; um ponto de interrogao ( ? ) quando temos dvida quanto exatido

    de determinado valor.Obs: O lado direito e esquerdo de uma tabela oficial deve ser aberto..

    SRIE ESTATSTICA: qualquer tabela que apresenta a distribuio de um conjunto dedados estatsticos em funo da poca, do local ou da espcie.

    7

  • 8/4/2019 resumao estatistica

    8/33

    Resumo Estatstica Bsica

    SRIES HOMGRADAS: so aquelas em que a varivel descrita apresenta variaodiscreta ou descontnua. Podem ser do tipo temporal,geogrfica ou especfica.

    a) Srie Temporal: Identifica-se pelo carter varivel do fator cronolgico. O

    local e a espcie (fenmeno) so elementos fixos. Esta srietambm chamada de histrica ou evolutiva.

    ABC VECULOS LTDA.Vendas no 1 bimestre de 1996

    PERODO UNIDADES VENDIDASJAN/96 20000FEV/96 10000

    TOTAL 30000.

    b) Srie Geogrfica: Apresenta como elemento varivel o fator geogrfico. Apoca e o fato (espcie) so elementos fixos. Tambm chamada de espacial, territorial ou de localizao.

    ABC VECULOS LTDA.Vendas no 1 bimestre de 1996

    FILIAIS UNIDADES VENDIDASSo Paulo 13000

    Rio de Janeiro 17000

    TOTAL 30000

    c) Srie Especfica: O carter varivel apenas o fato ou espcie. Tambm chamada de srie categrica.

    ABC VECULOS LTDA.Vendas no 1 bimestre de 1996

    MARCA UNIDADES VENDIDAS *FIAT 18000

    GM 12000TOTAL 30000

    SRIES CONJUGADAS: Tambm chamadas de tabelas de dupla entrada. Soapropriadas apresentao de duas ou mais sries de maneiraconjugada, havendo duas ordens de classificao: umahorizontal e outra vertical. O exemplo abaixo de uma sriegeogrfica-temporal.

    ABC VECULOS LTDA.

    Vendas no 1 bimestre de 1996

    FILIAIS Janeiro/96 Fevereiro/96So Paulo 10000 3000Rio de Janeiro 12000 5000TOTAL 22000 8000

    8

  • 8/4/2019 resumao estatistica

    9/33

    Resumo Estatstica Bsica

    GRFICOS ESTATSTICOSG

    So representaes visuais dos dados estatsticos que devem corresponder, masnunca substituir as tabelas estatsticas.

    Caractersticas: Uso de escalas, sistema de coordenadas, simplicidade, clareza everacidade.

    Grficos de informao: So grficos destinados principalmente ao pblico em geral,objetivando proporcionar uma visualizao rpida e clara.So grficos tipicamente expositivos, dispensandocomentrios explicativos adicionais. As legendas podem seromitidas, desde que as informaes desejadas estejampresentes.

    Grficos de anlise: So grficos que prestam-se melhor ao trabalho estatstico,fornecendo elementos teis fase de anlise dos dados, semdeixar de ser tambm informativos. Os grficos de anlisefreqentemente vm acompanhados de uma tabela estatstica.Inclui-se, muitas vezes um texto explicativo, chamando a atenodo leitor para os pontos principais revelados pelo grfico.

    Uso indevido de Grficos: Podem trazer uma idia falsa dos dados que esto sendoanalisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de umproblema de construo de escalas.

    .Classificao dos grficos: Diagramas, Estereogramas, Pictogramas e Cartogramas..1 - DIAGRAMAS: So grficos geomtricos dispostos em duas dimenses. So os mais usados na

    representao de sries estatsticas. Eles podem ser :

    1.1- Grficos em barras horizontais.

    1.2- Grficos em barras verticais( colunas ).

    Quando as legendas no so breves usa-se de preferncia os grficos em barrashorizontais. Nesses grficos os retngulos tm a mesma base e as alturas soproporcionais aos respectivos dados.

    A ordem a ser observada a cronolgica, se a srie for histrica, e a decrescente, se for geogrfica ou categrica.

    1.2- Grficos em barras compostas.

    1.4- Grficos em colunas superpostas. Eles diferem dos grficos em barras ou colunas convencionais apenas pelo fato de

    apresentar cada barra ou coluna segmentada em partes componentes. Servem pararepresentar comparativamente dois ou mais atributos.

    1.5- Grficos em linhas ou lineares. So freqentemente usados para representao de sries cronolgicas com um

    grande nmero de perodos de tempo. As linhas so mais eficientes do que ascolunas, quando existem intensas flutuaes nas sries ou quando h necessidade dese representarem vrias sries em um mesmo grfico.

    9

  • 8/4/2019 resumao estatistica

    10/33

    Resumo Estatstica Bsica

    Quando representamos, em um mesmo sistema de coordenadas, a variao de doisfenmenos, a parte interna da figura formada pelos grficos desses fenmenos denominada de rea de excesso.

    1.5- Grficos em setores.

    Este grfico construdo com base em um crculo, e empregado sempre quedesejamos ressaltar a participao do dado no total. O total representado pelocrculo, que fica dividido em tantos setores quantas so as partes. Os setores so taisque suas reas so respectivamente proporcionais aos dados da srie. O grfico emsetores s deve ser empregado quando h, no mximo, sete dados.

    Obs : As sries temporais geralmente no so representadas por este tipo de grfico.

    .2 - ESTEREOGRAMAS: So grficos geomtricos dispostos em trs dimenses, pois representam volume.

    So usados nas representaes grficas das tabelas de dupla entrada. Em algunscasos este tipo de grfico fica difcil de ser interpretado dada a pequena preciso queoferecem.

    .3 - PICTOGRAMAS: So construdos a partir de figuras representativas da intensidade do fenmeno. Este

    tipo de grfico tem a vantagem de despertar a ateno do pblico leigo, pois suaforma atraente e sugestiva. Os smbolos devem ser auto-explicativos. Adesvantagem dos pictogramas que apenas mostram uma viso geral do fenmeno,e no de detalhes minuciosos. Veja o exemplo abaixo:

    4- CARTOGRAMAS: So ilustraes relativas a cartas geogrficas (mapas). O objetivo desse grfico o de

    figurar os dados estatsticos diretamente relacionados com reas geogrficas oupolticas.

    DISTRIBUIO DE FREQNCIA um tipo de tabela que condensa uma coleo de dados conforme as

    freqncias (repeties de seus valores).

    Tabela primitiva ou dados brutos: uma tabela ou relao de elementos que noforam numericamente organizados. difcilformarmos uma idia exata do comportamento dogrupo como um todo, a partir de dados noordenados.

    Ex : 45, 41, 42, 41, 42 43, 44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58, 60, 51

    10

  • 8/4/2019 resumao estatistica

    11/33

    Resumo Estatstica Bsica

    ROL: a tabela obtida aps a ordenao dos dados (crescente ou decrescente).

    Ex : 41, 41, 41, 42, 42 43, 44, 45 ,46, 46, 50, 50, 51, 52, 54, 57, 58, 58, 60, 60

    Distribuio de freqncia SEM INTERVALOS DE CLASSE: a simples condensaodos dados conforme as repeties de seu valores. Para um ROL de tamanho razovel estadistribuio de freqncia inconveniente, j que exige muito espao. Veja exemplo abaixo:

    Dados Freqncia41 342 243 144 145 1

    46 250 251 152 154 157 158 260 2

    Total 20

    Distribuio de freqncia COM INTERVALOS DE CLASSE:Quando o tamanho daamostra elevado, mais racional efetuar o agrupamento dos valores em vrios intervalosde classe.

    Classes Freqncias41 |------- 45 745 |------- 49 349 |------- 53 453 |------- 57 157 |------- 61 5

    Total 20

    ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA (com intervalos de classe)CLASSE: so os intervalos de variao da varivel e simbolizada por i e o nmero total

    de classes simbolizada pork. Ex: na tabela anteriork= 5 e 49 |------- 53 a 3classe, onde i= 3.

    LIMITES DE CLASSE: so os extremos de cada classe. O menor nmero o limiteinferior de classe ( li ) e o maior nmero, limite superior de classe (Li ). Ex: em 49 |------- 53,... l3 = 49 e L3 = 53. O smbolo |-------representa um intervalo fechado esquerda e aberto direita.O dado 53 do ROL no pertence a classe 3 e sim a classe 4representada por53 |------- 57.

    11

  • 8/4/2019 resumao estatistica

    12/33

    Resumo Estatstica Bsica

    AMPLITUDE DO INTERVALO DE CLASSE: obtida atravs da diferena entre o limitesuperior e inferior da classe e simbolizadaporhi = Li - li. Ex: na tabela anteriorhi= 53- 49 = 4. Obs: Na distribuio de freqncia

    c/ classe o hi ser igual em todas asclasses.

    AMPLITUDE TOTAL DA DISTRIBUIO: a diferena entre o limite superior da ltimaclasse e o limite inferior da primeira classe. AT= L(max) - l(min). Ex: na tabela anteriorAT= 61 - 41= 20.

    AMPLITUDE TOTAL DA AMOSTRA (ROL): a diferena entre o valor mximo e o valormnimo da amostra (ROL). OndeAA = Xmax -

    Xmin. Em nosso exemploAA = 60 - 41 = 19.Obs: ATsempre ser maior queAA.

    PONTO MDIO DE CLASSE: o ponto que divide o intervalo de classe em duas partesiguais. .......Ex: em 49 |------- 53 o ponto mdio x3 =(53+49)/2 = 51, ou seja x3=( l3 + L3 )/2.

    Mtodo prtico para construo de uma Distribuio de Freqncias c/ Classe 1 - Organize os dados brutos em um ROL.

    2 - Calcule a amplitude amostralAA. No nosso exmplo: AA = 60 - 41 = 19

    3 - Calcule o nmero de classes atravs da "Regra de Sturges":

    n In de classes3 |-----| 5 36 |-----| 11 412 |-----| 22 523 |-----| 46 647 |-----| 90 791 |-----| 181 8182 |-----| 362 9

    Obs: Qualquer regra para determinao do n de classes da tabela no nos levam auma deciso final; esta vai depender, na realidade de um julgamento pessoal,que deve estar ligado natureza dos dados.

    No nosso exemplo: n = 20 dados, ento ,a princpio, a regra sugere a adoo de 5classes.

    12

  • 8/4/2019 resumao estatistica

    13/33

    Resumo Estatstica Bsica

    4 - Decidido o n de classes, calcule ento a amplitude do intervalo de classe h > AA / i.No nosso exemplo: AA/i = 19/5 = 3,8 . Obs: Como h > AA/i um valor ligeiramentesuperior para haver folga na ltima classe. Utilizaremos ento h = 4

    5 - Temos ento o menor n da amostra, o n de classes e a amplitude do intervalo.

    Podemos montar a tabela, com o cuidado para no aparecer classes com freqncia =0 (zero).No nosso exemplo: o menor n da amostra = 41 + h = 45, logo a primeira classe serrepresentada por ...... 41 |------- 45. As classes seguintes respeitaro o mesmoprocedimento.O primeiro elemento das classes seguintes sempre sero formadas pelo ltimoelemento da classe anterior.

    REPRESENTAO GRFICA DE UMA DISTRIBUIO

    Histograma, Polgono de freqncia e Polgono de freqncia acumulada

    Em todos os grficos acima utilizamos o primeiro quadrante do sistema de eixoscoordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas)colocamos os valores da varivel e na linha vertical (eixo das ordenadas), asfreqncias.

    .Histograma: formado por um conjunto de retngulos justapostos, cujas bases se

    localizam sobre o eixo horizontal, de tal modo que seus pontos mdioscoincidam com os pontos mdios dos intervalos de classe. A rea de umhistograma proporcional soma das freqncias simples ou absolutas.

    Freqncias simples ou absoluta:so os valores que realmente representam o nmerode dados de cada classe. A soma das freqnciassimples igual ao nmero total dos dados dadistribuio.

    Freqncias relativas: so os valores das razes entre as freqncia absolutas de cadaclasse e a freqncia total da distribuio. A soma dasfreqncias relativas igual a 1 (100 %).

    .

    Polgono de freqncia: um grfico em linha, sendo as freqncias marcadas sobreperpendiculares ao eixo horizontal, levantadas pelos pontosmdios dos intervalos de classe. Para realmente obtermos umpolgono (linha fechada), devemos completar a figura, ligando osextremos da linha obtida aos pontos mdios da classe anterior primeira e da posterior ltima, da distribuio.

    .

    Polgono de freqncia acumulada: traado marcando-se as freqncias acumuladassobre perpendiculares ao eixo horizontal, levantadasnos pontos correspondentes aos limites superioresdos intervalos de classe.

    Freqncia simples acumulada de uma classe: o total das freqncias de todos osvalores inferiores ao limite superior dointervalo de uma determinada classe.

    13

  • 8/4/2019 resumao estatistica

    14/33

    Resumo Estatstica Bsica

    Freqncia relativa acumulada de um classe: a freqncia acumulada da classe,dividida pela freqncia total dadistribuio.

    ...CLASSE.. ......fi..... .....xi..... .....fri..... .....Fi..... ......Fri.....

    50 |-------- 54 4 52 0,100 4 0,10054 |-------- 58 9 56 0,225 13 0,32558 |-------- 62 11 60 0,275 24 0,60062 |-------- 66 8 64 0,200 32 0,80066 |-------- 70 5 68 0,125 37 0,92570 |-------- 74 3 72 0,075 40 1,000Total 40 1,000

    fi = freqncia simples; xi = ponto mdio de classe; fri = freqncia simples acumulada;Fi = freqncia relativa e Fri = freqncia relativa acumulada.

    Obs: uma distribuio de freqncia sem intervalos de classe representadagraficamente por um diagrama onde cada valor da varivel representado por umsegmento de reta vertical e de comprimento proporcional respectiva freqncia.

    .

    3. MEDIDAS DE POSIO

    Introduo So as estatsticas que representam uma srie de dados orientando-nos quanto

    posio da distribuio em relao ao eixo horizontal do grfico da curva defreqncia.

    As medidas de posies mais importantes so as medidas de tendncia central oupromdias (verifica-se uma tendncia dos dados observados a se agruparem emtorno dos valores centrais).

    As medidas de tendncia central mais utilizadas so: mdia aritmtica, moda emediana. Outros promdios menos usados so as mdias: geomtrica, harmnica,

    quadrtica, cbica e biquadrtica.

    As outras medidas de posio so as separatrizes, que englobam: a prpriamediana, os decis, os quartis e os percentis.

    .

    MDIA ARITMTICA =

    igual ao quociente entre a soma dos valores do conjunto e o nmero total dos

    valores.

    ......

    onde xi so os valores da varivel e n o nmero de valores..

    14

  • 8/4/2019 resumao estatistica

    15/33

    Resumo Estatstica Bsica

    Dados no-agrupados: Quando desejamos conhecer a mdia dos dados no-agrupadosem tabelas de freqncias, determinamos a mdia aritmticasimples.

    Ex: Sabendo-se que a venda diria de arroz tipo A, durante uma semana, foi de10, 14, 13, 15, 16, 18 e 12 kilos, temos, para venda mdia diria na semana de:

    .= (10+14+13+15+16+18+12) / 7 = 14 kilos

    Desvio em relao mdia: a diferena entre cada elemento de um conjunto devalores e a mdia aritmtica, ou seja:.

    .di = Xi -

    No exemplo anterior temos sete desvios:... d1 = 10 - 14 = - 4 , ...d2 = 14 - 14 = 0 ,d3 = 13 - 14 = - 1 , ...d4 = 15 - 14 = 1 ,... d5 = 16 - 14 = 2 ,... d6 = 18 - 14 = 4 ...e. ..d7 = 12 - 14 = - 2.

    .

    Propriedades da mdia aritmtica

    1 propriedade: A soma algbrica dos desvios em relao mdia nula. No exemplo anterior : d1+d2+d3+d4+d5+d6+d7 = 0

    2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos osvalores de uma varivel, a mdia do conjunto fica aumentada ( oudiminuda) dessa constante.

    Se no exemplo original somarmos a constante 2 a cada um dos valores da variveltemos:

    Y = 12+16+15+17+18+20+14 / 7 = 16 kilos ou

    Y = .+ 2 = 14 +2 = 16 kilos

    3 propriedade: Multiplicando-se (ou dividindo-se) todos os valores de uma varivelpor uma constante (c), a mdia do conjunto fica multiplicada ( oudividida) por essa constante.

    Se no exemplo original multiplicarmos a constante 3 a cada um dos valores davarivel temos:

    Y = 30+42+39+45+48+54+36 / 7 = 42 kilos ou

    Y =

    x 3 = 14 x 3 = 42 kilos

    .

    15

  • 8/4/2019 resumao estatistica

    16/33

    Resumo Estatstica Bsica

    Dados agrupados:

    Sem intervalos de classe Consideremos a distribuio relativa a 34 famlias de quatrofilhos, tomando para varivel o nmero de filhos do sexomasculino. Calcularemos a quantidade mdia de meninos

    por famlia:

    N de meninos freqncia = fi0 21 62 103 124 4

    total 34

    Como as freqncias so nmeros indicadores da intensidade de cada valor davarivel, elas funcionam como fatores de ponderao, o que nos leva a calcular amdia aritmtica ponderada, dada pela frmula:

    ..xi. ..fi. ..xi.fi .0 2 01 6 62 10 20

    3 12 364 4 16total 34 78

    onde 78 / 34 = 2,3 meninos por famliaCom intervalos de classe Neste caso, convencionamos que todos os valores includos

    em um determinado intervalo de classe coincidem com oseu ponto mdio, e determinamos a mdia aritmticaponderada por meio da frmula:

    ..

    onde Xi o ponto mdio da classe.

    Ex: Calcular a estatura mdia de bebs conforme a tabela abaixo.

    Estaturas (cm) freqncia = fi ponto mdio = xi ..xi.fi.50 |------------ 54 4 52 20854 |------------ 58 9 56 50458 |------------ 62 11 60 660

    62 |------------ 66 8 64 51266 |------------ 70 5 68 34070 |------------ 74 3 72 216Total 40 2.440

    Aplicando a frmula acima temos: 2.440 / 40.= 61. logo... = 61 cm

    16

  • 8/4/2019 resumao estatistica

    17/33

    Resumo Estatstica Bsica

    MDIA GEOMTRICA = g

    a raiz n-sima do produto de todos eles.

    Mdia Geomtrica Simples: ou .

    Ex.: - Calcular a mdia geomtrica dos seguintes conjuntos de nmeros:E

    a) { 10, 60, 360 }.: = ( 10 * 60 * 36 0) (1/3) ....R: 60b) { 2, 2, 2 }........: = (2 * 2 * 2 ^ (1/3) .. .R: 2c) { 1, 4, 16, 64 }: = (1 * 4 * 16 * 64 ) (1/4) ....R: 8.

    Mdia Geomtrica Ponderada :

    ou ..Ex - Calcular a mdia geomtrica dos valores da tabela abaixo :

    ...xi... ...fi...1 23 49 2

    27 1Total 9

    = (12 * 34 * 92 * 271) (1/9)........R: 3,8296

    .

    MDIA HARMNICA - h

    o inverso da mdia aritmtica dos inversos..

    Mdia Harmnica Simples:. (para dados no agrupados)

    .. ou

    .Mdia Harmnica Ponderada : (para dados agrupados em tabelas de freqncias)

    ..

    Ex.: Calcular a mdia harmnica dos valores da tabela abaixo:

    17

  • 8/4/2019 resumao estatistica

    18/33

    Resumo Estatstica Bsica

    classes ....fi.... ....xi.... ........fi/xi........1 |--------- 3 2 2 2/2 = 1,003 |--------- 5 4 4 4/4 = 1,005 |--------- 7 8 6 8/6 = 1,33

    7 |--------- 9 4 8 4/8 = 0,509 |--------- 11 2 10 2/10 = 0,20total 20 4,03

    Resp: 20 / 4,03 = 4,96

    OBS: A mdia harmnica no aceita valores iguais a zero como dados de umasrie.

    A igualdade g = h.= ....s ocorrer quando todos os valores da srie forem

    iguais.

    OBS: Quando os valores da varivel no forem muito diferentes, verifica-seaproximadamente a seguinte relao:

    g = ( .+ h ) /.2

    Demonstraremos a relao acima com os seguintes dados:

    z = { 10,1 ; 10,1 ; 10,2 ; 10,4 ; 10,5 }

    Mdia aritmtica = 51,3 / 5 = 10,2600Mdia geomtrica= = 10,2587

    Mdia harmnica = 5 / 0,4874508 = 10,2574

    Comprovando a relao: 10,2600 + 10,2574 / 2 = 10,2587 = mdia geomtrica.

    MODA - Mo

    o valor que ocorre com maior freqncia em uma srie de valores.

    Desse modo, o salrio modal dos empregados de uma fbrica o salrio maiscomum, isto , o salrio recebido pelo maior nmero de empregados dessa fbrica.

    .A Moda quando os dados no esto agrupados

    A moda facilmente reconhecida: basta, de acordo com definio, procurar o valorque mais se repete.

    Ex: Na srie { 7 , 8 , 9 , 10 , 10 , 10 , 11 , 12 } a moda igual a 10.

    H sries nas quais no exista valor modal, isto , nas quais nenhum valor apareamais vezes que outros.

    18

  • 8/4/2019 resumao estatistica

    19/33

    Resumo Estatstica Bsica

    Ex: { 3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.

    .Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos,ento, que a srie tem dois ou mais valores modais.

    Ex: { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7. Asrie bimodal.

    .

    A Moda quando os dados esto agrupados a) Sem intervalos de classe: Uma vez agrupados os dados, possvel determinar

    imediatamente a moda: basta fixar o valor da varivel demaior freqncia.

    Ex: Qual a temperatura mais comum medida no ms abaixo:

    Temperaturas Freqncia0 C 31 C 92 C 123 C 6

    Resp: 2 C a temperatura modal, pois a de maior freqncia..

    b) Com intervalos de classe: A classe que apresenta a maior freqncia denominadaclasse modal. Pela definio, podemos afirmar que amoda, neste caso, o valor dominante que estcompreendido entre os limites da classe modal. Omtodo mais simples para o clculo da moda consiste emtomar o ponto mdio da classe modal. Damos a esse valora denominao de moda bruta.

    Mo = ( l* + L* ) / 2

    onde l* = limite inferior da classe modale L* =limite superior da classe modal.

    Ex: Calcule a estatura modal conforme a tabela abaixo.

    Classes (em cm) Freqncia54 |------------ 58 958 |------------ 62 1162 |------------ 66 866 |------------ 70 5

    Resposta: a classe modal 58|-------- 62, pois a de maior freqncia. l* = 58 e

    L* = 62Mo = (58+62) / 2 = 60 cm ( este valor estimado, pois no conhecemos o valorreal da moda).

    .Mtodo mais elaborado pela frmula de CZUBER: Mo = l* + (d1/(d1+d2)) x h*

    19

  • 8/4/2019 resumao estatistica

    20/33

    Resumo Estatstica Bsica

    l* = limite inferior da classe modal..... e.....L* = limite superior da classe modald1 = freqncia da classe modal - freqncia da classe anterior da classe modald2 = freqncia da classe modal - freqncia da classe posterior da classe modalh* = amplitude da classe modal

    Mo = 58 + ((11-9) / ((11-9) + (11 8)) x 4 Mo = 59,6

    Obs: A moda utilizada quando desejamos obter uma medida rpida e aproximadade posio ou quando a medida de posio deva ser o valor mais tpico dadistribuio. J a mdia aritmtica a medida de posio que possui a maiorestabilidade.

    MEDIANA - Md

    A mediana de um conjunto de valores, dispostos segundo uma ordem ( crescenteou decrescente), o valor situado de tal forma no conjunto que o separa em doissubconjuntos de mesmo nmero de elementos.

    .

    A mediana em dados no-agrupados Dada uma srie de valores como, por exemplo: { 5, 2, 6, 13, 9, 15, 10 }De acordo com a definio de mediana, o primeiro passo a ser dado o da ordenao(crescente ou decrescente) dos valores: { 2, 5, 6, 9, 10, 13, 15 }

    O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9..

    Mtodo prtico para o clculo da Mediana: Se a srie dada tiver nmero mpar de termos: O valor mediano ser o termo de

    ordem dado pela frmula :

    .( n + 1 ) / 2

    Ex: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 2, 5 }

    1 - ordenar a srie { 0, 0, 1, 1, 2, 2, 3, 4, 5 }n = 9 logo (n + 1)/2 dado por (9+1) / 2 = 5, ou seja, o 5 elemento da srie ordenadaser a mediana

    A mediana ser o 5 elemento = 2.

    Se a srie dada tiver nmero par de termos: O valor mediano ser o termo de ordemdado pela frmula :....

    .[( n/2 ) +( n/2+ 1 )] / 2

    Obs: n/2 e (n/2 + 1) sero termos de ordem e devem ser substitudos pelo valorcorrespondente.

    Ex: Calcule a mediana da srie { 1, 3, 0, 0, 2, 4, 1, 3, 5, 6 }1 - ordenar a srie { 0, 0, 1, 1, 2, 3, 3, 4, 5, 6 }

    20

  • 8/4/2019 resumao estatistica

    21/33

    Resumo Estatstica Bsica

    n = 10 logo a frmula ficar: [( 10/2 ) + (10/2 + 1)] / 2[( 5 + 6)] / 2 ser na realidade (5 termo+ 6 termo) / 25 termo = 26 termo = 3

    A mediana ser = (2+3) / 2 ou seja, Md = 2,5. A mediana no exemplo ser a mdia

    aritmtica do 5 e 6 termos da srie.

    Notas: Quando o nmero de elementos da srie estatstica for mpar, haver coincidncia da

    mediana com um dos elementos da srie.

    Quando o nmero de elementos da srie estatstica for par, nunca haver coincidnciada mediana com um dos elementos da srie. A mediana ser sempre a mdiaaritmtica dos 2 elementos centrais da srie.

    Em uma srie a mediana, a mdia e a moda no tm, necessariamente, o mesmovalor.

    A mediana, depende da posio e no dos valores dos elementos na srieordenada. Essa uma da diferenas marcantes entre mediana e mdia ( que sedeixa influenciar, e muito, pelos valores extremos). Vejamos:

    Em { 5, 7, 10, 13, 15 } a mdia = 10 e a mediana = 10Em { 5, 7, 10, 13, 65 } a mdia = 20 e a mediana = 10

    isto , a mdia do segundo conjunto de valores maior do que a do primeiro, porinfluncia dos valores extremos, ao passo que a mediana permanece a mesma.

    A mediana em dados agrupados a) Sem intervalos de classe: Neste caso, o bastante identificar a freqncia acumulada

    imediatamente superior metade da soma das freqncias.A mediana ser aquele valor da varivel que corresponde atal freqncia acumulada.

    Ex.: conforme tabela abaixo:

    Varivel xi Freqncia fi Freqncia acumulada

    0 2 21 6 82 9 173 13 304 5 35

    total 35

    Quando o somatrio das freqncias for mpar o valor mediano ser o termo deordem dado pela frmula :

    .

    Como o somatrio das freqncias = 35 a frmula ficar: ( 35+1 ) / 2 = 18 termo = 3..

    21

  • 8/4/2019 resumao estatistica

    22/33

    Resumo Estatstica Bsica

    Quando o somatrio das freqncias forparo valor mediano ser o termo de ordemdado pela frmula:

    Ex: Calcule Mediana da tabela abaixo:

    Varivel xi Freqncia fi Freqncia acumulada12 1 114 2 315 1 4

    16 2 617 1 720 1 8

    total 8

    Aplicando frmula acima teremos:[(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 +16) / 2 = 15,5

    b) Com intervalos de classe: Devemos seguir os seguintes passos:

    1) Determinamos as freqncias acumuladas ;

    2) Calculamos ;

    3) Marcamos a classe correspondente freqncia acumulada imediatamente superior

    . Tal classe ser a classe mediana ;

    4) Calculamos a Mediana pela seguinte frmula:. M Md = l* + [( - FAA ) x h*]/ f*

    l* = o limite inferiorda classemediana.

    FAA = a freqncia acumulada da classe anterior classe mediana.f* = a freqncia simples da classe mediana.h* = a amplitude do intervalo da classe mediana.

    Ex:classes freqncia = fi Freqncia acumulada50 |------------ 54 4 454 |------------ 58 9 1358 |------------ 62 11 2462 |------------ 66 8 32

    66 |------------ 70 5 3770 |------------ 74 3 40total 40

    = 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62

    22

  • 8/4/2019 resumao estatistica

    23/33

    Resumo Estatstica Bsica

    l* = 58........... FAA = 13........... f* = 11........... h* = 4

    Substituindo esses valores na frmula, obtemos:

    Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54

    OBS: Esta mediana estimada, pois no temos os 40 valores da distribuio.

    Emprego da Mediana Quando desejamos obter o ponto que divide a distribuio em duas partes iguais. Quando h valores extremos que afetam de maneira acentuada a mdia aritmtica. Quando a varivel em estudo salrio.

    SEPARATRIZES

    Alm das medidas de posio que estudamos, h outras que, consideradasindividualmente, no so medidas de tendncia central, mas esto ligadas mediana relativamente sua caracterstica de separar a srie em duas partes queapresentam o mesmo nmero de valores.Essas medidas - os quartis, os decis e os percentis - so, juntamente com amediana, conhecidas pelo nome genrico de separatrizes.

    .QUARTIS - Q

    Denominamos quartis os valores de uma srie que a dividem em quatro partesiguais. Precisamos portanto de 3 quartis (Q1 , Q2 e Q3) para dividir a srie emquatro partes iguais.

    Obs: O quartil 2 ( Q2 )SEMPRE SER IGUAL A MEDIANA DA SRIE.

    Quartis em dados no agrupados O mtodo mais prtico utilizar o princpio do clculo da mediana para os 3

    quartis. Na realidade sero calculadas " 3 medianas " em uma mesma srie.

    Ex 1: Calcule os quartis da srie: { 5, 2, 6, 9, 10, 13, 15 }

    - O primeiro passo a ser dado o da ordenao (crescente ou decrescente) dosvalores: { 2, 5, 6, 9, 10, 13, 15 }- O valor que divide a srie acima em duas partes iguais igual a 9, logo a Md = 9que ser = Q2 = 9- Temos agora {2, 5, 6 } e {10, 13, 15} como sendo os dois grupos de valores iguais

    proporcionados pela mediana (quartil 2). Para o clculo do quartil 1 e 3 bastacalcular as medianas das partes iguais provenientes da verdadeira Mediana dasrie (quartil 2).

    Logo em { 2, 5, 6 } a mediana = 5. Ou seja: ser o quartil 1 = Q1 = 5em {10, 13, 15 } a mediana =13 . Ou seja: ser o quartil 3 = Q = 13

    Ex 2: Calcule os quartis da srie: { 1, 1, 2, 3, 5, 5, 6, 7, 9, 9, 10, 13 }

    23

  • 8/4/2019 resumao estatistica

    24/33

    Resumo Estatstica Bsica

    - A srie j est ordenada, ento calcularemos o Quartil 2 = Md = (5+6)/2 = 5,5-

    - O quartil 1 ser a mediana da srie esquerda de Md: { 1, 1, 2, 3, 5, 5 }Q1 = (2+3)/2 = 2,5

    - O quartil 3 ser a mediana da srie direita de Md : {6, 7, 9, 9, 10, 13 }Q3 = (9+9)/2 = 9

    Quartis para dados agrupados em classes Usamos a mesma tcnica do clculo da mediana, bastando substituir, na frmula da

    mediana,

    Efi / 2.... por ... k .Efi / 4 ... sendo k o nmero de ordem do quartil.

    Assim, temos:

    Q1 = . l* + [(Efi / 4 - FAA ) x h*] / f*

    Q2 = . l* + [(2.Efi / 4 - FAA ) x h*] / f*

    Q3 = . l* + [(3.Efi / 4 - FAA ) x h*] / f*

    Ex 3 - Calcule os quartis da tabela abaixo:

    classes freqncia = fi Freqncia acumulada50 |------------ 54 4 454 |------------ 58 9 1358 |------------ 62 11 2462 |------------ 66 8 3266 |------------ 70 5 3770 |------------ 74 3 40total 40

    - O quartil 2 = Md , logo:

    = 40 / 2 =.20........... logo.a classe mediana ser 58 |---------- 62

    l* = 58........... FAA = 13........... f* = 11........... h* = 4

    Q2 = . l* + [(2.Efi / 4 - FAA ) x h*] / f*

    - Substituindo esses valores na frmula, obtemos:

    Md = 58 + [ (20 - 13) x 4] / 11 = 58 + 28/11 = 60,54 = Q2

    - O quartil 1 : Efi / 4 = 10

    Q1 = . l* + [(Efi / 4 - FAA ) x h*] / f*

    Q1 = 54 + [ (10 - 4) x 4] / 9 = 54 + 2,66 = 56,66 = Q1.

    24

  • 8/4/2019 resumao estatistica

    25/33

    Resumo Estatstica Bsica

    - O quartil 3 : 3.Efi / 4 = 30

    Q3 = . l* + [(3.Efi / 4 - FAA ) x h*] / f*

    Q3 = 62 + [ (30 -24) x 4] / 8 = 62 + 3 = 65 = Q3

    DECIS - D

    A definio dos decis obedece ao mesmo princpio dos quartis, com a modificao daporcentagem de valores que ficam aqum e alm do decil que se pretende calcular. Afrmula bsica ser : k .E fi / 10 onde k o nmero de ordem do decil a sercalculado. Indicamos os decis : D1, D2, ... , D9. Deste modo precisamos de 9 decispara dividirmos uma srie em 10 partes iguais.

    De especial interesse o quinto decil, que divide o conjunto em duas partesiguais. Assim sendo,o QUINTO DECIL IGUAL AO SEGUNDO QUARTIL, que porsua vez IGUAL MEDIANA.

    Para D5 temos : 5.Efi / 10 = Efi / 2

    Ex: Calcule o 3 decilda tabela anterior com classes.

    k= 3 onde 3 .Efi / 10 = 3 x 40 / 10 = 12.

    Este resultado corresponde a 2 classe.

    D3 = 54 + [ (12 - 4) x 4] / 9 = 54 + 3,55 = 57,55 = D3

    PERCENTIL ou CENTIL

    Denominamos percentis ou centis como sendo os noventa e nove valores que

    separam uma srie em 100 partes iguais. Indicamos: P1, P2, ... , P99. evidente queP50 = Md ; P25 = Q1 e P75 = Q3.

    O clculo de um centil segue a mesma tcnica do clculo da mediana, porm afrmula ser : k .Efi / 100 onde k o nmero de ordem do centil a ser calculado.

    Disperso ou Variabilidade: a maior ou menor diversificao dos valores de umavarivel em torno de um valor de tendncia central ( mdiaou mediana ) tomado como ponto de comparao.

    A mdia - ainda que considerada como um nmero que tem a faculdade derepresentar uma srie de valores - no pode, por si mesma, destacar o grau dehomogeneidade ou heterogeneidade que existe entre os valores que compem oconjunto.

    Consideremos os seguintes conjuntos de valores das variveis X, Y e Z:

    25

  • 8/4/2019 resumao estatistica

    26/33

    Resumo Estatstica Bsica

    X = { 70, 70, 70, 70, 70 }Y = { 68, 69, 70 ,71 ,72 }Z = { 5, 15, 50, 120, 160 }

    -

    Observamos ento que os trs conjuntos apresentam a mesma mdiaaritmtica = 350/5 = 70

    Entretanto, fcil notar que o conjunto X mais homogneo que os conjuntosY eZ, j que todos os valores so iguais mdia. O conjunto Y, por sua vez, maishomogneo que o conjunto Z, pois h menor diversificao entre cada um de seusvalores e a mdia representativa.

    Conclumos ento que o conjunto X apresenta DISPERSO NULA e que o conjuntoY apresenta uma DISPERSO MENOR que o conjunto Z.

    26

  • 8/4/2019 resumao estatistica

    27/33

    Resumo Estatstica Bsica

    4. MEDIDAS DE DISPERSO ABSOLUTA

    AMPLITUDE TOTAL: a nica medida de disperso que no tem na mdia o pontode referncia.

    Quando os dados no esto agrupados a amplitude total a diferena entrE o maior eo menor valor observado:

    AT = X mximo - X mnimo.

    Ex: Para os valores 40, 45, 48, 62 e 70 a amplitude total ser: AT = 70 - 40 = 30Quando os dados esto agrupados sem intervalos de classe ainda temos :

    AT = X mximo - X mnimo.

    Ex:xi fi

    0 21 63 54 3

    AT = 4 - 0 = 4

    * Com intervalos de classe a AMPLITUDE TOTAL a diferena entre o limite superior daltima classe e o limite inferior da primeira classe. Ento:

    AT = L mximo - l mnimoEx:

    Classes fi4 |------------- 6 66 |------------- 8 28 |------------- 10 3

    AT = 10 - 4 = 6

    A amplitude total tem o inconveniente de s levar em conta os dois valores extremosda srie, descuidando do conjunto de valores intermedirios. Faz-se uso da amplitudetotal quando se quer determinar a amplitude da temperatura em um dia, nocontrole de qualidade ou como uma medida de clculo rpido sem muitaexatido.

    DESVIO QUARTIL: Tambm chamado de amplitude semi-interquatlica e baseada

    nos quartis.

    Smbolo: Dq e a Frmula: Dq = (Q3 - Q1) / 2

    Observaes:

    1 - O desvio quartil apresenta como vantagem o fato de ser uma medida fcil de calculare de interpretar. Alm do mais, no afetado pelos valores extremos, grandes oupequenos, sendo recomendado, por conseguinte, quando entre os dados figuremvalores extremos que no se consideram representativos.

    2- O desvio quartil dever ser usado preferencialmente quando a medida de tendnciacentral for a mediana.

    27

  • 8/4/2019 resumao estatistica

    28/33

    Resumo Estatstica Bsica

    3- Trata-se de uma medida insensvel distribuio dos itens menores que Q1, entre Q1e Q3 e maiores que Q3.

    Ex: Para os valores 40, 45, 48, 62 e 70 o desvio quartil ser:

    Q1 = (45+40)/2 = 42,5 Q3 = (70+62)/2 = 66 Dq = (66 - 42,5) / 2 = 11,75

    DESVIO MDIO ABSOLUTO - Dm

    Para dados brutos: a mdia aritmtica dos valores absolutos dos desviostomados em relao a uma das seguintes medidas de tendnciacentral: mdia ou mediana.

    para a Mdia = Dm = E| Xi - | / n

    para a Mediana = Dm = E| Xi - Md | / n

    As barras verticais indicam que so tomados os valores absolutos, prescindindo dosinal dos desvios.

    Ex: Calcular o desvio mdio do conjunto de nmeros { - 4 , - 3 , - 2 , 3 , 5 }

    = - 0, 2 e Md = - 2

    Tabela auxiliar para clculo do desvio mdio

    Xi Xi - | Xi - | Xi - Md | Xi - Md |

    - 4 (- 4) - (-0,2) = -3,8 3,8 (- 4) - (-2) = - 2 2

    - 3 (- 3) - (-0,2) = -2,8 2,8 (- 3) - (-2) = - 1 1- 2 (- 2) - (-0,2) = -1,8 1,8 (- 2) - (-2) = 0 03 3 - (-0,2) = 3,2 3,2 3 - (-2) = 5 55 5 - (-0,2) = 5,2 5,2 5 - (-2) = 7 7

    E= 16,8 E= 15

    Pela Mdia : Dm = 16,8 / 5 = 3,36 Pela Mediana : Dm = 15 / 5 = 3

    DESVIO PADRO - S

    28

  • 8/4/2019 resumao estatistica

    29/33

    Resumo Estatstica Bsica

    a medida de disperso mais geralmente empregada, pois leva em consideraoa totalidade dos valores da varivel em estudo. um indicador de variabilidadebastante estvel. O desvio padro baseia-se nos desvios em torno da mdiaaritmtica e a sua frmula bsica pode ser traduzida como : a raiz quadrada damdia aritmtica dos quadrados dos desvios e representada por S .

    A frmula acima empregada quando tratamos de uma populao de dados no-agrupados.

    Ex: Calcular o desvio padro da populao representada por - 4 , -3 , -2 , 3 , 5

    Xi

    - 4 - 0,2 - 3,8 14,44- 3 - 0,2 - 2,8 7,84- 2 - 0,2 - 1,8 3,243 - 0,2 3,2 10,245 - 0,2 5,2 27,04

    E = 62,8

    Sabemos que n = 5 e 62,8 / 5 = 12,56.

    A raiz quadrada de 12,56 o desvio padro = 3,54

    Obs: Quando nosso interesse no se restringe descrio dos dados mas, partindo daamostra, visamos tirar inferncias vlidas para a respectiva populao, convmefetuar uma modificao, que consiste em usar o divisor n - 1 em lugar de n. Afrmula ficar ento:

    Se os dados - 4 , -3 , -2 , 3 , 5 representassem uma amostra o desvio padro

    amostral seria a raiz quadrada de 62,8 / (5 -1) = 3,96 O desvio padro goza de algumas propriedades, dentre as quais destacamos:

    1 = Somando-se (ou subtraindo-se) uma constante a todos os valores de uma varivel, odesvio padro no se altera.

    2 = Multiplicando-se (ou dividindo-se) todos os valores de uma varivel por uma constante(diferente de zero), o desvio padro fica multiplicado ( ou dividido) por essa constante.

    Quando os dados esto agrupados (temos a presena de freqncias) a frmula dodesvio padro ficar :

    29

  • 8/4/2019 resumao estatistica

    30/33

    Resumo Estatstica Bsica

    ou quando se trata de uma amostra

    Ex: Calcule o desvio padro populacional da tabela abaixo:

    Xi f i Xi . f i . f i

    0 2 0 2,1 -2,1 4,41 8,821 6 6 2,1 -1,1 1,21 7,262 12 24 2,1 -0,1 0,01 0,123 7 21 2,1 0,9 0,81 5,67

    4 3 12 2,1 1,9 3,61 10,83

    Total 30 63 E = 32,70

    - Sabemos que E fi = 30 e 32,7 / 30 = 1,09.

    - A raiz quadrada de 1,09 o desvio padro = 1,044- Se considerarmos os dados como sendo de uma amostra o desvio padro seria :a raiz quadrada de 32,7 / (30 -1) = 1,062

    Obs: Nas tabelas de freqncias com intervalos de classe a frmula a ser utilizada a mesma do exemplo anterior.

    VARINCIA - S2

    o desvio padro elevado ao quadrado. A varincia uma medida que tem poucautilidade como estatstica descritiva, porm extremamente importante na infernciaestatstica e em combinaes de amostras.

    MEDIDAS DE DISPERSO RELATIVA

    Coeficiente de Variao de Pearson - CVP

    Na estatstica descritiva o desvio padro por si s tem grandes limitaes. Assim, umdesvio padro de 2 unidades pode ser considerado pequeno para uma srie devalores cujo valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo nopode ser dito.

    Alm disso, o fato de o desvio padro ser expresso na mesma unidade dos dadoslimita o seu emprego quando desejamos comparar duas ou mais sries de valores,relativamente sua disperso ou variabilidade, quando expressas em unidadesdiferentes.

    Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ouvariabilidade dos dados em termos relativos a seu valor mdio, medida essa

    30

  • 8/4/2019 resumao estatistica

    31/33

    Resumo Estatstica Bsica

    denominada de CVP: Coeficiente de Variao de Pearson ( A RAZO ENTRE ODESVIO PADRO E A MDIA REFERENTES A DADOS DE UMA MESMA SRIE).

    CVP = (S / ) x 100

    o resultado neste caso expresso em percentual, entretanto pode serexpresso tambm atravs de um fator decimal, desprezando assim ovalor 100 da frmula.

    Ex: Tomemos os resultados das estaturas e dos pesos de um mesmo grupo deindivduos:

    Discriminao M D I A DESVIO PADROESTATURAS 175 cm 5,0 cm

    PESOS 68 kg 2,0 kg

    - Qual das medidas (Estatura ou Peso) possui maior homogeneidade ?

    Resposta: Teremos que calcular o CVP da Estatura e o CVP do Peso. O resultadomenorser o de maior homogeneidade ( menor disperso ou variabilidade).

    CVP estatura = ( 5 / 175 ) x 100 = 2,85 %CVP peso = ( 2 / 68 ) x 100 = 2,94 %.

    Logo, nesse grupo de indivduos, as estaturas apresentam menor grau de dispersoque os pesos.

    Coeficiente de Variao de Thorndike - CVT

    igual ao quociente entre o desvio padro e a mediana.

    CVT = ( S / Md )x 100 %

    Coeficiente Quartlico de Variao - CVQ

    Esse coeficiente definido pela seguinte expresso:

    CVQ = [(Q3 - Q1) / (Q3 + Q1)] x 100 %.

    Desvio quartil Reduzido Dqr

    Dqr = [(Q3 - Q1) / 2Md ] x 100 %.

    5. MEDIDAS DE ASSIMETRIA

    31

  • 8/4/2019 resumao estatistica

    32/33

    Resumo Estatstica Bsica

    Introduo:

    Uma distribuio com classes simtrica quando :

    Mdia = Mediana = Moda Uma distribuio com classes :

    Assimtrica esquerda ou negativa quando : Mdia < Mediana < Moda

    Assimtrica direita ou positiva quando : Mdia > Mediana > Moda

    Coeficiente de assimetria: A medida anterior, por ser absoluta, apresenta a mesmadeficincia do desvio padro, isto , no permite a

    possibilidade de comparao entre as medidas de duasdistribuies. Por esse motivo, daremos preferncia aocoeficiente de assimetria de Person:

    As = 3 ( Mdia - Mediana ) / Desvio Padro

    Escalas de assimetria:

    | AS | < 0,15 assimetria pequena

    0,15 < | AS | < 1 assimetria moderada

    | AS | > 1 assimetria elevada

    Obs: Suponhamos AS = - 0,49 a assimetria considerada moderada enegativa

    Suponhamos AS = 0,75 a assimetria considerada moderada epositiva

    MEDIDAS DE CURTOSEIntroduo:

    Denominamos CURTOSE o grau de achatamento de uma distribuio em relao auma distribuio padro, denominada curva normal (curva correspondente a umadistribuio terica de probabilidade).

    Quando a distribuio apresenta uma curva de freqncia mais fechada que anormal (ou mais aguda ou afilada em sua parte superior), ela recebe o nome deleptocrtica.

    Quando a distribuio apresenta uma curva de freqncia mais aberta que anormal (ou mais achatada em sua parte superior), ela recebe o nome de platicrtica.

    A curva normal, que a nossa base referencial, recebe o nome de mesocrtica.

    32

  • 8/4/2019 resumao estatistica

    33/33

    Resumo Estatstica Bsica

    Coeficiente de curtose

    C1 = (Q3 - Q1) / 2(P90 - P10)

    Este coeficiente conhecido como percentlico de curtose.

    Relativamente a curva normal, temos:

    C1 = 0,263 curva mesocrticaC1 < 0,263 curva leptocrticaC1 > 0,263 curva platicrtica

    O coeficiente abaixo ( C2 )ser utilizado em nossas anlises:

    onde S desvio padro

    C2 = 3 curva mesocrticaC2 > 3 curva leptocrticaC2 < 3 curva platicrtica

    FIM

    Agradecimento: Este resumo s foi possvel graas a garimpagem realizada na WEB,mais especificamente na pagina do Prof. Paulo Cezar Ribeiro da Silva,ao qual eu externo meus agradecimentos.