Statistiques descriprtives-cours et exercices

247

description

On dit souvent que l’on peut faire dire ce qu’on veut aux statistiques ! C’est bien connu,entre le verre à moitié plein et le verre à moitié vide la différence d’interprétation nousinterpelle, mais avant de pouvoir interpréter un ensemble de données, il est indispensable desavoir comment représenter, dans un tableau ou par un graphique, une série statistique,comment en faire les premiers traitements et surtout comment présenter les résultats de cescalculs.Ce sont là, les objectifs de ce livre !Le présent livre est un livre de cours.La méthode adoptée peut se résumer dans les deux points suivants :- Chaque chapitre est traité d’une façon exhaustive pour englober tous les concepts ettoutes les démonstrations des formules statistiques.Il renferme, en plus, un ensemble d’exemples d’application avec solutions et surtout lesméthodes de résolution.- A la fin de chaque chapitre, le lecteur trouvera, ensuite un ensemble d’exercicesd’application qui lui permettra de s’entraîner à résoudre des problèmes classiques destatistique.

Transcript of Statistiques descriprtives-cours et exercices

  • Mohamed DIOURIDocteur Ingnieur

    Prsident Fondateur de lIGA

    Adil ELMARHOUMDocteur en statistique et informatique applique

    Professeur Habilit Universit Mohamed V Agdal

    STATISTIQUE DESCRIPTIVECours et exercices

  • Collection Sciences Techniques et Managements des ditions TOUBKALPublications du Centre de Recherche en Mathmatiques (CRM) de lIGA

    STATISTIQUE DESCRIPTIVECours et exercices

    Tous les droits sont rservsDpt lgal N2006/2774

    I.S.S.N. 9954 496 03 3

    Les livres de la collection Sciences Techniques et Managementsont co-dits par les ditions TOUBKAL et lInstitut suprieur du Gnie Appliqu, IGA.

  • 3

  • A la mmoire de MyriamM D

    A mes chers enfants Zineb et AdamA.E

  • LIMINAIRE

    On dit souvent que lon peut faire dire ce quon veut aux statistiques ! Cest bien connu,entre le verre moiti plein et le verre moiti vide la diffrence dinterprtation nousinterpelle, mais avant de pouvoir interprter un ensemble de donnes, il est indispensable desavoir comment reprsenter, dans un tableau ou par un graphique, une srie statistique,comment en faire les premiers traitements et surtout comment prsenter les rsultats de cescalculs.

    Ce sont l, les objectifs de ce livre !

    Le prsent livre est un livre de cours.

    La mthode adopte peut se rsumer dans les deux points suivants :

    - Chaque chapitre est trait dune faon exhaustive pour englober tous les concepts ettoutes les dmonstrations des formules statistiques.Il renferme, en plus, un ensemble dexemples dapplication avec solutions et surtout lesmthodes de rsolution.

    - A la fin de chaque chapitre, le lecteur trouvera, ensuite un ensemble dexercicesdapplication qui lui permettra de sentraner rsoudre des problmes classiques destatistique.

    Signalons, cet effet, que pour toutes les solutions proposes pour les exemples, nous avonsutilis lordinateur avec des logiciels de graphisme et de gestionnaires de tableaux et nousencourageons vivement autant les tudiants que les professeurs den faire de mme pour toutproblme de statistique.

    Cette utilisation de lordinateur nous amne avertir nos lecteurs que les rsultats descalculs donns dans les tableaux et ailleurs diffreront de ceux quon pourrait obtenir grce une calculette pour la simple raison que la puissance de prcision dun ordinateur ne peutjamais tre gale par une calculette.

  • Ce livre est ainsi destin aux tudiants qui dsirent acqurir une certaine adresse larsolution de problmes de statistique descriptive et aux professeurs qui recherchent unensemble dexercices didactiques de statistique descriptive proposer la rflexion de leurstudiants.

    Les auteurs

    Casablanca, octobre 2006.

  • SOMMAIRE

    INTRODUCTION 9PARTIE 1- STATISTIQUE DESCRIPTIVE A UNE SEULE VARIABLE 13

    CH. 1. TABLEAUX ET GRAPHIQUES 151.1. Tableaux statistiques 151.2. Reprsentations graphiques 281.3. Exercices dapplication 37

    CH. 2. CARACTERISTIQUES DE TENDANCE CENTRALE 432.1. Les moyennes 432.2. Le mode 612.3. La mdiane 632.4. La mdiale 662.5. Les fractiles 692.6. Exercices dapplication 73

    CH. 3. CARACTERISTIQUES DE DISPERSION 783.1. Ecart absolu moyen 783.2. Variance 823.3. Ecart type 863.4. Coefficient de variation 873.5. Indice de concentration 933.6. Exercices dapplication 104

    PARTIE 2 - STATISTIQUE DESCRIPTIVE A DEUX VARIABLES 111CH. 4. REGRESSION ET CORRELATION 113

    4.1. Introduction 1134.2. Rgression simple 1134.3. Qualit de lajustement 1304.4. Calcul des prvisions 1374.5. Rgression non linaire simple 1384.6. Rgression multiple 1424.7. Exercices dapplication 153

  • CH. 5. LES SERIES CHRONOLOGIQUES 1635.1. Dfinition 1635.2. Reprsentation graphique 1645.3. Les principaux mouvements des sries chronologiques 1665.4. Les schmas de composition 1675.5. Les mthodes de lissage 1695.6. Etude du trend 1785.7. Etude de la composante saisonnire 1835.8. Exercices dapplication 195

    CH. 6. INDICES STATISTIQUES 2056.1. Les indices lmentaires 2056.2. Les indices synthtiques 2116.3. Les indices synthtiques pondrs 2166.4. Les principaux indices synthtiques 2176.5. Lindice des prix la consommation 2206.6. Indices boursiers 2336.7. Exercices dapplication 234

    BIBLIOGRAPHIE 246

  • Statistique descriptive Introduction

    9

    INTRODUCTION

    HISTORIQUE.

    Lactivit qui consiste recueillir des donnes permettant de connatre la situation des tatsremonte la plus haute antiquit. On cite, dune part, lempereur chinois Yao, organisant lerecensement des productions agricoles en 2238 avant J.-C., et, dautre part, linstitution desrecensements de la population chez les gyptiens, en 1700 avant J.-C.

    Au dbut du XVIe sicle, on commena tenir en Angleterre un registre des dcs et desnaissances. En France, les intendants Sully, Colbert et Vauban commandrent de nombreuxinventaires et enqutes. En 1662, l'Anglais John Graunt constata une certaine constance dans lerapport du nombre de naissances fminines celui des naissances masculines.

    On attribue la cration du terme statistique un professeur allemand Gttingen,G. Achenwall (1719-1772), qui aurait en 1746 cr le mot Statistik, driv de la notionStaatskunde.

    Mais c'est seulement au XIXe sicle qu'on dcouvrit que la thorie des probabilits pouvaitconstituer une aide prcieuse la mthode statistique. Ce rapprochement, dj peru par lemathmaticien Laplace, fut l'uvre d'Adolphe Qutelet (1796-1874), statisticien belge qui fut l'initiative du premier congrs international de statistiques en 1853. Ds lors, la statistique sedveloppa dans la plupart des sciences.

    Lapparition dune relle mthodologie statistique a t initie par des statisticiens anglaisautour de 1900. Cest--dire une thorie bien formalise du raisonnement qui permet, partirdes donnes observes, de tirer des conclusions sur les lois de probabilit des phnomnes.Cest la statistique mathmatique, qui sest dveloppe entre 1900 et 1950 et dont les succsont impos, au cours de cette priode, une interprtation particulire du concept de probabilit.

  • Statistique descriptive Introduction

    10

    partir des annes cinquante, lapparition de calculateurs puissants a donn naissance auxmthodes danalyse des donnes multidimensionnelles, qui ont connu une grande vogue,parfaitement justifie par leur efficacit. Ces mthodes permettent de dcrire, de classer et desimplifier des donnes, les rsultats auxquels elles conduisent peuvent suggrer des lois, desmodles ou des explications des phnomnes.

    Aujourd'hui, les statistiques sont considres comme des outils fiables qui peuvent fournirune reprsentation exacte des valeurs de donnes conomiques, politiques, sociales,psychologiques, biologiques ou physiques. Elles permettent de mettre en corrlation de tellesdonnes et de les analyser. Le travail du statisticien ne se limite plus recueillir des donnes et les prsenter sous forme de tableaux, mais il consiste principalement interprterl'information.

    DEFINITION.

    Statistique, une discipline qui a pour objet la collecte, le traitement et l'analyse de donnesnumriques relatives un ensemble d'individus ou d'lments. Elle constitue un outil prcieuxpour l'exprimentation, la gestion des entreprises ou encore l'aide la dcision.

    Une tude statistique se dcompose en quatre tapes : la dfinition et la collecte desdonnes, leur prsentation en tableaux, leur analyse et enfin la comparaison des rsultats avecdes lois statistiques connues.

    1 - Dfinition et collecte des donnes

    La matire premire des mthodes statistiques est constitue d'ensembles de nombres,obtenus en comptant ou en mesurant des lments. Il est donc indispensable, lors de la collectede donnes statistiques, de s'assurer de l'exhaustivit et de la fiabilit des informationsrecueillies.

    Avant la collecte des donnes, on commence par dfinir la nature et la quantit des donnes recueillir. Cette collecte s'effectue par recensement ou par sondage. Les donnes recueilliespeuvent faire l'objet d'une vrification partielle par mesure de scurit.

    2 - Reprsentation des donnes

    Les donnes recueillies sont classes et ranges dans des tableaux de faon permettre uneanalyse et une interprtation directes. Ensuite, On peut reprsenter graphiquement les donnesdu tableau.

  • Statistique descriptive Introduction

    11

    3 - Analyse des donnes

    Une fois les donnes recueillies et prsentes sous forme de tableaux, le travail d'analysecommence par le calcul d'un paramtre statistique qui puisse rsumer lui seul l'ensemble desdonnes. On distingue trois types de paramtres statistiques :

    - Tendance centrale : elle sert caractriser l'ordre de grandeur des observations ;- Dispersion : elle sert savoir si les mesures sont troitement regroupes autour de la

    moyenne ou si elles sont disperses ;- Corrlation : elle sert tudier la relation qui peut exister entre deux phnomnes.

    4 - Comparaison des rsultats avec des lois statistiques

    Les statisticiens se sont aperus que de nombreux ensembles de mesures avaient le mmetype de distribution. Ils ont donc t amens concevoir des modles mathmatiques qui soientle reflet des lois statistiques souvent rencontres. La comparaison des rsultats avec ces loisstatistiques permet de donner une explication du phnomne observ et en vrifier le bienfond.

    Dans le prsent ouvrage, nous nous proposons de montrer comment reprsenter les donnesrecueillies et comment en faire le traitement en exposant successivement les mthodes de calculdes 3 paramtres statistiques que sont les paramtres de tendance centrale, ceux de dispersion etceux de corrlation.

    Les mthodes de collecte de donne et celles de la comparaison des rsultats de leurstraitements avec des lois statistiques feront lobjet dun autre ouvrage.

  • Statistique descriptive Introduction

    12

  • Statistique descriptive Partie 1 : statistique descriptive une variable

    13

    PARTIE 1STATISTIQUE DESCRIPTIVE A UNE VARIABLE

    La statistique descriptive une variable est lensemble des mthodes qui permet dobtenir etde faire un 1er traitement des informations relatives un caractre particulier dindividus dunepopulation donne.

    La statistique descriptive a plusieurs objectifs :

    - recueillir lensemble des donnes relatives un caractre particulier dindividus dunepopulation donne ;

    - classer lensemble de ces donnes selon des sries statistiques afin de permettre denfaire :

    * des reprsentations graphiques pour en visualiser lallure ;* des traitements mathmatiques pour en dterminer certaines caractristiques.

    Dans cette partie, nous axerons notre propos, dabord sur la dfinition des diffrentsconcepts que nous venons dintroduire, ensuite sur les premiers traitements mathmatiques envue de la dtermination de certaines caractristiques.

  • Statistique descriptive Partie 1 : statistique descriptive une variable

    14

  • Statistique descriptive 1. Tableaux et graphiques

    15

    CHAPITRE 1TABLEAUX ET GRAPHIQUES

    1.1. TABLEAUX STATISTIQUES.

    Nous donnons dans ce qui suit la dfinition des principaux concepts de la statistique.

    Population : ensemble dlments ou dindividus ayant un caractre commun tudier.

    Exemples 1 : Ensemble des tudiants dune cole ; Ensemble des habitants dune ville ; Ensemble des livres dune bibliothque ; Ensemble de la production dune entreprise pendant un an ; Etc.

    Echantillon : partie de la population. Du fait de la taille importante de la population et delimpossibilit den faire ltude exhaustive, on se contente, le plus souvent, dtudier lecaractre daprs un chantillon.

    Lchantillon doit tre choisi de faon quil soit reprsentatif, pour ce faire il existe desmthodes de tri en vue de la constitution dchantillon. Elles font lobjet dtudes spcifiques.

    Exemples 2 : Lensemble des tudiants dune salle de classe dune cole ; Lensemble dun millier dhabitants choisi parmi tous les habitants dune ville ; Lensemble dune centaine de livre tri parmi tous les livres dune bibliothque ; La production dune entreprise pendant quelques jours ; Etc.

    Individu : lment de base constituant la population ou lchantillon, on dit aussi, unitstatistique.

    Exemples 3 :

  • Statistique descriptive 1. Tableaux et graphiques

    16

    Ltudiant dune cole ; Lhabitant dune ville ; Le livre dune bibliothque ; lunit produite par une entreprise ; Etc.

    Effectif : nombre dindividus observs constituant lchantillon, il est not n.

    Exemples 4 : n = 30 sil y a 30 tudiants dans lchantillon ; n = 2000 sil y a 2000 habitants dans lchantillon ; n = 125 sil y a 125 livres dans lchantillon ; n = 15 000 sil y a 15 000 units produites constituant lchantillon ; etc.

    Caractre : Aspect particulier commun tous les individus de la population et donc delchantillon. Le caractre peut tre qualitatif ou quantitatif et dans ce cas il peut tre discret oucontinu.

    Exemples 5 : Notes des tudiants dune cole ; Situations familiales des habitants dune ville ; Thmes des livres dune bibliothque ; Poids des units produites par une entreprise ; Etc.

    Modalits : Ce sont les diffrentes possibilits que peut prendre le caractre, par exemplefminin ou masculin si le caractre est le sexe et 1,50 m ou 1,70 m si le caractre est la taille,etc.

    Caractre qualitatif : Un caractre est dit qualitatif quand il ne peut pas tre mesur.

    Exemples 6 : Le tableau ci-dessous liste quelques exemples de caractres qualitatifs et demodalits :

    Caractres Modalits GenresCouleur Rose, rouge, blanc, bleu, QualitatifNationalit Marocain, Franais, Suisse, QualitatifSituation matrimoniale Mari, clibataire, veuf, divorc, QualitatifDisponibilit Oui, non. Qualitatif

  • Statistique descriptive 1. Tableaux et graphiques

    17

    Pour chaque modalit i du caractre tudier, on dtermine, pour lchantillon considr,de taille n :

    ni : effectif dindividus chez qui a t observe la modalit i.

    fi = ni / n : frquence relative de la modalit i.

    Avec 1k

    1i ifetn

    k

    1i in

    Exemples 7 : Dans un chantillon de 2000 habitants dune ville, en relve que 900personnes sont maries, on a ainsi, pour la modalit habitants maris :

    ni = 900 et fi = 900/2000 = 45 % ;

    - Dans une bibliothque constitue de 5000 livres on relve que 120 livres ont pour thmeles mathmatiques, on a ainsi pour la modalit livres de mathmatiques :

    ni = 120 et fi = 120/5000 = 2,4 %

    - On considre lensemble des touristes qui visitent le Maroc pendant une priode donne eton considre comme caractre la nationalit. Si lon relve quil y a 300 Franais parmi unensemble de 900 touristes on a pour la modalit nationalit franaise :

    ni = 300 et fi = 300/900 = 33,33 %

    Caractre quantitatif : Un caractre est dit quantitatif quand il peut tre mesur. Il peutalors tre continu ou discret :

    - il est discret dans le cas doprations de dnombrement ou de comptage ;- il est continu dans le cas doprations de mesures.

    Exemples 8 : Le tableau ci-dessous donne quelques exemples de caractres quantitatifs etde modalits.

    Caractres Modalits GenresPoids 60,5 Kg; 59,2 Kg; 65,3 Kg; ContinuAnciennet en entreprise 10 ans et 2 mois ; 9ans ; ContinuVolume 1 m3 ; 2,3 m3 ; 3 m3 ; ContinuLongueur 1 m ; 2,75 km ; 350 dm ; ContinuNotation 10/20 ; 9,5/10 ; ContinuAnnes dtudes 2 ans ; 3 ans ; 6 ans ; DiscretNombre de frres et surs 1 ; 2 ; 3 ; DiscretNombre denfants 0 ; 1 ; 2 ; Discret

  • Statistique descriptive 1. Tableaux et graphiques

    18

    On dtermine pour chaque caractre quantitatif :

    Si le caractre est discret : xi la valeur de la modalit ;

    ni : effectif dindividus chez qui, la modalit i, a t observe.

    fi = ni / n : frquence relative de la modalit i.

    Fi :

    ij

    1jjf frquence relative cumule croissante.

    F(x) : Fonction de rpartition, proportion dindividus ayant des modalits du caractretudi infrieures ou gales x.

    Exemple 9 : On considre le poids des habitants dune ville comme caractre, on a, pour unchantillon, la distribution suivante :

    Poidsxi

    Effectifs concernsni

    Frquences relativesfi

    Frquences relativescumules Fi

    65Kg 54 21.86% 21.86%70Kg 132 53.44% 75.30%75Kg 27 10.93% 86.23%80Kg 34 13.77% 100.00%Total 247 100% -

    Unit statistique : habitant de la ville ;Population : lensemble des habitants de la ville ;Caractre tudi : le poids ;Type de caractre : variable statistique discrte. (dans le cas de lexemple).

    La fonction de rpartition F(x) se dfinit comme suit :Pour x 65 Kg, on a : F(x) = 21,86% ou 21,86 % de lchantillon ont un poids infrieur ou

    gal 65 Kg.Pour x 70 Kg, on a : F(x) = 75.30% ou 75,30 % de lchantillon ont un poids infrieur ou

    gal 70 Kg.Pour x 75 Kg, on a : F(x) = 86.23% ou 86,23 % de lchantillon psent au plus 75 Kg.Pour x 80 Kg, on a : F(x) = 100.00 % ou la totalit de lchantillon a un poids infrieur ou

    gal 80 Kg.

    Exemple 10 : une enqute auprs de 1000 commerants portant sur le nombre de leursemploys, a donn les rsultats suivants :

  • Statistique descriptive 1. Tableaux et graphiques

    19

    xi ni fi

    Frquenceabsoluecumule

    croissante

    Frquenceabsoluecumule

    dcroissante

    Frquencerelativecumule

    croissante

    Frquencerelativecumule

    dcroissante01234567

    5010020015012016013090

    5 %10 %20 %15 %12 %16 %13 %9 %

    50150350500620780910

    1000

    100095085065050038022090

    5 %15 %35 %50 %62 %78 %91 %

    100 %

    100 %95 %85 %65 %50 %38 %22 %9 %

    Total 1000 100 % - - - -

    Unit statistique : Un commerant ;Population : lensemble des 1000 commerants ;Caractre tudi : Nombre demploys ;Type de caractre : Variable statistique discrte.

    Le nombre de commerants n'employant aucun employ est 50, ce qui reprsente 5 % descommerants.

    Les frquences absolues ou relatives cumules croissantes sont calcules en cumulant lesfrquences absolues ou relatives du haut du tableau vers le bas. Elles permettent de rpondreaux questions du genre : quel est le nombre ou la proportion au plus ?

    Par contre, les frquences absolues ou relatives cumules dcroissantes sont calcules encumulant les frquences absolues ou relatives du bas du tableau vers le haut. Elles permettentde rpondre aux questions du genre : quel est le nombre ou la proportion au moins (auminimum ou plus de) ?

    Le nombre de commerants employant au plus 5 employs (au maximum 5 employs oumoins de 6 employs) est 780, ils reprsentent 78 % des commerants.

    Le nombre de commerants employant au moins 3 employs (au minimum 3 employs ouplus de 2 employs) est 650, ils reprsentent 65% des commerants.

  • Statistique descriptive 1. Tableaux et graphiques

    20

    Si le caractre est continu : [Ci ; Ci+1[ est lintervalle ou classe des modalits avec : Ci et Ci+1 les bornes de la classe ; ci : centre de la classe ; ai : amplitude de la classe ; di : densit de la classe. ni : effectif de la classe i, nombre dindividus dont la modalit du caractre est

    comprise entre Ci et Ci+1.

    ci = 2CC i1i

    , ai = Ci+1 Ci et di = ni/ai

    De la mme manire que dans le cas discret, on dfinit :

    fi = ni / n : frquence relative de la modalit i.

    Fi :

    ij

    1jjf frquence relative cumule croissante.

    Exemple 11 : On considre la taille comme caractre, on a pour un chantillon de 169personnes, la distribution suivante :

    Tailles (en m)Ci ; Ci+1

    ci(en m)

    Effectifsconcerns

    ni

    Frquencesrelatives

    fi

    Frquencesrelatives cumules

    Fi[1,50 ; 1,60[ 1.55 35 20,71 % 20,71 %[1,60 ; 1,70[ 1.65 42 24,85 % 45,56 %[1,70 ; 1,80[ 1.75 53 31,36 % 76,92 %[1,80 ; 1,90[ 1.85 39 23,08 % 100 %

    Total - 169 100 % -

    Parmi les 169 personnes, 35 mesurent entre 1,50 m et moins de 1,60 m, ce qui reprsente20,71 % de lensemble de lchantillon.

    76,92 % de lchantillon mesurent moins de 1,80 m.

    Le fait de remplacer la classe Ci ; Ci+1 par ci permet de faire des calculs car on ne sait pasfaire des calculs sur des intervalles.

    Srie statistique : Une srie statistique est lensemble constitu des xi et ni. On parle ausside distribution statistique une seule variable, comme par exemple :

    Tailles et effectifs ; Situations matrimoniales et effectifs ; Ages et effectifs. Etc.

  • Statistique descriptive 1. Tableaux et graphiques

    21

    Question 1 : Comment passer dune srie statistique relative un caractre discret oucontinu donne sous forme dune suite de classes [Ci ; Ci+1[et deffectifs ni de ces classes unesrie statistique sous forme dune suite de valeurs xi et deffectifs ni relatifs ces valeurs ?

    On doit considrer 2 cas possibles :

    1 cas : Classes amplitudes gales.

    Il suffit, dans ce cas, de remplacer chaque classe [Ci ; Ci+1[ par son lment central ci = ( Ci+ Ci+1 ) / 2 auquel il faut affecter leffectif ni.

    Exemple 12 : On considre la srie statistique relative aux poids dun chantillon de 120habitants dune ville, elle se prsente comme lindique le tableau suivant :

    Poids (kg)Ci ; Ci+1

    Effectifsni

    [55 ; 60[ 5[60 ; 65[ 14[65 ; 70[ 20[70 ; 75[ 40[75 ; 80[ 18[80 ; 85[ 15[85 ; 90[ 8

    Total 120

    Unit statistique : Habitant dune ville ;Population : Lensemble des habitants dune ville ;Caractre tudi : Le poids de lhabitant ;Type de caractre : Variable statistique continue.

    On remplace chaque classe par le centre de cette classe, on obtient alors la srie quivalentesuivante :

    Poids (kg)ci

    Effectifsni

    Frquence relativefi

    57,5 5 4.17%62,5 14 11.67%67,5 20 16.67%72,5 40 33.33%77,5 18 15.00%82,5 15 12.50%87,5 8 6.67%

    Total 120 100%

  • Statistique descriptive 1. Tableaux et graphiques

    22

    Exemple 13 : On considre la srie statistique relative aux notes obtenues dans une matire,par les tudiants dune classe dcole :

    NotesCi ; Ci+1

    Effectifsni

    6 ; 8 28 ; 10 610 ; 12 1212 ; 14 714 ; 16 3

    Total 30

    Unit statistique : Un tudiant ;Population : Lensemble des tudiants dune classe dcoleCaractre : Note dtudiantType de caractre : Variable statistique continue

    On remplace chaque classe par le centre de cette classe, on obtient alors la srie quivalentesuivante :

    Notesci

    Effectifsxi

    Frquences relativesfi

    7 2 6.67%9 6 20%

    11 12 40%13 7 23.33%15 3 10%

    Total 30 100%

    2 cas : Classes amplitudes diffrentes.

    Il suffit, dans ce cas :- de considrer les amplitudes des diffrentes classes ;- de calculer leur Plus Grand Commun Diviseur (PGCD) ;- de diviser chaque classe par le PGCD pour obtenir plusieurs sous classes qui

    deviennent de nouvelles classes ;- Daffecter chaque nouvelle classe, le quotient de leffectif de la classe mre par le

    nombre de sous classes.

    Remarquons que cette mthode repose sur lhypothse simple suivante qui consiste admettre que les effectifs se rpartissent de faon rgulire dans une classe.

  • Statistique descriptive 1. Tableaux et graphiques

    23

    Exemple 14 : Reprenons lexemple 13 et considrons la srie statistique relative aux notesobtenues dans une autre matire, par les tudiants dune classe dcole :

    NotesCi ; Ci+1

    Effectifsni

    [0 ; 6[ 66 ; 8 48 ; 14 1214 ; 18 4

    Unit statistique : Un tudiant ;Population : Lensemble des tudiants dune classe dcoleCaractre : Note dtudiantType de caractre : Variable statistique continue

    Dans cette srie, les amplitudes des diffrentes classes sont : 6 ; 2 ; 6 ; 4. Leur PGCD est 2.On remplace chaque classe par plusieurs autres classes et on obtient alors la srie quivalentesuivante :

    NotesCi ; Ci+1

    Effectifsni

    [0 ; 2[ 2[2 ; 4[ 2[4 ; 6[ 26 ; 8 48 ; 10 410 ; 12 412 ; 14 4[14 ; 16 216 ; 18[ 2

  • Statistique descriptive 1. Tableaux et graphiques

    24

    On remplace, aprs cette opration, chaque classe par le centre de cette classe, on obtientalors la srie quivalente suivante :

    NotesCi ; Ci+1

    ciEffectifs

    ni[0 ; 2[ 1 2[2 ; 4[ 3 2[4 ; 6[ 5 26 ; 8 7 48 ; 10 9 410 ; 12 11 412 ; 14 13 4[14 ; 16 15 216 ; 18[ 17 2

    Remarque : Ainsi on peut considrer que toute srie statistique est donne, selon lesbesoins du traitement numrique :

    - Soit sous forme dune suite de classes [Ci ; Ci+1[et deffectifs ni.- Soit sous forme dune suite de valeurs xi et deffectifs ni

    Question 2 : Comment passer dune srie statistique relative un caractre discret oucontinu donne sous forme dune suite de valeurs xi une srie donne sous forme dune suitede classes [Ci , Ci+1[ et deffectifs ni par classe ?

    Pour ce faire, on utilise la rgle de STURGES donnant le nombre k de classes en fonctiondu nombre n des donnes :

    k = 1 + 3,322 log10 n

    Ce calcul donne un nombre rel, on prend alors pour k le nombre entier trs proche dursultat de calcul de la formule prcdente.

    Et tant ltendue E de toute la srie statistique, on dtermine e, tendue de chaque classe :

    e = E / k avec E = xmax - xmin

    xmax et xmin tant la valeur maximale et la valeur minimale prises par le caractre, lesdiffrentes classes seront alors :

    La borne infrieure de la premire classe C1 est gale xmin ou une valeur lgrementinfrieure xmin.

  • Statistique descriptive 1. Tableaux et graphiques

    25

    C1 ; C1+e C1+e ; C1+2e C1+2e ; C1+3e C1+(k-1)e ; C1+ke

    Exemple 15 : En prenant la taille comme caractre des habitants dune ville on a lesrsultats relatifs un chantillon de 169 habitants :

    Tailles (en m)xi

    Effectifs concernsni

    1.45 51.55 301.65 421.75 531.85 39

    Total 169

    Unit statistique : Habitants dune ville;Population : Lensemble des habitants de la villeCaractre : La taille de lhabitantType de caractre : Variable statistique continue

    On applique la mthode de STURGES avec les conditions :

    N = 169 E = 1,85 1,45 = 0.40

    Ce qui donne, aprs calcul, k=1+3.322 log10 169 = 8.40

    On prendra k = 8 et e = E/8 = 0.40/8 = 0.05

  • Statistique descriptive 1. Tableaux et graphiques

    26

    La srie prcdente peut tre transforme en la srie quivalente suivanteTailles (en m)

    [Ci ; Ci+1[Effectifs concerns

    ni1.45 ; 1.50 51.50 ; 1.55 01.55 ; 1.60 301.60 ; 1.65 01.65 ; 1.70 421.70 ; 1.75 01.75 ; 1.80 531.80 ; 1.85 01.85 ; 1.90 39

    Total 137

    Remarque : on aboutit 9 classes au lieu de 8 du fait de la configuration des intervallesdfinissant les classes.

    Exemple 16 : On a mesur le poids en kilogramme comme caractre pour un chantillon de80 lves dune cole. Les donnes brutes sont reportes dans le tableau suivant :

    68 84 75 82 68 90 62 88 76 9373 79 88 73 60 93 71 59 85 7561 65 75 87 74 62 95 78 63 7266 78 82 75 94 77 69 74 68 6096 78 89 61 75 95 60 79 83 7179 62 67 97 78 85 76 65 71 7565 80 73 57 88 78 62 76 53 7486 67 73 81 72 63 76 75 85 77

    Unit statistique : Elve dune cole ;Population : Lensemble des lves dune cole ;Caractre : Le poids ;Type de caractre : Variable statistique discrte.

    La plus grande valeur est : 97La plus petite valeur est : 53L'tendue est : E = 97 - 53 = 44

    On applique la mthode de STURGES avec les conditions : n = 80 E = 44

  • Statistique descriptive 1. Tableaux et graphiques

    27

    Ce qui donne, aprs calcul, k = 1 + 3,322 log10 80 = 7,322On prendra k = 7 et e = E / 7 = 44 /7 = 6

    La srie prcdente peut tre transforme en la srie quivalente suivante :

    Poids ci(1)ni(2)

    Ni cr(3)

    Ni d(4)

    fi(5)

    Fi cr(6)

    Fi d(7)

    [52 ; 58[[58 ; 64[[64 ; 70[[70 ; 76[[76 ; 82[[82 ; 88[[88 ; 94[

    [94 ; 100[

    5561677379859197

    212101916975

    214244359687580

    807866563721125

    2,5%15%

    12,5%23,75%

    20%11,25%8,75%6,25%

    2,5%17,5%30%53,7573,7585%

    93,75%100%

    100%97,5%82,5%70%

    46,25%26,25%

    15%6,25%

    Total - - - 80 - - - - - - 100% - - - - - -

    Lgende du tableau :- (1) : point central de la classe ;- (2) : effectif de la classe, frquence absolue ;- (3) : frquence absolue cumule croissante ;- (4) : frquence absolue cumule dcroissante ;- (5) : pourcentage de la classe, frquence relative ;- (6) : frquence relative cumule croissante ;- (7) : frquence relative cumule dcroissante.

    Le nombre de personnes pesant entre 64 et moins de 70 kilogrammes est 10, ils reprsentent12,5 % des personnes peses.

    Le nombre de personnes pesant au moins 70 kilogrammes est 56, ils reprsentent 70 % despersonnes peses.

    Le nombre de personnes pesant moins de 82 kilogrammes est 59, ils reprsentent 73,75 %des personnes peses.

  • Statistique descriptive 1. Tableaux et graphiques

    28

    Pour rcapituler toute cette premire partie, donnons, dans un tableau synthtique, grce des exemples, lensemble des concepts que nous avons introduits jusque l :

    Population Echantillon Caractres Modalits Effectifs

    Habitants dune ville 200 habitants choisis-taille-poids-etc.

    - 1m65- 65kg- etc.

    200

    Elves dune cole 30 lves tris -notes - 13,5 30Livres dunebibliothque 125 livres tris -thmes des livres - math 125

    Production duneusine

    1500 units produitestries

    -poids de lunit-dimension delunit

    - 8g

    - 37cm1500

    Le tri ou le choix pour constituer un chantillon se fait selon des processus bien prcis.

    1.2. REPRESENTATIONS GRAPHIQUES.

    Il est trs courant, dans un premier traitement, pour bien visualiser lallure dune sriestatistique, de la reprsenter par un graphe. Cette reprsentation peut tre faite selon plusieursmanires, en effet on peut citer les diffrentes reprsentations suivantes :

    - le diagramme bandes ;- le diagramme secteurs ;- le diagramme btons ;- lhistogramme des frquences simples ;- le polygramme des frquences simples ;- la courbe des frquences cumules.

    Chaque type de reprsentation convient un type de caractre (qualitatif ou quantitatif,quantitatif discret ou quantitatif continu) et un type de srie.

    Nous donnons dans ce qui suit un ensemble de possibilits de reprsentations dune sriestatistique en indiquant, chaque fois, le choix du graphe adquat selon le type de caractre oude la srie ainsi que les raisons de ce choix.

    1.2.1. Caractre qualitatif : Rappelons quun caractre qualitatif est un caractre quon nepeut pas mesurer. Dans ce cas, deux types de reprsentations sont conseills :

    Diagramme bandes :

    Exemple 17 : On considre la srie statistique relative la situation familiale dunchantillon de 130 personnes :

  • Statistique descriptive 1. Tableaux et graphiques

    29

    Situations familiales xi Effectifs concerns : niClibataires 1 30

    Maris 2 35Divorcs 3 40

    Veufs 4 25Total --- 130

    La reprsentation graphique dune telle srie peut tre trs bien faite par un diagramme bandes.

    05

    1015202530354045

    clibataires maris divorcs veufs

    Modalits de la variable

    Effe

    ctifs

    Remarques : La largeur des bandes est quelconque mais identique pour toutes les bandes.

    Seules les hauteurs des bandes indiquent les effectifs ou les frquences relatives.

    La numrotation des classes de modalits de 1 4 est faite uniquement dans le but defaciliter les reprsentations graphiques.

    Diagramme secteurs :

    Exemple 18 : On reprend lexemple 7 et lon considre la mme srie statistique relative la situation familiale dun chantillon de 130 personnes pour laquelle nous avons converti leseffectifs en pourcentage :

  • Statistique descriptive 1. Tableaux et graphiques

    30

    Situations familiales xiEffectifs concerns : ni

    Frquences relatives : fiClibataires 1 30 = 23%

    Maris 2 35 = 27%Divorcs 3 40 = 31%

    Veufs 4 25 = 19%Total - - - 130 = 100%

    La reprsentation graphique dune telle srie peut tre trs bien faite par un diagramme secteurs.

    clibataires23%

    maris27%

    divorcs31%

    veufs19%

    Remarque 1 : le mme caractre, situation familiale a pu tre reprsent par deux types dediagrammes.

    Remarque 2 : La surface de chaque secteur reprsente, en pourcentage, la frquencerelative de la modalit indique.

    Le rayon du cercle est quelconque.

    1.2.2. Caractre quantitatif discret : Rappelons quun caractre quantitatif est discretdans le cas doprations de comptage, dans ce cas, plusieurs types de reprsentation sontpossibles.

    Diagramme btons :

    Exemple 19 : On considre la srie statistique des notes obtenues dans une matire, par unchantillon de 200 tudiants dun amphithtre de 500.

  • Statistique descriptive 1. Tableaux et graphiques

    31

    Notes : xi Effectifs : ni10 5512 4014 6016 45

    Total 200

    Pour reprsenter une telle srie, on a habituellement recours aux diagrammes btons.

    0

    10

    20

    30

    40

    50

    60

    70

    10 12 14 16

    Modalits de la variable

    Effe

    ctifs

    Remarque : La hauteur de chaque bton est proportionnelle ni ou fi pour la valeur xi ducaractre.

    Sur laxe des x, on reporte les valeurs de xi attribues aux caractres afin de pouvoir traiterla srie statistique.

    La largeur du bton na aucune importance.

    Polygone de frquences :

    Les polygones de frquences sont construits en joignant par une ligne les sommets desbtons du diagramme en btons.

  • Statistique descriptive 1. Tableaux et graphiques

    32

    010203040506070

    10 12 14 16Modalits de la variable

    Effe

    ctifs

    Polygone de frquences cumules ou diagramme en escalier :

    Exemple 20 : On reprend lexemple 18 et lon considre les notes obtenues dans unematire, par un chantillon de 200 lves, calculons les effectifs cumuls.

    Notes : xi Effectifs : ni Effectifs cumuls Fi10 55 5512 40 9514 60 15516 45 200

    Total 200 - - -

    0

    50

    100

    150

    200

    250

    10 12 14 16Modalits de la variable

    Effe

    ctifs

    cum

    uls

  • Statistique descriptive 1. Tableaux et graphiques

    33

    1.2.3. Caractre quantitatif continu : Rappelons quun caractre quantitatif est continudans le cas doprations de mesures, dans ce cas, plusieurs types de reprsentation sontpossibles.

    Histogramme :

    Un histogramme est un graphique constitu de bandes verticales jointives. On dlimite enabscisses les classes successives de la variable continue, en principe de mme amplitude, et surchaque base ainsi dlimite, on lve un rectangle de hauteur proportionnelle la frquencecorrespondante de telle sorte que la surface du rectangle soit proportionnelle l'effectifcorrespondant.

    Quand les classes sont de mme amplitude, la hauteur des rectangles est proportionnelle auxfrquences des classes, elle est gale numriquement la frquence correspondante. Si lesclasses n'ont pas la mme amplitude, il est ncessaire d'ajuster la hauteur des rectangles de tellesorte que la surface du rectangle soit proportionnelle l'effectif correspondant, la hauteur desrectangles est gale dans ce cas la densit de la classe.

    Histogramme des frquences classes damplitudes gales :

    Exemple 21 : On considre un chantillon de 530 personnes et lon prend pour caractre lasomme en DH quelles ont dans leur poche.

    Montant dargent DH Effectifs ni20 ; 30 11030 ; 40 12040 ; 50 10050 ; 60 200

    Total 530Pour reprsenter une telle srie statistique on a habituellement recours lhistogramme des

    frquences classes damplitudes gales.

  • Statistique descriptive 1. Tableaux et graphiques

    34

    0

    50

    100

    150

    200

    250

    25 35 45 55

    Xi

    ni o

    u fi

    Remarque : On peut regrouper les valeurs discrtes par classes de mme amplitude, il suffitalors que la hauteur de chaque rectangle soit proportionnelle ni ou fi .

    Sur laxe des x, on reporte les valeurs Ci, bornes des classesdu caractre x.

    Histogramme des frquences classes damplitudes ingales :

    On peut regrouper les valeurs discrtes par classes damplitudes diffrentes, il suffit alorsque la hauteur de chaque rectangle soit proportionnelle di, densit de la classe considre.

    Sur laxe des x, on reporte les valeurs Ci, bornes des classes du caractre x.

    Exemple 22 : La rpartition de la surface, en m, de 100 logements est reprsente dans letableau suivant :

    Surface en m Nombre de logements Densits0 20

    20 4040 60

    60 100100 160160 260

    1020401884

    0,512

    0,450,130,04

    Total 100Les amplitudes des classes tant ingales, il convient de calculer les densits afin de

    reprsenter l'histogramme.

  • Statistique descriptive 1. Tableaux et graphiques

    35

    0

    0,5

    1

    1,5

    2

    2,5

    10 30 50 70 90 110 130 150 170 190 210 230 250

    surface (centres de classes)

    dens

    it d

    i

    Polygone des frquences : di ou fi

    Exemple 23 : La rpartition des soldes dun chantillon de 150 comptes bancaires estdonne par le tableau suivant :

    [Ci ; Ci+1[en 1000 DH

    cien 1000 DH

    Effectifni

    [5 ; 15[[15 ; 25[[25 ; 35[[35 ; 45[[45 ; 55[

    1020304050

    2535453015

    Total - - - 150

  • Statistique descriptive 1. Tableaux et graphiques

    36

    05

    101520253035404550

    10 20 30 40 50Xi

    ni o

    u fi

    On construit, partir de lhistogramme des frquences.

    - Le polygone des frquences, en joignant les milieux des segments.- La surface du polygone des frquences est la mme que celle de lhistogramme.

    Exemple 24 : On reprend lexemple 23 et on se propose de reprsenter la courbe desfrquences cumules croissantes.

    Courbe des frquences cumules croissantes

    [Ci ; Ci+1[ en 1000 DH Ci en 1000 DH Effectif ni Fi[5 ; 15[

    [15 ; 25[[25 ; 35[[35 ; 45[[45 ; 55[

    1020304050

    2535453015

    2560

    105135150

    Total - - - 150 - - -

  • Statistique descriptive 1. Tableaux et graphiques

    37

    0

    20

    40

    60

    80

    100

    120

    140

    160

    10 20 30 40 50

    Xi

    Fi

    Les individus sont classs en classes, la frquence cumule associe la classe numro icorrespond la proportion dindividus dont la valeur du caractre est strictement infrieure lalimite suprieure de la classe numro i.

    1.3. EXERCICES DAPPLICATIONS.

    1.3.1. Exercice.

    A partir des tableaux suivants prciser :a) l'unit statistique et la population ;b) le caractre tudi ;c) la nature du caractre tudi ;d) reprsenter graphiquement la distribution ;

    Structure de l'emploi au Maroc :

    Secteurs d'activits Part en %Agricole, fort, pche et mineIndustrie, btimentCommerceHtels et restaurantsTransport et communicationsFinances et banquesEmploi domestiqueSecteur public

    4,934,5192,77,96,6

    20,34,1

    Total 100

  • Statistique descriptive 1. Tableaux et graphiques

    38

    Effectif des stagiaires en formation :

    Niveau 1re anne 2me anne TotalTechnicien spcialisTechnicienQualificationSpcialisation

    10319727

    125426573

    -

    848792931335

    103118214218357908

    Total 29873 19115 48988

    Rpartition du nombre de pices dun ensemble de logements :

    Nombre de pices Part en %1 pice2 pices3 pices4 pices5 pices et plus

    24,6821,4520,5016,5416,83

    Total 100

    Dure de vie des tubes lectroniques :

    Dure (heures) Nombre de tubes400-499500-599600-699700-799800-899900-999

    1000-1099

    9088

    1201051027520

    Total 600

    1.3.2. Exercice.

    Une tude de march a mesur le degr de satisfaction dun chantillon de 500 clients dunebanque. Les rsultas sont prsents dans le tableau suivant :

    Degr de satisfaction EffectifsPas du tout satisfait 223Insatisfait 187Indiffrent 32Satisfait 55Trs satisfait 3

    Total 500a) Quelle est la population tudie ?

  • Statistique descriptive 1. Tableaux et graphiques

    39

    b) Quel est le caractre tudi ? quelle est sa nature ?c) Calculer les frquences relatives ?d) Reprsenter graphiquement cette distribution.

    1.3.3. Exercice.

    Soit la distribution suivante du nombre de pices dans 300 logements :

    Nombre de pices Effectifs123456

    355168554942

    Total 300

    a) Prsenter dans un tableau les diffrentes frquences cumules.b) Quel est le nombre de logements possdant au moins 3 pices ?c) Quelle est la proportion des logements possdant moins de 5 pices?d) Quel est le nombre de logements possdant au plus 4 pices ?e) Quelle est la proportion des logements possdant plus de 3 pices ?f) Reprsenter graphiquement :

    - la distribution des frquences ;- la distribution des frquences cumules croissantes ;

    1.3.4. Exercice.

    On a relev la recette hebdomadaire en milliers de dirhams de 40 commerces. Les donnesbrutes sont :

    57 60 52 49 56 46 51 63 49 5786 93 77 67 81 70 71 91 67 8247 87 92 55 48 90 49 50 58 6267 89 69 72 75 48 85 90 83 66

    a) Prsenter les donnes dans un tableau statistique sous forme de classes.b) Reprsenter graphiquement la distribution de frquences tablie.

    1.3.5. Exercice.

  • Statistique descriptive 1. Tableaux et graphiques

    40

    Le tableau suivant prsente le nombre de femmes en activit selon l'ge de 500 femmes actives

    Tranche d'ges Effectif[15 20[[20 25[[25 30[[30 35[[35 40[[40 45[[45 50[[50 55[55 et plus

    1470

    10065695663612

    a) Reprsenter graphiquement cette distribution de frquences.b) Reprsenter le diagramme des frquences cumules croissantes.c) Quel est le nombre de femmes actives ges au moins de 25 ans?d) Quelle est la proportion des femmes actives ges de plus de 30 ans ?

    1.3.6. Exercice.

    Le tableau suivant donne le niveau de scolarit en nombre dannes passes lcole dunchantillon de 200 personnes.

    Niveau de scolarit Effectif[0 ; 6[

    [6 ; 12[[12 ; 14[[14 ; 16[

    40805030

    Total 200

    a) Reprsenter graphiquement cette distribution de frquences.b) Reprsenter le diagramme des frquences cumules croissantes.c) Quel est le nombre de personnes ayant un niveau de moins de 12 annes passes

    lcole?d) Quel est la proportion des personnes ayant un niveau dau moins 12 annes passes

    lcole?

    1.3.7. Exercice.

    Soit la rpartition des travailleurs d'une entreprise selon l'ge :

  • Statistique descriptive 1. Tableaux et graphiques

    41

    11 % d'entre eux ont moins de 20 ans ;31 % d'entre eux ont de 20 25 ans ;26 % d'entre eux ont de 25 30 ans ;16 % d'entre eux ont de 30 35 ans ;7 % d'entre eux ont de 35 40 ans ;9 % d'entre eux ont 40 ans et plus.

    a) Reprsenter graphiquement cette distribution.b) Reprsenter le diagramme des frquences cumules croissantes.

    1.3.8. Exercice.

    Un organisme charg de raliser des enqutes statistiques gre un rseau de 125 enquteurs. Ladirection de cet organisme dcide d'tudier la rpartition de ses enquteurs selon le nombred'enqutes qu'ils ont ralises. Les donnes collectes ce sujet sont rsumes dans le tableauci-aprs :

    Nombre d'enqutes ralises Effectifs5

    1015202530

    81235402010

    Reprsenter graphiquement cette srie statistique.a- Par un polygone des frquences relativesb- Par une courbe des frquences relatives cumules croissantes.

    1.3.9. Exercice.

    Le tableau suivant donne la distribution de frquences du nombre d'enfants dans 300 familles.Nombre d'enfants Nombre de familles

    0123456

    plus de 6

    1322464958423931

  • Statistique descriptive 1. Tableaux et graphiques

    42

    Total 300

    a) Calculer les diffrents types de frquences cumules.b) Etablir le diagramme de frquences et le diagramme de frquences cumules.c) Quel est le nombre de familles ayant au plus 4 enfants ?d) Quel est le nombre de familles ayant au moins 2 enfants ?e) Quel est le pourcentage des familles qui n'ont pas d'enfants ?f) Quel est le pourcentage des familles qui ont des enfants ?g) Quel est le pourcentage des familles qui ont moins de 4 enfants?

    1.3.10. Exercice.

    Une cooprative laitire fabrique un fromage qui doit contenir, selon les tiquettes, 45 % dematires grasses. Un institut de consommation dont le rle est de vrifier que la qualit desproduits est bien celle qui est affirme par l'tiquette, fait prlever et analyser un chantillon de100 fromages. Les rsultats de l'analyse sont consigns dans le tableau suivant :

    Taux de matires grasses Nombre de fromages[41,5 - 42,5[[42,5 - 43,5[[43,5 - 44,5[[44,5 - 45,5[[45,5 - 46,5[[46,5 - 47,5[[47,5 - 48,5[

    11124382231

    a) Reprsenter graphiquement cette distribution.b) Reprsenter le diagramme des frquences cumules croissantes.

  • Statistique descriptive 2. Caractristiques de tendance centrale

    43

    CHAPITRE 2CARACTERISTIQUES DE TENDANCE CENTRALE

    Les caractristiques de tendance centrale, appeles aussi paramtres de position,servent caractriser l'ordre de grandeur des observations. Les principauxparamtres de position sont : les moyennes, le mode, la mdiane, et la mdiale.

    Pour les caractristiques centrales, nous ne nous intressons quaux sries statistiquesrelatives des caractres quantitatifs discrets ou continus, cest--dire des sries statistiquesdonnes sous les formes : (xi) , (xi ; ni) ; (xi ; fi) ; (ci ; ni) ou (ci ; fi).

    2.1. LES MOYENNES.

    On peut rduire un ensemble d'observations en une seule observation constanteappele moyenne. La moyenne est donc une valeur qui se prsente comme si toutes lesobservations lui taient gales.

    On distingue plusieurs types de moyennes :

    - la moyenne arithmtique ;- la moyenne gomtrique ;- la moyenne harmonique ;- la moyenne quadratique.

    2.1.1. Moyenne arithmtique.

    2.1.1.1. Moyenne arithmtique simple.

    La moyenne arithmtique simple, qu'on appelle couramment moyenne, d'une srie deplusieurs observations est gale la somme de toutes les observations divise par lenombre de ces observations.

  • Statistique descriptive 2. Caractristiques de tendance centrale

    44

    Dans le cas d'une suite de n observations : x1, x2, , xi, , xn la moyenne est gale, pardfinition :

    n

    x

    n

    xxxxx

    n

    ii

    n

    1321

    ...

    Lintroduction du terme

    n

    iix

    1doit tre explicite, en effet on convient habituellement

    dcrire, en mathmatique :

    n

    iix

    1= x1 + x2 + x3 + . . . + xi + . . . + xn

    Dans le cas dune srie statistique donne par un ensemble (xi , ni), c'est--dire lorsquechaque valeur xi est rpte ni fois et quil y a k valeurs xi diffrentes, la moyenne arithmtiquesimple dune telle srie se dduit de la formule prcdente :

    k

    1ii

    k

    1iii

    n

    xn

    x avec n =

    k

    1iin

    De mme dans le cas dune srie statistique donne par un ensemble (xi , fi) la moyennearithmtique simple se dduit de la formule prcdente :

    k

    1iii xfx

    avec n =

    k

    1iin ;

    n

    nf ii et

    k

    1iif = 1

    Dans le cas d'une variable statistique continue groupe en classes, la moyenne arithmtiquesimple est donne par les formules suivantes :

  • Statistique descriptive 2. Caractristiques de tendance centrale

    45

    k

    1iiik

    1ii

    k

    1iii

    cfn

    cn

    x

    ci est le point central de la classe i, il est tel que : 2CC

    c1ii

    i

    Exemple 1 : On considre lensemble des notes obtenues par les tudiants dune classedune cole, dans une matire ; on a la srie statistique suivante donne sous la forme simple(xi) et pour laquelle on demande de calculer la moyenne arithmtique simple.

    12 11 13 12 1315 13 12 13 1113 15 11 11 1212 12 10 12 15

    La moyenne arithmtique simple de cette srie est facile calculer, elle est gale :

    4,1220248

    n

    x

    x

    20

    1ii

    Exemple 2 : On considre la mme srie statistique quon reprsente maintenant sous laforme (xi ; ni) pour laquelle on demande de calculer la moyenne arithmtique simple.

    xi ni10 111 412 713 515 3

  • Statistique descriptive 2. Caractristiques de tendance centrale

    46

    Le calcul de la moyenne arithmtique simple peut tre facilement fait selon le tableausuivant :

    xi ni ni xi10 1 1011 4 4412 7 8413 5 6515 3 45

    Total 20 248Moyenne - - - 12,4

    Exemple 3 : On considre la mme srie statistique quon reprsente sous la forme (xi ; fi)pour laquelle on demande de calculer la moyenne arithmtique simple.

    xi ni fi10 1 5%11 4 20%12 7 35%13 5 25%15 3 15%

    Total 20 100%

    Le calcul de la moyenne arithmtique simple peut tre facilement fait selon le tableausuivant :

    xi ni fi fi xi10 1 0,05 0,511 4 0,20 2,212 7 0,35 4,213 5 0,25 3,2515 3 0,15 2,25

    Total 20 100% 12,4Moyenne - - - - - - 12,4

    On voit, sur ces 3 exemples, que pour calculer la moyenne arithmtique simple, on utiliselune des 3 formules selon la forme dans laquelle est donne la srie statistique.

    Exemple 4 : On a procd au recensement des 50 salaris de la socit STM en relevant lessalaires horaires quils peroivent. Les donnes brutes sont :

  • Statistique descriptive 2. Caractristiques de tendance centrale

    47

    34 36 45 62 37 43 42 102 31 4251 30 61 63 47 105 52 43 81 9592 77 60 36 48 49 65 71 78 8143 52 63 71 43 42 51 55 61 4193 82 83 47 54 61 102 33 48 55

    La moyenne arithmtique simple dune telle srie est gale :

    h /DH78,5850

    293950

    50

    1

    i

    ix

    x

    Chaque salari de la socit touche, en moyenne, 58,78 DH par heure.

    Exemple 5 : Une enqute, chez 1000 commerants, porte sur le nombre dagents quilsemploient. Les rsultats obtenus sont reprsents dans le tableau suivant :

    Nombre d'employsxi

    Nombre de commerantsni

    proportion des commerantsfi

    01234567

    5010020015012016013090

    5 %10 %20 %15 %12 %16 %13 %9 %

    Total 1000 100 %

    La moyenne arithmtique simple dune telle srie est gale :

    commerantparemploys64,310003640

    xfn

    xn

    x8

    1iii8

    1ii

    8

    1iii

    Chaque commerant emploie, en moyenne, trois quatre employs.

    Exemple 6 : La rpartition de la surface, en m, de 100 logements est reprsente dans letableau suivant :

  • Statistique descriptive 2. Caractristiques de tendance centrale

    48

    Surface en m Nombre de logements Point central0 20

    20 4040 60

    60 100100 160160 260

    1020401884

    10305080

    130210

    La moyenne arithmtique simple dune telle srie est gale :

    20601006020cf

    n

    cn

    x6

    1iii6

    1ii

    6

    1iii

    ,

    m par logement

    La superficie moyenne dun logement est de 60,20 m.

    2.1.1.2. Moyenne arithmtique pondre.

    La moyenne arithmtique simple suppose que toutes les observations ont la mmeimportance, ce qui n'est pas toujours le cas. La moyenne arithmtique pondreintervient dans le cas o les observations n'ont pas la mme importance. Il s'agitd'associer chaque observation un coefficient de pondration indiquant son poidsparmi les autres observations.

    k

    ii

    k

    iii x

    x

    1

    1

    i est le poids affect l'observation i.

    Exemple 7 : Un tudiant a eu 14 sur 20 au contrle continu, 12 sur 20 l'examen partiel et13 sur 20 l'examen final. Les trois notes n'ont pas la mme importance. On associe uncoefficient de 1 la note du contrle, un coefficient de 2 la note de l'examen partiel, et uncoefficient de 4 la note de l'examen final. La note moyenne de l'anne obtenue par cettudiant est :

  • Statistique descriptive 2. Caractristiques de tendance centrale

    49

    86,12421

    134122141x

    x 3

    1ii

    3

    1iii

    2.1.1.3 Proprits de la moyenne arithmtique.

    * Proprit 1 : Transformation linaire

    La transformation linaire d'une variable statistique x en une autre variable y telleque :

    y = ax + b avec a et b deux constantes quelconques

    La moyenne de y peut tre obtenue directement partir de la moyenne de x :

    bxabn

    x

    ay

    n

    bnxa

    n

    b)(ax

    n

    yy

    n

    1ii

    n

    1ii

    n

    1ii

    n

    1ii

    La moyenne d'une transformation linaire est donc une transformation linaire de lamoyenne.

    Exemple 8 : Le tableau suivant prsente les prix en DH de 100 ordinateurs portablesachets dans diffrents points de vente :

    Prix Nombre dordinateurs10000 1100011000 1200012000 1300013000 1400014000 1500015000 1600016000 1700017000 18000

    910101416141215

    Total 100

  • Statistique descriptive 2. Caractristiques de tendance centrale

    50

    Pour calculer la moyenne des prix des ordinateurs, on peut utiliser la proprit de latransformation linaire dans le but de simplifier les calculs.

    On effectue un changement de variable, c'est--dire, on remplace la variable prix par uneautre variable y de telle sorte que le prix soit une transformation linaire de y.

    p = a y + b Donc : y =a

    bp

    Il faut choisir les constantes a et b qui donnent des valeurs trs simples de y. On choisit laconstante b parmi les valeurs de p, de prfrence une valeur du milieu, pour avoir une valeurnulle de y au milieu. On choisit la constante a comme tant le plus grand diviseur commun desvaleurs de (p - b) (le plus souvent a est l'amplitude constante des classes) pour avoir des valeursentires de y.

    Pour notre exemple, on choisit :

    b = 13500 et a = 1000

    Y =100013500p

    Les valeurs de y sont trs simples, on peut calculer facilement la moyenne de y.

    PrixNombre

    dordinateurs(ni)

    Point central(ci) yi ni yi

    10000 1100011000 1200012000 1300013000 1400014000 1500015000 1600016000 1700017000 18000

    910101416141215

    1050011500125001350014500155001650017500

    -3-2-101234

    -27-20-100

    16283660

    Total 100 83

    83010083

    n

    yny 8

    1ii

    8

    1iii

    ,

    On calcule facilement la moyenne grce aux formules de la transformation linaire :

  • Statistique descriptive 2. Caractristiques de tendance centrale

    51

    DH14330135000,83100013500y1000p

    * Proprit 2 : La moyenne des carts par rapport la moyenne est nulle.

    La somme des diffrences par rapport la moyenne est toujours nulle.

    0xnxnxnx)xx(n

    1ii

    n

    1ii

    * Proprit 3 : La somme des carres des carts par rapport la moyenne estminimale.

    ])ax()ax)(xx(2)xx[(

    )]ax()xx[()ax(

    2i

    2n

    1ii

    2n

    1ii

    n

    1i

    2i

    n

    1i

    2n

    1ii

    2n

    1ii )ax()ax)(xx(2)xx(

    n

    1i

    2n

    1ii

    2n

    1ii

    n

    1i

    2i )ax()xx()ax(2)xx()ax(

    22

    11

    2 )()()( axnxxaxn

    ii

    n

    ii

    Cette expression est positive, elle est donc minimale lorsque :

    xalorsquedireestc'0)( 2ax

    2.1.2. Moyenne gomtrique.

    2.1.2.1. Moyenne gomtrique simple.

    La moyenne gomtrique simple est calcule pour des observations positives. Elle est gale la racine nme du produit de lensemble des n observations. Elle est utilise principalementlorsqu'on raisonne en taux de croissance.

  • Statistique descriptive 2. Caractristiques de tendance centrale

    52

    La moyenne gomtrique est gale, par dfinition, dans le cas dune suite de n observationsx1, x2, , xi, , xn :

    n

    1

    ]n

    1i ix[n

    1

    )n

    x2x1x(n nx2x1xx g

    Exemple 9 : On considre une action qui a accus, en bourse, durant le 1er semestre delanne 2005, les taux daugmentation mensuels suivants : +2,1% ; 1,3% ; 0,5% ; 0,9% ; 1,4% ;3,8%. Calculer le taux daugmentation mensuel moyen de laction durant le 1er semestre 2005.

    Cest lexemple type de lapplication de la moyenne gomtrique simple :

    Remarque : Rappelons que pour une variable qui a accus un taux daugmentation de 2%par exemple, on multiplie cette variable par 1,02 pour trouver la nouvelle valeur de lavariable.

    Ainsi si laction a comme valeur 25,35 DH en Janvier et quelle subisse un taux

    daugmentation de 2,1% entre janvier et fvrier, sa valeur, en fvrier est gale :

    25,35 x 1,021 = 25,88 DH.

    Donc nous allons, tout le temps, utiliser cette remarque lorsquil sagit de taux.

    Revenons lexemple 9 et calculons le taux daugmentation mensuel moyen de laction :

    %66,11038,1014,1009,1005,1013,1021,1t 6

    Exemple 10 : La population marocaine est passe, entre 1994 et 2004 de 26 019 000 29 800 000.

    Quel est le taux global daugmentation de la population pendant les 10 annes ?

    Quel est le taux annuel moyen daugmentation de la population ?

    Entre 1994 et 2004, le taux global d'accroissement de la population marocaine est :

    %53,1410026019

    2601929800t

  • Statistique descriptive 2. Caractristiques de tendance centrale

    53

    Le taux d'accroissement annuel moyen est

    t tel que :

    29800)t1(26019 10

    1453,12601929800)t1( 10

    %37,10137,011453,1t 10

    Entre 1994 et 2004, la population marocaine a augment en moyenne, de 1,37 % par an.

    2.1.2.2. Moyenne gomtrique pondre.

    De mme que pour la moyenne arithmtique simple qui suppose que toutes lesobservations aient la mme importance, ce qui n'est pas toujours le cas, la moyennegomtrique pondre intervient dans le cas o les observations n'ont pas la mmeimportance. Il s'agit d'associer chaque observation un coefficient de pondrationindiquant son poids parmi les autres observations.

    nnx22x11xxg

    n1

    nnx22x11xxg )(

    k

    1iifix

    1k

    1iiixxg ][

    i est le poids affect l'observation i.

    Avec

    k

    1ii

    Cest le cas de sries statistiques discrtes donnes sous la forme (xi ; ni) ou (xi ; fi), lorsque,dans les sries, la variable xi est rpte ni fois (ou fi en %) et quil y a k observations distinctes.

    Dans le cas d'une srie statistique continue, on dfinit la moyenne gomtriquepondre comme suit :

  • Statistique descriptive 2. Caractristiques de tendance centrale

    54

    k

    1iific

    n

    1

    ]k

    1iin

    ic[

    n

    1

    )c...cc(n c...ccgx k21k21 nkn2n1nkn2n1

    ci est le point central de la classe i, il est tel que : 2CC

    c1ii

    i

    Exemple 11 : Etude du taux de variation dune action en bourse.

    Le tableau suivant donne l'volution du taux daugmentation de la valeur dune action, enbourse, entre janvier et dcembre 2005.

    Priodes Taux daugmentation mensuel moyenEntre janvier et avril 2,03% par mois en moyenneEntre mai et juillet 0,69% par mois en moyenneEntre aot et dcembre 2,13% par mois en moyenne

    Quel est le taux global de variation de la valeur de laction entre janvier et dcembre 2005 ?

    Quel est le taux mensuel moyen de variation de la valeur de laction entre janvier etdcembre 2005 ?

    Sagissant de taux daugmentation mensuels relatifs des priodes diffrentes, de nombresde mois diffrents, il y a lieu daffecter chaque taux dun poids gal aux nombres de moiscontenu dans la priode ;

    Le taux daugmentation global de la valeur de laction est :

    %92,22102135,100693,102034,1t

    Le taux daugmentation mensuel moyen de la valeur de laction entre janvier et dcembre2005 est alors gal :

    %,, 731122941t 12 2.1.2.3. Proprits de la moyenne gomtrique.

  • Statistique descriptive 2. Caractristiques de tendance centrale

    55

    La moyenne gomtrique est aussi gale l'exponentielle de la moyenne arithmtiquedes logarithmes des variables statistiques.

    n

    n

    1i i xLog

    ]n

    1i ixLog[

    n

    1n1

    ]n

    1i ixLog[xLog g

    n

    n

    i ixLog

    gx

    1(exp )

    2.1.3. Moyenne harmonique.

    2.1.3.1. Moyenne harmonique simple.

    La moyenne harmonique simple est gale l'inverse de la moyenne arithmtique desinverses des observations. Son usage s'impose lorsque la variable statistique est unquotient (cot moyen, vitesse moyenne, etc.).

    Dans le cas d'une suite de n observations x1, x2, , xi, , xn, toutes distinctes et de poidsidentiques, la moyenne harmonique simple est gale :

    n

    1i i

    h

    x

    1n

    x

    Exemple 12 : Calcul de la vitesse moyenne.

    On considre un automobiliste qui fait 80 km et qui parcourt chaque 20 km avec desvitesses moyennes diffrentes, soient successivement 90 km/h, puis 75 km/h, ensuite 85 km/h etenfin 115 km/h.

    Quelle est la vitesse moyenne de lautomobiliste ?

    Comme il sagit de vitesses moyennes, toutes relatives la mme distance de 20 km, ellesdoivent avoir le mme poids. Montrons donc que la vitesse moyenne sur les 80 km est lamoyenne harmonique des vitesses.

    En effet, le temps t mis pour parcourir une distance d la vitesse v est donn par la formulesimple : t = d / v.

    Ainsi le temps global t est la somme des quatre temps ti :

  • Statistique descriptive 2. Caractristiques de tendance centrale

    56

    4321 ttttt

    4

    1i i

    i

    4

    4

    3

    3

    2

    2

    1

    1

    Vd

    Vd

    Vd

    Vd

    Vd

    v

    d

    En divisant les 2 membres de cette galit par d et en constatant que di / d = 1 / 4 on trouvefacilement le rsultat recherch :

    4V1

    v

    1

    4

    1i i

    C'est--dire dune faon plus gnrale :n

    V1

    v

    1

    n

    1i i

    v

    1= 01123,0)

    1151

    851

    751

    901(

    41

    Soit aprs calcul : v = 89,077 km/h

    2.1.3.2. Moyenne harmonique pondre.

    La moyenne harmonique pondre intervient dans le cas o les observations n'ont pasla mme importance. Il s'agit d'associer chaque observation un coefficient depondration indiquant son poids parmi les autres observations.

    * Cas d'une srie statistique discrte : dans laquelle la variable statistique xi est rpte nifois (ou fi en %), lorsque la srie est de la forme (xi ; ni) ou (xi ; fi).

    hx

    =

    k

    1i ii

    k

    1ii

    xn

    n

    =

    k

    1i ii

    xf

    1

    * Cas d'une srie statistique continue :

  • Statistique descriptive 2. Caractristiques de tendance centrale

    57

    k

    1i i

    ik

    1i i

    i

    k

    1ii

    h

    c

    f1

    c

    n

    nx

    ci est le point central de la classe i, il est tel que : 2CC

    c1ii

    i

    Exemple 13 : Calcul de la vitesse moyenne.

    Reprenons lexemple de lautomobiliste et supposons que maintenant il ait roul surun trajet de 100 Km une vitesse de 90 Km/h, sur les 10 premiers kilomtres; de 100Km/h sur un trajet de 30 Km, et de 120 Km/h sur les 60 derniers kilomtres.L'automobiliste a parcouru le trajet de 100 Km avec trois vitesses moyennes diffrentes sur

    des trajets de diffrentes longueurs :

    Vitesses moyennes TrajetsV1 = 90 km/hV2 = 100 km/hV3 = 120 km/h

    d1 = 10 kmd2 = 30 kmd3 = 60 km

    Total 100 km

    Comme il sagit de vitesses moyennes relatives des distances diffrentes, elles doivent treaffectes de poids diffrents. Montrons donc que la vitesse moyenne sur les 100 km est lamoyenne harmonique pondre des vitesses.

    En effet, le temps t mis pour parcourir une distance d la vitesse v est donn par la formulesimple : t = d / v.

    Ainsi le temps global t est la somme des quatre temps ti :

    4321 ttttt

    4

    1i i

    i

    4

    4

    3

    3

    2

    2

    1

    1

    Vd

    Vd

    Vd

    Vd

    Vd

    v

    d

    En divisant les 2 membres de cette galit par d et en posant i di / d, on trouvefacilement le rsultat recherch :

  • Statistique descriptive 2. Caractristiques de tendance centrale

    58

    4

    1i ii V

    1v

    1avec par exemple 10,0

    10010

    1

    C'est--dire dune faon plus gnrale :

    n

    1i ii V

    1v

    1

    Aprs calcul, on trouve v = 109,8 km/h.

    Exemple 14 : Calcul du cot moyen dun stock.

    Calculer le cot moyen dune pice de rechange stocke dans le magasin delentreprise si lon suppose que le stock ait t approvisionn, diffrents prix, enplusieurs tapes.

    Etapes Nombre de pices achetes Prix unitaires des pices

    N 1 10 12,35 DH

    N 2 25 13,12 DH

    N 3 20 13,46 DH

    N 4 45 14,07 DH

    Comme le cot est un rapport, montrons que le cot moyen est la moyenneharmonique pondre des diffrents cots. En effet, les cots moyens auxquels lespices de rechange ont t achetes sont relatifs des lots de diffrentes tailles, ce quifait que ces cots doivent tre affects de diffrents poids.Convenons dappeler, dans ce qui suit, pour le lot i, cui le cot unitaire, cti le cot totalet ni le nombre de pices de rechange achetes.Nous avons lgalit suivante vidente relative aux nombres de pices de rechange :

    4

    1ii4321 nnnnnn

    Or commei

    ii

    cu

    ctn on a :

    4

    1i i

    i

    cu

    ct

    cu

    ctn

  • Statistique descriptive 2. Caractristiques de tendance centrale

    59

    En divisant les 2 membres de la dernire galit par ct et en posant i cti / ct ontrouve la formule recherche, savoir :

    4

    1i ii

    4

    1i i

    i

    cu

    1cu

    1ctct

    cu

    1

    Avec par exemple :

    2422,0

    07,144546,132012,132535,121012,1325

    ct

    ct4

    1ii

    22

    Le cot moyen dapprovisionnement de la pice de rechange est, aprs calculs, gal :13,51 DH/unit.

    2.1.4. Moyenne quadratique.

    La moyenne quadratique est la racine carre de la moyenne arithmtique des carres.Elle est trs rarement utilise.* Cas d'une suite de n observations : x1, x2, , xi, , xn

    n

    x

    x

    n

    1i

    2i

    q

    * Cas d'une srie statistique discrte : lorsque chaque variable xi est rpte ni (ou fi en%) fois dans la srie et quil y a k valeurs diffrentes.

    k

    1i

    2iik

    1ii

    k

    1i

    2ii

    q xfn

    xn

    x

    avec n =

    k

    iin

    1et 1f

    k

    1ii

  • Statistique descriptive 2. Caractristiques de tendance centrale

    60

    * Cas d'une srie statistique continue :

    k

    1i

    2iik

    1ii

    k

    1i

    2ii

    q cfn

    cn

    x

    avec n =

    k

    iin

    1et 1f

    k

    1ii

    ci est le point central de la classe i, il est tel que : 21 iii

    CCc

    Exemple 15 : Dans une entreprise produisant des pices pour lassemblage dune machineon veut contrler si la longueur moyenne des pices est conforme la norme de 12 cm. Laproduction est juge comme conforme si lcart moyen par rapport la norme ne dpasse pas 1cm. cette fin on a mesur la longueur dun chantillon de 16 pices dont les rsultats sont :

    11 10 12,5 10,8 13,5 11,5 13 12,513 13,5 11,5 13,2 10,5 12,5 11 11,5

    Peut-on admettre que le produit de lentreprise est conforme la norme ?

    Calculons les carts par rapport la norme :

    -1 -2 0,5 -1,2 1,5 -0,5 1 0,5+1 1,5 -0,5 1,2 -1,5 0,5 -1 -0,5

    On voit bien que certains carts sont positifs et dautres sont ngatifs ; le calcul de lamoyenne arithmtique nest pas appropri car les carts ngatifs vont compenser les cartspositifs. La moyenne quil faut calculer est la moyenne quadratique.

    n

    x

    x

    n

    1i

    2i

    q

    =

    16)5,0()1(5,0)5,1(2,1)5,0(5,11

    165,01)5,0(5,1)2,1(5,0)2()1(

    xq

    = 1,09 cm

    Lcart moyen par rapport la norme est de 1,09 cm, il dpasse lcart moyen tolr qui estde 1 cm, on ne peut donc admettre que le produit de lentreprise est conforme la norme.

  • Statistique descriptive 2. Caractristiques de tendance centrale

    61

    Remarque : On peut montrer que la moyenne harmonique est infrieure ou gale lamoyenne gomtrique qui est infrieure ou gale la moyenne arithmtique qui estinfrieure ou gale la moyenne quadratique.

    qgh xxxx

    Exemple 16 : On peut aisment vrifier de telles ingalits dans lexemple simplesuivant.

    On considre la srie statistique simple constitue des cinq observations suivantes : 2 ;5 ; 6 ; 8 et 10.

    On trouve, aprs un calcul facile que :

    6643x27290)101

    81

    61

    51

    21(4

    1x

    1 hh

    ,,

    4485108652x 5g ,

    265108652

    x ,

    76765108652

    xq ,

    Et lon a bien :

    ),(),(),(),( 7676x26x4485x6643x qgh 2.2. LE MODE.

    Le mode est lobservation la plus frquente dans une srie statistique.

    * Cas d'une suite de n observations : Le mode d'une srie statistique est l'observation quel'on rencontre le plus frquemment. Le mode peut ne pas exister, et s'il existe, il peut ne pas treunique.

    Exemple 17 : On considre les sries dobservations suivantes :

    a) 3; 5 ; 8 ; 8 ; 8 ; 10 ; 10 ; 10 ; 10 ; 10 ; 14 ; 18 ; 20 ; 24 ; 24b) 4 ; 8 ; 10 ; 10 ; 10 ; 10 ; 14 ; 18 ; 22 ; 22 ; 22 ; 22 ; 26c) 5, 11, 14, 17, 18, 21, 23, 26, 29, 30, 32, 35, 38d) 12 ; 23 ; 34 ; 23 ; 35 ; 23 ; 52 ; 23 ; 33 ; 56 ; 23 ; 23 ; 40

    Dans ces exemples, on a successivement :

  • Statistique descriptive 2. Caractristiques de tendance centrale

    62

    - pour le cas a : Le mode est 10.- pour le cas b : Il y a deux modes, 10 et 22.- pour le cas c : Le mode nexiste pas.- pour le cas d : Le mode est 23

    * Cas d'une srie statistique discrte : Le mode correspond la valeur qui possde la plusgrande frquence.

    Exemple 18 : Soit la distribution du nombre d'employs observs chez 1000 commerants.

    Nombre d'employsxi

    Nombre de commerants(ni)

    proportion descommerants (fi)

    01234567

    5010020015012016013090

    5 %10 %20 %15 %12 %16 %13 %9 %

    Total 1000 100 %

    La variable xi nombre d'employs a pour mode 2, c'est--dire la plupart descommerants ont deux employs.* Cas d'une srie statistique continue : Dans le cas d'une variable statistique continue

    groupe en classes, on parle de classe modale, elle correspond la classe dont la frquence estla plus leve. Le mode correspond la valeur de la variable qui correspond au maximum del'histogramme. C'est le point central de la classe modale si les classes ont la mme amplitude,dans le cas contraire, il faut travailler avec les densits.

    Exemple 19 : La rpartition de la surface, en m, de 100 logements est reprsente dans letableau suivant :

    Surface en m Nombre de logements0 20

    20 4040 60

    60 100100 160160 260

    1020401884

    Les amplitudes des classes tant ingales, il convient de calculer les densits.

  • Statistique descriptive 2. Caractristiques de tendance centrale

    63

    Surface en m Nombre de logements Densits0 20

    20 4040 60

    60 100100 160160 260

    1020401884

    0,512

    0,450,130,04

    Total 100

    En cherchant la plus grande densit, la classe modale est la classe 40 60 m, le modeest gal au centre de la classe modale, savoir : 50 m.

    2.3. LA MEDIANE.

    La mdiane d'une variable statistique est une valeur pour laquelle, la moiti desobservations lui sont infrieure ou gales et la moiti suprieures ou gales. Lamdiane partage donc le nombre total d'observations en deux parties gales. Lamdiane est un paramtre statistique qui ne dpend que du nombre d'observations.Pour dterminer la mdiane, il faut raisonner en terme de frquences cumules, lamdiane est alors la valeur de la variable qui correspond la moiti de l'effectif total.* Cas d'une srie statistique discrte.

    Si le nombre d'observations est impair, la mdiane est l'observation de rang2

    1n .

    21nxMe

    Si le nombre d'observations est pair, la mdiane est comprise entre l'observation de rang 2n

    et l'observation de rang 12n . On prend comme valeur de la mdiane la moyenne arithmtique

    simple des deux observations.

    2

    xx

    Me

    xMex

    12n

    2n

    12n

    2n

    Exemple 20 : Soit la distribution du nombre d'employs observs chez 1000 commerants.

  • Statistique descriptive 2. Caractristiques de tendance centrale

    64

    Nombre d'employsxi

    Nombre de commerants(ni)

    Frquences cumules croissantesFic

    01234567

    5010020015012016013090

    50150350500620780910

    1000Total 1000

    Le nombre d'observations, 1000, est pair, la mdiane est comprise entre l'observation derang 500 et l'observation de rang 501. On prend comme valeur de la mdiane la moyennearithmtique simple des deux observations.

    2xx

    Me

    xMex

    501500

    501500

    En consultant les frquences absolues cumules croissantes, x500 correspond 3 et x501correspond 4. La mdiane est donc :

    5,32

    43Me

    La moiti des commerants emploient 3 employs ou moins, et la moiti emploient 4employs ou plus.* Cas d'une srie statistique continue.

    Pour des donnes groupes en classes, la classe mdiane est la classe qui contient lamdiane. On dtermine la mdiane par interpolation linaire.Dsignons par :

    [Ci ; Ci+1[ : la classe mdiane ;n : le nombre total des observations ;Fi : la frquence absolue cumule croissante ;ni : la frquence absolue de la classe mdiane.

    La mdiane est comprise entre Ci et Ci+1

    Ci < Me < Ci+1

    De mme : Fi-1 < 2n < Fi

  • Statistique descriptive 2. Caractristiques de tendance centrale

    65

    Frquence cumule

    Fi

    50 % = n/2

    Fi-1

    CaractreCi Me Ci+1

    On suppose que la distribution au sein de la classe mdiane soit rgulire.

    Ainsi :1ii

    i1iFF

    CC

    =

    1i

    i

    F2n

    CMe

    Ce qui donne : )( 1i1ii

    i1ii F2n

    FFCCCMe

    Exemple 21 : La rpartition de la surface, en m, de 100 logements est reprsente dans letableau suivant :

    Surface en m Nombre de logements F. cumules croissantes0 20

    20 4040 60

    60 100100 160160 260

    1010501884

    1020708896

    100Total 100

    En consultant les frquences absolues cumules croissantes, la classe mdiane est laclasse 40 60 m. La mdiane est donc :

  • Statistique descriptive 2. Caractristiques de tendance centrale

    66

    40 < Me < 6020 < 50 < 70

    20704060

    = 205040Me

    Me = 40 + 5020 x 30 = 52 m

    La moiti des logements ont une superficie infrieure ou gale 52 m et la moiti deslogements ont une superficie suprieure ou gale 52 m.

    2.4. LA MEDIALE.

    La mdiale est une valeur telle que la somme des observations qui lui sont infrieuresest gale la somme des observations qui lui sont suprieures. La mdiale partagedonc la somme des observations en deux parties gales. La mdiale est un paramtrestatistique qui dpend de la somme de toutes les observations.

    Pour dterminer la mdiale, il faut raisonner en terme de sommes cumules, lamdiale est alors la valeur de la variable qui correspond la moiti de la somme desobservations.

    La mdiale calcule pour une variable statistique groupe en classes, la classe mdiale est laclasse qui contient la mdiale. On dtermine la mdiale par interpolation linaire.

    Dsignons par :

    [Ci ; Ci+1[ : la classe mdiale ;

    S =

    k

    1iiicn : la somme des observations ;

    Si =

    ij

    1jjjcn : la somme des observations cumule croissante;

    ni ci : la somme des observations de la classe mdiale.

    La mdiale est comprise entre Ci et Ci+1Ci < Ml < Ci+1Si-1 < 2

    S < SiSommes cumules

  • Statistique descriptive 2. Caractristiques de tendance centrale

    67

    Si

    50 % = S/2

    Si-1

    CaractreCi Ml Ci+1

    On suppose que la distribution au sein de la classe mdiale soit rgulire.

    Ainsi :1iii1i

    SSCC

    =

    1i

    i

    S2S

    CMl

    )( 1i1iii1ii S2

    SSS

    CCCMl

    Exemple 22 : La rpartition de la surface, en m, de 100 logements est reprsente dans letableau suivant :

    Surface en m Nombre delogements niPoint central ci

    Sommesnixi

    Sommes cumulescroissantes

    0 2020 4040 60

    60 100100 160160 260

    1020401884

    10305080

    130210

    100600

    200014401040840

    100700

    2700414051806020

    Total 100 6020

    La moiti de la somme des observations est :

    30102

    60202

    cn6

    1iii

  • Statistique descriptive 2. Caractristiques de tendance centrale

    68

    En consultant les sommes cumules croissantes, la classe mdiale est la classe 60 100m. La mdiale est donc :

    60 < Ml < 1002700 < 3010 < 4140

    2700414060100

    = 2700301060Ml

    Ml = 60 + 144040 x 310 = 68,61 m

    La moiti de la superficie totale des 100 logements est rpartie sous forme delogements dont la superficie est infrieure ou gale 68,61 m et l'autre moiti sousforme de logements dont la superficie est suprieure ou gale 68,61 m.

    2.5. LES FRACTILES.

    De mme que la mdiane nous a permis de partager la population en deux partiesgales, le fractile d'ordre p permet de partager la population en p parties gales,

    chaque partie contient %p

    100du nombre total des observations. Ainsi les quartiles,

    dciles, centiles vont respectivement nous permettre de partager la populationrespectivement en quatre, dix et cent parties gales.2.5.1. Les quartiles.

    Les quartiles partagent le nombre total des observations en quatre parties gales,chaque partie contient 25% des observations. On dfinit trois quartiles.Le premier quartile Q1 : C'est une valeur pour laquelle un quart des observations(25%) lui sont infrieures ou gales et trois quarts des observations (75%) lui sontsuprieures ou gales.

    Le deuxime quartile Q2 : C'est une valeur pour laquelle deux quarts des observations(50%) lui sont infrieures ou gales et deux quarts des observations (50%) lui sontsuprieures ou gales. Il est aussi gal la mdiane.Le troisime quartile Q3 : C'est une valeur pour laquelle trois quarts des observations(75%) lui sont infrieures ou gales et un quart des observations (25%) lui sontsuprieures ou gales.

  • Statistique descriptive 2. Caractristiques de tendance centrale

    69

    Pour le calcul des quartiles, on utilise la mme mthode de calcul que pour la mdiane.Pour des donnes groupes en classes, on dtermine un quartile par interpolationlinaire.Dsignons par :

    [Ci ; Ci+1[ : la classe qui contient le quartile ;n : le nombre total des observations ;Fi : la frquence absolue cumule croissante ;ni : la frquence absolue de la classe qui contient le quartile ;

    Le quartile numro j, Qj est compris entre Ci et Ci+1Ci < Qj < Ci+1

    Fi-1 < 4nj

    < Fi

    Frquence cumule

    Fi

    j n /4

    Fi-1

    CaractreCi Qj Ci+1

    On suppose que la distribution au sein de la classe est rgulire.

    Ainsi :1ii

    i1iFF

    CC

    =

    1i

    i

    F4nj

    CQj

    )( 1i1ii

    i1ii F4nj

    FFCCCQj

    Les trois quartiles sont :

  • Statistique descriptive 2. Caractristiques de tendance centrale

    70

    )( 1i1ii

    i1ii1 F4n

    FFCCCQ

    )( 1i1ii

    i1ii2 F2n

    FFCCCQ

    = Me

    )( 1i1ii

    i1ii3 F4n3

    FFCCCQ

    Exemple 23 : La rpartition de la surface, en m, de 100 logements est reprsente dans letableau suivant :

    Surface en m Nombre de logements Frquences cumules croissantes0 20

    20 4040 60

    60 100100 160160 260

    1020401884

    1030708896

    100Total 100

    En consultant les frquences absolues cumules croissantes, q1, qui correspond la25me observation, se trouve dans la classe 20 40 m. q3, qui correspond la 75meobservation, se trouve dans la classe 60 100 m.

    m3520

    104

    100

    2020q1

    m11,7118

    7041003

    4060q3

    25 % des logements ont une superficie infrieure ou gale 35 m.75 % des logements ont une superficie infrieure ou gale 71,11 m.50 % des logements ont une superficie comprise entre 35 m et 71,11 m.

    2.5.2. Les dciles.

    Les dciles partagent le nombre total des observations en dix parties gales, chaquepartie contient 10% des observations. On dfinit neuf dciles.

  • Statistique descriptive 2. Caractristiques de tendance centrale

    71

    Le premier dcile d1 : C'est une valeur pour laquelle un dixime des observations(10%) lui sont infrieures ou gales et neuf diximes des observations (90%) lui sontsuprieures ou gales.Le deuxime dcile d2 : C'est une valeur pour laquelle deux diximes des observations(20%) lui sont infrieures ou gales et huit diximes des observations (80%) lui sontsuprieures ou gales.Le kme dcile dk : C'est une valeur pour laquelle k dixime des observations lui sontinfrieures ou gales et (10 - k) dixime des observations lui sont suprieures ougales.Le cinquime dcile correspond aussi la mdiane et au deuxime quartile.Pour le calcul des dciles, on utilise la mme mthode de calcul que pour la mdiane etles quartiles. Pour des donnes groupes en classes, on dtermine un dcile parinterpolation linaire.Dsignons par :

    [Ci ; Ci+1[ : la classe qui contient le dcile ;n : le nombre total des observations ;Fi : la frquence absolue cumule croissante ;ni : la frquence absolue de la classe qui contient le dcile ;

    Le dcile dk est compris entre Ci et Ci+1

    Ci < dk < Ci+1

    Fi-1 < 10nk < Fi

  • Statistique descriptive 2. Caractristiques de tendance centrale

    72

    Frquence cumule

    Fi

    k n /10

    Fi-1

    CaractreCi Qj Ci+1

    On suppose que la distribution au sein de la classe est rgulire.

    Ainsi :1ii

    i1iFF

    CC

    =

    1i

    ik

    F10nk

    Cd

    )( 1i1ii

    i1iik F10nk

    FFCCCd

    Exemple 24 : La rpartition de la surface, en m, de 100 logements est reprsente dans letableau suivant :

    Surface en m Nombre delogementsFrquences cumules

    croissantes0 20

    20 4040 60

    60 100100 160160 260

    1020401884

    1030708896

    100Total 100

  • Statistique descriptive 2. Caractristiques de tendance centrale

    73

    En consultant les frquences absolues cumules croissantes, d1, qui correspond la10me observation, se trouve dans la classe 0 20 m. d9, qui correspond la 90meobservation, se trouve dans la classe 100 160 m.

    29

    21

    m1158

    88101009

    60100

    m2010

    010100

    200

    d

    d

    - 10 % des logements ont une superficie infrieure ou gale 20 m.- 90 % des logements ont une superficie infrieure ou gale 115 m.- 80 % des logements ont une superficie comprise entre 20 m et 115 m.

    2.6. EXERCICES DAPPLICATION.

    2.6.1. Exercice.

    Soit la distribution suivante du nombre de pices dans 300 logements :

    Nombre de pices Effectifs123456

    355168554942

    Total 300

    On demande de dterminer pour cette srie statistique la moyenne arithmtique, le mode lamdiane et les quartiles.

    Solution :

    k

    1iiixfx = 3,53 pices ; Mode = 3 pices ; Me = 2,95 soit 3 pices

    q1 = 1,76 soit 2 pices ; q2 = Me = 3 pices et q3 = 4,31 soit 4 pices

  • Statistique descriptive 2. Caractristiques de tendance centrale

    74

    2.6.2. Exercice.

    On a relev la recette hebdomadaire en milliers de dirhams de 40 commerces. Les donnesbrutes sont :

    57 60 52 49 56 46 51 63 49 5786 93 77 67 81 70 71 91 67 8247 87 92 55 48 90 49 50 58 6267 89 69 72 75 48 85 90 83 66

    On demande de dterminer pour cette srie statistique la moyenne arithmtique et lamdiane :

    - A partir de la srie brute ;- A partir de la distribution des frquences tablies lexercice 1.3.4.- Comparer les rsultats obtenus.

    Solution : Srie brute : Moyenne = 67 675 DH ; Me = 67 000 DH

    Srie des frquences :

    k

    1iii xfx = 68 200 DH ; Me = 66 444 Dh

    Comparaison des rsultats : Les rsultats obtenus partir de la distribution desfrquences sont des rsultats approximatifs.

    2.6.3. Exercice.

    Le tableau suivant prsente le nombre de femmes en activit selon l'ge de 500 femmesactives :

    Tranche d'ges Effectif[15 20[[20 25[[25 30[[30 35[[35 40[[40 45[[45 50[[50 55[55 et plus

    1470

    10065695663612

    On demande de dterminer pour cette srie statistique la moyenne arithmtique, le mode, lamdiane et les quartiles.

    Dterminer lintervalle central qui contient 60 % des femmes actives.

  • Statistique descriptive 2. Caractristiques de tendance centrale

    75

    Solution :

    k

    1iii xfx = 35,92 ans ; Mo = 27,5 ans ; Me = 35,07 ans

    q1 = 27,05 ans ; q2 = Me = 35,07 ans et q3 = 45,08 ansd2 = 25,8 ans ; d8 = 47,06 ans => 60 % des femmes actives sont ges entre 25,8 et 47,06 ans.

    2.6.4. Exercice.

    Le tableau suivant donne le niveau de scolarit, en nombre dannes passes lcole, dunchantillon de 200 personnes.

    Niveau de scolarit Effectif[0 ; 6[

    [6 ; 12[[12 ; 14[[14 ; 16[

    40805030

    Total 200

    On demande de dterminer pour la srie statistique la moyenne arithmtique, le mode, lamdiane et les quartiles.

    Solution :

    k

    1iiixfx = 9,72 annes soit 10 annes environ ; Mode = 13 et

    Me = 10,5 annesq1 = 6,75 annes ; q2 = Me = 10,5 annes et q3 = 13,2 annes

    2.6.5. Exercice.

    Un organisme charg de raliser des enqutes statistiques gre un rseau de 125 enquteurs. Ladirection de cet organisme dcide d'tudier la rpartition de ses enquteurs selon le nombred'enqutes qu'ils ont ralises. Les donnes collectes ce sujet sont rsumes dans le tableauci-aprs :

    Nombre d'enqutes ralises Effectifs5

    1015202530

    81235402010

  • Statistique descriptive 2. Caractristiques de tendance centrale

    76

    On demande de dterminer pour cette srie statistique la moyenne arithmtique, le mode etla mdiane.

    Solution :

    k

    1iii xfx = 18,28 enqutes ; Mode = 20 enqutes et Me = 15,94 soit 16

    enqutes environ.

    2.6.6. Exercice.

    Une cooprative laitire fabrique un fromage qui doit contenir, selon les tiquettes, 45 % dematires grasses. Un institut de consommation dont le rle est de vrifier que la qualit desproduits est bien celle qui est affirme par l'tiquette, fait prlever et analyser un chantillon de100 fromages. Les rsultats de l'analyse sont consigns dans le tableau suivant :

    Taux de matires grasses Nombre de fromages[41,5 - 42,5[[42,5 - 43,5[[43,5 - 44,5[[44,5 - 45,5[[45,5 - 46,5[[46,5 - 47,5[[47,5 - 48,5[

    11124382231

    On demande de dterminer pour la srie statistique la moyenne arithmtique, le mode, lamdiane, la mdiale et les quartiles.

    Solution :

    k

    1iii xfx = 44,82 % ; Mode = 45 % ; Me = 44,87 % et Ml = 44,89 %

    q1 = 44,04 % ; q2 = Me = 44,87 % et q3 = 45,55 %

    2.6.7. Exercice.

    Si le prix d'un article double tous les quatre ans, quel est le taux moyen d'augmentation du prixpar an ?

    Solution : Moyenne gomtrique : Taux moyen = 4 2 -1 = 0,189 = 18,9 %

    2.6.8. Exercice.

    Une enqute, abordant la crise de logement, a t ralise auprs d'un chantillon de 1000personnes choisies dans quatre rgions diffrentes. Parmi les rsultats de cette enqute on arelev le nombre moyen de personnes par pice pour chaque rgion.

  • Statistique descriptive 2. Caractristiques de tendance centrale

    77

    Rgion Nombre moyen depersonnes par piceNombre d'habitants

    (en milliers)NordEstOuestSud

    2,22,63,13,3

    5146560063507000

    Quel est le nombre moyen de personnes par pice pour l'ensemble des quatre rgions ?Solution : Moyenne harmonique = 2,78 personnes par pices soit 278 personnes pour 100pices.

    2.6.9. Exercice.

    Le coefficient budgtaire de la consommation des mnages en services de sant est pass de 6,9% en 1990 8,5 % en 1995, puis 9,8 % en 2000, 10,6 % en 2004 et enfin 10,9 % en 2005.

    a) Calculer les taux annuels moyens de croissance pour les priodes suivantes : (1990 1995) ;(1995 2000) ; (2000 2004) et (2004 2005).b) Dterminer le taux de croissance annuel moyen de 1990 2005.c) Donner une estimation du coefficient budgtaire en 2010 si la tendance relative de la priode2000 - 2005 se maintenait.

    Solution : a) t1995/1990 = 4,26 % par an ; t2000/1995 = 2,89 % par an ; t2004/2000 = 1,98 % par an ett2005/2004 = 2,83 %. b) t2005/1995 = 3,10 % par an. c) Coefficient budgtaire estim en 2010 = 12,1%.

    2.6.10. Exercice.

    Le prix la tonne d'une matire premire a volu au cours de la priode allant de 2001 2005,comme suit :

    Anne 2001 2002 2003 2004 2005Prix unitaire 310 266 220 200 150

    a) Sachant que chaque anne une socit achte la mme quantit de cette matire premire,calculer le cot moyen pour les cinq annes.b) Quel est le cot moyen si la socit dpense, chaque anne, la mme somme : 1 00 000 DH,pour l'achat de cette matire premire ?

    Solution : a) Cot moyen = 229,2 DH/t. b) Cot moyen = 215,54 DH/t.

  • Statistique descriptive 3. Caractristiques de dispersion

    78

    CHAPITRE 3CARACTERISTIQUES DE DISPERSION

    Les paramtres de dispersion dune srie statistique permettent de chiffrer la variation desvaleurs observes autour d'un paramtre de position. Les principaux paramtres de dispersionsont : lcar