Statistiques descriprtives-cours et exercices
description
Transcript of Statistiques descriprtives-cours et exercices
-
Mohamed DIOURIDocteur Ingnieur
Prsident Fondateur de lIGA
Adil ELMARHOUMDocteur en statistique et informatique applique
Professeur Habilit Universit Mohamed V Agdal
STATISTIQUE DESCRIPTIVECours et exercices
-
Collection Sciences Techniques et Managements des ditions TOUBKALPublications du Centre de Recherche en Mathmatiques (CRM) de lIGA
STATISTIQUE DESCRIPTIVECours et exercices
Tous les droits sont rservsDpt lgal N2006/2774
I.S.S.N. 9954 496 03 3
Les livres de la collection Sciences Techniques et Managementsont co-dits par les ditions TOUBKAL et lInstitut suprieur du Gnie Appliqu, IGA.
-
3
-
A la mmoire de MyriamM D
A mes chers enfants Zineb et AdamA.E
-
LIMINAIRE
On dit souvent que lon peut faire dire ce quon veut aux statistiques ! Cest bien connu,entre le verre moiti plein et le verre moiti vide la diffrence dinterprtation nousinterpelle, mais avant de pouvoir interprter un ensemble de donnes, il est indispensable desavoir comment reprsenter, dans un tableau ou par un graphique, une srie statistique,comment en faire les premiers traitements et surtout comment prsenter les rsultats de cescalculs.
Ce sont l, les objectifs de ce livre !
Le prsent livre est un livre de cours.
La mthode adopte peut se rsumer dans les deux points suivants :
- Chaque chapitre est trait dune faon exhaustive pour englober tous les concepts ettoutes les dmonstrations des formules statistiques.Il renferme, en plus, un ensemble dexemples dapplication avec solutions et surtout lesmthodes de rsolution.
- A la fin de chaque chapitre, le lecteur trouvera, ensuite un ensemble dexercicesdapplication qui lui permettra de sentraner rsoudre des problmes classiques destatistique.
Signalons, cet effet, que pour toutes les solutions proposes pour les exemples, nous avonsutilis lordinateur avec des logiciels de graphisme et de gestionnaires de tableaux et nousencourageons vivement autant les tudiants que les professeurs den faire de mme pour toutproblme de statistique.
Cette utilisation de lordinateur nous amne avertir nos lecteurs que les rsultats descalculs donns dans les tableaux et ailleurs diffreront de ceux quon pourrait obtenir grce une calculette pour la simple raison que la puissance de prcision dun ordinateur ne peutjamais tre gale par une calculette.
-
Ce livre est ainsi destin aux tudiants qui dsirent acqurir une certaine adresse larsolution de problmes de statistique descriptive et aux professeurs qui recherchent unensemble dexercices didactiques de statistique descriptive proposer la rflexion de leurstudiants.
Les auteurs
Casablanca, octobre 2006.
-
SOMMAIRE
INTRODUCTION 9PARTIE 1- STATISTIQUE DESCRIPTIVE A UNE SEULE VARIABLE 13
CH. 1. TABLEAUX ET GRAPHIQUES 151.1. Tableaux statistiques 151.2. Reprsentations graphiques 281.3. Exercices dapplication 37
CH. 2. CARACTERISTIQUES DE TENDANCE CENTRALE 432.1. Les moyennes 432.2. Le mode 612.3. La mdiane 632.4. La mdiale 662.5. Les fractiles 692.6. Exercices dapplication 73
CH. 3. CARACTERISTIQUES DE DISPERSION 783.1. Ecart absolu moyen 783.2. Variance 823.3. Ecart type 863.4. Coefficient de variation 873.5. Indice de concentration 933.6. Exercices dapplication 104
PARTIE 2 - STATISTIQUE DESCRIPTIVE A DEUX VARIABLES 111CH. 4. REGRESSION ET CORRELATION 113
4.1. Introduction 1134.2. Rgression simple 1134.3. Qualit de lajustement 1304.4. Calcul des prvisions 1374.5. Rgression non linaire simple 1384.6. Rgression multiple 1424.7. Exercices dapplication 153
-
CH. 5. LES SERIES CHRONOLOGIQUES 1635.1. Dfinition 1635.2. Reprsentation graphique 1645.3. Les principaux mouvements des sries chronologiques 1665.4. Les schmas de composition 1675.5. Les mthodes de lissage 1695.6. Etude du trend 1785.7. Etude de la composante saisonnire 1835.8. Exercices dapplication 195
CH. 6. INDICES STATISTIQUES 2056.1. Les indices lmentaires 2056.2. Les indices synthtiques 2116.3. Les indices synthtiques pondrs 2166.4. Les principaux indices synthtiques 2176.5. Lindice des prix la consommation 2206.6. Indices boursiers 2336.7. Exercices dapplication 234
BIBLIOGRAPHIE 246
-
Statistique descriptive Introduction
9
INTRODUCTION
HISTORIQUE.
Lactivit qui consiste recueillir des donnes permettant de connatre la situation des tatsremonte la plus haute antiquit. On cite, dune part, lempereur chinois Yao, organisant lerecensement des productions agricoles en 2238 avant J.-C., et, dautre part, linstitution desrecensements de la population chez les gyptiens, en 1700 avant J.-C.
Au dbut du XVIe sicle, on commena tenir en Angleterre un registre des dcs et desnaissances. En France, les intendants Sully, Colbert et Vauban commandrent de nombreuxinventaires et enqutes. En 1662, l'Anglais John Graunt constata une certaine constance dans lerapport du nombre de naissances fminines celui des naissances masculines.
On attribue la cration du terme statistique un professeur allemand Gttingen,G. Achenwall (1719-1772), qui aurait en 1746 cr le mot Statistik, driv de la notionStaatskunde.
Mais c'est seulement au XIXe sicle qu'on dcouvrit que la thorie des probabilits pouvaitconstituer une aide prcieuse la mthode statistique. Ce rapprochement, dj peru par lemathmaticien Laplace, fut l'uvre d'Adolphe Qutelet (1796-1874), statisticien belge qui fut l'initiative du premier congrs international de statistiques en 1853. Ds lors, la statistique sedveloppa dans la plupart des sciences.
Lapparition dune relle mthodologie statistique a t initie par des statisticiens anglaisautour de 1900. Cest--dire une thorie bien formalise du raisonnement qui permet, partirdes donnes observes, de tirer des conclusions sur les lois de probabilit des phnomnes.Cest la statistique mathmatique, qui sest dveloppe entre 1900 et 1950 et dont les succsont impos, au cours de cette priode, une interprtation particulire du concept de probabilit.
-
Statistique descriptive Introduction
10
partir des annes cinquante, lapparition de calculateurs puissants a donn naissance auxmthodes danalyse des donnes multidimensionnelles, qui ont connu une grande vogue,parfaitement justifie par leur efficacit. Ces mthodes permettent de dcrire, de classer et desimplifier des donnes, les rsultats auxquels elles conduisent peuvent suggrer des lois, desmodles ou des explications des phnomnes.
Aujourd'hui, les statistiques sont considres comme des outils fiables qui peuvent fournirune reprsentation exacte des valeurs de donnes conomiques, politiques, sociales,psychologiques, biologiques ou physiques. Elles permettent de mettre en corrlation de tellesdonnes et de les analyser. Le travail du statisticien ne se limite plus recueillir des donnes et les prsenter sous forme de tableaux, mais il consiste principalement interprterl'information.
DEFINITION.
Statistique, une discipline qui a pour objet la collecte, le traitement et l'analyse de donnesnumriques relatives un ensemble d'individus ou d'lments. Elle constitue un outil prcieuxpour l'exprimentation, la gestion des entreprises ou encore l'aide la dcision.
Une tude statistique se dcompose en quatre tapes : la dfinition et la collecte desdonnes, leur prsentation en tableaux, leur analyse et enfin la comparaison des rsultats avecdes lois statistiques connues.
1 - Dfinition et collecte des donnes
La matire premire des mthodes statistiques est constitue d'ensembles de nombres,obtenus en comptant ou en mesurant des lments. Il est donc indispensable, lors de la collectede donnes statistiques, de s'assurer de l'exhaustivit et de la fiabilit des informationsrecueillies.
Avant la collecte des donnes, on commence par dfinir la nature et la quantit des donnes recueillir. Cette collecte s'effectue par recensement ou par sondage. Les donnes recueilliespeuvent faire l'objet d'une vrification partielle par mesure de scurit.
2 - Reprsentation des donnes
Les donnes recueillies sont classes et ranges dans des tableaux de faon permettre uneanalyse et une interprtation directes. Ensuite, On peut reprsenter graphiquement les donnesdu tableau.
-
Statistique descriptive Introduction
11
3 - Analyse des donnes
Une fois les donnes recueillies et prsentes sous forme de tableaux, le travail d'analysecommence par le calcul d'un paramtre statistique qui puisse rsumer lui seul l'ensemble desdonnes. On distingue trois types de paramtres statistiques :
- Tendance centrale : elle sert caractriser l'ordre de grandeur des observations ;- Dispersion : elle sert savoir si les mesures sont troitement regroupes autour de la
moyenne ou si elles sont disperses ;- Corrlation : elle sert tudier la relation qui peut exister entre deux phnomnes.
4 - Comparaison des rsultats avec des lois statistiques
Les statisticiens se sont aperus que de nombreux ensembles de mesures avaient le mmetype de distribution. Ils ont donc t amens concevoir des modles mathmatiques qui soientle reflet des lois statistiques souvent rencontres. La comparaison des rsultats avec ces loisstatistiques permet de donner une explication du phnomne observ et en vrifier le bienfond.
Dans le prsent ouvrage, nous nous proposons de montrer comment reprsenter les donnesrecueillies et comment en faire le traitement en exposant successivement les mthodes de calculdes 3 paramtres statistiques que sont les paramtres de tendance centrale, ceux de dispersion etceux de corrlation.
Les mthodes de collecte de donne et celles de la comparaison des rsultats de leurstraitements avec des lois statistiques feront lobjet dun autre ouvrage.
-
Statistique descriptive Introduction
12
-
Statistique descriptive Partie 1 : statistique descriptive une variable
13
PARTIE 1STATISTIQUE DESCRIPTIVE A UNE VARIABLE
La statistique descriptive une variable est lensemble des mthodes qui permet dobtenir etde faire un 1er traitement des informations relatives un caractre particulier dindividus dunepopulation donne.
La statistique descriptive a plusieurs objectifs :
- recueillir lensemble des donnes relatives un caractre particulier dindividus dunepopulation donne ;
- classer lensemble de ces donnes selon des sries statistiques afin de permettre denfaire :
* des reprsentations graphiques pour en visualiser lallure ;* des traitements mathmatiques pour en dterminer certaines caractristiques.
Dans cette partie, nous axerons notre propos, dabord sur la dfinition des diffrentsconcepts que nous venons dintroduire, ensuite sur les premiers traitements mathmatiques envue de la dtermination de certaines caractristiques.
-
Statistique descriptive Partie 1 : statistique descriptive une variable
14
-
Statistique descriptive 1. Tableaux et graphiques
15
CHAPITRE 1TABLEAUX ET GRAPHIQUES
1.1. TABLEAUX STATISTIQUES.
Nous donnons dans ce qui suit la dfinition des principaux concepts de la statistique.
Population : ensemble dlments ou dindividus ayant un caractre commun tudier.
Exemples 1 : Ensemble des tudiants dune cole ; Ensemble des habitants dune ville ; Ensemble des livres dune bibliothque ; Ensemble de la production dune entreprise pendant un an ; Etc.
Echantillon : partie de la population. Du fait de la taille importante de la population et delimpossibilit den faire ltude exhaustive, on se contente, le plus souvent, dtudier lecaractre daprs un chantillon.
Lchantillon doit tre choisi de faon quil soit reprsentatif, pour ce faire il existe desmthodes de tri en vue de la constitution dchantillon. Elles font lobjet dtudes spcifiques.
Exemples 2 : Lensemble des tudiants dune salle de classe dune cole ; Lensemble dun millier dhabitants choisi parmi tous les habitants dune ville ; Lensemble dune centaine de livre tri parmi tous les livres dune bibliothque ; La production dune entreprise pendant quelques jours ; Etc.
Individu : lment de base constituant la population ou lchantillon, on dit aussi, unitstatistique.
Exemples 3 :
-
Statistique descriptive 1. Tableaux et graphiques
16
Ltudiant dune cole ; Lhabitant dune ville ; Le livre dune bibliothque ; lunit produite par une entreprise ; Etc.
Effectif : nombre dindividus observs constituant lchantillon, il est not n.
Exemples 4 : n = 30 sil y a 30 tudiants dans lchantillon ; n = 2000 sil y a 2000 habitants dans lchantillon ; n = 125 sil y a 125 livres dans lchantillon ; n = 15 000 sil y a 15 000 units produites constituant lchantillon ; etc.
Caractre : Aspect particulier commun tous les individus de la population et donc delchantillon. Le caractre peut tre qualitatif ou quantitatif et dans ce cas il peut tre discret oucontinu.
Exemples 5 : Notes des tudiants dune cole ; Situations familiales des habitants dune ville ; Thmes des livres dune bibliothque ; Poids des units produites par une entreprise ; Etc.
Modalits : Ce sont les diffrentes possibilits que peut prendre le caractre, par exemplefminin ou masculin si le caractre est le sexe et 1,50 m ou 1,70 m si le caractre est la taille,etc.
Caractre qualitatif : Un caractre est dit qualitatif quand il ne peut pas tre mesur.
Exemples 6 : Le tableau ci-dessous liste quelques exemples de caractres qualitatifs et demodalits :
Caractres Modalits GenresCouleur Rose, rouge, blanc, bleu, QualitatifNationalit Marocain, Franais, Suisse, QualitatifSituation matrimoniale Mari, clibataire, veuf, divorc, QualitatifDisponibilit Oui, non. Qualitatif
-
Statistique descriptive 1. Tableaux et graphiques
17
Pour chaque modalit i du caractre tudier, on dtermine, pour lchantillon considr,de taille n :
ni : effectif dindividus chez qui a t observe la modalit i.
fi = ni / n : frquence relative de la modalit i.
Avec 1k
1i ifetn
k
1i in
Exemples 7 : Dans un chantillon de 2000 habitants dune ville, en relve que 900personnes sont maries, on a ainsi, pour la modalit habitants maris :
ni = 900 et fi = 900/2000 = 45 % ;
- Dans une bibliothque constitue de 5000 livres on relve que 120 livres ont pour thmeles mathmatiques, on a ainsi pour la modalit livres de mathmatiques :
ni = 120 et fi = 120/5000 = 2,4 %
- On considre lensemble des touristes qui visitent le Maroc pendant une priode donne eton considre comme caractre la nationalit. Si lon relve quil y a 300 Franais parmi unensemble de 900 touristes on a pour la modalit nationalit franaise :
ni = 300 et fi = 300/900 = 33,33 %
Caractre quantitatif : Un caractre est dit quantitatif quand il peut tre mesur. Il peutalors tre continu ou discret :
- il est discret dans le cas doprations de dnombrement ou de comptage ;- il est continu dans le cas doprations de mesures.
Exemples 8 : Le tableau ci-dessous donne quelques exemples de caractres quantitatifs etde modalits.
Caractres Modalits GenresPoids 60,5 Kg; 59,2 Kg; 65,3 Kg; ContinuAnciennet en entreprise 10 ans et 2 mois ; 9ans ; ContinuVolume 1 m3 ; 2,3 m3 ; 3 m3 ; ContinuLongueur 1 m ; 2,75 km ; 350 dm ; ContinuNotation 10/20 ; 9,5/10 ; ContinuAnnes dtudes 2 ans ; 3 ans ; 6 ans ; DiscretNombre de frres et surs 1 ; 2 ; 3 ; DiscretNombre denfants 0 ; 1 ; 2 ; Discret
-
Statistique descriptive 1. Tableaux et graphiques
18
On dtermine pour chaque caractre quantitatif :
Si le caractre est discret : xi la valeur de la modalit ;
ni : effectif dindividus chez qui, la modalit i, a t observe.
fi = ni / n : frquence relative de la modalit i.
Fi :
ij
1jjf frquence relative cumule croissante.
F(x) : Fonction de rpartition, proportion dindividus ayant des modalits du caractretudi infrieures ou gales x.
Exemple 9 : On considre le poids des habitants dune ville comme caractre, on a, pour unchantillon, la distribution suivante :
Poidsxi
Effectifs concernsni
Frquences relativesfi
Frquences relativescumules Fi
65Kg 54 21.86% 21.86%70Kg 132 53.44% 75.30%75Kg 27 10.93% 86.23%80Kg 34 13.77% 100.00%Total 247 100% -
Unit statistique : habitant de la ville ;Population : lensemble des habitants de la ville ;Caractre tudi : le poids ;Type de caractre : variable statistique discrte. (dans le cas de lexemple).
La fonction de rpartition F(x) se dfinit comme suit :Pour x 65 Kg, on a : F(x) = 21,86% ou 21,86 % de lchantillon ont un poids infrieur ou
gal 65 Kg.Pour x 70 Kg, on a : F(x) = 75.30% ou 75,30 % de lchantillon ont un poids infrieur ou
gal 70 Kg.Pour x 75 Kg, on a : F(x) = 86.23% ou 86,23 % de lchantillon psent au plus 75 Kg.Pour x 80 Kg, on a : F(x) = 100.00 % ou la totalit de lchantillon a un poids infrieur ou
gal 80 Kg.
Exemple 10 : une enqute auprs de 1000 commerants portant sur le nombre de leursemploys, a donn les rsultats suivants :
-
Statistique descriptive 1. Tableaux et graphiques
19
xi ni fi
Frquenceabsoluecumule
croissante
Frquenceabsoluecumule
dcroissante
Frquencerelativecumule
croissante
Frquencerelativecumule
dcroissante01234567
5010020015012016013090
5 %10 %20 %15 %12 %16 %13 %9 %
50150350500620780910
1000
100095085065050038022090
5 %15 %35 %50 %62 %78 %91 %
100 %
100 %95 %85 %65 %50 %38 %22 %9 %
Total 1000 100 % - - - -
Unit statistique : Un commerant ;Population : lensemble des 1000 commerants ;Caractre tudi : Nombre demploys ;Type de caractre : Variable statistique discrte.
Le nombre de commerants n'employant aucun employ est 50, ce qui reprsente 5 % descommerants.
Les frquences absolues ou relatives cumules croissantes sont calcules en cumulant lesfrquences absolues ou relatives du haut du tableau vers le bas. Elles permettent de rpondreaux questions du genre : quel est le nombre ou la proportion au plus ?
Par contre, les frquences absolues ou relatives cumules dcroissantes sont calcules encumulant les frquences absolues ou relatives du bas du tableau vers le haut. Elles permettentde rpondre aux questions du genre : quel est le nombre ou la proportion au moins (auminimum ou plus de) ?
Le nombre de commerants employant au plus 5 employs (au maximum 5 employs oumoins de 6 employs) est 780, ils reprsentent 78 % des commerants.
Le nombre de commerants employant au moins 3 employs (au minimum 3 employs ouplus de 2 employs) est 650, ils reprsentent 65% des commerants.
-
Statistique descriptive 1. Tableaux et graphiques
20
Si le caractre est continu : [Ci ; Ci+1[ est lintervalle ou classe des modalits avec : Ci et Ci+1 les bornes de la classe ; ci : centre de la classe ; ai : amplitude de la classe ; di : densit de la classe. ni : effectif de la classe i, nombre dindividus dont la modalit du caractre est
comprise entre Ci et Ci+1.
ci = 2CC i1i
, ai = Ci+1 Ci et di = ni/ai
De la mme manire que dans le cas discret, on dfinit :
fi = ni / n : frquence relative de la modalit i.
Fi :
ij
1jjf frquence relative cumule croissante.
Exemple 11 : On considre la taille comme caractre, on a pour un chantillon de 169personnes, la distribution suivante :
Tailles (en m)Ci ; Ci+1
ci(en m)
Effectifsconcerns
ni
Frquencesrelatives
fi
Frquencesrelatives cumules
Fi[1,50 ; 1,60[ 1.55 35 20,71 % 20,71 %[1,60 ; 1,70[ 1.65 42 24,85 % 45,56 %[1,70 ; 1,80[ 1.75 53 31,36 % 76,92 %[1,80 ; 1,90[ 1.85 39 23,08 % 100 %
Total - 169 100 % -
Parmi les 169 personnes, 35 mesurent entre 1,50 m et moins de 1,60 m, ce qui reprsente20,71 % de lensemble de lchantillon.
76,92 % de lchantillon mesurent moins de 1,80 m.
Le fait de remplacer la classe Ci ; Ci+1 par ci permet de faire des calculs car on ne sait pasfaire des calculs sur des intervalles.
Srie statistique : Une srie statistique est lensemble constitu des xi et ni. On parle ausside distribution statistique une seule variable, comme par exemple :
Tailles et effectifs ; Situations matrimoniales et effectifs ; Ages et effectifs. Etc.
-
Statistique descriptive 1. Tableaux et graphiques
21
Question 1 : Comment passer dune srie statistique relative un caractre discret oucontinu donne sous forme dune suite de classes [Ci ; Ci+1[et deffectifs ni de ces classes unesrie statistique sous forme dune suite de valeurs xi et deffectifs ni relatifs ces valeurs ?
On doit considrer 2 cas possibles :
1 cas : Classes amplitudes gales.
Il suffit, dans ce cas, de remplacer chaque classe [Ci ; Ci+1[ par son lment central ci = ( Ci+ Ci+1 ) / 2 auquel il faut affecter leffectif ni.
Exemple 12 : On considre la srie statistique relative aux poids dun chantillon de 120habitants dune ville, elle se prsente comme lindique le tableau suivant :
Poids (kg)Ci ; Ci+1
Effectifsni
[55 ; 60[ 5[60 ; 65[ 14[65 ; 70[ 20[70 ; 75[ 40[75 ; 80[ 18[80 ; 85[ 15[85 ; 90[ 8
Total 120
Unit statistique : Habitant dune ville ;Population : Lensemble des habitants dune ville ;Caractre tudi : Le poids de lhabitant ;Type de caractre : Variable statistique continue.
On remplace chaque classe par le centre de cette classe, on obtient alors la srie quivalentesuivante :
Poids (kg)ci
Effectifsni
Frquence relativefi
57,5 5 4.17%62,5 14 11.67%67,5 20 16.67%72,5 40 33.33%77,5 18 15.00%82,5 15 12.50%87,5 8 6.67%
Total 120 100%
-
Statistique descriptive 1. Tableaux et graphiques
22
Exemple 13 : On considre la srie statistique relative aux notes obtenues dans une matire,par les tudiants dune classe dcole :
NotesCi ; Ci+1
Effectifsni
6 ; 8 28 ; 10 610 ; 12 1212 ; 14 714 ; 16 3
Total 30
Unit statistique : Un tudiant ;Population : Lensemble des tudiants dune classe dcoleCaractre : Note dtudiantType de caractre : Variable statistique continue
On remplace chaque classe par le centre de cette classe, on obtient alors la srie quivalentesuivante :
Notesci
Effectifsxi
Frquences relativesfi
7 2 6.67%9 6 20%
11 12 40%13 7 23.33%15 3 10%
Total 30 100%
2 cas : Classes amplitudes diffrentes.
Il suffit, dans ce cas :- de considrer les amplitudes des diffrentes classes ;- de calculer leur Plus Grand Commun Diviseur (PGCD) ;- de diviser chaque classe par le PGCD pour obtenir plusieurs sous classes qui
deviennent de nouvelles classes ;- Daffecter chaque nouvelle classe, le quotient de leffectif de la classe mre par le
nombre de sous classes.
Remarquons que cette mthode repose sur lhypothse simple suivante qui consiste admettre que les effectifs se rpartissent de faon rgulire dans une classe.
-
Statistique descriptive 1. Tableaux et graphiques
23
Exemple 14 : Reprenons lexemple 13 et considrons la srie statistique relative aux notesobtenues dans une autre matire, par les tudiants dune classe dcole :
NotesCi ; Ci+1
Effectifsni
[0 ; 6[ 66 ; 8 48 ; 14 1214 ; 18 4
Unit statistique : Un tudiant ;Population : Lensemble des tudiants dune classe dcoleCaractre : Note dtudiantType de caractre : Variable statistique continue
Dans cette srie, les amplitudes des diffrentes classes sont : 6 ; 2 ; 6 ; 4. Leur PGCD est 2.On remplace chaque classe par plusieurs autres classes et on obtient alors la srie quivalentesuivante :
NotesCi ; Ci+1
Effectifsni
[0 ; 2[ 2[2 ; 4[ 2[4 ; 6[ 26 ; 8 48 ; 10 410 ; 12 412 ; 14 4[14 ; 16 216 ; 18[ 2
-
Statistique descriptive 1. Tableaux et graphiques
24
On remplace, aprs cette opration, chaque classe par le centre de cette classe, on obtientalors la srie quivalente suivante :
NotesCi ; Ci+1
ciEffectifs
ni[0 ; 2[ 1 2[2 ; 4[ 3 2[4 ; 6[ 5 26 ; 8 7 48 ; 10 9 410 ; 12 11 412 ; 14 13 4[14 ; 16 15 216 ; 18[ 17 2
Remarque : Ainsi on peut considrer que toute srie statistique est donne, selon lesbesoins du traitement numrique :
- Soit sous forme dune suite de classes [Ci ; Ci+1[et deffectifs ni.- Soit sous forme dune suite de valeurs xi et deffectifs ni
Question 2 : Comment passer dune srie statistique relative un caractre discret oucontinu donne sous forme dune suite de valeurs xi une srie donne sous forme dune suitede classes [Ci , Ci+1[ et deffectifs ni par classe ?
Pour ce faire, on utilise la rgle de STURGES donnant le nombre k de classes en fonctiondu nombre n des donnes :
k = 1 + 3,322 log10 n
Ce calcul donne un nombre rel, on prend alors pour k le nombre entier trs proche dursultat de calcul de la formule prcdente.
Et tant ltendue E de toute la srie statistique, on dtermine e, tendue de chaque classe :
e = E / k avec E = xmax - xmin
xmax et xmin tant la valeur maximale et la valeur minimale prises par le caractre, lesdiffrentes classes seront alors :
La borne infrieure de la premire classe C1 est gale xmin ou une valeur lgrementinfrieure xmin.
-
Statistique descriptive 1. Tableaux et graphiques
25
C1 ; C1+e C1+e ; C1+2e C1+2e ; C1+3e C1+(k-1)e ; C1+ke
Exemple 15 : En prenant la taille comme caractre des habitants dune ville on a lesrsultats relatifs un chantillon de 169 habitants :
Tailles (en m)xi
Effectifs concernsni
1.45 51.55 301.65 421.75 531.85 39
Total 169
Unit statistique : Habitants dune ville;Population : Lensemble des habitants de la villeCaractre : La taille de lhabitantType de caractre : Variable statistique continue
On applique la mthode de STURGES avec les conditions :
N = 169 E = 1,85 1,45 = 0.40
Ce qui donne, aprs calcul, k=1+3.322 log10 169 = 8.40
On prendra k = 8 et e = E/8 = 0.40/8 = 0.05
-
Statistique descriptive 1. Tableaux et graphiques
26
La srie prcdente peut tre transforme en la srie quivalente suivanteTailles (en m)
[Ci ; Ci+1[Effectifs concerns
ni1.45 ; 1.50 51.50 ; 1.55 01.55 ; 1.60 301.60 ; 1.65 01.65 ; 1.70 421.70 ; 1.75 01.75 ; 1.80 531.80 ; 1.85 01.85 ; 1.90 39
Total 137
Remarque : on aboutit 9 classes au lieu de 8 du fait de la configuration des intervallesdfinissant les classes.
Exemple 16 : On a mesur le poids en kilogramme comme caractre pour un chantillon de80 lves dune cole. Les donnes brutes sont reportes dans le tableau suivant :
68 84 75 82 68 90 62 88 76 9373 79 88 73 60 93 71 59 85 7561 65 75 87 74 62 95 78 63 7266 78 82 75 94 77 69 74 68 6096 78 89 61 75 95 60 79 83 7179 62 67 97 78 85 76 65 71 7565 80 73 57 88 78 62 76 53 7486 67 73 81 72 63 76 75 85 77
Unit statistique : Elve dune cole ;Population : Lensemble des lves dune cole ;Caractre : Le poids ;Type de caractre : Variable statistique discrte.
La plus grande valeur est : 97La plus petite valeur est : 53L'tendue est : E = 97 - 53 = 44
On applique la mthode de STURGES avec les conditions : n = 80 E = 44
-
Statistique descriptive 1. Tableaux et graphiques
27
Ce qui donne, aprs calcul, k = 1 + 3,322 log10 80 = 7,322On prendra k = 7 et e = E / 7 = 44 /7 = 6
La srie prcdente peut tre transforme en la srie quivalente suivante :
Poids ci(1)ni(2)
Ni cr(3)
Ni d(4)
fi(5)
Fi cr(6)
Fi d(7)
[52 ; 58[[58 ; 64[[64 ; 70[[70 ; 76[[76 ; 82[[82 ; 88[[88 ; 94[
[94 ; 100[
5561677379859197
212101916975
214244359687580
807866563721125
2,5%15%
12,5%23,75%
20%11,25%8,75%6,25%
2,5%17,5%30%53,7573,7585%
93,75%100%
100%97,5%82,5%70%
46,25%26,25%
15%6,25%
Total - - - 80 - - - - - - 100% - - - - - -
Lgende du tableau :- (1) : point central de la classe ;- (2) : effectif de la classe, frquence absolue ;- (3) : frquence absolue cumule croissante ;- (4) : frquence absolue cumule dcroissante ;- (5) : pourcentage de la classe, frquence relative ;- (6) : frquence relative cumule croissante ;- (7) : frquence relative cumule dcroissante.
Le nombre de personnes pesant entre 64 et moins de 70 kilogrammes est 10, ils reprsentent12,5 % des personnes peses.
Le nombre de personnes pesant au moins 70 kilogrammes est 56, ils reprsentent 70 % despersonnes peses.
Le nombre de personnes pesant moins de 82 kilogrammes est 59, ils reprsentent 73,75 %des personnes peses.
-
Statistique descriptive 1. Tableaux et graphiques
28
Pour rcapituler toute cette premire partie, donnons, dans un tableau synthtique, grce des exemples, lensemble des concepts que nous avons introduits jusque l :
Population Echantillon Caractres Modalits Effectifs
Habitants dune ville 200 habitants choisis-taille-poids-etc.
- 1m65- 65kg- etc.
200
Elves dune cole 30 lves tris -notes - 13,5 30Livres dunebibliothque 125 livres tris -thmes des livres - math 125
Production duneusine
1500 units produitestries
-poids de lunit-dimension delunit
- 8g
- 37cm1500
Le tri ou le choix pour constituer un chantillon se fait selon des processus bien prcis.
1.2. REPRESENTATIONS GRAPHIQUES.
Il est trs courant, dans un premier traitement, pour bien visualiser lallure dune sriestatistique, de la reprsenter par un graphe. Cette reprsentation peut tre faite selon plusieursmanires, en effet on peut citer les diffrentes reprsentations suivantes :
- le diagramme bandes ;- le diagramme secteurs ;- le diagramme btons ;- lhistogramme des frquences simples ;- le polygramme des frquences simples ;- la courbe des frquences cumules.
Chaque type de reprsentation convient un type de caractre (qualitatif ou quantitatif,quantitatif discret ou quantitatif continu) et un type de srie.
Nous donnons dans ce qui suit un ensemble de possibilits de reprsentations dune sriestatistique en indiquant, chaque fois, le choix du graphe adquat selon le type de caractre oude la srie ainsi que les raisons de ce choix.
1.2.1. Caractre qualitatif : Rappelons quun caractre qualitatif est un caractre quon nepeut pas mesurer. Dans ce cas, deux types de reprsentations sont conseills :
Diagramme bandes :
Exemple 17 : On considre la srie statistique relative la situation familiale dunchantillon de 130 personnes :
-
Statistique descriptive 1. Tableaux et graphiques
29
Situations familiales xi Effectifs concerns : niClibataires 1 30
Maris 2 35Divorcs 3 40
Veufs 4 25Total --- 130
La reprsentation graphique dune telle srie peut tre trs bien faite par un diagramme bandes.
05
1015202530354045
clibataires maris divorcs veufs
Modalits de la variable
Effe
ctifs
Remarques : La largeur des bandes est quelconque mais identique pour toutes les bandes.
Seules les hauteurs des bandes indiquent les effectifs ou les frquences relatives.
La numrotation des classes de modalits de 1 4 est faite uniquement dans le but defaciliter les reprsentations graphiques.
Diagramme secteurs :
Exemple 18 : On reprend lexemple 7 et lon considre la mme srie statistique relative la situation familiale dun chantillon de 130 personnes pour laquelle nous avons converti leseffectifs en pourcentage :
-
Statistique descriptive 1. Tableaux et graphiques
30
Situations familiales xiEffectifs concerns : ni
Frquences relatives : fiClibataires 1 30 = 23%
Maris 2 35 = 27%Divorcs 3 40 = 31%
Veufs 4 25 = 19%Total - - - 130 = 100%
La reprsentation graphique dune telle srie peut tre trs bien faite par un diagramme secteurs.
clibataires23%
maris27%
divorcs31%
veufs19%
Remarque 1 : le mme caractre, situation familiale a pu tre reprsent par deux types dediagrammes.
Remarque 2 : La surface de chaque secteur reprsente, en pourcentage, la frquencerelative de la modalit indique.
Le rayon du cercle est quelconque.
1.2.2. Caractre quantitatif discret : Rappelons quun caractre quantitatif est discretdans le cas doprations de comptage, dans ce cas, plusieurs types de reprsentation sontpossibles.
Diagramme btons :
Exemple 19 : On considre la srie statistique des notes obtenues dans une matire, par unchantillon de 200 tudiants dun amphithtre de 500.
-
Statistique descriptive 1. Tableaux et graphiques
31
Notes : xi Effectifs : ni10 5512 4014 6016 45
Total 200
Pour reprsenter une telle srie, on a habituellement recours aux diagrammes btons.
0
10
20
30
40
50
60
70
10 12 14 16
Modalits de la variable
Effe
ctifs
Remarque : La hauteur de chaque bton est proportionnelle ni ou fi pour la valeur xi ducaractre.
Sur laxe des x, on reporte les valeurs de xi attribues aux caractres afin de pouvoir traiterla srie statistique.
La largeur du bton na aucune importance.
Polygone de frquences :
Les polygones de frquences sont construits en joignant par une ligne les sommets desbtons du diagramme en btons.
-
Statistique descriptive 1. Tableaux et graphiques
32
010203040506070
10 12 14 16Modalits de la variable
Effe
ctifs
Polygone de frquences cumules ou diagramme en escalier :
Exemple 20 : On reprend lexemple 18 et lon considre les notes obtenues dans unematire, par un chantillon de 200 lves, calculons les effectifs cumuls.
Notes : xi Effectifs : ni Effectifs cumuls Fi10 55 5512 40 9514 60 15516 45 200
Total 200 - - -
0
50
100
150
200
250
10 12 14 16Modalits de la variable
Effe
ctifs
cum
uls
-
Statistique descriptive 1. Tableaux et graphiques
33
1.2.3. Caractre quantitatif continu : Rappelons quun caractre quantitatif est continudans le cas doprations de mesures, dans ce cas, plusieurs types de reprsentation sontpossibles.
Histogramme :
Un histogramme est un graphique constitu de bandes verticales jointives. On dlimite enabscisses les classes successives de la variable continue, en principe de mme amplitude, et surchaque base ainsi dlimite, on lve un rectangle de hauteur proportionnelle la frquencecorrespondante de telle sorte que la surface du rectangle soit proportionnelle l'effectifcorrespondant.
Quand les classes sont de mme amplitude, la hauteur des rectangles est proportionnelle auxfrquences des classes, elle est gale numriquement la frquence correspondante. Si lesclasses n'ont pas la mme amplitude, il est ncessaire d'ajuster la hauteur des rectangles de tellesorte que la surface du rectangle soit proportionnelle l'effectif correspondant, la hauteur desrectangles est gale dans ce cas la densit de la classe.
Histogramme des frquences classes damplitudes gales :
Exemple 21 : On considre un chantillon de 530 personnes et lon prend pour caractre lasomme en DH quelles ont dans leur poche.
Montant dargent DH Effectifs ni20 ; 30 11030 ; 40 12040 ; 50 10050 ; 60 200
Total 530Pour reprsenter une telle srie statistique on a habituellement recours lhistogramme des
frquences classes damplitudes gales.
-
Statistique descriptive 1. Tableaux et graphiques
34
0
50
100
150
200
250
25 35 45 55
Xi
ni o
u fi
Remarque : On peut regrouper les valeurs discrtes par classes de mme amplitude, il suffitalors que la hauteur de chaque rectangle soit proportionnelle ni ou fi .
Sur laxe des x, on reporte les valeurs Ci, bornes des classesdu caractre x.
Histogramme des frquences classes damplitudes ingales :
On peut regrouper les valeurs discrtes par classes damplitudes diffrentes, il suffit alorsque la hauteur de chaque rectangle soit proportionnelle di, densit de la classe considre.
Sur laxe des x, on reporte les valeurs Ci, bornes des classes du caractre x.
Exemple 22 : La rpartition de la surface, en m, de 100 logements est reprsente dans letableau suivant :
Surface en m Nombre de logements Densits0 20
20 4040 60
60 100100 160160 260
1020401884
0,512
0,450,130,04
Total 100Les amplitudes des classes tant ingales, il convient de calculer les densits afin de
reprsenter l'histogramme.
-
Statistique descriptive 1. Tableaux et graphiques
35
0
0,5
1
1,5
2
2,5
10 30 50 70 90 110 130 150 170 190 210 230 250
surface (centres de classes)
dens
it d
i
Polygone des frquences : di ou fi
Exemple 23 : La rpartition des soldes dun chantillon de 150 comptes bancaires estdonne par le tableau suivant :
[Ci ; Ci+1[en 1000 DH
cien 1000 DH
Effectifni
[5 ; 15[[15 ; 25[[25 ; 35[[35 ; 45[[45 ; 55[
1020304050
2535453015
Total - - - 150
-
Statistique descriptive 1. Tableaux et graphiques
36
05
101520253035404550
10 20 30 40 50Xi
ni o
u fi
On construit, partir de lhistogramme des frquences.
- Le polygone des frquences, en joignant les milieux des segments.- La surface du polygone des frquences est la mme que celle de lhistogramme.
Exemple 24 : On reprend lexemple 23 et on se propose de reprsenter la courbe desfrquences cumules croissantes.
Courbe des frquences cumules croissantes
[Ci ; Ci+1[ en 1000 DH Ci en 1000 DH Effectif ni Fi[5 ; 15[
[15 ; 25[[25 ; 35[[35 ; 45[[45 ; 55[
1020304050
2535453015
2560
105135150
Total - - - 150 - - -
-
Statistique descriptive 1. Tableaux et graphiques
37
0
20
40
60
80
100
120
140
160
10 20 30 40 50
Xi
Fi
Les individus sont classs en classes, la frquence cumule associe la classe numro icorrespond la proportion dindividus dont la valeur du caractre est strictement infrieure lalimite suprieure de la classe numro i.
1.3. EXERCICES DAPPLICATIONS.
1.3.1. Exercice.
A partir des tableaux suivants prciser :a) l'unit statistique et la population ;b) le caractre tudi ;c) la nature du caractre tudi ;d) reprsenter graphiquement la distribution ;
Structure de l'emploi au Maroc :
Secteurs d'activits Part en %Agricole, fort, pche et mineIndustrie, btimentCommerceHtels et restaurantsTransport et communicationsFinances et banquesEmploi domestiqueSecteur public
4,934,5192,77,96,6
20,34,1
Total 100
-
Statistique descriptive 1. Tableaux et graphiques
38
Effectif des stagiaires en formation :
Niveau 1re anne 2me anne TotalTechnicien spcialisTechnicienQualificationSpcialisation
10319727
125426573
-
848792931335
103118214218357908
Total 29873 19115 48988
Rpartition du nombre de pices dun ensemble de logements :
Nombre de pices Part en %1 pice2 pices3 pices4 pices5 pices et plus
24,6821,4520,5016,5416,83
Total 100
Dure de vie des tubes lectroniques :
Dure (heures) Nombre de tubes400-499500-599600-699700-799800-899900-999
1000-1099
9088
1201051027520
Total 600
1.3.2. Exercice.
Une tude de march a mesur le degr de satisfaction dun chantillon de 500 clients dunebanque. Les rsultas sont prsents dans le tableau suivant :
Degr de satisfaction EffectifsPas du tout satisfait 223Insatisfait 187Indiffrent 32Satisfait 55Trs satisfait 3
Total 500a) Quelle est la population tudie ?
-
Statistique descriptive 1. Tableaux et graphiques
39
b) Quel est le caractre tudi ? quelle est sa nature ?c) Calculer les frquences relatives ?d) Reprsenter graphiquement cette distribution.
1.3.3. Exercice.
Soit la distribution suivante du nombre de pices dans 300 logements :
Nombre de pices Effectifs123456
355168554942
Total 300
a) Prsenter dans un tableau les diffrentes frquences cumules.b) Quel est le nombre de logements possdant au moins 3 pices ?c) Quelle est la proportion des logements possdant moins de 5 pices?d) Quel est le nombre de logements possdant au plus 4 pices ?e) Quelle est la proportion des logements possdant plus de 3 pices ?f) Reprsenter graphiquement :
- la distribution des frquences ;- la distribution des frquences cumules croissantes ;
1.3.4. Exercice.
On a relev la recette hebdomadaire en milliers de dirhams de 40 commerces. Les donnesbrutes sont :
57 60 52 49 56 46 51 63 49 5786 93 77 67 81 70 71 91 67 8247 87 92 55 48 90 49 50 58 6267 89 69 72 75 48 85 90 83 66
a) Prsenter les donnes dans un tableau statistique sous forme de classes.b) Reprsenter graphiquement la distribution de frquences tablie.
1.3.5. Exercice.
-
Statistique descriptive 1. Tableaux et graphiques
40
Le tableau suivant prsente le nombre de femmes en activit selon l'ge de 500 femmes actives
Tranche d'ges Effectif[15 20[[20 25[[25 30[[30 35[[35 40[[40 45[[45 50[[50 55[55 et plus
1470
10065695663612
a) Reprsenter graphiquement cette distribution de frquences.b) Reprsenter le diagramme des frquences cumules croissantes.c) Quel est le nombre de femmes actives ges au moins de 25 ans?d) Quelle est la proportion des femmes actives ges de plus de 30 ans ?
1.3.6. Exercice.
Le tableau suivant donne le niveau de scolarit en nombre dannes passes lcole dunchantillon de 200 personnes.
Niveau de scolarit Effectif[0 ; 6[
[6 ; 12[[12 ; 14[[14 ; 16[
40805030
Total 200
a) Reprsenter graphiquement cette distribution de frquences.b) Reprsenter le diagramme des frquences cumules croissantes.c) Quel est le nombre de personnes ayant un niveau de moins de 12 annes passes
lcole?d) Quel est la proportion des personnes ayant un niveau dau moins 12 annes passes
lcole?
1.3.7. Exercice.
Soit la rpartition des travailleurs d'une entreprise selon l'ge :
-
Statistique descriptive 1. Tableaux et graphiques
41
11 % d'entre eux ont moins de 20 ans ;31 % d'entre eux ont de 20 25 ans ;26 % d'entre eux ont de 25 30 ans ;16 % d'entre eux ont de 30 35 ans ;7 % d'entre eux ont de 35 40 ans ;9 % d'entre eux ont 40 ans et plus.
a) Reprsenter graphiquement cette distribution.b) Reprsenter le diagramme des frquences cumules croissantes.
1.3.8. Exercice.
Un organisme charg de raliser des enqutes statistiques gre un rseau de 125 enquteurs. Ladirection de cet organisme dcide d'tudier la rpartition de ses enquteurs selon le nombred'enqutes qu'ils ont ralises. Les donnes collectes ce sujet sont rsumes dans le tableauci-aprs :
Nombre d'enqutes ralises Effectifs5
1015202530
81235402010
Reprsenter graphiquement cette srie statistique.a- Par un polygone des frquences relativesb- Par une courbe des frquences relatives cumules croissantes.
1.3.9. Exercice.
Le tableau suivant donne la distribution de frquences du nombre d'enfants dans 300 familles.Nombre d'enfants Nombre de familles
0123456
plus de 6
1322464958423931
-
Statistique descriptive 1. Tableaux et graphiques
42
Total 300
a) Calculer les diffrents types de frquences cumules.b) Etablir le diagramme de frquences et le diagramme de frquences cumules.c) Quel est le nombre de familles ayant au plus 4 enfants ?d) Quel est le nombre de familles ayant au moins 2 enfants ?e) Quel est le pourcentage des familles qui n'ont pas d'enfants ?f) Quel est le pourcentage des familles qui ont des enfants ?g) Quel est le pourcentage des familles qui ont moins de 4 enfants?
1.3.10. Exercice.
Une cooprative laitire fabrique un fromage qui doit contenir, selon les tiquettes, 45 % dematires grasses. Un institut de consommation dont le rle est de vrifier que la qualit desproduits est bien celle qui est affirme par l'tiquette, fait prlever et analyser un chantillon de100 fromages. Les rsultats de l'analyse sont consigns dans le tableau suivant :
Taux de matires grasses Nombre de fromages[41,5 - 42,5[[42,5 - 43,5[[43,5 - 44,5[[44,5 - 45,5[[45,5 - 46,5[[46,5 - 47,5[[47,5 - 48,5[
11124382231
a) Reprsenter graphiquement cette distribution.b) Reprsenter le diagramme des frquences cumules croissantes.
-
Statistique descriptive 2. Caractristiques de tendance centrale
43
CHAPITRE 2CARACTERISTIQUES DE TENDANCE CENTRALE
Les caractristiques de tendance centrale, appeles aussi paramtres de position,servent caractriser l'ordre de grandeur des observations. Les principauxparamtres de position sont : les moyennes, le mode, la mdiane, et la mdiale.
Pour les caractristiques centrales, nous ne nous intressons quaux sries statistiquesrelatives des caractres quantitatifs discrets ou continus, cest--dire des sries statistiquesdonnes sous les formes : (xi) , (xi ; ni) ; (xi ; fi) ; (ci ; ni) ou (ci ; fi).
2.1. LES MOYENNES.
On peut rduire un ensemble d'observations en une seule observation constanteappele moyenne. La moyenne est donc une valeur qui se prsente comme si toutes lesobservations lui taient gales.
On distingue plusieurs types de moyennes :
- la moyenne arithmtique ;- la moyenne gomtrique ;- la moyenne harmonique ;- la moyenne quadratique.
2.1.1. Moyenne arithmtique.
2.1.1.1. Moyenne arithmtique simple.
La moyenne arithmtique simple, qu'on appelle couramment moyenne, d'une srie deplusieurs observations est gale la somme de toutes les observations divise par lenombre de ces observations.
-
Statistique descriptive 2. Caractristiques de tendance centrale
44
Dans le cas d'une suite de n observations : x1, x2, , xi, , xn la moyenne est gale, pardfinition :
n
x
n
xxxxx
n
ii
n
1321
...
Lintroduction du terme
n
iix
1doit tre explicite, en effet on convient habituellement
dcrire, en mathmatique :
n
iix
1= x1 + x2 + x3 + . . . + xi + . . . + xn
Dans le cas dune srie statistique donne par un ensemble (xi , ni), c'est--dire lorsquechaque valeur xi est rpte ni fois et quil y a k valeurs xi diffrentes, la moyenne arithmtiquesimple dune telle srie se dduit de la formule prcdente :
k
1ii
k
1iii
n
xn
x avec n =
k
1iin
De mme dans le cas dune srie statistique donne par un ensemble (xi , fi) la moyennearithmtique simple se dduit de la formule prcdente :
k
1iii xfx
avec n =
k
1iin ;
n
nf ii et
k
1iif = 1
Dans le cas d'une variable statistique continue groupe en classes, la moyenne arithmtiquesimple est donne par les formules suivantes :
-
Statistique descriptive 2. Caractristiques de tendance centrale
45
k
1iiik
1ii
k
1iii
cfn
cn
x
ci est le point central de la classe i, il est tel que : 2CC
c1ii
i
Exemple 1 : On considre lensemble des notes obtenues par les tudiants dune classedune cole, dans une matire ; on a la srie statistique suivante donne sous la forme simple(xi) et pour laquelle on demande de calculer la moyenne arithmtique simple.
12 11 13 12 1315 13 12 13 1113 15 11 11 1212 12 10 12 15
La moyenne arithmtique simple de cette srie est facile calculer, elle est gale :
4,1220248
n
x
x
20
1ii
Exemple 2 : On considre la mme srie statistique quon reprsente maintenant sous laforme (xi ; ni) pour laquelle on demande de calculer la moyenne arithmtique simple.
xi ni10 111 412 713 515 3
-
Statistique descriptive 2. Caractristiques de tendance centrale
46
Le calcul de la moyenne arithmtique simple peut tre facilement fait selon le tableausuivant :
xi ni ni xi10 1 1011 4 4412 7 8413 5 6515 3 45
Total 20 248Moyenne - - - 12,4
Exemple 3 : On considre la mme srie statistique quon reprsente sous la forme (xi ; fi)pour laquelle on demande de calculer la moyenne arithmtique simple.
xi ni fi10 1 5%11 4 20%12 7 35%13 5 25%15 3 15%
Total 20 100%
Le calcul de la moyenne arithmtique simple peut tre facilement fait selon le tableausuivant :
xi ni fi fi xi10 1 0,05 0,511 4 0,20 2,212 7 0,35 4,213 5 0,25 3,2515 3 0,15 2,25
Total 20 100% 12,4Moyenne - - - - - - 12,4
On voit, sur ces 3 exemples, que pour calculer la moyenne arithmtique simple, on utiliselune des 3 formules selon la forme dans laquelle est donne la srie statistique.
Exemple 4 : On a procd au recensement des 50 salaris de la socit STM en relevant lessalaires horaires quils peroivent. Les donnes brutes sont :
-
Statistique descriptive 2. Caractristiques de tendance centrale
47
34 36 45 62 37 43 42 102 31 4251 30 61 63 47 105 52 43 81 9592 77 60 36 48 49 65 71 78 8143 52 63 71 43 42 51 55 61 4193 82 83 47 54 61 102 33 48 55
La moyenne arithmtique simple dune telle srie est gale :
h /DH78,5850
293950
50
1
i
ix
x
Chaque salari de la socit touche, en moyenne, 58,78 DH par heure.
Exemple 5 : Une enqute, chez 1000 commerants, porte sur le nombre dagents quilsemploient. Les rsultats obtenus sont reprsents dans le tableau suivant :
Nombre d'employsxi
Nombre de commerantsni
proportion des commerantsfi
01234567
5010020015012016013090
5 %10 %20 %15 %12 %16 %13 %9 %
Total 1000 100 %
La moyenne arithmtique simple dune telle srie est gale :
commerantparemploys64,310003640
xfn
xn
x8
1iii8
1ii
8
1iii
Chaque commerant emploie, en moyenne, trois quatre employs.
Exemple 6 : La rpartition de la surface, en m, de 100 logements est reprsente dans letableau suivant :
-
Statistique descriptive 2. Caractristiques de tendance centrale
48
Surface en m Nombre de logements Point central0 20
20 4040 60
60 100100 160160 260
1020401884
10305080
130210
La moyenne arithmtique simple dune telle srie est gale :
20601006020cf
n
cn
x6
1iii6
1ii
6
1iii
,
m par logement
La superficie moyenne dun logement est de 60,20 m.
2.1.1.2. Moyenne arithmtique pondre.
La moyenne arithmtique simple suppose que toutes les observations ont la mmeimportance, ce qui n'est pas toujours le cas. La moyenne arithmtique pondreintervient dans le cas o les observations n'ont pas la mme importance. Il s'agitd'associer chaque observation un coefficient de pondration indiquant son poidsparmi les autres observations.
k
ii
k
iii x
x
1
1
i est le poids affect l'observation i.
Exemple 7 : Un tudiant a eu 14 sur 20 au contrle continu, 12 sur 20 l'examen partiel et13 sur 20 l'examen final. Les trois notes n'ont pas la mme importance. On associe uncoefficient de 1 la note du contrle, un coefficient de 2 la note de l'examen partiel, et uncoefficient de 4 la note de l'examen final. La note moyenne de l'anne obtenue par cettudiant est :
-
Statistique descriptive 2. Caractristiques de tendance centrale
49
86,12421
134122141x
x 3
1ii
3
1iii
2.1.1.3 Proprits de la moyenne arithmtique.
* Proprit 1 : Transformation linaire
La transformation linaire d'une variable statistique x en une autre variable y telleque :
y = ax + b avec a et b deux constantes quelconques
La moyenne de y peut tre obtenue directement partir de la moyenne de x :
bxabn
x
ay
n
bnxa
n
b)(ax
n
yy
n
1ii
n
1ii
n
1ii
n
1ii
La moyenne d'une transformation linaire est donc une transformation linaire de lamoyenne.
Exemple 8 : Le tableau suivant prsente les prix en DH de 100 ordinateurs portablesachets dans diffrents points de vente :
Prix Nombre dordinateurs10000 1100011000 1200012000 1300013000 1400014000 1500015000 1600016000 1700017000 18000
910101416141215
Total 100
-
Statistique descriptive 2. Caractristiques de tendance centrale
50
Pour calculer la moyenne des prix des ordinateurs, on peut utiliser la proprit de latransformation linaire dans le but de simplifier les calculs.
On effectue un changement de variable, c'est--dire, on remplace la variable prix par uneautre variable y de telle sorte que le prix soit une transformation linaire de y.
p = a y + b Donc : y =a
bp
Il faut choisir les constantes a et b qui donnent des valeurs trs simples de y. On choisit laconstante b parmi les valeurs de p, de prfrence une valeur du milieu, pour avoir une valeurnulle de y au milieu. On choisit la constante a comme tant le plus grand diviseur commun desvaleurs de (p - b) (le plus souvent a est l'amplitude constante des classes) pour avoir des valeursentires de y.
Pour notre exemple, on choisit :
b = 13500 et a = 1000
Y =100013500p
Les valeurs de y sont trs simples, on peut calculer facilement la moyenne de y.
PrixNombre
dordinateurs(ni)
Point central(ci) yi ni yi
10000 1100011000 1200012000 1300013000 1400014000 1500015000 1600016000 1700017000 18000
910101416141215
1050011500125001350014500155001650017500
-3-2-101234
-27-20-100
16283660
Total 100 83
83010083
n
yny 8
1ii
8
1iii
,
On calcule facilement la moyenne grce aux formules de la transformation linaire :
-
Statistique descriptive 2. Caractristiques de tendance centrale
51
DH14330135000,83100013500y1000p
* Proprit 2 : La moyenne des carts par rapport la moyenne est nulle.
La somme des diffrences par rapport la moyenne est toujours nulle.
0xnxnxnx)xx(n
1ii
n
1ii
* Proprit 3 : La somme des carres des carts par rapport la moyenne estminimale.
])ax()ax)(xx(2)xx[(
)]ax()xx[()ax(
2i
2n
1ii
2n
1ii
n
1i
2i
n
1i
2n
1ii
2n
1ii )ax()ax)(xx(2)xx(
n
1i
2n
1ii
2n
1ii
n
1i
2i )ax()xx()ax(2)xx()ax(
22
11
2 )()()( axnxxaxn
ii
n
ii
Cette expression est positive, elle est donc minimale lorsque :
xalorsquedireestc'0)( 2ax
2.1.2. Moyenne gomtrique.
2.1.2.1. Moyenne gomtrique simple.
La moyenne gomtrique simple est calcule pour des observations positives. Elle est gale la racine nme du produit de lensemble des n observations. Elle est utilise principalementlorsqu'on raisonne en taux de croissance.
-
Statistique descriptive 2. Caractristiques de tendance centrale
52
La moyenne gomtrique est gale, par dfinition, dans le cas dune suite de n observationsx1, x2, , xi, , xn :
n
1
]n
1i ix[n
1
)n
x2x1x(n nx2x1xx g
Exemple 9 : On considre une action qui a accus, en bourse, durant le 1er semestre delanne 2005, les taux daugmentation mensuels suivants : +2,1% ; 1,3% ; 0,5% ; 0,9% ; 1,4% ;3,8%. Calculer le taux daugmentation mensuel moyen de laction durant le 1er semestre 2005.
Cest lexemple type de lapplication de la moyenne gomtrique simple :
Remarque : Rappelons que pour une variable qui a accus un taux daugmentation de 2%par exemple, on multiplie cette variable par 1,02 pour trouver la nouvelle valeur de lavariable.
Ainsi si laction a comme valeur 25,35 DH en Janvier et quelle subisse un taux
daugmentation de 2,1% entre janvier et fvrier, sa valeur, en fvrier est gale :
25,35 x 1,021 = 25,88 DH.
Donc nous allons, tout le temps, utiliser cette remarque lorsquil sagit de taux.
Revenons lexemple 9 et calculons le taux daugmentation mensuel moyen de laction :
%66,11038,1014,1009,1005,1013,1021,1t 6
Exemple 10 : La population marocaine est passe, entre 1994 et 2004 de 26 019 000 29 800 000.
Quel est le taux global daugmentation de la population pendant les 10 annes ?
Quel est le taux annuel moyen daugmentation de la population ?
Entre 1994 et 2004, le taux global d'accroissement de la population marocaine est :
%53,1410026019
2601929800t
-
Statistique descriptive 2. Caractristiques de tendance centrale
53
Le taux d'accroissement annuel moyen est
t tel que :
29800)t1(26019 10
1453,12601929800)t1( 10
%37,10137,011453,1t 10
Entre 1994 et 2004, la population marocaine a augment en moyenne, de 1,37 % par an.
2.1.2.2. Moyenne gomtrique pondre.
De mme que pour la moyenne arithmtique simple qui suppose que toutes lesobservations aient la mme importance, ce qui n'est pas toujours le cas, la moyennegomtrique pondre intervient dans le cas o les observations n'ont pas la mmeimportance. Il s'agit d'associer chaque observation un coefficient de pondrationindiquant son poids parmi les autres observations.
nnx22x11xxg
n1
nnx22x11xxg )(
k
1iifix
1k
1iiixxg ][
i est le poids affect l'observation i.
Avec
k
1ii
Cest le cas de sries statistiques discrtes donnes sous la forme (xi ; ni) ou (xi ; fi), lorsque,dans les sries, la variable xi est rpte ni fois (ou fi en %) et quil y a k observations distinctes.
Dans le cas d'une srie statistique continue, on dfinit la moyenne gomtriquepondre comme suit :
-
Statistique descriptive 2. Caractristiques de tendance centrale
54
k
1iific
n
1
]k
1iin
ic[
n
1
)c...cc(n c...ccgx k21k21 nkn2n1nkn2n1
ci est le point central de la classe i, il est tel que : 2CC
c1ii
i
Exemple 11 : Etude du taux de variation dune action en bourse.
Le tableau suivant donne l'volution du taux daugmentation de la valeur dune action, enbourse, entre janvier et dcembre 2005.
Priodes Taux daugmentation mensuel moyenEntre janvier et avril 2,03% par mois en moyenneEntre mai et juillet 0,69% par mois en moyenneEntre aot et dcembre 2,13% par mois en moyenne
Quel est le taux global de variation de la valeur de laction entre janvier et dcembre 2005 ?
Quel est le taux mensuel moyen de variation de la valeur de laction entre janvier etdcembre 2005 ?
Sagissant de taux daugmentation mensuels relatifs des priodes diffrentes, de nombresde mois diffrents, il y a lieu daffecter chaque taux dun poids gal aux nombres de moiscontenu dans la priode ;
Le taux daugmentation global de la valeur de laction est :
%92,22102135,100693,102034,1t
Le taux daugmentation mensuel moyen de la valeur de laction entre janvier et dcembre2005 est alors gal :
%,, 731122941t 12 2.1.2.3. Proprits de la moyenne gomtrique.
-
Statistique descriptive 2. Caractristiques de tendance centrale
55
La moyenne gomtrique est aussi gale l'exponentielle de la moyenne arithmtiquedes logarithmes des variables statistiques.
n
n
1i i xLog
]n
1i ixLog[
n
1n1
]n
1i ixLog[xLog g
n
n
i ixLog
gx
1(exp )
2.1.3. Moyenne harmonique.
2.1.3.1. Moyenne harmonique simple.
La moyenne harmonique simple est gale l'inverse de la moyenne arithmtique desinverses des observations. Son usage s'impose lorsque la variable statistique est unquotient (cot moyen, vitesse moyenne, etc.).
Dans le cas d'une suite de n observations x1, x2, , xi, , xn, toutes distinctes et de poidsidentiques, la moyenne harmonique simple est gale :
n
1i i
h
x
1n
x
Exemple 12 : Calcul de la vitesse moyenne.
On considre un automobiliste qui fait 80 km et qui parcourt chaque 20 km avec desvitesses moyennes diffrentes, soient successivement 90 km/h, puis 75 km/h, ensuite 85 km/h etenfin 115 km/h.
Quelle est la vitesse moyenne de lautomobiliste ?
Comme il sagit de vitesses moyennes, toutes relatives la mme distance de 20 km, ellesdoivent avoir le mme poids. Montrons donc que la vitesse moyenne sur les 80 km est lamoyenne harmonique des vitesses.
En effet, le temps t mis pour parcourir une distance d la vitesse v est donn par la formulesimple : t = d / v.
Ainsi le temps global t est la somme des quatre temps ti :
-
Statistique descriptive 2. Caractristiques de tendance centrale
56
4321 ttttt
4
1i i
i
4
4
3
3
2
2
1
1
Vd
Vd
Vd
Vd
Vd
v
d
En divisant les 2 membres de cette galit par d et en constatant que di / d = 1 / 4 on trouvefacilement le rsultat recherch :
4V1
v
1
4
1i i
C'est--dire dune faon plus gnrale :n
V1
v
1
n
1i i
v
1= 01123,0)
1151
851
751
901(
41
Soit aprs calcul : v = 89,077 km/h
2.1.3.2. Moyenne harmonique pondre.
La moyenne harmonique pondre intervient dans le cas o les observations n'ont pasla mme importance. Il s'agit d'associer chaque observation un coefficient depondration indiquant son poids parmi les autres observations.
* Cas d'une srie statistique discrte : dans laquelle la variable statistique xi est rpte nifois (ou fi en %), lorsque la srie est de la forme (xi ; ni) ou (xi ; fi).
hx
=
k
1i ii
k
1ii
xn
n
=
k
1i ii
xf
1
* Cas d'une srie statistique continue :
-
Statistique descriptive 2. Caractristiques de tendance centrale
57
k
1i i
ik
1i i
i
k
1ii
h
c
f1
c
n
nx
ci est le point central de la classe i, il est tel que : 2CC
c1ii
i
Exemple 13 : Calcul de la vitesse moyenne.
Reprenons lexemple de lautomobiliste et supposons que maintenant il ait roul surun trajet de 100 Km une vitesse de 90 Km/h, sur les 10 premiers kilomtres; de 100Km/h sur un trajet de 30 Km, et de 120 Km/h sur les 60 derniers kilomtres.L'automobiliste a parcouru le trajet de 100 Km avec trois vitesses moyennes diffrentes sur
des trajets de diffrentes longueurs :
Vitesses moyennes TrajetsV1 = 90 km/hV2 = 100 km/hV3 = 120 km/h
d1 = 10 kmd2 = 30 kmd3 = 60 km
Total 100 km
Comme il sagit de vitesses moyennes relatives des distances diffrentes, elles doivent treaffectes de poids diffrents. Montrons donc que la vitesse moyenne sur les 100 km est lamoyenne harmonique pondre des vitesses.
En effet, le temps t mis pour parcourir une distance d la vitesse v est donn par la formulesimple : t = d / v.
Ainsi le temps global t est la somme des quatre temps ti :
4321 ttttt
4
1i i
i
4
4
3
3
2
2
1
1
Vd
Vd
Vd
Vd
Vd
v
d
En divisant les 2 membres de cette galit par d et en posant i di / d, on trouvefacilement le rsultat recherch :
-
Statistique descriptive 2. Caractristiques de tendance centrale
58
4
1i ii V
1v
1avec par exemple 10,0
10010
1
C'est--dire dune faon plus gnrale :
n
1i ii V
1v
1
Aprs calcul, on trouve v = 109,8 km/h.
Exemple 14 : Calcul du cot moyen dun stock.
Calculer le cot moyen dune pice de rechange stocke dans le magasin delentreprise si lon suppose que le stock ait t approvisionn, diffrents prix, enplusieurs tapes.
Etapes Nombre de pices achetes Prix unitaires des pices
N 1 10 12,35 DH
N 2 25 13,12 DH
N 3 20 13,46 DH
N 4 45 14,07 DH
Comme le cot est un rapport, montrons que le cot moyen est la moyenneharmonique pondre des diffrents cots. En effet, les cots moyens auxquels lespices de rechange ont t achetes sont relatifs des lots de diffrentes tailles, ce quifait que ces cots doivent tre affects de diffrents poids.Convenons dappeler, dans ce qui suit, pour le lot i, cui le cot unitaire, cti le cot totalet ni le nombre de pices de rechange achetes.Nous avons lgalit suivante vidente relative aux nombres de pices de rechange :
4
1ii4321 nnnnnn
Or commei
ii
cu
ctn on a :
4
1i i
i
cu
ct
cu
ctn
-
Statistique descriptive 2. Caractristiques de tendance centrale
59
En divisant les 2 membres de la dernire galit par ct et en posant i cti / ct ontrouve la formule recherche, savoir :
4
1i ii
4
1i i
i
cu
1cu
1ctct
cu
1
Avec par exemple :
2422,0
07,144546,132012,132535,121012,1325
ct
ct4
1ii
22
Le cot moyen dapprovisionnement de la pice de rechange est, aprs calculs, gal :13,51 DH/unit.
2.1.4. Moyenne quadratique.
La moyenne quadratique est la racine carre de la moyenne arithmtique des carres.Elle est trs rarement utilise.* Cas d'une suite de n observations : x1, x2, , xi, , xn
n
x
x
n
1i
2i
q
* Cas d'une srie statistique discrte : lorsque chaque variable xi est rpte ni (ou fi en%) fois dans la srie et quil y a k valeurs diffrentes.
k
1i
2iik
1ii
k
1i
2ii
q xfn
xn
x
avec n =
k
iin
1et 1f
k
1ii
-
Statistique descriptive 2. Caractristiques de tendance centrale
60
* Cas d'une srie statistique continue :
k
1i
2iik
1ii
k
1i
2ii
q cfn
cn
x
avec n =
k
iin
1et 1f
k
1ii
ci est le point central de la classe i, il est tel que : 21 iii
CCc
Exemple 15 : Dans une entreprise produisant des pices pour lassemblage dune machineon veut contrler si la longueur moyenne des pices est conforme la norme de 12 cm. Laproduction est juge comme conforme si lcart moyen par rapport la norme ne dpasse pas 1cm. cette fin on a mesur la longueur dun chantillon de 16 pices dont les rsultats sont :
11 10 12,5 10,8 13,5 11,5 13 12,513 13,5 11,5 13,2 10,5 12,5 11 11,5
Peut-on admettre que le produit de lentreprise est conforme la norme ?
Calculons les carts par rapport la norme :
-1 -2 0,5 -1,2 1,5 -0,5 1 0,5+1 1,5 -0,5 1,2 -1,5 0,5 -1 -0,5
On voit bien que certains carts sont positifs et dautres sont ngatifs ; le calcul de lamoyenne arithmtique nest pas appropri car les carts ngatifs vont compenser les cartspositifs. La moyenne quil faut calculer est la moyenne quadratique.
n
x
x
n
1i
2i
q
=
16)5,0()1(5,0)5,1(2,1)5,0(5,11
165,01)5,0(5,1)2,1(5,0)2()1(
xq
= 1,09 cm
Lcart moyen par rapport la norme est de 1,09 cm, il dpasse lcart moyen tolr qui estde 1 cm, on ne peut donc admettre que le produit de lentreprise est conforme la norme.
-
Statistique descriptive 2. Caractristiques de tendance centrale
61
Remarque : On peut montrer que la moyenne harmonique est infrieure ou gale lamoyenne gomtrique qui est infrieure ou gale la moyenne arithmtique qui estinfrieure ou gale la moyenne quadratique.
qgh xxxx
Exemple 16 : On peut aisment vrifier de telles ingalits dans lexemple simplesuivant.
On considre la srie statistique simple constitue des cinq observations suivantes : 2 ;5 ; 6 ; 8 et 10.
On trouve, aprs un calcul facile que :
6643x27290)101
81
61
51
21(4
1x
1 hh
,,
4485108652x 5g ,
265108652
x ,
76765108652
xq ,
Et lon a bien :
),(),(),(),( 7676x26x4485x6643x qgh 2.2. LE MODE.
Le mode est lobservation la plus frquente dans une srie statistique.
* Cas d'une suite de n observations : Le mode d'une srie statistique est l'observation quel'on rencontre le plus frquemment. Le mode peut ne pas exister, et s'il existe, il peut ne pas treunique.
Exemple 17 : On considre les sries dobservations suivantes :
a) 3; 5 ; 8 ; 8 ; 8 ; 10 ; 10 ; 10 ; 10 ; 10 ; 14 ; 18 ; 20 ; 24 ; 24b) 4 ; 8 ; 10 ; 10 ; 10 ; 10 ; 14 ; 18 ; 22 ; 22 ; 22 ; 22 ; 26c) 5, 11, 14, 17, 18, 21, 23, 26, 29, 30, 32, 35, 38d) 12 ; 23 ; 34 ; 23 ; 35 ; 23 ; 52 ; 23 ; 33 ; 56 ; 23 ; 23 ; 40
Dans ces exemples, on a successivement :
-
Statistique descriptive 2. Caractristiques de tendance centrale
62
- pour le cas a : Le mode est 10.- pour le cas b : Il y a deux modes, 10 et 22.- pour le cas c : Le mode nexiste pas.- pour le cas d : Le mode est 23
* Cas d'une srie statistique discrte : Le mode correspond la valeur qui possde la plusgrande frquence.
Exemple 18 : Soit la distribution du nombre d'employs observs chez 1000 commerants.
Nombre d'employsxi
Nombre de commerants(ni)
proportion descommerants (fi)
01234567
5010020015012016013090
5 %10 %20 %15 %12 %16 %13 %9 %
Total 1000 100 %
La variable xi nombre d'employs a pour mode 2, c'est--dire la plupart descommerants ont deux employs.* Cas d'une srie statistique continue : Dans le cas d'une variable statistique continue
groupe en classes, on parle de classe modale, elle correspond la classe dont la frquence estla plus leve. Le mode correspond la valeur de la variable qui correspond au maximum del'histogramme. C'est le point central de la classe modale si les classes ont la mme amplitude,dans le cas contraire, il faut travailler avec les densits.
Exemple 19 : La rpartition de la surface, en m, de 100 logements est reprsente dans letableau suivant :
Surface en m Nombre de logements0 20
20 4040 60
60 100100 160160 260
1020401884
Les amplitudes des classes tant ingales, il convient de calculer les densits.
-
Statistique descriptive 2. Caractristiques de tendance centrale
63
Surface en m Nombre de logements Densits0 20
20 4040 60
60 100100 160160 260
1020401884
0,512
0,450,130,04
Total 100
En cherchant la plus grande densit, la classe modale est la classe 40 60 m, le modeest gal au centre de la classe modale, savoir : 50 m.
2.3. LA MEDIANE.
La mdiane d'une variable statistique est une valeur pour laquelle, la moiti desobservations lui sont infrieure ou gales et la moiti suprieures ou gales. Lamdiane partage donc le nombre total d'observations en deux parties gales. Lamdiane est un paramtre statistique qui ne dpend que du nombre d'observations.Pour dterminer la mdiane, il faut raisonner en terme de frquences cumules, lamdiane est alors la valeur de la variable qui correspond la moiti de l'effectif total.* Cas d'une srie statistique discrte.
Si le nombre d'observations est impair, la mdiane est l'observation de rang2
1n .
21nxMe
Si le nombre d'observations est pair, la mdiane est comprise entre l'observation de rang 2n
et l'observation de rang 12n . On prend comme valeur de la mdiane la moyenne arithmtique
simple des deux observations.
2
xx
Me
xMex
12n
2n
12n
2n
Exemple 20 : Soit la distribution du nombre d'employs observs chez 1000 commerants.
-
Statistique descriptive 2. Caractristiques de tendance centrale
64
Nombre d'employsxi
Nombre de commerants(ni)
Frquences cumules croissantesFic
01234567
5010020015012016013090
50150350500620780910
1000Total 1000
Le nombre d'observations, 1000, est pair, la mdiane est comprise entre l'observation derang 500 et l'observation de rang 501. On prend comme valeur de la mdiane la moyennearithmtique simple des deux observations.
2xx
Me
xMex
501500
501500
En consultant les frquences absolues cumules croissantes, x500 correspond 3 et x501correspond 4. La mdiane est donc :
5,32
43Me
La moiti des commerants emploient 3 employs ou moins, et la moiti emploient 4employs ou plus.* Cas d'une srie statistique continue.
Pour des donnes groupes en classes, la classe mdiane est la classe qui contient lamdiane. On dtermine la mdiane par interpolation linaire.Dsignons par :
[Ci ; Ci+1[ : la classe mdiane ;n : le nombre total des observations ;Fi : la frquence absolue cumule croissante ;ni : la frquence absolue de la classe mdiane.
La mdiane est comprise entre Ci et Ci+1
Ci < Me < Ci+1
De mme : Fi-1 < 2n < Fi
-
Statistique descriptive 2. Caractristiques de tendance centrale
65
Frquence cumule
Fi
50 % = n/2
Fi-1
CaractreCi Me Ci+1
On suppose que la distribution au sein de la classe mdiane soit rgulire.
Ainsi :1ii
i1iFF
CC
=
1i
i
F2n
CMe
Ce qui donne : )( 1i1ii
i1ii F2n
FFCCCMe
Exemple 21 : La rpartition de la surface, en m, de 100 logements est reprsente dans letableau suivant :
Surface en m Nombre de logements F. cumules croissantes0 20
20 4040 60
60 100100 160160 260
1010501884
1020708896
100Total 100
En consultant les frquences absolues cumules croissantes, la classe mdiane est laclasse 40 60 m. La mdiane est donc :
-
Statistique descriptive 2. Caractristiques de tendance centrale
66
40 < Me < 6020 < 50 < 70
20704060
= 205040Me
Me = 40 + 5020 x 30 = 52 m
La moiti des logements ont une superficie infrieure ou gale 52 m et la moiti deslogements ont une superficie suprieure ou gale 52 m.
2.4. LA MEDIALE.
La mdiale est une valeur telle que la somme des observations qui lui sont infrieuresest gale la somme des observations qui lui sont suprieures. La mdiale partagedonc la somme des observations en deux parties gales. La mdiale est un paramtrestatistique qui dpend de la somme de toutes les observations.
Pour dterminer la mdiale, il faut raisonner en terme de sommes cumules, lamdiale est alors la valeur de la variable qui correspond la moiti de la somme desobservations.
La mdiale calcule pour une variable statistique groupe en classes, la classe mdiale est laclasse qui contient la mdiale. On dtermine la mdiale par interpolation linaire.
Dsignons par :
[Ci ; Ci+1[ : la classe mdiale ;
S =
k
1iiicn : la somme des observations ;
Si =
ij
1jjjcn : la somme des observations cumule croissante;
ni ci : la somme des observations de la classe mdiale.
La mdiale est comprise entre Ci et Ci+1Ci < Ml < Ci+1Si-1 < 2
S < SiSommes cumules
-
Statistique descriptive 2. Caractristiques de tendance centrale
67
Si
50 % = S/2
Si-1
CaractreCi Ml Ci+1
On suppose que la distribution au sein de la classe mdiale soit rgulire.
Ainsi :1iii1i
SSCC
=
1i
i
S2S
CMl
)( 1i1iii1ii S2
SSS
CCCMl
Exemple 22 : La rpartition de la surface, en m, de 100 logements est reprsente dans letableau suivant :
Surface en m Nombre delogements niPoint central ci
Sommesnixi
Sommes cumulescroissantes
0 2020 4040 60
60 100100 160160 260
1020401884
10305080
130210
100600
200014401040840
100700
2700414051806020
Total 100 6020
La moiti de la somme des observations est :
30102
60202
cn6
1iii
-
Statistique descriptive 2. Caractristiques de tendance centrale
68
En consultant les sommes cumules croissantes, la classe mdiale est la classe 60 100m. La mdiale est donc :
60 < Ml < 1002700 < 3010 < 4140
2700414060100
= 2700301060Ml
Ml = 60 + 144040 x 310 = 68,61 m
La moiti de la superficie totale des 100 logements est rpartie sous forme delogements dont la superficie est infrieure ou gale 68,61 m et l'autre moiti sousforme de logements dont la superficie est suprieure ou gale 68,61 m.
2.5. LES FRACTILES.
De mme que la mdiane nous a permis de partager la population en deux partiesgales, le fractile d'ordre p permet de partager la population en p parties gales,
chaque partie contient %p
100du nombre total des observations. Ainsi les quartiles,
dciles, centiles vont respectivement nous permettre de partager la populationrespectivement en quatre, dix et cent parties gales.2.5.1. Les quartiles.
Les quartiles partagent le nombre total des observations en quatre parties gales,chaque partie contient 25% des observations. On dfinit trois quartiles.Le premier quartile Q1 : C'est une valeur pour laquelle un quart des observations(25%) lui sont infrieures ou gales et trois quarts des observations (75%) lui sontsuprieures ou gales.
Le deuxime quartile Q2 : C'est une valeur pour laquelle deux quarts des observations(50%) lui sont infrieures ou gales et deux quarts des observations (50%) lui sontsuprieures ou gales. Il est aussi gal la mdiane.Le troisime quartile Q3 : C'est une valeur pour laquelle trois quarts des observations(75%) lui sont infrieures ou gales et un quart des observations (25%) lui sontsuprieures ou gales.
-
Statistique descriptive 2. Caractristiques de tendance centrale
69
Pour le calcul des quartiles, on utilise la mme mthode de calcul que pour la mdiane.Pour des donnes groupes en classes, on dtermine un quartile par interpolationlinaire.Dsignons par :
[Ci ; Ci+1[ : la classe qui contient le quartile ;n : le nombre total des observations ;Fi : la frquence absolue cumule croissante ;ni : la frquence absolue de la classe qui contient le quartile ;
Le quartile numro j, Qj est compris entre Ci et Ci+1Ci < Qj < Ci+1
Fi-1 < 4nj
< Fi
Frquence cumule
Fi
j n /4
Fi-1
CaractreCi Qj Ci+1
On suppose que la distribution au sein de la classe est rgulire.
Ainsi :1ii
i1iFF
CC
=
1i
i
F4nj
CQj
)( 1i1ii
i1ii F4nj
FFCCCQj
Les trois quartiles sont :
-
Statistique descriptive 2. Caractristiques de tendance centrale
70
)( 1i1ii
i1ii1 F4n
FFCCCQ
)( 1i1ii
i1ii2 F2n
FFCCCQ
= Me
)( 1i1ii
i1ii3 F4n3
FFCCCQ
Exemple 23 : La rpartition de la surface, en m, de 100 logements est reprsente dans letableau suivant :
Surface en m Nombre de logements Frquences cumules croissantes0 20
20 4040 60
60 100100 160160 260
1020401884
1030708896
100Total 100
En consultant les frquences absolues cumules croissantes, q1, qui correspond la25me observation, se trouve dans la classe 20 40 m. q3, qui correspond la 75meobservation, se trouve dans la classe 60 100 m.
m3520
104
100
2020q1
m11,7118
7041003
4060q3
25 % des logements ont une superficie infrieure ou gale 35 m.75 % des logements ont une superficie infrieure ou gale 71,11 m.50 % des logements ont une superficie comprise entre 35 m et 71,11 m.
2.5.2. Les dciles.
Les dciles partagent le nombre total des observations en dix parties gales, chaquepartie contient 10% des observations. On dfinit neuf dciles.
-
Statistique descriptive 2. Caractristiques de tendance centrale
71
Le premier dcile d1 : C'est une valeur pour laquelle un dixime des observations(10%) lui sont infrieures ou gales et neuf diximes des observations (90%) lui sontsuprieures ou gales.Le deuxime dcile d2 : C'est une valeur pour laquelle deux diximes des observations(20%) lui sont infrieures ou gales et huit diximes des observations (80%) lui sontsuprieures ou gales.Le kme dcile dk : C'est une valeur pour laquelle k dixime des observations lui sontinfrieures ou gales et (10 - k) dixime des observations lui sont suprieures ougales.Le cinquime dcile correspond aussi la mdiane et au deuxime quartile.Pour le calcul des dciles, on utilise la mme mthode de calcul que pour la mdiane etles quartiles. Pour des donnes groupes en classes, on dtermine un dcile parinterpolation linaire.Dsignons par :
[Ci ; Ci+1[ : la classe qui contient le dcile ;n : le nombre total des observations ;Fi : la frquence absolue cumule croissante ;ni : la frquence absolue de la classe qui contient le dcile ;
Le dcile dk est compris entre Ci et Ci+1
Ci < dk < Ci+1
Fi-1 < 10nk < Fi
-
Statistique descriptive 2. Caractristiques de tendance centrale
72
Frquence cumule
Fi
k n /10
Fi-1
CaractreCi Qj Ci+1
On suppose que la distribution au sein de la classe est rgulire.
Ainsi :1ii
i1iFF
CC
=
1i
ik
F10nk
Cd
)( 1i1ii
i1iik F10nk
FFCCCd
Exemple 24 : La rpartition de la surface, en m, de 100 logements est reprsente dans letableau suivant :
Surface en m Nombre delogementsFrquences cumules
croissantes0 20
20 4040 60
60 100100 160160 260
1020401884
1030708896
100Total 100
-
Statistique descriptive 2. Caractristiques de tendance centrale
73
En consultant les frquences absolues cumules croissantes, d1, qui correspond la10me observation, se trouve dans la classe 0 20 m. d9, qui correspond la 90meobservation, se trouve dans la classe 100 160 m.
29
21
m1158
88101009
60100
m2010
010100
200
d
d
- 10 % des logements ont une superficie infrieure ou gale 20 m.- 90 % des logements ont une superficie infrieure ou gale 115 m.- 80 % des logements ont une superficie comprise entre 20 m et 115 m.
2.6. EXERCICES DAPPLICATION.
2.6.1. Exercice.
Soit la distribution suivante du nombre de pices dans 300 logements :
Nombre de pices Effectifs123456
355168554942
Total 300
On demande de dterminer pour cette srie statistique la moyenne arithmtique, le mode lamdiane et les quartiles.
Solution :
k
1iiixfx = 3,53 pices ; Mode = 3 pices ; Me = 2,95 soit 3 pices
q1 = 1,76 soit 2 pices ; q2 = Me = 3 pices et q3 = 4,31 soit 4 pices
-
Statistique descriptive 2. Caractristiques de tendance centrale
74
2.6.2. Exercice.
On a relev la recette hebdomadaire en milliers de dirhams de 40 commerces. Les donnesbrutes sont :
57 60 52 49 56 46 51 63 49 5786 93 77 67 81 70 71 91 67 8247 87 92 55 48 90 49 50 58 6267 89 69 72 75 48 85 90 83 66
On demande de dterminer pour cette srie statistique la moyenne arithmtique et lamdiane :
- A partir de la srie brute ;- A partir de la distribution des frquences tablies lexercice 1.3.4.- Comparer les rsultats obtenus.
Solution : Srie brute : Moyenne = 67 675 DH ; Me = 67 000 DH
Srie des frquences :
k
1iii xfx = 68 200 DH ; Me = 66 444 Dh
Comparaison des rsultats : Les rsultats obtenus partir de la distribution desfrquences sont des rsultats approximatifs.
2.6.3. Exercice.
Le tableau suivant prsente le nombre de femmes en activit selon l'ge de 500 femmesactives :
Tranche d'ges Effectif[15 20[[20 25[[25 30[[30 35[[35 40[[40 45[[45 50[[50 55[55 et plus
1470
10065695663612
On demande de dterminer pour cette srie statistique la moyenne arithmtique, le mode, lamdiane et les quartiles.
Dterminer lintervalle central qui contient 60 % des femmes actives.
-
Statistique descriptive 2. Caractristiques de tendance centrale
75
Solution :
k
1iii xfx = 35,92 ans ; Mo = 27,5 ans ; Me = 35,07 ans
q1 = 27,05 ans ; q2 = Me = 35,07 ans et q3 = 45,08 ansd2 = 25,8 ans ; d8 = 47,06 ans => 60 % des femmes actives sont ges entre 25,8 et 47,06 ans.
2.6.4. Exercice.
Le tableau suivant donne le niveau de scolarit, en nombre dannes passes lcole, dunchantillon de 200 personnes.
Niveau de scolarit Effectif[0 ; 6[
[6 ; 12[[12 ; 14[[14 ; 16[
40805030
Total 200
On demande de dterminer pour la srie statistique la moyenne arithmtique, le mode, lamdiane et les quartiles.
Solution :
k
1iiixfx = 9,72 annes soit 10 annes environ ; Mode = 13 et
Me = 10,5 annesq1 = 6,75 annes ; q2 = Me = 10,5 annes et q3 = 13,2 annes
2.6.5. Exercice.
Un organisme charg de raliser des enqutes statistiques gre un rseau de 125 enquteurs. Ladirection de cet organisme dcide d'tudier la rpartition de ses enquteurs selon le nombred'enqutes qu'ils ont ralises. Les donnes collectes ce sujet sont rsumes dans le tableauci-aprs :
Nombre d'enqutes ralises Effectifs5
1015202530
81235402010
-
Statistique descriptive 2. Caractristiques de tendance centrale
76
On demande de dterminer pour cette srie statistique la moyenne arithmtique, le mode etla mdiane.
Solution :
k
1iii xfx = 18,28 enqutes ; Mode = 20 enqutes et Me = 15,94 soit 16
enqutes environ.
2.6.6. Exercice.
Une cooprative laitire fabrique un fromage qui doit contenir, selon les tiquettes, 45 % dematires grasses. Un institut de consommation dont le rle est de vrifier que la qualit desproduits est bien celle qui est affirme par l'tiquette, fait prlever et analyser un chantillon de100 fromages. Les rsultats de l'analyse sont consigns dans le tableau suivant :
Taux de matires grasses Nombre de fromages[41,5 - 42,5[[42,5 - 43,5[[43,5 - 44,5[[44,5 - 45,5[[45,5 - 46,5[[46,5 - 47,5[[47,5 - 48,5[
11124382231
On demande de dterminer pour la srie statistique la moyenne arithmtique, le mode, lamdiane, la mdiale et les quartiles.
Solution :
k
1iii xfx = 44,82 % ; Mode = 45 % ; Me = 44,87 % et Ml = 44,89 %
q1 = 44,04 % ; q2 = Me = 44,87 % et q3 = 45,55 %
2.6.7. Exercice.
Si le prix d'un article double tous les quatre ans, quel est le taux moyen d'augmentation du prixpar an ?
Solution : Moyenne gomtrique : Taux moyen = 4 2 -1 = 0,189 = 18,9 %
2.6.8. Exercice.
Une enqute, abordant la crise de logement, a t ralise auprs d'un chantillon de 1000personnes choisies dans quatre rgions diffrentes. Parmi les rsultats de cette enqute on arelev le nombre moyen de personnes par pice pour chaque rgion.
-
Statistique descriptive 2. Caractristiques de tendance centrale
77
Rgion Nombre moyen depersonnes par piceNombre d'habitants
(en milliers)NordEstOuestSud
2,22,63,13,3
5146560063507000
Quel est le nombre moyen de personnes par pice pour l'ensemble des quatre rgions ?Solution : Moyenne harmonique = 2,78 personnes par pices soit 278 personnes pour 100pices.
2.6.9. Exercice.
Le coefficient budgtaire de la consommation des mnages en services de sant est pass de 6,9% en 1990 8,5 % en 1995, puis 9,8 % en 2000, 10,6 % en 2004 et enfin 10,9 % en 2005.
a) Calculer les taux annuels moyens de croissance pour les priodes suivantes : (1990 1995) ;(1995 2000) ; (2000 2004) et (2004 2005).b) Dterminer le taux de croissance annuel moyen de 1990 2005.c) Donner une estimation du coefficient budgtaire en 2010 si la tendance relative de la priode2000 - 2005 se maintenait.
Solution : a) t1995/1990 = 4,26 % par an ; t2000/1995 = 2,89 % par an ; t2004/2000 = 1,98 % par an ett2005/2004 = 2,83 %. b) t2005/1995 = 3,10 % par an. c) Coefficient budgtaire estim en 2010 = 12,1%.
2.6.10. Exercice.
Le prix la tonne d'une matire premire a volu au cours de la priode allant de 2001 2005,comme suit :
Anne 2001 2002 2003 2004 2005Prix unitaire 310 266 220 200 150
a) Sachant que chaque anne une socit achte la mme quantit de cette matire premire,calculer le cot moyen pour les cinq annes.b) Quel est le cot moyen si la socit dpense, chaque anne, la mme somme : 1 00 000 DH,pour l'achat de cette matire premire ?
Solution : a) Cot moyen = 229,2 DH/t. b) Cot moyen = 215,54 DH/t.
-
Statistique descriptive 3. Caractristiques de dispersion
78
CHAPITRE 3CARACTERISTIQUES DE DISPERSION
Les paramtres de dispersion dune srie statistique permettent de chiffrer la variation desvaleurs observes autour d'un paramtre de position. Les principaux paramtres de dispersionsont : lcar