Opération et systèmes de décisionFaculté des Sciences de l ’administration
MQT-21919 Probabilités et statistique
Les statistiques descriptives
LecturesLectures
Livre du cours : – Sections 2.1, 2.2, annexe 2.2
Volume recommandé: "Statistique et gestion en économie"– Sections 2.1, 2.2
Les statistiques descriptivesLes statistiques descriptives
Les trois étapes du traitement des données statistiques:
1) La synthèse des résultats à l’aide d’un tableau;2) La représentation graphique du phénomène
étudié;3) Le calcul des mesures caractéristiques.
Étape 1 : La présentation des donnéesÉtape 1 : La présentation des données
Les tableaux statistiques :
Distribution de fréquences absolues Distribution de fréquences relatives Distribution de fréquences relatives cumulées
Notation :
X: une variable statistique (caractère)
xi : (modalités) valeurs possibles prises par la variable statistique X
fi : le nombre d’unités (fréquence absolue) présentant la valeur xi
fi /n : la fréquence relative de xi
Fi: la fréquence cumulée des valeurs prises par la variable X qui sont inférieures ou égales à xi
Fi /n: fréquence relative cumulée - c'est la proportion des valeurs prises par la variable X qui sont inférieures ou égales à xi
n: taille de l'échantillon
Étape 1 : La présentation des donnéesÉtape 1 : La présentation des données(variable discrète)(variable discrète)
La distribution de fréquence d’une variable statistique X est une fonction qui, à chaque valeur xi de la variable, fait correspondre sa fréquence fi .
De façon similaire on définit la distribution de fréquence relative.
Étape 1 : La présentation des données Étape 1 : La présentation des données (variable discrète)(variable discrète)
La clinique médicale MD a fait une étude sur tous ses dossiers de varicelle recensée cette année et on y a notamment enregistré le nombre de frères et sœurs de chacun des patients atteints de cette maladie contagieuse. On relève les données brutes suivantes :Posons X = la variable statistique représentant le nombre de frères et sœurs de chacun des patients atteints de cette maladie contagieuse. Calculer les fréquences et dessiner le diagramme en bâtons.2 1 3 0 6 0 1 2 3 13 0 2 0 4 1 0 4 0 21 1 3 2 3 3 2 1 1 10 1 2 4 1 2 2 7 3 20 1 1 2 5 5 3 4 3 01 2 2 3 0 1 2 0 2 2
Voir chiffrier Excel: exemple 1: données non groupées (varicelle)
Exemple 1 Exemple 1 (données non groupées)(données non groupées)
Calcul des fréquencesCalcul des fréquences
n = 60 8 classes
xi fi fi/n Fi/n
Étape 2 : La représentation graphiqueÉtape 2 : La représentation graphique
Diagramme en bâtons
Distribution de fréquence
(données non groupées)
Le nombre de frères et soeurs
76543210
Fré
qu
en
ce
20
10
0 2
4
10
1615
11
Exemple 1 (pour valeurs quantitatives non groupées, ou données qualitatives, variable discrète)
Insertion de graphiqueInsertion de graphique
Utilitaire d'analyseUtilitaire d'analyse
Les données sont souvent groupées en classes lorsque la variable est continue ou que celle-ci peut prendre un grand nombre de valeurs différentes (même si cette variable est discrète).
Pour construire une distribution de fréquence, de fréquence relative ou de fréquence relative cumulée, on doit d’abord déterminer le nombre de classes.
Étape 1 : La présentation des données (valeurs Étape 1 : La présentation des données (valeurs groupées)groupées)
Valeurs groupées en classes
Comment calculer le nombre de classes ?
1) 1 + 3,3 log10 n (règle de Sturges)
2)
Étape 1 : La présentation des données (valeurs Étape 1 : La présentation des données (valeurs groupées)groupées)
n
Pour obtenir des classes d’amplitude égale :
Trouvons E (l’étendue):E=Valeur maximale - Valeur minimale
Calculons l’amplitude:Amplitude=E/nombre de classes
Étape 1 : La présentation des données (valeurs Étape 1 : La présentation des données (valeurs groupées)groupées)
Pour les trois dernières années, le débit mensuel moyen d'une rivière, exprimé en milliers de mètres cubes par seconde, a été le suivant :
0,22 0,09 0,08 0,10 1,05 0,36 0,18 0,15 0,150,22 0,11 0,09 0,09 0,19 0,68 0,78 0,42 0,150,66 0,39 0,34 0,19 0,15 0,08 0,08 0,37 0,670,23 0,16 0,35 0,34 0,21 0,11 0,32 0,22 0,36
Voir chiffrier Excel: exemple 2: données groupées (Rivière)
Exemple 2 - données groupéesExemple 2 - données groupées
Trouvons n le nombre de classes:n= =6
ou encore: 1 + 3,3 log n = 1+3,3 log 36= 6,1358Trouvons E (l’étendue):
E=1,05 - 0,08=0,97
Calculons l’amplitude:Amplitude=0,97/6=0,17
On choisit la limite de la dernière classe un peu plus élevée que 1,05, disons 1,06, et on construit les limites des classes précédentes à reculons, en soustrayant 0,17 à chaque fois
Étape 1 : La présentation des donnéesÉtape 1 : La présentation des données
36
Les classesLes classes
Les classes sont:
(0,04-0,21]
(0,21-0,38]
(0,38-0,55]
(0,55-0,72]
(0,72-0,89]
(0,89-1,06]
Règle de 3 pour les données groupées Règle de 3 pour les données groupées (interpolation linéaire)(interpolation linéaire)
Lorsqu’on est en présence de données groupées la ième valeur d’une classe: Vi est:
1i
i IV
CV B ( i )
f
BI: limite inférieure de la classe qui contient Vi
fVi: fréquence absolue de la classe contenant Vi
C: amplitude de la classe
Les représentations graphiques permettent de visualiser le résumé statistique que nous donne la distribution de fréquence, de fréquence relative et de fréquence relative cumulée.
Étape 2 : La représentation graphiqueÉtape 2 : La représentation graphique
Le diagramme en bâtons (en barres) pour les données non groupées
– En abscisse: les valeurs de la variable discrète– En ordonnée: bâton de longueur proportionnelle à la
fréquence de chaque variable L’histogramme (pour les données groupées)
– Rectangles juxtaposés dont chacune des bases est égale à l’intervalle de chaque classe, et dont la hauteur est telle que la surface soit proportionnelle à la fréquence de la classe correspondante
Le polygone de fréquences– Distribution des fréquences sous-forme de courbe
Ogive (polygone de fréquence relative cumulée)
Étape 2 : La représentation graphiqueÉtape 2 : La représentation graphique
Étape 2 : La représentation graphiqueÉtape 2 : La représentation graphique
Exemple 1 - Diagramme en barres (en bâtons)
Distribution de fréquence relative
pour variable discrète
Le nombre de frères et soeurs
76543210
Fré
qu
en
ce
re
lative
( P
ou
rce
nta
ge
)
30
20
10
03
7
17
2725
18
Utiliser: Insertion/Graphique/Histogramme dans Excel
Histogramme Histogramme
Nous avons déjà défini les classes
HistogrammeHistogramme
Les classes sont définies automatiquement par Excel
Exemple 2 (pour valeurs groupées)
- Histogramme et ogive
Étape 2 : La représentation graphiqueÉtape 2 : La représentation graphique
Histogramme
0
18
11
2 31 1 0
0
5
10
15
20
0.04 0.21 0.38 0.55 0.72 0.89 1.06 ouplus...
Classes
Fréquence
.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
Fréquence
% cumulé
Utiliser Outils/Utilitaire d’analyse/Histogramme dans Excel
Exemple 2 (pour valeurs groupées )
- Polygone de fréquence doit commencer et se terminer à 0
Étape 2 : La représentation graphiqueÉtape 2 : La représentation graphique
Polygone de fréquences
0
5
10
15
20
1 2 3 4 5 6 7 8
Classes
Fréquence
Utiliser: Insertion/Graphique/Courbes dans Excel
Polygone de fréquence dans Polygone de fréquence dans ExcelExcel
Top Related