Suivez votre progression
Connectez-vous pour enregistrer votre progression et vos tentatives de quiz.
Cours — Statistique descriptive
Série statistique • effectifs • fréquences • moyenne • médiane • étendue • écart-type • interprétation des données
1) Vocabulaire de base
La statistique descriptive sert à recueillir, organiser, résumer et interpréter des données.
Dans une étude statistique, on rencontre souvent :
  • la population : ensemble étudié ;
  • le caractère : propriété observée ;
  • les valeurs : résultats possibles du caractère ;
  • l’effectif : nombre d’individus correspondant à une valeur ;
  • la fréquence : proportion associée à une valeur.
Caractère quantitatif
Il prend des valeurs numériques, par exemple une note, un âge, un salaire ou un nombre d’articles vendus.
Caractère qualitatif
Il prend des valeurs non numériques, par exemple une couleur, une catégorie socioprofessionnelle ou un type de produit.
2) Tableau statistique
Une série statistique peut être présentée dans un tableau indiquant les valeurs du caractère, les effectifs et les fréquences.
Valeur \(x_i\) 1 2 3 4
Effectif \(n_i\) 2 5 3 4
L’effectif total vaut : \[ N=\sum n_i. \]
La fréquence associée à une valeur est donnée par : \[ f_i=\frac{n_i}{N}. \]
Exemple
Si une valeur apparaît 8 fois dans une série de 40 données, alors sa fréquence est : \[ \frac{8}{40}=0{,}2 \] soit \(20\%\).
3) Moyenne
La moyenne d’une série est une valeur centrale obtenue en faisant la somme des valeurs pondérées par leurs effectifs puis en divisant par l’effectif total.
Pour une série discrète : \[ \bar{x}=\frac{\sum x_i n_i}{N}. \]
Interprétation
La moyenne représente une valeur « d’équilibre » de la série.
Attention
La moyenne peut être influencée par des valeurs très grandes ou très petites.
Exemple de calcul
On considère la série : \[ 8,\ 10,\ 12,\ 10. \] La moyenne vaut : \[ \bar{x}=\frac{8+10+12+10}{4}=\frac{40}{4}=10. \]
4) Médiane
La médiane est une valeur qui partage une série ordonnée en deux groupes de même effectif :
  • au moins 50 % des données lui sont inférieures ou égales ;
  • au moins 50 % des données lui sont supérieures ou égales.
Pour déterminer la médiane, il faut d’abord ranger les données dans l’ordre croissant.
Effectif impair
La médiane est la valeur du milieu.
Effectif pair
On prend souvent la moyenne des deux valeurs centrales.
Exemple
Dans la série ordonnée : \[ 4,\ 5,\ 7,\ 9,\ 12, \] la médiane est \(7\). Dans la série ordonnée : \[ 3,\ 6,\ 8,\ 10, \] les deux valeurs centrales sont \(6\) et \(8\), donc la médiane vaut : \[ \frac{6+8}{2}=7. \]
5) Mesures de dispersion
Deux séries peuvent avoir la même moyenne mais être plus ou moins dispersées. Pour étudier cette dispersion, on utilise notamment l’étendue et l’écart-type.
Étendue
L’étendue est la différence entre la plus grande valeur et la plus petite : \[ \text{étendue}=\text{maximum}-\text{minimum}. \]
Idée
Plus l’étendue est grande, plus la série semble étalée.
L’étendue ne tient compte que des valeurs extrêmes : elle ne résume pas à elle seule toute la dispersion d’une série.
6) Écart-type
L’écart-type mesure la dispersion des données autour de la moyenne. Plus il est petit, plus les données sont regroupées autour de la moyenne. Plus il est grand, plus les données sont dispersées.
Pour une série discrète, on admet la formule : \[ \sigma=\sqrt{\frac{\sum n_i(x_i-\bar{x})^2}{N}}. \]
Si \(\sigma\) est petit
Les valeurs sont proches de la moyenne.
Si \(\sigma\) est grand
Les valeurs sont davantage réparties autour de la moyenne.
7) Interprétation des données
En statistique descriptive, calculer ne suffit pas : il faut interpréter.
Questions typiques
  • la moyenne est-elle élevée ou faible ?
  • la médiane est-elle proche de la moyenne ?
  • la série est-elle homogène ou dispersée ?
  • certaines valeurs sont-elles extrêmes ?
Une série avec faible écart-type est souvent considérée comme plus homogène qu’une série avec grand écart-type.
Exemple d’analyse
Deux classes ont une moyenne de \(12\). Si la première a un écart-type de \(1\) et la seconde un écart-type de \(4\), alors les notes de la première classe sont beaucoup plus regroupées autour de \(12\) que celles de la seconde.
8) Formulaire
\[ N=\sum n_i \] \[ f_i=\frac{n_i}{N} \] \[ \bar{x}=\frac{\sum x_i n_i}{N} \] \[ \text{étendue}=\text{maximum}-\text{minimum} \] \[ \sigma=\sqrt{\frac{\sum n_i(x_i-\bar{x})^2}{N}} \] \[ \text{médiane : valeur centrale d’une série ordonnée} \]