Fiche ultra-synthèse — Statistiques & échantillonnage (2nde)
Effectifs/fréquences • moyenne • médiane • quartiles • diagrammes • échantillon • estimation simple.
Objectif : réponses propres + méthodes rapides (niveau solide / 2nde+).
Essentiel (à savoir par cœur)
1 Effectifs & fréquences
Effectif : nombre d’individus d’une modalité.
Fréquence :
\[
f_i=\frac{n_i}{N}\quad (0\le f_i\le 1)
\qquad\text{et}\qquad
\%_i=100f_i
\]
Contrôle rapide : \(\sum n_i=N\) et \(\sum f_i=1\) (à l’arrondi près).
Piège : 0,28 c’est une fréquence ; 28 % c’est le pourcentage.
2 Moyenne (pondérée)
Si la série est donnée par \((x_i,n_i)\) :
\[
\bar{x}=\frac{\sum (n_i x_i)}{N}
\]
En liste brute :
\[
\bar{x}=\frac{x_1+\cdots+x_N}{N}
\]
Lecture : “valeur moyenne” — mais elle est sensible aux valeurs extrêmes.
Piège : oublier les effectifs \(n_i\) (on doit multiplier \(x_i\) par \(n_i\)).
3 Médiane
La médiane partage la série ordonnée :
- au moins 50 % des valeurs \(\le m\)
- au moins 50 % des valeurs \(\ge m\)
Rangs (liste triée) :
- Si \(N\) impair : rang \(\dfrac{N+1}{2}\).
- Si \(N\) pair : moyenne des 2 valeurs centrales (rangs \(\dfrac{N}{2}\) et \(\dfrac{N}{2}+1\)).
Piège : chercher la médiane sans trier.
4 Quartiles \(Q_1\) et \(Q_3\)
Série ordonnée (ou via cumulés) :
- \(Q_1\) : au moins 25 % des données \(\le Q_1\).
- \(Q_3\) : au moins 75 % des données \(\le Q_3\).
Dispersion robuste : écart interquartile \(IQR=Q_3-Q_1\).
Piège : confondre quartiles et “moyennes”. \(Q_3=10\) ne dit pas que la moyenne vaut 10.
Méthodes (procédures rapides 20/20)
A Faire un tableau (propre) + cumulés
- Je liste les modalités (ou classes) \(x_i\) dans l’ordre.
- Je note les effectifs \(n_i\) et je calcule \(N=\sum n_i\).
- Je calcule les fréquences \(f_i=\dfrac{n_i}{N}\) (et les %).
- Je calcule les cumulés : \(N_i\) puis \(F_i\).
- Je vérifie : \(\sum f_i=1\) (à l’arrondi près).
Exemple “seuil quartile” avec cumulés :
\(N=20\Rightarrow 0{,}25N=5\) et \(0{,}75N=15\).
On prend la première valeur dont le cumulé \(\ge 5\) → \(Q_1\).
Première valeur dont le cumulé \(\ge 15\) → \(Q_3\).
\(N=20\Rightarrow 0{,}25N=5\) et \(0{,}75N=15\).
On prend la première valeur dont le cumulé \(\ge 5\) → \(Q_1\).
Première valeur dont le cumulé \(\ge 15\) → \(Q_3\).
B Moyenne pondérée (méthode sans faute)
\[
\bar{x}=\frac{\sum(n_i x_i)}{N}
\]
Étapes : (1) calcule chaque produit \(n_i x_i\), (2) additionne, (3) divise par \(N\).
Exemple : \(x=9\) (15 élèves), \(x=12\) (8 élèves), \(x=18\) (5 élèves), \(x=2\) (2 élèves)
\(N=30\).
\(S=15\cdot 9+8\cdot 12+5\cdot 18+2\cdot 2=325\).
\(\bar{x}=325/30\approx 10{,}83\).
\(N=30\).
\(S=15\cdot 9+8\cdot 12+5\cdot 18+2\cdot 2=325\).
\(\bar{x}=325/30\approx 10{,}83\).
Interprétation attendue : “La note moyenne est d’environ \(10{,}83\) sur 20.”
C Trouver la médiane
Cas liste brute : je trie, puis je prends la valeur centrale (ou la moyenne des deux centrales).
Données triées : \(2,6,7,9,10,11,12,18\) (\(N=8\))
Valeurs centrales : rangs 4 et 5 → \(9\) et \(10\).
Médiane : \(m=(9+10)/2=9{,}5\).
Valeurs centrales : rangs 4 et 5 → \(9\) et \(10\).
Médiane : \(m=(9+10)/2=9{,}5\).
La médiane résiste mieux aux valeurs extrêmes que la moyenne.
D Quartiles + dispersion
Avec cumulés :
- Seuil \(Q_1\) : \(0{,}25N\)
- Seuil \(Q_3\) : \(0{,}75N\)
IQR : \(Q_3-Q_1\) (mesure de dispersion “robuste”).
Étendue : \(\max-\min\) (très sensible aux extrêmes).
Étendue : \(\max-\min\) (très sensible aux extrêmes).
Si \(Q_1=8\) et \(Q_3=10\), alors \(IQR=2\).
Interprétation : “La moitié centrale des données est dans \([8 ; 10]\)”.
Interprétation : “La moitié centrale des données est dans \([8 ; 10]\)”.
E Choisir le bon diagramme
| Type de variable | Diagramme conseillé | Remarque |
|---|---|---|
| Qualitative | Barres / secteurs | Proportions, comparaisons |
| Quantitative discrète | Bâtons | Valeurs isolées |
| Quantitative continue (classes) | Histogramme | Attention aux largeurs de classes |
F Échantillon & estimation simple
Population : ensemble étudié.
Échantillon : sous-ensemble observé (taille \(n\)).
Si on observe \(k\) “succès”, l’estimation de proportion est : \[ \hat{p}=\frac{k}{n} \]
Échantillon : sous-ensemble observé (taille \(n\)).
Si on observe \(k\) “succès”, l’estimation de proportion est : \[ \hat{p}=\frac{k}{n} \]
Biais : si l’échantillon n’est pas représentatif, l’estimation peut être trompeuse.
Plus \(n\) est grand, plus l’estimation est en général stable.
Exemple : \(n=200\), \(k=56\) → \(\hat{p}=56/200=0{,}28=28\%\).
Phrase : “On estime qu’environ 28 % …”
Phrase : “On estime qu’environ 28 % …”
Pièges classiques (à éviter)
1 Moyenne vs médiane
Une valeur extrême fait bouger la moyenne beaucoup, la médiane beaucoup moins.
Donc “moyenne élevée” ne veut pas dire “la plupart sont élevés”.
2 Oublis de calcul
- Ne pas trier → médiane/quartiles faux.
- Ne pas multiplier par \(n_i\) → moyenne fausse.
- Ne pas vérifier \(\sum f_i=1\).
3 Diagrammes
Histogramme : des classes de largeurs différentes peuvent tromper visuellement.
Et camembert : un pourcentage doit “faire sens” (somme = 100 %).
Phrase obligatoire : après un calcul, j’écris une phrase d’interprétation (sinon c’est “maths sans sens” → points perdus).
Mini-tests (45 secondes chacun) — corrigés
Q1 Fréquence
Sur 40 élèves, 12 prennent le bus. Donner la fréquence et le %.
Corrigé : \(f=12/40=0{,}30\) soit \(30\%\).
Q2 Vérification
Deux fréquences : 0,18 et 0,83. Est-ce possible ?
Corrigé : non, car \(0{,}18+0{,}83=1{,}01\) (trop). On a un arrondi mal géré (ou une erreur).
Q3 Moyenne pondérée
Valeurs 5 (3 fois), 9 (2 fois), 11 (5 fois). Moyenne ?
Corrigé : \(N=10\). \(S=3\cdot5+2\cdot9+5\cdot11=15+18+55=88\). \(\bar{x}=88/10=8{,}8\).
Q4 Médiane
Liste triée : \(1,3,3,4,7,9\). Médiane ?
Corrigé : \(N=6\) → moyenne des rangs 3 et 4 : \((3+4)/2=3{,}5\).
Q5 Quartiles
Pour \(N=20\), quels sont les seuils pour \(Q_1\) et \(Q_3\) ?
Corrigé : \(0{,}25N=5\) et \(0{,}75N=15\).
Q6 Estimation
Sur 150 personnes, 39 répondent “oui”. Estimation de proportion ?
Corrigé : \(\hat{p}=39/150=0{,}26\) soit \(26\%\). Phrase : “On estime environ 26 % …”
Checklist (avant contrôle)
Je sais faire
- Définir population, variable (qualitative/quantitative), effectif total.
- Construire un tableau : \(x_i\), \(n_i\), \(f_i\), % et (si besoin) cumulés.
- Calculer une moyenne pondérée \(\bar{x}=\dfrac{\sum(n_i x_i)}{N}\).
- Trouver la médiane en triant et en utilisant les rangs.
- Trouver \(Q_1\) et \(Q_3\) via les seuils \(0{,}25N\) et \(0{,}75N\).
- Choisir le diagramme adapté et l’interpréter.
- Estimer une proportion : \(\hat{p}=\dfrac{k}{n}\) + phrase claire.
Réflexes 20/20
1) Toujours trier avant médiane/quartiles.
2) Moyenne : je calcule \(S=\sum(n_ix_i)\), puis je divise par \(N\).
3) Je finis par une phrase d’interprétation (points faciles).
4) Échantillon : je me demande “biais ? représentatif ? taille ?”
2) Moyenne : je calcule \(S=\sum(n_ix_i)\), puis je divise par \(N\).
3) Je finis par une phrase d’interprétation (points faciles).
4) Échantillon : je me demande “biais ? représentatif ? taille ?”
À bannir : oublier les effectifs, confondre fréquence/%,
interpréter une moyenne comme “valeur typique” sans nuance,
conclure sur la population avec un échantillon biaisé.
Notation FR : intervalles \([a ; b]\).