Statistiques à deux variables

Nuage de points • ajustement affine • régression linéaire • corrélation • esprit critique.

Fiche — Statistiques à deux variables
Nuage de points • ajustement affine • régression • corrélation • esprit critique.
Ultra-synthèse Interprétation Bac
1) L’essentiel à savoir
  • Une série à deux variables est un ensemble de couples \((x_i ; y_i)\).
  • On cherche à décrire et parfois modéliser \(y\) en fonction de \(x\).
  • Le premier outil est le nuage de points.
  • Un ajustement affine est pertinent seulement si les points sont globalement alignés.
  • Une corrélation forte n’implique pas une relation de cause à effet.
2) Nuage de points : lecture rapide
Tendance croissante

\(x\) augmente ⟹ \(y\) augmente globalement.

Ajustement affine souvent pertinent.

Tendance décroissante

\(x\) augmente ⟹ \(y\) diminue globalement.

Ajustement affine possible (pente négative).

Pas de tendance claire

Points très dispersés.

Modèle affine peu pertinent.

Tendance non linéaire

Courbe (parabole, saturation, exponentielle…).

Une droite peut être trompeuse.

3) Ajustement affine

On modélise par une droite : \[ y \approx ax + b \]

  • Pente \(a\) : variation moyenne de \(y\) quand \(x\) augmente de 1.
  • Ordonnée à l’origine \(b\) : valeur modélisée de \(y\) pour \(x = 0\) (à interpréter seulement si \(x=0\) a un sens).
Droite d’ajustement “à la main”

En choisissant deux points \(A(x_1 ; y_1)\) et \(B(x_2 ; y_2)\) : \[ a=\frac{y_2-y_1}{x_2-x_1} \qquad b=y_1-ax_1 \]

Méthode approximative mais acceptée si elle est cohérente avec le nuage.

4) Régression linéaire (calculatrice)
  • La droite de régression est calculée par la méthode des moindres carrés.
  • On sait utiliser l’équation \(y=ax+b\) fournie.
  • On fait des prévisions avec prudence.
Interpolation

\(x\) est dans l’intervalle observé.

Prévision généralement fiable.

Extrapolation ⚠️

\(x\) est en dehors des données.

Toujours signaler l’incertitude.

5) Corrélation linéaire

Le coefficient de corrélation \(r\) vérifie : \[ -1 \le r \le 1 \]

  • \(r \approx 1\) : forte corrélation positive.
  • \(r \approx -1\) : forte corrélation négative.
  • \(r \approx 0\) : absence de corrélation linéaire marquée.
Point clé Bac

Corrélation élevée ≠ causalité. Un lien peut être dû à une variable cachée ou à une simple coïncidence.

6) Méthode Bac (à appliquer systématiquement)
  1. Décrire l’allure du nuage (croissante, décroissante, non linéaire…).
  2. Dire si un ajustement affine est pertinent.
  3. Donner ou utiliser l’équation \(y=ax+b\).
  4. Préciser interpolation ou extrapolation.
  5. Conclure avec esprit critique (corrélation ≠ causalité).
7) Erreurs classiques à éviter
  • Conclure trop fortement à partir d’une extrapolation.
  • Interpréter \(b\) alors que \(x=0\) n’a aucun sens réel.
  • Dire “pas de lien” parce que \(r \approx 0\).
  • Confondre corrélation et causalité.