I. Série statistique double
Une série statistique double étudie deux caractères quantitatifs X et Y sur une même population.
Elle se présente souvent par des couples (xᵢ ; yⱼ) accompagnés d'effectifs nᵢⱼ dans un tableau de contingence.
- Les totaux par colonnes donnent la série marginale de X.
- Les totaux par lignes donnent la série marginale de Y.
- Les fréquences marginales s'obtiennent en divisant les effectifs par l'effectif total.
II. Nuage de points
Le nuage de points associé à une série double est l'ensemble des points de coordonnées (xᵢ ; yᵢ).
Il permet de visualiser l'existence éventuelle d'une relation entre X et Y.
III. Point moyen
G(X̄ ; Ȳ) avec X̄=(x₁+...+xₙ)/n et Ȳ=(y₁+...+yₙ)/n
Le point moyen représente le centre du nuage de points.
IV. Covariance
La covariance mesure le sens de variation simultanée de deux caractères.
Cov(X,Y)= (1/n)Σ(xᵢ−X̄)(yᵢ−Ȳ)
Cov(X,Y)= (Σxᵢyᵢ)/n − X̄Ȳ
| Signe | Interprétation |
|---|
| Cov>0 | X et Y tendent à augmenter ensemble |
| Cov<0 | Quand X augmente, Y tend à diminuer |
| Cov≈0 | Pas de tendance linéaire nette |
V. Coefficient de corrélation linéaire
r = Cov(X,Y)/(√V(X)√V(Y))
- −1≤r≤1.
- r a le même signe que la covariance.
- Si |r| est proche de 1, la corrélation linéaire est forte.
- En pratique, si |r|≥0,87, on considère souvent qu'il y a forte corrélation.
VI. Droites de régression
1. Régression de Y en X
y=ax+b avec a=Cov(X,Y)/V(X) et b=Ȳ−aX̄
2. Régression de X en Y
x=a'y+b' avec a'=Cov(X,Y)/V(Y) et b'=X̄−a'Ȳ
Les deux droites de régression passent par le point moyen G.
VII. Estimation
Lorsqu'il existe une forte corrélation linéaire, on peut utiliser une droite de régression pour prévoir une valeur.
- Calculer ou choisir l'équation de la droite d'ajustement.
- Remplacer la valeur connue dans l'équation.
- Arrondir le résultat selon le contexte.
- Interpréter la prévision avec prudence.
VIII. Relations utiles
aa'=r² ; |r|=√(aa')
Si r²=1, les deux droites de régression sont confondues : le nuage est parfaitement aligné.
Créé par Haniel_dev