Degré de liberté (statistiques)

Cet article est une ébauche concernant les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

En statistiques le degré de liberté (ddl) désigne le nombre de variables aléatoires qui ne peuvent être déterminées ou fixées par une équation (notamment les équations des tests statistiques).

Une autre définition est : le degré de liberté est égal au nombre d'observations moins le nombre de relations entre ces observations^[1]. On pourrait remplacer l'expression « nombre de relations » par « nombre de paramètres à estimer ».

Exemple : vecteur aléatoire

Supposons un ensemble de n variables aléatoires, toutes de même loi et indépendantes $X 1,..., X n$ .

Le vecteur aléatoire $X$ dont chaque coordonnée est une de ces variables est défini dans un espace à n dimensions, donc naturellement, il a n degrés de libertés.

On note ${\bar {X}}$ la moyenne de ce vecteur. On peut alors réécrire le vecteur de cette façon :

{\begin{pmatrix}X_{1}\\\vdots \\X_{n}\end{pmatrix}}={\bar {X}}{\begin{pmatrix}1\\\vdots \\1\end{pmatrix}}+{\begin{pmatrix}X_{1}-{\bar {X}}\\\vdots \\X_{n}-{\bar {X}}\end{pmatrix}}.

Le premier vecteur étant entièrement déterminé par la valeur ${\bar {X}}$ , il n'a qu'un degré de liberté. Le deuxième vecteur doit satisfaire la condition $\sum _{i=1}^{n}(X_{i}-{\bar {X}})=0$ . Ainsi, en connaissant n − 1 coordonnées du vecteur, on peut en déduire la n^e : ce vecteur a n − 1 degrés de liberté.

Mathématiquement, cette décomposition traduit la projection orthogonale du vecteur aléatoire sur le sous-espace défini par le vecteur constant à 1, qui est de dimension 1, et donc son complémentaire de dimension n − 1.

Dans les tests statistiques, on s'intéresse plus à l'écart quadratique des composantes du vecteur :

\sum _{i=1}^{n}(X_{i}-{\bar {X}})^{2}={\begin{Vmatrix}X_{1}-{\bar {X}}\\\vdots \\X_{n}-{\bar {X}}\end{Vmatrix}}^{2}.

Pour le cas où les $X i$ suivent une loi normale centrée et de variance $σ 2$ , alors la somme définie plus haut suit une loi du χ² à n − 1 degrés de liberté, comme vu précédemment.

De même, la statistique de test du test de Student

{\frac {{\sqrt {n}}({\bar {X}}-\mu _{0})}{\sqrt {\sum \limits _{i=1}^{n}(X_{i}-{\bar {X}})^{2}/(n-1)}}}

suit une loi de Student à n − 1 degrés de liberté si la moyenne $μ 0$ est connue.

Références

↑ Walker, H. M., « Degrees of freedom », Journal of Educational Psychology, vol. 31, n^o 4,‎ avril 1940, p. 253-269 (DOI 10.1037/h0054588).

Portail des probabilités et de la statistique

[1] Walker, H. M., « Degrees of freedom », Journal of Educational Psychology, vol. 31, n^o 4,‎ avril 1940, p. 253-269 (DOI 10.1037/h0054588).

[1]