Accueil » Publications » Le Bulletin Vert » Pour chercher et approfondir » Étonnante précision de la méthode des (...)
  APMEP   Étonnante précision de la méthode des moindres carrés

Article du bulletin 467

Adhérer ou faire un don

pour des séries chronologiques issues de modèles linéaires fortement perturbés.

- décembre 2006 -

Stéphane Junca [1]

1. Introduction

L’étude de séries statistiques en classe demande souvent du temps pour rentrer les données. Ce qui nous limite dans la taille des échantillons. Pour gagner du temps et traiter très rapidement des exemples de plus grande taille, j’utilise dans mes classes de préparation au C.A.P.E.S. des séries de la forme $(k,k+e_k)_{k=1}^{n}$, facile à rentrer et à illustrer graphiquement avec ma calculatrice à écran rétroprojetable. Pour des « petites » perturbations $e_k$, on n’est pas surpris de retrouver précisément la pente 1 avec la méthode des moindres carrés. On est alors tenté de prendre des perturbations de plus en plus grandes. À la grande surprise de ma classe, la méthode des moindres carrés résiste très bien à ce genre de traitement. Pour éclaircir ce mystère, cet article propose de nombreux exemples et des explications mathématiques et historiques de cette étonnante stabilité de la méthode des moindres carrés.

Il faut savoir que cette méthode comprend bien plus que le problème de l’ajustement affine. En général, il s’agit de trouver p paramètres solutions d’un système linéaire rectangulaire. En pratique, on a beaucoup plus d’équations que d’inconnues et il s’agit de trouver la solution au sens des moindres carrés [10].

Le cas p = 1 est déjà fait dès le Collège sans bien sûr le présenter de cette manière.

En effet lorsque l’on choisit de n’associer à une série statistique $(x_k)_{k=1}^{n}$qu’un seul nombre représentatif : la moyenne m, on résout le système linéaire surdéterminé : $m = x_{k}, k = 1, \ldots, n$ à une inconnue et avec n équations au sens des moindres carrés.

C’est-à-dire que l’on prend l’unique nombre m qui minimise l’écart quadratique moyen :

$\frac{1}{n}\sum_{i=1}^{n}(x_{i}-m)^2$

Le cas p = 2 n’est fait qu’au Lycée pour certaines Terminales dans le cadre d’ajustement affine d’un nuage de points $(x_k,y_k)_{k=1}^{n}$ . Il en est ainsi pour la section ES, des séries technologiques (par exemple la série sciences et technologies de la gestion) et des séries professionnelles.

L’utilisation croissante de matériel informatique ne fera que renforcer cette tendance. D’autant plus que son utilisation est très courante après le bac en coordonnées semilog ou log-log, en physique, en chimie, en biologie, en économie, en sciences humaines, …

Pour le problème de l’ajustement affine, les inconnues sont les coefficients de la droite $(\alpha, \beta)$, et les équations sont $y_k = \alpha x_k + \beta, k = 1,\ldots, n $ avec n > 2. Une fois encore la solution s’obtient en minimisant la moyenne des écarts quadratiques $(y_k -(\alpha x_k + \beta))^2$.

Ainsi, la méthode nous fournit toujours une droite. Mais cette droite est-elle bien pertinente ? Par exemple, si le nuage de points est un échantillon de points d’une parabole, la droite fournie est sans intérêt. Il faut donc avoir plus d’informations sur le nuage de points.

Dans cet article nous ne traiterons que des cas issus de perturbations du modèle linéaire. De plus nous supposerons que la série des abscisses est arithmétique, ce qui est fréquent pour des séries chronologiques. Dans ce cadre nous verrons que cette méthode est très efficace et très stable.

Lire l'article dans son intégralité


[1] IUFM et Université de Nice, Laboratoire J. A. Dieudonné, UMR CNRS 6621.


 Accueil   Plan du site   Haut de la page   Page précédente