Adhérer ou faire un don

Des démonstrations qui font boum !

Jean Baptiste Hiriart-Urruty

Lorsqu’en cours, à la fin de la démonstration d’un résultat, je m’exclame « Voilà une démonstration qui fait boum ! », mes étudiants savent qu’il s’agit d’une démonstration particulièrement courte et astucieuse, qui mérite d’être relue et étudiée à tête reposée... Mais qu’est-ce qu’une démonstration qui fait boum ? Je vais essayer de l’illustrer dans cette note avec trois exemples.

Avant cela, prenons le temps de quelques réflexions. Un énoncé de mathématiques n’a de valeur que s’il est démontré ... chose qu’il est parfois difficile à faire admettre à ces « amateurs » (intéressés par les mathématiques) qui viennent vous présenter « une démonstration du grand théorème de FERMAT », « la conjecture de GOLDBACH en trois pages » ou bien une nouvelle théorie de l’intégration…Une démonstration, terme très souvent transcrit en « preuve » (anglicisme venant de proof), est l’élément essentiel qui fera qu’un énoncé mathématique sera accepté ou pas. Bien sûr, il y a des démonstrations qui sont refaites, améliorées, raccourcies au cours du temps, … et même les non mathématiciens conviennent que trouver une démonstration plus courte et élégante que les existantes est une activité de création mathématique. Quant à l’enseignant, il lui revient de choisir la démonstration la plus appropriée au public concerné, c’est-à-dire dépendant essentiellement de ce que l’auditoire connaît.

Certains mathématiciens comme P. ERDÖS [1] pensent qu’il y a pour chaque résultat de mathématiques une démonstration divine, celle écrite « dans le livre », mais que nous ne connaissons pas forcément. Sans aller jusque là, je relate ci-dessous trois résultats de mathématiques avec des démonstrations « qui font boum », selon moi du moins. Chaque lecteur mathématicien a probablement dans sa besace un lot de démonstrations répondant à cette définition.

Exemple 1. L’inégalité de Cauchy-Schwarz

Un espace préhilhertien réel E (appelé encore espace euclidien s’il est de dimension finie) est un espace vectoriel réel muni d’un produit scalaire que l’on notera $\langle \cdot , \cdot \rangle $. Par définition même de ce produit scalaire, nous avons :

$$\langle u,u \rangle \ge 0 \text{ pour tout u} \in E, \langle u,u \rangle =0 \ seulement\ pour\ u=0.\ \ \ (1) $$

Si $\|u\|$ est posé par définition égal à $\sqrt{\langle u,u \rangle}$, sans savoir encore que cela conduira à une norme sur E, le développement suivant est immédiat à partir du caractère bilinéaire symétrique de $\langle \cdot , \cdot \rangle $ :

$$\|x+y\|^2=\|x\|^2 + \|y\|^2 + 2 \langle x,y \rangle \ pour \ tout \ x, y \ dans \ E. \ \ \ (2)$$

Les étudiants aiment bien ce développement (2), qui leur rappelle la formule $\ (a + b)^2 = a^2 + b^2 + 2ab\ $ apprise en collège. Avec le développement au-dessus, la deuxième chose la plus importante en calcul hilbertien est la dite inégalité de CAUCHY-SCHWARZ [2] qui dit ceci : x et y étant pris dans E,

$$\| \langle x,y \rangle\| \le \|x\| \|y\| \ \ \ \ (CS) $$

avec égalité si et seulement si x et y sont colinéaires.

La démonstration de (CS) est pratiquement toujours faite de la même façon, je l’ai apprise ainsi, je l’ai souvent enseignée ainsi : on considère le trinôme du second degré

$$p(t):=\|x+ty\|^2=\|x\|^2+t^2\|y\|^2+2t\langle x,y \rangle$$

lequel est toujours positif sur $\mathbb R$, donc de discriminant négatif (c’est là le point essentiel)… Puis, on retravaille sur le discriminant pour montrer que le cas d’égalité n’a lieu que si x et y sont colinéaires. Tous les livres ou cours que j’ai compulsés proposent cette démonstration, à une ou deux exceptions près… Or il existe une autre démonstration très rapide et élégante de (CS), la voici. Observons tout d’abord que (CS) n’est à démontrer, y compris pour le cas d’égalité, que pour des x et y non nuls. Prenons donc $x\ne 0 \ et \ y\ne 0$ dans E et développons $\left\| \frac{x}{\|x\|} \pm \frac{y}{\|y\|}\right\|^2$ suivant la règle (2) (± est mis pour indiquer qu’on procède aussi bien avec le signe + qu’avec le signe −). Cela donne, puisque $ \left\| \frac{u}{\|u\|} \right\| =1 $ pour tout u de E,

$$\left\| \frac{x}{\|x\|} \pm \frac{y}{\|y\|}\right\|^2=1+1 \pm \frac{2\langle x,y \rangle}{ \|x\| \|y\|} \ \ \ (3)$$

Étant donné que la quantité développée est positive, c’est-ter-mi-né ! Nous avons l’inégalité de (CS)… Plus percutant encore est le cas d’égalité dans (CS) : la quantité en (3) n’est nulle que si $\left\| \frac{x}{\|x\|} \pm \frac{y}{\|y\|}\right\|=0 \ $ , c’est-à-dire exactement lorsque $\frac{x}{\|x\|} = \pm \frac{y}{\|y\|}$

J’ai appris de P. HALMOS [3] cette manière de faire ; G. ROOS donne une forme équivalente [4]

Exemple 2. Existence de points extrémaux dans une partie convexe compacte.

Dans l’espace structuré $\mathbb R^n$ en espace normé grâce à la norme euclidienne usuelle, notée $\| . \|$ , on considère une partie convexe fermée C (c’est-à-dire telle que tout segment joignant deux points quelconques de C est entièrement contenu dans C). Une notion essentielle concernant C est celle de point extrémal (on dit aussi sommet lorsque C est polyédral) : un point x de C est dit extrémal s’il ne peut être placé à l’intérieur d’un segment dont les extrémités seraient dans C. En termes mathématiques, cela veut dire :

$$ \left. \begin{gathered} x=ty+(1-t)z\hfill \\ y \in C, z \in C, y \ne z \hfill \\ 0

Par exemple, un sous-espace affine n’a pas de points extrémaux, un cône (convexe fermé) ne peut avoir comme point extrémal que sa pointe (et encore, pas toujours), un triangle (non aplati) du plan a pour points extrémaux ce qu’on appelle usuellement ses sommets, … Alors, avoir ou ne pas avoir des points extrémaux ? Là est la question… Au premier abord, décider qu’une partie convexe fermée de a effectivement des points extrémaux peut être d’une difficulté « existentielle », aussi redoutable que celle qui permet d’affirmer l’existence d’une base d’un espace vectoriel… En fait il n’en est rien. Voici comment on démontre rapidement qu’ une partie convexe fermée bornée (en d’autres termes, compacte) C de $\mathbb R^n$ a des points extrémaux. La démonstration a, de plus, une saveur géométrique. Nous prétendons que le point le plus éloigné de l’origine dans C est nécessairement un point extrémal. En effet, considérons la fonction définie sur $\mathbb R^n$ par $f(x)=\|x\|^2$. Cette fonction est continue, elle peut donc être maximisée sur C : il existe x dans C tel que :

$$ \|x\|^2= \displaystyle \max_{u \in C}\|u\|^2 \ \ \ (5)$$

Or la fonction f est strictement convexe (c’est un des intérêts d’avoir pris le carré de la norme !), c’est-à-dire :

$$f(ty+(1-t)z) dès lors que $y \ne z $ et $0 < t < 1$.

En clair, il n’y a pas de partie linéaire (i.e. de la forme d’un segment) dans le graphe de f. Il n’y a plus qu’à comparer (5) et (6) pour décider, avec (4), que x est extrémal. On arrive en effet à la contradiction que voici :

$$ \displaystyle \max_{u \in C}\|u\|^2-\|x\|^2

Les points extrémaux se trouvent être les points essentiels de C car ils servent à reconstituer C : la partie convexe compacte C de $\mathbb R^n$ est le plus petit ensemble convexe (au sens de l’inclusion) qui contiennent tous ses points extrémaux ; ou encore : C est l’ensemble de tous les barycentres de points extrémaux. Rapidement dit, dans beaucoup de domaines d’applications (comme en Commande optimale), ce qu’on demande de faire avec les points de C peut l’être aussi uniquement à l’aide des points extrémaux de C.

Enfin, parlant de points les plus éloignes dans un convexe, voici un petit résultat élémentaire qui peut être établi en collège à l’aide du théorème de PYTHAGORE (et qui nous a été signalé par un lecteur-arbitre de cette note) : la distance maximale de l’origine à un point d’un segment du plan est nécessairement atteinte à l’une ou à ses deux extrémités.

Exemple 3. Les convexes du plan d’aire maximale parmi ceux de diamètre majoré.

Étant donnée une partie convexe fermée bornée C du plan, on appelle diamètre de C la plus grande distance entre deux points de C, soit la quantité définie comme suit :

$$\Delta (C)=\displaystyle \max_{x,y \in C}\|x-y\|$$

Par exemple, un segment (du plan) de longueur d est de diamètre d. un disque de diamètre d est … de diamètre d. La question posée ici est la suivante : parmi les parties convexes fermées du plan, par exemple dont le bord $ \gamma $ est d’équation $\rho = \rho (\theta)$ en coordonnées polaires, dont le diamètre est majoré par $\delta$, quelles sont celles d’aire maximale ? Pas facile a priori de répondre à cette question … et pourtant. Remarquons tout d’abord que les objets en question (d’aire maximale) auront probablement un diamètre égal à $\delta$ (sinon on dilate la partie convexe jusqu’à avoir un diamètre maximal, et ce faisant on agrandit l’aire). Ensuite, notons que les disques de diamètre $\delta$ ont pour aire $\pi {\delta^2 \over 4}$. Nous allons donc démontrer que toute partie convexe fermée bornée de diamètre majoré par $\delta$ a une aire majorée par $\pi {\delta^2 \over 4}$

Pour la démonstration, garder un oeil sur les figures ci-dessous.

Quand on était petit, on a appris – et on l’enseigne toujours – que l’aire A(C) de C est donnée par la formule

$$ A(C)={1\over2} \int_{-{\pi \over2}}^{\pi \over2} \rho^2(\theta)d \theta \ \ \ (7)$$

Première étape : 80 % de la démonstration. Comme $ A(C)={1\over2} \int_{-{\pi \over2}}^0 \rho^2(\theta)d \theta + {1\over2} \int_0^{\pi \over 2} \rho^2(\theta)d \theta \ $, un simple changement de variable dans la première intégrale $\left( \theta ' = \theta + {\pi \over 2} \right)$ conduit à la formule

$$ A(C)={1\over2} \int_0^{\pi \over 2} \left[ \rho^2 \left( \theta-{\pi \over 2} \right)+ \rho^2(\theta) \right]d \theta \ \ \ \ (8)$$

Deuxième étape : 20 % restants de la démonstration.

Dans le triangle rectangle OPQ,

$$ OP^2+OQ^2=PQ^2 \le \Delta(C)^2 \le \delta^2$$

Par conséquent, grâce à l’expression (8) de A(C),

$$ A(C) \le {1 \over 2} {\pi \over 2} \delta^2=\pi{\delta^2 \over 4}$$

Boum !

La démonstration très astucieuse qui vient d’être exposée est due à J.E. LITTLEWOOD (1953).

Une partie de l’activité du mathématicien professionnel consiste a nettoyer, améliorer, généraliser les résultats existants … de sorte que la quête de démonstrations particulièrement courtes et élégantes fait partie de ses objectifs. Nous-mêmes tentons de le faire régulièrement, par exemple dans quelques exercices [5]. Mais on peut imaginer aussi que les « amateurs éclairés » que j’ai évoqués en tout début d’article viennent un jour nous proposer des « démonstrations qui font boum » de résultats connus.

(Article mis en ligne par Armelle BOURGAIN)

[1] M. AIGNER G.-M. ZIEGLER, Proofs from THE BOOK (3ème édition), Springer-Verlag (2004). Traduction française en Raisonnements divins : quelques démonstrations particulièrement élégantes (2ème édition), Springer-Verlag (2006)

[2] Pour des raisons historiques, il serait sans doute plus juste de parler de l’inégalité de CAUCHY-BUNIAKOVSKI-SCHWARZ, ce que ne manquent pas de faire nos collègues russes. Si A.-L. CAUCHY (en 1821) démontra le premier une inégalité de ce type, une version pour les intégrales fut donnée par V. BUNIAKOVSKI (en 1859), puis la forme générale par H. A. SCHWARZ (1843-1921) (SCHWARZ sans T s.v.p.). Cela explique que l’on se contente parfois de dire « inégalité de SCHWARZ »

[3] P. HALMOS, A Hilbert space problem book (2nd édition). Springer-Verlag (1982).

[4] G. ROOS. Analyse et géométrie. Méthodes hilbertiennes. Éditions Dunod (2002) page 3

[5] D. AZÉ. J.-B. HIRIART-URRUTY, Analyse variationnelle et optimisation : éléments de cours, exercices et problèmes, Éditions Cépaduès (à paraître fin 2009).