504

Quand l’intuition a tout faux

Jean-Paul Delahaye [1]

Ce texte est une version partielle d’un article déjà publié dans la revue Pour la Science, n° 409, Novembre 2011.

Les erreurs de nos jugements spontanés sont parfois étonnantes :
le hasard créé par une pièce de monnaie en est l’exemple le plus
frappant car tout y semble paradoxal

Les suites de PILE ou FACE obtenues avec une pièce non truquée nous semblent
sans grand mystère et nous ne doutons guère des jugements généraux et prédictions
statistiques que nous formulons les concernant. pourtant, une multitude de subtilités
sont ignorées de la plupart d’entre-nous, et cette ignorance nous conduit à l’erreur,
voire nous ferait perdre de l’argent si nous engagions des paris. Comprendre
pourquoi et tirer toutes les leçons des pièges tendus à la raison par ces suites de
tirages équitables et indépendants est un travail délicat et difficile comme l’attestent
les dizaines d’articles publiés depuis quarante ans sur ce sujet.

Voici un premier exemple de piège. Il a été proposé en 1969 par l’amateur de
récréations mathématiques Walter Penney.

On lance une pièce de monnaie (non truquée) autant de fois qu’il le faut jusqu’à
obtenir des séquences fixées à l’avance de PILE ou FACE. par exemple on cherche
à obtenir PILE-FACE, notée PF, ou FACE-FACE, FF.

La question posée est : laquelle des séquences PF ou FF a le plus de chances de se
présenter en premier, et combien est-il raisonnable de parier sur elle dans une telle
compétition ?
Il semble aller de soi de raisonner ainsi.

Raisonnement A. Si on considère deux tirages successifs d’une pièce de monnaie, il
y a autant de chances d’obtenir PF que FF et cette probabilité est 1/4. Les deux séquences PF et FF étant équiprobables, chacune a la même probabilité d’être obtenue en premier, et donc, la probabilité que PF survienne avant FF est 1/2. Les deux séquences mises en compétition partent sur des bases égales, et donc, si on me propose de parier, je peux choisir indifféremment l’une ou l’autre et miser 1 euro contre 1 euro.

Pourtant la réalité est bien différente : dans une compétition entre PF et FF la séquence PF gagnera 3 fois sur 4. Il est donc intéressant d’accepter de miser 2 euros pour PF, contre 1 euro en faveur de FF et un pari ne favorisant aucun joueur consiste
à miser 3 euros pour PF contre 1 pour FF. Voici la démonstration de ces affirmations.

Raisonnement B. Les deux premiers tirages peuvent être PF, FP, PP, FF et ces quatre
débuts possibles sont équiprobables chacun survenant avec une probabilité 1/4. Si c’est FF qui sort, la séquence FF aura gagné la compétition. Dans les trois autres cas, le gagnant sera toujours PF. en effet, dès qu’un p tombe, FF ne peut plus arriver avant PF : tant que des p continuent de tomber personne ne gagne, et dès que F
tombe, PF gagne. Si on vous propose le jeu, choisissez PF ; c’est certain : vous gagnerez 3 fois sur 4.

Pour que tout soit bien clair, il faut repérer l’endroit où il y a une erreur dans le
raisonnement a. La première phrase du raisonnement a est indubitable. elle
implique d’ailleurs que dans une longue séquence de p ou F tirée avec une pièce de
monnaie non truquée, il y aura en moyenne autant de couples PF que de couples FF.
L’erreur du premier raisonnement se trouve dans la seconde phrase : « Les deux
séquences PF et FF étant équiprobables, chacune a la même probabilité d’être
obtenue en premier, et donc, la probabilité que PF survienne avant FF est 1/2 ». en effet, même si les deux séquences sont équiprobables, les relations qu’elles
entretiennent l’une avec l’autre, comme le détaille le raisonnement B, ont pour
conséquences que dès qu’un P est tombé, FF ne peut plus gagner ce qui entraîne alors
que PF sera 3 fois plus souvent la première à apparaître que FF. (voir l’annexe 2 qui illustre ce raisonnement).

Le même type de blocage d’une séquence par une autre montre que si on oppose PFF contre FFF, la première gagne 7 fois sur 8 (voir annexe 3). Plus généralement encore,
si on oppose PF … F (n-1 fois F) à FF … F (n fois F) alors la première séquence gagne $2^n - 1$ fois sur $2^n$ : il ne faut donc pas hésiter à parier 1000 euros contre 1 euro en choisissant PFFFFFFFFF contre FFFFFFFFFF.

Le petit calcul énumératif suivant ne constitue pas une preuve (elle est dans le
raisonnement B !), mais il vous aidera sans ordinateur à accepter l’étrange
compatibilité entre les diverses affirmations que nous avons formulées. Considérons
les 16 séquences possibles et équiprobables qu’on obtient en opérant 4 tirages.

Parmi les 48 couples obtenus avec ces 16 tirages (chaque suite aBCD de quatre
signes contenant les trois couples aB, BC, CD), la séquence FF est présente 12 fois
comme la séquence PF, il y a donc bien égalité des fréquences et FF (ainsi que PF)
apparaît dans 1/4 des couples.

Concernant la compétition pour savoir qui arrive la première de FF ou de PF, la
séquence PF gagne 10 fois (souligné simple) alors que la séquence FF ne gagne que
4 fois (souligné double). Dans les deux cas restants, aucune séquence n’a encore
gagné et les tirages doivent donc se poursuivre. Cependant, dans ces deux cas, PF gagnera nécessairement puisque les séquences se terminent par un p ce qui interdit
mécaniquement à FF de se présenter avant PF, si les tirages se poursuivent. au total
on trouve donc que PF gagne (en moyenne) exactement 3 fois sur 4.

Si on envisage les autres compétitions entre séquences de longueur 2, les résultats faciles à établir (car résultant de symétrie ou se ramenant à la compétition FF contre PF) sont les suivants :

PP gagne contre PF avec une probabilité 1/2
PP gagne contre FP avec une probabilité 1/4
PP gagne contre FF avec une probabilité 1/2
PF gagne contre FP avec une probabilité 1/2
PF gagne contre FF avec une probabilité 3/4
FP gagne contre FF avec une probabilité 1/2

Le temps moyen d’attente

Malheureusement les cas particuliers que nous venons d’envisager ne nous
permettent pas de savoir ce qui se passe quand on oppose deux séquences
quelconques, par exemple PFP et FFF. La notion de « temps d’attente moyen »
devrait nous aider à mettre nos idées en place. Lorsqu’une séquence S est fixée, on
dénomme « temps d’attente moyen de S », le nombre moyen de fois qu’il faut lancer
la pièce pour que la séquence S se présente. par exemple, le temps d’attente moyen
de p (ou de F) est 2.

Deux séquences S et S’ de longueur k ont la même probabilité de se produire quand
on lance k fois la pièce, et donc elles apparaissent avec la même fréquence quand on
lance indéfiniment la pièce. De cela, on a envie d’en déduire que les temps d’attentes
moyens de S et de S’ sont les mêmes. pourtant, comme dans le cas des compétitions
entre deux séquences, ce serait une erreur. On montre que le temps d’attente moyen
de FF est 6 alors que le temps d’attente moyen de PF est 4 (voir l’annexe 4).

Cette surprise va cependant dans le même sens que la précédente surprise quand nous
faisions s’opposer FF et PF. puisque FF apparaît en moyenne plus tardivement dans
une suite de lancers que PF, il semble assez naturel que FF se fasse battre par PF
quand on cherche à savoir laquelle arrive le plus souvent en premier. est-ce qu’on
peut déduire le 3/4 de tout à l’heure en faveur de PF, des temps d’attente moyens 6
et 4 ? Cela ne semble pas bien clair et si nous voulions chercher une règle nous ne la
trouverions jamais, car ici encore il se produit un phénomène inattendu qui contrarie
notre intuition et rend illusoire la déduction du 3/4 à partir des temps d’attente
moyens. En effet :
Il se peut très bien que le temps d’attente moyen d’une séquence $S_1$ soit plus long que le temps d’attente d’une séquence $S_2$, et que pourtant, dans une compétition entre $S_1$ et $S_2$, la séquence $S_1$ se présente plus souvent avant $S_2$ que l’inverse.

L’exemple le plus simple connu d’une telle situation paradoxale est donné par les deux séquences $S_1$= PFPF et $S_2$= FPFF. La séquence $S_1$ a un temps d’attente de 20, alors que $S_2$ a un temps d’attente de 18. pourtant $S_1$ arrive devant $S_2$
avec une probabilité de 9/14 = 0,6428.

Déconnexion paradoxale

Les trois notions « fréquence d’apparition », « temps moyen d’attente » et « gagnant d’une compétition entre deux séquences » qu’intuitivement nous lions les unes autres quand nous comparons deux séquences sont en réalité indépendantes !

Résumons la situation multi-paradoxale à laquelle nous sommes arrivés :

(a) Deux séquences de longueurs égales ont la même probabilité de survenir en
un emplacement donné d’une suite infinie de tirages, et donc leurs fréquences
moyennes d’apparition sont les mêmes.

Pourtant :

(b) Il se peut que l’une d’elles survienne plus souvent première que l’autre dans
une compétition entre elles.

(c) Il se peut qu’elles aient des temps d’attente différents l’une de l’autre.

De plus, et cela paraît un comble :

(d) Il est possible aussi que celle qui arrive statistiquement le plus tardivement
soit, en moyenne, plus souvent devant l’autre quand on les fait concourir l’une
contre l’autre.

Intransitivité

Ce n’est pas tout : les comportements anti-intuitifs des suites de tirages de pile ou face vont encore plus loin.

(e) Une séquence plus courte peut perdre dans une compétition qui l’oppose à
une séquence plus longue et c’est le cas par exemple quand on oppose PPP et
FFPP car la seconde gagne avec une probabilité 7/12.

(f) Des séquences peuvent dans une compétition à 4 gagner avec des chances
égales (25% de chance chacune), et pourtant dans des compétitions deux à deux
être toujours inégales.

C’est ce qui se produit avec les séquences PPF, PFF, FPP, FFP qui gagnent chacune dans 25% des cas quand on les fait concourir toutes les quatre ensemble, et qui pourtant ne font jamais jeu égal quand on les oppose deux à deux.

(g) Il se peut que dans des compétitions deux à deux on obtienne des cycles $S_1$ bat $S_2$, $S_2$ bat $S_3$, , …, $S_{n-1}$ bat $S_n$ avec pourtant $S_n$ bat $S_1$.

Un tel cycle est obtenu avec les quatre séquences citées au-dessus :PPF gagne contre PFF avec une probabilité 2/3

PFF gagne contre FFP avec une probabilité 3/4
FFP gagne contre FPP avec une probabilité 2/3
FPP gagne contre PPF avec une probabilité 3/4

(voir une justification de ces affirmations dans l’annexe 5).

Nous avons donc affaire à un paradoxe de non-transitivité : notre intuition nous souffle que chaque séquence possède une force propre qui lui permet de se présenter
en tête devant une autre séquence, et que donc, si $S_1$
est plus forte que $S_3$ et $S_2$ plus
forte que $S_3$ alors nécessairement $S_1$ est plus forte que $S_3$. C’est une illusion, car une séquence peut-être « forte » devant une seconde et « faible » devant une troisième.
En sport, et dans les problèmes d’élection, ce genre de choses se produit aussi (note :
l’article original contient une présentation de l’algorithme de Conway, algorithme
qui donne les probabilités de gain pour n’importe quelle paire de séquences en
compétition
).

Corriger les fausses simplicités

L’annexe 1 relative aux graphes d’état, ainsi que les autres annexes, tentent d’expliquer comment mener les calculs permettant de vérifier tout ce qui vient d’être affirmé. L’examen attentif de ces méthodes affine notre
compréhension et corrige nos jugements spontanés dont l’inadéquation est flagrante.
en relisant le raisonnement B présenté plus haut et en le comprenant, on finit par
accepter que PF gagne contre FF et que finalement … cela n’aurait pas dû nous
étonner. La méthode des graphes d’états (voir annexe 1) conduit à saisir clairement
pourquoi PPF bat par exemple PFF. plus généralement, elle permet de visualiser le rapport de force entre séquences, et de comprendre (et de calculer) que ce rapport se
construit à partir de la structure des deux séquences, et qu’une séquence ne possède
pas de force propre indépendante des compétitions à laquelle on la soumet.

Connaître la fréquence de survenue d’une séquence $S_1$
et son temps moyen d’attente ne suffit pas pour prédire sa force quand elle sera confrontée une autre séquence $S_1$,
car cette force se décide face à $S_1$
et est spécifique de la compétition particulière $S_1$
contre $S_1$, contrairement à ce que notre jugement premier nous faisait croire.
L’explication de l’inadéquation de nos appréciations spontanées est sans doute à
rechercher dans l’expérience que nous avons des nombreuses situations où la force
d’un concurrent dans une compétition provient d’une aptitude qu’il possède en
propre (par exemple en course à pied, son aptitude à aller vite) et qui n’est pas liée
aux adversaires qu’il affronte.

Bibliographie
• Ed pegg, How to Win at Coin Flipping, november 2010 :
http://blog.wolfram.com/2010/11/30/how-to-win-at-coin-flipping/

• Raymond Nickerson, Penney Ante : Counterintuitive Probabilities in Coin Tossing, The UMap (Undergraduate Mathematics and Its applications) Journal, 28, 523-532, 2007.

• Daniel Felix, Optimal Penney Ante Strategy via Correlation Polynomial Identities, The electronic Journal of Combinatorics, 13-1, R35, 2006.

• Mark andrews, Anyone for a Nontransitive Paradoxe ? The Case of Penney Ante, 2004.

• Stanley Collings, Coin Sequence Probabilities and Paradoxes, Bulletin of the Institute of Mathematics and its applications, 18, 227-232, 1982.

• Leonidas Guibas, Andrew Odlyzko, String Overlaps, Pattern Matching, and Nontransitive Games, Journal of Combinatorial Theory, A30-2,183-208, 1981.

• Martin Gardner, On the Paradoxical Situations that Arise From Nontransitive Situations, Scientific american, 120-125, oct 1974.

• Walter penney, Problem 95 : Penney-ante, Journal of Recreational Mathematics 2,
p 241, 1969.

(nous ajoutons à cette bibliographie : Arthur Engel, Processus aléatoires pour les débutants ; ed.Cassini, avril 2011).

Télécharger l’annexe 1
Télécharger l’annexe 2
Télécharger l’annexe 3
Télécharger l’annexe 4
Télécharger l’annexe 5

<redacteur|auteur=500>

Notes

[1Université des Sciences et Technologies de Lille, Laboratoire d’Informatique
Fondamentale de Lille, UMR 8022 CNRS.

Les Journées Nationales
L’APMEP

Brochures & Revues
Ressources

Actualités et Informations
Base de ressources bibliographiques

 

Les Régionales de l’APMEP