2023-08-04

Par Jean-Philippe Legault, blogueur invité

Il y a quelques semaines, je suis tombé sur un article où l’auteur prévoyait une baisse importante des marchés boursiers. En lisant cet article, j’avoue avoir eu la chair de poule. Détrompez-vous; mon effroi ne venait pas de sa conclusion négative, mais plutôt du processus utilisé pour arriver à cette conclusion.

Sans trop entrer dans les détails, l’auteur avait développé un « modèle » qui lui indiquait que les marchés boursiers allaient fléchir. Son modèle était conçu de manière à comparer les rendements historiques du S&P 500 par rapport à certaines périodes du cycle présidentiel américain. Il combinait également différentes mesures économiques qui permettaient de démontrer que les niveaux actuels ressemblaient fortement à ceux de 2000 et 2008. Autrement dit, il utilisait une multitude de données historiques pour soutenir sa conclusion à l’effet que nous étions sur le point de connaître une correction.

Je crois qu’il faut être prudent avec ce type de modèle et d’analyse puisqu’on y retrouve souvent le « biais d’exploration des données », plus communément appelé le biais du data-mining.Afin de vous aider à mieux comprendre ce qu’est le data-mining, je vais vous expliquer le paradoxe des anniversaires.

Le paradoxe des anniversaires

Imaginez que vous travaillez dans une petite entreprise et qu’un nouveau patron vient d’être nommé. Quelle est la probabilité que vous ayez la même date d’anniversaire que votre nouveau patron? La réponse : 0,27%, soit 1 sur 365,25 jours (en incluant l’année bissextile). La probabilité est donc très faible. Maintenant, quelle est la probabilité que deux personnes aient la même date d’anniversaire dans votre entreprise composée de 23 personnes ? La réponse : près de 50 %!

Un pourcentage aussi élevé peut paraître surprenant, mais il découle du nombre élevé de relations potentielles entre chaque individu. Au total, il existe pas moins de 253 relations possibles entre ces 23 individus (l’individu 1 avec l’individu 2, l’individu 1 avec l’individu 3, etc.)

Puisque vous maîtrisez désormais le concept, voici une nouvelle question. Quelle est la probabilité que deux individus partagent la même date d’anniversaire dans un groupe de 50 personnes? La réponse: 97%. Encore une fois, les 1 225 relations possibles entre ces 50 individus expliquent cette probabilité élevée.

Fouillez et vous trouverez

Je suis constamment fasciné par la quantité d’information et de données qui existe dans l’univers financier. Grâce à la technologie, nous pouvons enregistrer, analyser et comparer toutes ces données. Ainsi, avec un peu de recherche, vous réussirez sans doute à trouver des données qui confirment votre opinion ou même des données financières qui semblent prédire l’avenir.

En plus de me faire sourire, l’analyse effectuée en 1995 par David J. Leinweber, Ph. D. illustre bien ce point. M. Leinweber avait réussi à trouver une relation très forte entre la variation du S&P 500 et la production de beurre au Bangladesh. La relation avec le S&P 500 devenait encore meilleure si on ajoutait la production de fromage aux États-Unis.

Imaginez que je vous présente ce modèle et que j’utilise ces dernières données pour prévoir les fluctuations du S&P 500. Vous rirez assurément de moi. Imaginez maintenant que ces données sont l’inflation, le PIB, les taux d’intérêt et même les périodes du cycle présidentiel américain. Vous me prendrez probablement au sérieux.

L’utilisation de données économiques est certainement plus logique que le beurre au Bangladesh puisqu’il existe assurément des relations de cause à effet entre la performance du S&P 500 et l’économie. Pourtant, certaines relations peuvent tenir du simple hasard.

Voilà pourquoi j’estime qu’il est préférable de regarder ces « modèles » historiques avec prudence. L’explication et le raisonnement derrière la construction d’un modèle sont certainement plus importants que le modèle lui-même.