Théorie des jeux et écologie : le dilemne du prisonnier

Comme le notait Olivier Bazin dans son billet du 29 janvier, Théorie des jeux et écologie, la théorie des jeux offre un cadre conceptuel pertinent pour appréhender certaines des problématiques environnementales actuelles. Notamment, elle permet de mieux comprendre pourquoi – alors qu’il devient évident que le réchauffement climatique, la perte de biodiversité ou l’épuisement des ressources naturelles représentent une menace majeure pour l’humanité – les individus, entreprises et gouvernement mettent autant de temps à adopter des contre-mesures concrètes.

 

Pour la première fois formalisée par Von Neuman et Morgenstern dans leur ouvrage de 1944 « Theory of game and economic behavior », la théorie des jeux est une branche des mathématiques appliquées visant à appréhender des situations dans lesquelles le choix d’un individu est impacté par les choix des autres individus. Elle sera développée à partir des années 50 par de nombreux scientifiques, parmi lesquels 8 ont été titulaires du prix Nobel (le plus célèbre d’entre eux étant probablement John Nash, dont la vie, romancée, a été racontée dans le film « Un homme d’exception » de Ron Howard).

Afin d’appréhender pourquoi les mesures concrètes de lutte contre la dégradation de l’environnement mettent autant de temps à être implémentées, nous utiliserons ci-dessous comme cadre théorique un jeu de type « dilemme du prisonnier ». Nous verrons dans un premier temps en quoi un jeu de type du dilemme du prisonnier permet d’expliquer le manque de réactivité autour des problématiques environnementales, pour ensuite examiner le rôle d’un arbitre dans l’adoption d’options de sorties plus conformes à l’intérêt général.

Illustration par un jeu de type dilemme du prisonnier des problèmes de coopération dans la lutte contre la pollution

Pour montrer pourquoi la mise en place d’une action efficace semble aussi difficile à mettre en œuvre dans le cadre des problématiques environnementales, imaginons deux individus ayant leurs habitations en bordure d’un lac, et dont les déchets sanitaires sont déversés directement dans celui-ci. A l’hiver, peu importe aux habitants des deux maisons que le lac soit pollué, car ils ne tirent aucun bénéfice à sa pureté. Par contre, l’été venu, ils souhaitent avoir une eau la plus propre possible pour se baigner.

Les solutions permettant de changer cet état de fait existent. Il suffirait qu’ils équipent leurs habitations respectives d’un système de gestion des déchets sanitaires pour que ceux-ci ne soient plus déversés et que le lac retrouve sa pureté. Evidemment, cette solution a un coût qui devra être supporté par chaque individu.

Dernier point d’importance, on considère que les deux individus sont en froid, et ne se concertent pas avant de prendre leur décision. Cette hypothèse sera pertinente pour expliquer des interactions où un nombre élevé d’individus interviennent, car dans ce cas, il devient excessivement coûteux, voire impossible, de se concerter avant la prise de décision.

Principales hypothèses

Concernant la propreté de l’eau :

  • Si aucun des deux habitants n’installe de système de dépollution, la baignade à l’été ne sera pas possible. On considère que cela représente une désutilité de  (-3) pour chacun d’entre eux.
  • Si un des deux habitants seulement dépollue, la baignade devient possible, mais l’eau restera partiellement polluée ; par conséquent, l’utilité ne sera pas maximale. On considère alors qu’elle se place à un niveau de (0) (l’utilisateur s’y baigne, mais sans réel plaisir).
  • Enfin, si les deux habitants dépolluent, non seulement ils pourront se baigner, mais en plus, ils auront plaisir à le faire dans de l’eau propre. Le gain en termes d’utilité pour eux est donc de (3).

Concernant le coût de l’investissement à concéder pour dépolluer :

  • L’installation du système de dépollution nécessitant un investissement, il génère une désutilité pour les utilisateurs, que l’on évalue à (-4).

En résumé, on a donc le tableau suivant :

Hypothèses Utilité
Pollution par 2 utilisateurs -3
Pollution par 1 utilisateur 0
Pas de pollution 3
Investissement pour dépolluer -4

On considère que l’utilité totale est la somme de l’utilité/désutilité générée par la qualité de l’eau et de la désutilité générée par l’investissement nécessaire à la dépollution.

Représentation du jeu

On peut représenter l’ensemble des choix des individus dans la matrice de jeu suivante, où chaque case représente une combinaison des choix possibles. Le premier chiffre montrant l’utilité de A, le second  celui de B.

B
A Polluer Dépolluer
Polluer -3 -3 0 -4
Dépolluer -4 0 -1 -1

4 combinaisons de choix sont donc possibles :

  • Soit A et B décident de ne rien faire, la pollution est maximale, et la baignade impossible. La désutilité pour chacun des individus est de (-3)
  • Soit A et B décident de dépolluer, le lac est assaini, et chaque joueur atteint une utilité de (3). Celle-ci est toutefois compensée par une désutilité de (-4) liée au coût de mise en place du système de dépollution.

L’utilité globale est donc de (-1) pour chaque joueur.

  • Soit A décide de dépolluer, et B de continuer à polluer. Dans ce cas, l’utilité de B est de 0 car il pourra se baigner l’été venu, et celle de A est de (-4) car c’est lui qui doit subir le coût de la dépollution.
  • Soit B décide de dépolluer, et A de polluer, et dans ce cas on retrouve la situation décrite ci-dessus mais en inversée : A atteint une utilité de (0), et B de (-4).

Détermination de l’équilibre

Afin de déterminer l’issue du jeu, plaçons-nous du point de vue de A. Afin de choisir sa stratégie, celui-ci va prendre en compte les choix de B :

  • Si B décide de dépolluer, A trouve une utilité nulle (0) s’il pollue et une désutilité de (-1) s’il dépollue. Il est donc plus rationnel pour lui de polluer.
  • Si B décide de polluer, A trouve une désutilité (-3) s’il décide de polluer, et une désutilité de (-4) si il décide de dépolluer.

Ainsi, dans les deux cas de figure, la meilleure stratégie de A est de polluer, puisque c’est celle qui lui apportera la désutilité la moins forte. On dit que la stratégie est strictement dominante.

Par ailleurs,  comme B mène de son coté le même raisonnement, le seul équilibre du jeu est la position polluer. Le lac restera pollué et les deux habitants subiront chacun une désutilité de (-3) car ils ne pourront pas profiter du lac l’été venu.

Principaux enseignements et illustration de situations réelles

Ce résultat est intéressant car il montre que dans ce cadre, la solution rationnelle pour chaque individu est la pire d’un point de vue collectif. En effet, si l’on fait la somme des désutilités subies par chacun des joueurs, on a :

  • Si les deux joueurs dépolluent, la désutilité globale est de -2
  • Si l’un des deux joueurs seulement dépollue, la désutilité globale est de -4
  • Si aucun des deux joueurs ne dépollue, la désutilité globale est de -6

Ainsi, on le voit, la solution polluer ; polluer choisie par les joueurs st celle qui conduit au plus mauvais résultat d’un point de vue collectif.

Transposition au cas des individus et de la lutte contre le réchauffement climatique

Cet exemple illustre bien la position des individus dans le cas de la lutte contre le réchauffement climatique. Les solutions permettant de limiter les émissions de CO2 existent aujourd’hui : l’utilisation des transports en commun, la limitation du nombre de trajets de longue distance en avions, etc.

Pour autant, à titre individuel, ces mesures ont un coût. En effet, lorsque je choisis de prendre le métro plutôt que la voiture pour faire un déplacement, je subis un certain nombre de contraintes (de temps, puisque je dois accorder mes horaires de départ sur les horaires de passage du métro ; de déplacement, car je dois me rendre à pied jusqu’à la gare la plus proche ; ou encore de confort, parce qu’un métro bondé restera toujours moins confortable que ma voiture).

Aussi, je peux avoir deux raisonnements inverses, qui aboutiront à la même conclusion :

  • Soit je me dis que les autres ont une conscience environnementale plus développée que la mienne, qu’ils vont consentir à l’effort que je refuse de faire, et que dans ce cas, même si je continue à avoir des comportements générant des émissions trop importantes de CO2, je bénéficierai des résultats de leurs efforts.
  • Soit je me dis : « de toute façon, tout le monde a un raisonnement identique au mien, et dans ce cas, je n’ai aucun intérêt à faire un effort qui n’amènera qu’un résultat limité ».

Au final, si les autres tiennent le même raisonnement que moi, la situation ne connaît aucune évolution et personne ne réduit ses émissions.

Transposition au cas des entreprises

Le raisonnement appliqué pour des individus peut être transposé aux entreprises. En effet, imaginons 2 entreprises concurrentes qui émettent des gaz à effet de serre. Elles savent toutes deux qu’à terme, il y aura un coût important lié au réchauffement climatique et aux conséquences qu’il entraîne. Quelle va être la réaction des entreprises face à cela ?

Si l’une d’entre elle décide de mettre en place des mesures limitant les émissions de gaz à effet de serre, la seconde va non seulement bénéficier d’une diminution du réchauffement et de ses conséquences, mais aussi d’un avantage relatif en termes de coûts : alors que la première supportera le coût de la dépollution, ce qui viendra ou amputer sa marge ou grever son prix, la deuxième restera sur un modèle de coût inchangé. De ce fait, elle acquiert un avantage concurrentiel sur la seconde, qui pourra se traduire soit par  une augmentation de sa marge relative par rapport à la première entreprise, soit par une diminution de son prix relativement à celui qui est exercé par sa concurrente.

Ainsi, on voit que celle qui décidera la première de limiter ses gaz à effet de serre devra subir un désavantage concurrentiel.

C’est exactement ce que dénonce Nicolas Sarkozy dans les récentes propositions de la commission européenne visant à réduire les émissions de gaz à effet de serre de 20% d’ici à 2020. Les entreprises dont les unités de production sont situées au sein de l’UE devront mettre en place des investissements permettant de limiter les émissions. Ces investissements viendront peser sur la marge des entreprises, qui auront alors le choix d’impacter ou non ce coût supplémentaire dans leurs prix. Néanmoins, quelle que soit l’option choisie, elles subiront un désavantage compétitif se traduisant soit en termes de baisse des marges, soit en termes de compétitivité prix.

Options de sorties du jeu

Cette vision peut sembler pessimiste : si l’on considère la démonstration développée ci-dessus comme reflétant parfaitement la réalité, cela signifie que dans des problématiques telles que le réchauffement climatique, les différents acteurs sont voués à un immobilisme aux conséquences catastrophiques.

En fait, outre le fait que les conditions initiales de ce type de jeu sont rarement toutes réalisées dans la réalité (non communication entre les agents, rationalité parfaite, etc.), la théorie prévoit néanmoins –même dans le cas ou ces conditions sont présentes – des cas dans lesquelles une issue plus conforme à l’intérêt général peut voir le jour. On compte deux principaux changements dans les conditions initiales du jeu qui permettent d’arriver à une situation plus optimale d’un point de vue collectif : la répétition sur un horizon de temps infini, et la mise en place d’un arbitre. Nous examinerons ici uniquement la mise en place d’un arbitre.

L’introduction d’un arbitre dans le jeu

Pour permettre une issue plus en rapport avec l’intérêt général, on peut faire entrer un arbitre dans le jeu. Reprenons l’exemple développé au début de cet article, et voyons en quoi sa présence peut changer l’issue du jeu.

On ne considère que celui-ci à 3 grands types de moyen d’actions :

  • Il peut mettre en place une récompense associée à certains comportements de jeu
  • Il peut mettre en place une sanction pour d’autres
  • Il peut combiner récompense et sanction

Les moyens d’action de l’arbitre : récompense et sanction

Reprenons le jeu décrit ci-dessus, mais en modifiant la configuration initiale. On introduit un régulateur qui prend en compte l’intérêt général, et dont l’objectif est de favoriser une solution qui maximise les gains de A et de B. Quelles sont les stratégies possibles ?

Une première option consiste en la mise en place d’une subvention à la dépollution : le régulateur décide d’accorder un supplément d’utilité à celui qui met en place la solution de dépollution, afin de limiter le poids de l’investissement. Elle prend la forme d’un gain d’utilité de (+2). On obtient donc la table d’hypothèses suivantes, selon que la subvention est considérée ou non.

Hypothèses Utilité sans subv. Utilité avec subv.
Pollution maximale (1 joueur) -3 -3
Pollution partielle (1 joueur) 0 0
Dépollution 3 3
Coût de la solution -4 -2

La matrice de gains associés devient alors :

B
A Polluer Dépolluer
Polluer -3 -3 0 -2
Dépolluer -2 0 1 1

Du fait de la subvention,  polluer n’est plus une option viable. En effet, si l’on résout le jeu en se plaçant du point de vue de A, on obtient :

  • Si B pollue, A subit une désutilité de (-3) si il pollue, et de (-2) s’il dépollue
  • Si B dépollue, A bénéficie d’une utilité de (0) si il pollue et de (1) s’il dépollue

De ce fait, la meilleure stratégie de A, quel que soit le choix de B, est de dépolluer. Et comme on a fait l’hypothèse que B est un agent parfaitement rationnel, et qu’il tiendra donc de ce fait le même raisonnement que A, alors le seul équilibre de ce jeu est la combinaison dépolluer ; dépolluer, qui amène un gain de +1.

Ainsi, en changeant les règles du jeu en créant une subvention, l’arbitre vient modifier les gains associés a chaque stratégie, et rend donc l’adoption de la solution optimale dépolluer ; dépolluer possible.

Il est à noter que le régulateur arriverait exactement au même résultat en taxant celui qui décide de continuer à polluer. La différence principale étant que dans ce cas, la mise en place de mesures incitatives ne représente plus une perte sèche pour le régulateur (dans le premier cas, il faut qu’il fournisse le supplément d’utilité que demande la subvention, alors que dans le second, il retire simplement du jeu un montant équivalent en cas de pollution).

Enfin, on peut ajouter que le régulateur peut encore augmenter son impact en mixant les stratégies de récompenses / sanctions.

Illustration par un cas réel : la taxation / subvention sur les véhicules

On l’aura compris, le régulateur prend le plus souvent la forme d’un organisme public qui, au travers d’outils tels que la subvention, la taxe, ou l’établissement d’une norme, change les gains associés aux différentes stratégies utilisées par les joueurs.

Examinons un exemple réel : lorsque la France décide la mise en place de l’écotaxe CO2 bonus – malus, elle applique un principe identique. Pour rappel, cette taxe implémentée en janvier 2008 établit un barème de bonus / malus en fonction des émissions de CO2 des véhicules neufs. En dessous de 130 g de CO2 / km, le propriétaire reçoit un bonus, au dessus, il est taxé pour le surcroît d’émissions.

De cette manière, le régulateur incite les consommateurs à acheter des voitures moins polluantes. On peut en effet supposer qu’à tarif équivalent, le futur propriétaire choisira sa voiture sur des critères autres que les émissions de CO2 (esthétique, puissance, marque, etc.). En mettant en place l’écotaxe, le régulateur change les règles du jeu, et accorde un avantage supplémentaire aux véhicules respectueux de l’environnement.

Par ailleurs, en plus de cela, il a institué un « superbonus » lorsque l’acquisition du véhicule s’accompagne de la mise au rebut d’un véhicule de plus de 15 ans. Cette dernière mesure permet d’évacuer du parc automobile des véhicules anciens – qui sont supposés êtres plus polluants – et supprimer l’incitation pour l’acheteur d’un nouveau véhicule de les remettre sur le marché.

Le consommateur vu comme régulateur ?

Le régulateur n’est pas toujours un arbitre identifié comme tel. En effet, les consommateurs ou l’opinion publique peuvent avoir une influence extrêmement proche de celle du régulateur.

Ainsi, selon une étude du CREDOC (1) sur la consommation engagée, 20% des français seraient prêts à payer un surcoût de 5% pour un produit respectant un engagement de citoyenneté et 32% seraient « peut-être » prêts à le faire. Si l’on reprend le cadre d’analyse développé plus haut, cela signifie que pour un produit écologique, les consommateurs accordent une forme de subvention au producteur, subvention qui permettra à celui-ci de couvrir une partie du surcoût nécessaire à la production de produits « citoyens ».

De la même manière, on sait que dans certains cas extrêmes, une entreprise qui va avoir une politique environnementale par trop inconséquente encourt le risque de voir ses produits boycottés par les consommateurs. Ainsi, selon une étude de la TNS Sofres , 36% des français affirment boycotter les entreprises qui polluent et ne respectent pas la réglementation en matière de protection de l’environnement. Dans ce cas, on peut considérer que le boycott est une forme de taxation par le régulateur, voire de mise en place d’une norme.

Au niveau international, des difficultés liées à l’absence d’un régulateur unique

Ainsi, on voit que l’introduction d’un régulateur, que celui-ci soit formel (la puissance publique) ou informel (les consommateurs / l’opinion publique), permet de changer les gains associés au jeu et de choisir une issue qui maximise l’intérêt général.

Pourtant, comme l’ont prouvé les récentes négociations de Bali, au niveau interétatique, il reste difficile de trouver une solution maximisant l’intérêt général.

En effet, à ce niveau, il n’existe aucun arbitre possédant un pouvoir de contrainte. Là ou dans un pays donné, le régulateur peut imposer des règles à l’ensemble de la société, celui-ci n’existe pas au niveau de la communauté internationale. De ce fait, il existe toujours une incitation forte pour un des acteurs d’adopter un comportement de free rider, laissant les autres pays adopter les mesures nécessaires à la lutte contre le réchauffement, en espérant de son coté pouvoir en profiter.

(1) :CREDOC, Représentations et pratiques de la consommation engagée,  évolution 2002 – 2006, Décembre 2006

Categories: Théories