Le Dilemme du Prisonnier et le Rôle de l'Etat

Michel Roudot

La théorie des jeux

C'est une théorie mathématique qui a des implications sur notre vie courante. En particulier, le cas des jeux à somme non nulle (le gain du gagnant n'est pas égal à la perte du perdant) est particulièrement intéressant, d'une part parce qu'il va à l'encontre de la croyance selon laquelle quand on est en conflit avec quelqu'un ce que gagne l'un est perdu par l'autre, d'autre part parce que beaucoup de situations réelles relèvent de jeux à somme non nulle. Si votre voisine ramène vos enfants de l'école en même temps que les siens, vous avez gagné du temps qu'elle n'a pas perdu. Si un voyou lance un caillou dans votre fenêtre, vous allez dépenser de l'argent qu'il n aura pas économisé.

Parmi les jeux à somme non nulle, il est beaucoup question dans la littérature du dilemme du prisonnier. Mais certains résultats et certaines implications ne sont pas assez connus.  

Le dilemme du prisonnier

Principe

A et B ont commis un crime en commun. Ils sont arrêtés et interrogés séparément. Il n y a pas de preuve mais des fortes présomptions: s'ils se taisent ils risquent une peine légère. Si un des prisonniers fournit des preuves contre son camarade, il peut gagner l'indulgence du tribunal :  

Peine de A / Peine de B

B trahit

B se tait

A trahit

10 / 10

0 / 15

A se tait

15 / 0

1 / 1

Stratégie gagnante

L'intérêt des deux prisonniers est manifestement de se taire. Ils ne feront qu'1 an, contre 10 s'ils trahissent.

Oui, mais si B se tait, A peut éviter la prison en trahissant, et si B trahit, A fera 5 ans de moins en trahissant aussi.

De plus A sait que B est dans la même situation et raisonne très probablement de la même façon.

Le choix rationnel est donc de trahir, alors qu'économiquement c'est le mauvais choix.  

Généralisation

Bien sûr on peut modifier le jeu avec des valeurs différentes et les présenter comme des gains. Supposons que nos deux joueurs se soient mis d'accord pour gagner beaucoup d'argent avec une combine qui suppose qu'ils s'entraident. Au moment de toucher leur gain, ils peuvent trahir pour gagner un peu plus ou plus probablement perdre un peu moins :  

Gain de A / Gain de B

B trahit

B coopère

A trahit

100 / 100

1500 / 0

A coopère

0 / 1500

1000 / 1000

   

Le dilemme du prisonnier itéré

Principe

Le dilemme du prisonnier décrit ci-dessus suppose que les deux joueurs ne se connaissent pas et n'interagiront plus dans le futur : le facteur psychologique n'est pas intégré. Si on place les deux prisonniers plusieurs fois consécutives dans la même situation, chacun sait comment l'autre a réagi les fois précédentes et peut utiliser cette information, et chacun sait qu'il reverra l'autre et que celui ci prendra en compte les interactions passées.  

Stratégie économiquement stable

On ne peut pas définir de stratégie rationnelle au sens propre, mais on peut tester les gains cumulés sur plusieurs itérations de chaque joueur utilisant une stratégie donnée. Plusieurs études ont été faites, en programmant des algorithmes différents et en les faisant interagir.

Il est intéressant de remarquer que dans toutes les études l'algorithme qui choisit selon la simple règle du talion , en collaborant lors du premier contact avec un inconnu, s'en sort mieux que tout autre, même les plus remarquablement élaborés.

Le dilemme du prisonnier à nombreux joueurs

Principe

Imaginons que les prisonniers dont il a été question soient non plus deux mais très nombreux, disons 1000. Que le gain à coopérer soit réparti sur l'ensemble et celui à trahir soit réservé au traître :

Gain de A / Gain d'un des autres / Gain cumulé des autres

Tous les autres trahissent

Tous les autres coopèrent

A trahit

-1000 / -1000 / -1000 000

1000 / -10 / -10 000

A coopère

-2000 / -990 / -990 000

0 / 0 / 0

A partir d'une situation où tout le monde coopère, si A trahit il peut gagner beaucoup sans que cela coûte cher à chacun des autres. Mais si tout le monde en fait autant les coûts se cumulent et le gain n'arrive pas à les compenser. Si au contraire A coopère alors que tout le monde trahit, la trahison des autres lui coûte cher et sa coopération aussi sans qu'elle rapporte grand chose aux autres.

Si on reprend le raisonnement du cas à deux joueurs, on voit qu'ici aussi la stratégie rationnelle conduit à un comportement catastrophique.  

Exemples

Le remembrement

Dans les années 70 l'agriculture bretonne a subi une mutation considérable qui a été accompagnée d'une rationalisation des surfaces agricoles. Jusque là la Bretagne était un pays de bocage où prédominaient de petites parcelles entourées de talus boisés, mis en place en trois ou quatre siècles par toute une population. Chaque agriculteur était propriétaire de nombreuses parcelles rarement connexes. Le remembrement a consisté à regrouper les parcelles.

A cette occasion les agriculteurs avaient la possibilité d abattre les talus, dont la fonction séparative avait disparu. Ils y gagnaient en surface cultivable, en commodité pour l'utilisation des machines agricoles qui se répandaient simultanément, et par la suppression de la concurrence entre les plantes des talus et les plantes cultivées.

Ils y perdaient, très peu, en perdant la protection fournie par la "forêt linéaire" contre le vent, la sécheresse et le gel, et, par la faune auxiliaire qu'elle abrite, contre les nuisibles. Très peu, à condition que tout le monde n'en fasse pas autant. En vingt ans la Bretagne a perdu des millions de kilomètres de forêt linéaire, subi plusieurs catastrophes météorologiques, et se débat avec de graves problèmes de déséquilibres écologiques. On tente aujourd hui à grands frais de recréer quelques milliers de kilomètres de talus.  

Le transport multimodal

Dans ce cas le problème n'est pas d'un statu quo favorable et instable, mais d'un statu quo défavorable et stable. Si les transporteurs adoptaient massivement le transport multi-modal, des économies considérables pourraient être faites par tous. Mais aucun armateur n'a intérêt à mettre en place un service de cabotage sur un port si la majorité des transporteurs routiers de sa région ne sont pas demandeurs, et aucun transporteur routier ne choisira d'envoyer ses camions par mer s'il ne dispose pas de services quotidiens pour ses principales destinations habituelles.  

La pêche industrielle

Ce cas est celui de toutes les ressources limitées. Les stocks de poissons sont exploités à la limite de leurs capacités de renouvellement (ou au delà). Si un armateur investit dans un bateau deux fois plus gros, plus puissant, plus performant, etc, il récoltera un peu moins de deux fois plus de poisson pour un peu moins de deux fois plus d investissement. Mais si tous les armateurs en font autant, leur récolte n'augmentera pas, elle baissera même peut être.

Depuis 50 ans la puissance des bateaux de pêche n'a cessé d'augmenter et leur récolte n'a cessé de diminuer.  

Le rôle de l'état

De ce qui précède on voit bien que le problème de tous ces dysfonctionnements est un problème d'internalisation ou d'externalisation des coûts.

L'agriculteur paie une météo favorable, qui lui procure une certaine productivité, à un certain prix. S'il cesse de payer ce prix et qu'il est le seul à le faire, il profite gratuitement de la météo favorable qui lui est payée par les autres. L'entrepreneur paie une clientèle solvable au prix des salaires et de la bonne santé de ses fournisseurs. S'il économise sur ce prix en licenciant son personnel ou en expoitant ses fournisseurs, il profite gratuitement de la clientèle qui lui est payée par les autres. Economiquement on appelle cela une distorsion du marché, moralement on parle de problème du passager clandestin.

Il suffit de modifier un peu la matrice des gains pour que l'intérêt égoïste de chacun le pousse à une attitude d'apparence altruiste. Si on reprend la table précédente, en ajoutant une taxe sur la trahison on voit que l'intérêt de chacun est de coopérer:

Gain de A / Gain d un des autres / Gain cumulé des autres

Tous les autres trahissent

Tous les autres coopèrent

A trahit

-2000 / -2000 / -2000 000

0 / -10 / -10 000

A coopère

-2000 / -1990 / -1990 000

0 / 0 / 0

On voit aussi qu'une prime sur la coopération, bien que beaucoup plus coûteuse est moins efficace (dans l'exemple ci dessus on met en place une taxe de 1000, qu'il ne sera probablement jamais nécessaire de recouvrir, dans l'exemple ci dessous on voit que pour être efficace la subvention devrait être de 1000 000) :

Gain de A / Gain d un des autres / Gain cumulé des autres

Tous les autres trahissent

Tous les autres coopèrent

A trahit

-1000 / -1010 / -1010 000

1000 / 0 / 0

A coopère

-1990 / -1000 / -1000 000

10 / 10 / 10 000

Bien qu'on l'oublie souvent, et les politiques les premiers, en ne voyant que leur aspect de ressource financière, la fonction principale des taxes, impôts et cotisations sociales est justement celle là: réinternaliser les coûts, non pour financer mais pour inciter.

Bien sûr les valeurs dans la matrice de gains ne sont pas forcément des montants monétaires. Ils relèvent plutôt des catégories bonheur, qualité de vie, etc. Heureusement, souvent, une matrice duale de gains, financiers ceux là, a les mêmes effets sur les comportements et est plus facile à modifier parce que plus consensuelle.

Bien sûr, déterminer quelles sont les situations qui relèvent d'un dilemme du prisonnier, quel est le coût pour chacun et la valeur pour chacun d'un bien collectif, et, même, qui est chacun (doit on prendre en compte les générations à venir pour calculer la valeur d'une ressource non renouvelable ?), relève d'un choix de société.

Bien sûr, seul l'état peut mettre en oeuvre ce choix de société en imposant la modification des matrices de gain qui incitera l'égoïsme de chacun à travailler pour le bien de tous. C'est même sa seule fonction. En particulier le choix de société lui-même est à faire par nous tous, habitants du vaisseau spatial Terre, et pas par une structure administrative, quelle qu'elle soit.