CHAPITRE 7

Télécharger au format pdf ou txt
Télécharger au format pdf ou txt
Vous êtes sur la page 1sur 9

CHAPITRE 7 : THEORIE DES JEUX

Ce chapitre introduit l’analyse des comportements stratégiques entre les agents économiques. Ces
comportements découlent même de notre hypothèse de rationalité de tous les agents qui maximisent une
certaine fonction de gains. La théorie des jeux peut servir à analyser le comportement des agents
économiques dans les marchés imparfaits (les monopoles, les duopoles, les oligopoles, oligopsones), les
négociations politiques, les négociations commerciales etc…

7.1 La matrice de paiement d’un jeu

Un jeu est défini par les joueurs, les stratégies et les gains du jeu. Soit la matrice de paiement du jeu suivant
avec deux joueurs A et B (Table 1). La stratégie du Joueur A est de jouer ‘Haut’ ou ‘Bas’ et la stratégie du
Joueur B est de jouer Gauche ou Droite.

Table 1 : Matrice de paiement d’un jeu

Joueur B

Gauche Droite

Haut 1,2 0,1

Joueur A Bas 2,1 1,0

Le jeu décrit ci-dessus a une simple solution. Du point de vue du joueur A, il est avantageux pour lui de
toujours jouer ‘Bas’ qui donne un paiement de 2 ou 1 alors que la stratégie ‘Haut’ lui ferait gagner 1ou 0
selon la stratégie choisie par l’autre joueur. Ainsi, la stratégie d’équilibre de A serait de jouer ‘Bas ‘. Dans
ce cas nous diront que nous avons une stratégie dominante. Puisque quoique le joueur B fasse, il est
toujours avantageux pour A de jouer ‘Bas’. De même quoi que le joueur A fasse on voit qu’il serait
avantageux pour B de jouer ‘Gauche’. Nous dirons que ces choix optimaux dominent les autres alternatives,
et donc nous avons un équilibre à stratégie dominante. Si un jeu admet une stratégie dominante pour chaque
joueur, donc cette stratégie pourra être prédite come résultat de l’équilibre du jeu. La stratégie dominante
est la stratégie qui est meilleure pour l’individu quel que soit la stratégie jouée par les autres joueurs. Ainsi
l’équilibre de cet exemple sera (Bas, Gauche) qui donnera le gain de 2 au joueur A et celui de 1 au joueur
B.

7.2 L’équilibre de Nash

Les équilibres à stratégies dominantes sont intéressants mais ne se réalisent pas souvent. Par exemple dans
le jeu de la Table 2, il n’existe pas de stratégies dominantes d’équilibre. Ici nous voyons que si le joueur B

1
choisit ‘Gauche’ le paiement de A sera 2 ou 0 selon son choix de stratégie. Si le Joueur B choisit par contre
la stratégie ‘Droite’ le paiement de A sera 0 ou 1. Ce qui veut dire que si B choisit ‘Gauche’ A choisira
‘Haut’ et si B choisit ‘Droite’, A choisira ‘Bas’. Ainsi, nous voyons que le choix optimal de A dépendra de
ce que le joueur A pense faire.

Table 2 : Un équilibre de Nash

Joueur B

Gauche Droite

Haut 2,1 0,0

Joueur A Bas 0,0 1,2

Dans ce cas de figure où une stratégie dominante d’équilibre n’est pas disponible, nous utilisons la notion
de l’équilibre de Nash. Un équilibre de Nash peut être interprété comme étant une espérance de choix de
chaque joueur telle que quand le choix de l’autre personne est révélé, aucun individu ne voudra changer
son comportement. Dans l’exemple de la Table 2, nous voyons que la stratégie (Haut, Gauche) est un
équilibre de Nash. De même la stratégie (Bas, Droite) est aussi un équilibre de Nash.

La notion de l’équilibre de Nash est une notion d’équilibre supérieure à la notion d’équilibre basée sur la
stratégie dominante simple. Cependant, la notion d’équilibre de Nash aussi admet des limitations. Ces
limitations sont liées à des problèmes de multiplicité de l’équilibre (le jeu de la Table 2 admet deux
équilibres de Nash). D’autres limitations de cette notion d’équilibre de Nash c’est qu’il y a des jeux pour
lesquels un équilibre de Nash peut ne pas exister. L’exemple de jeu dans la Table 3 donne ce cas de fi gure
où l’équilibre de Nash n’existe pas.

7.3 Stratégie mixte

Cependant si nous élargissons la notion de stratégie, nous pourrions trouver une sorte d’équilibre de Nash
pour ce jeu. Nous pensions au paravent que chaque agent faisait un choix de stratégie une fois et pour toute.
C’est-à-dire que l’agent choisissait une stratégie et tenait strictement à cela. Ceci s’appelle une stratégie
pure.

Table 3: Un jeu sans équilibre de Nash (en stratégie pure)

2
Joueur B

Gauche Droite

Haut 0,0 0,-1

Joueur A Bas 1,0 -1,3

Une autre façon de voir les choses, c’est de supposer que les choix de stratégies des agents se fait de façon
aléatoire, c’est-à-dire que des probabilités peuvent être associées aux choix de stratégies de chaque agent.
Par exemple le joueur A peut choisir de jouer ‘Haut’ 50 pourcent du temps et ‘Bas’ 50 pourcent du temps.
De la même façon le joueur B peut choisir de jouer ‘Gauche’ 50 pourcent du temps et ‘Droite’ 50 pourcent
du temps. Cette façon de concevoir les stratégies s’appelle stratégie mixte.

Selon la loi de probabilité 1, si chaque individu joue l’une de ses deux stratégies la moitié du temps, la
probabilité de finir dans l’une des quatre cellules est de 1/4. Ainsi, le paiement espéré 2 (ou paiement moyen)
du joueur A sera 0 et celui du joueur B sera 1/2.

Un équilibre de Nash en stratégie mixte se réfère à une situation d’équilibre dans laquelle chaque agent
choisit la fréquence optimale pour jouer sa stratégie étant donné le choix de fréquence de l’autre agent.

On peut montrer (Gibbons, 1992) 3que dans les jeux que nous analysons, un équilibre de Nash en stratégie
mixte existe toujours si même l’équilibre en stratégie pure n’existe pas. Dans notre exemple de la Table 3
on peut montrer que si le Joueur A joue ‘Haut’ avec la probabilité 3/4 et ‘Bas’ avec probabilité 1/4 et le
joueur B joue ‘Droite’ avec probabilité 1/2 et ‘Gauche’ avec probabilité 1/2, cela sera un équilibre de Nash
en stratégie mixte.

1
Il faut noter que 𝑃(𝑋 𝑒𝑡 𝑌) = 𝑃(𝑋) × 𝑃(𝑌) si les deux évènements sont indépendants (et c’est le cas ici). Ainsi la
1 1 1
probabilité de choisir la stratégie (Haut, Gauche) est égale à × = et ceci est la même chose dans toutes les
2 2 4

cellules.
2
Pour calculer le paiement espéré il faut utiliser la loi de probabilité 𝑃(𝑋 𝑜𝑢 𝑌) = 𝑃(𝑋) + 𝑃(𝑌). Ainsi, le joueur A
1 1 1 1
doit jouer la stratégie ‘Haut’ ou ‘Bas’ et donc nous avons : (0 × + 0 × ) + (1 × + (−1) × ) = 0. On peut
4 4 4 4
1 1 1 1
utiliser la même loi pour calculer le paiement espéré de B qui est(0 × + 0 × ) + ((−1) × + 3 × ) = 1/2.
4 4 4 4
3
Gibbons, R. (1992). Game Theory for Applied Economist. Princeton University Press, Princeton, NJ.

3
7.4 Le dilemme du prisonnier

L’autre problème de l’équilibre de Nash, c’est qu’il ne conduit pas nécessairement à un résultat qui est
Pareto-efficient. Considérons le jeu suivant dans la Table 4. Ce jeu est connu sous le nom du dilemme du
prisonnier.

Table 4 : Jeu du dilemme du prisonnier

Prisonnier B

Confesser Nier

Confesser -3,-3 0,-6

Prisonnier A Nier -6,0 -1,-1

La discussion originale de ce jeu décrit une situation où deux partenaires de crime sont questionnés dans
deux cellules différentes de prison. Chaque prisonnier a le choix de ‘confesser’ ou de ‘nier’ le crime. Si les
deux prisonniers confessent leur crime, ils feront trois mois de prison. Si par contre un prisonnier confesse
son crime alors que l’autre nie le crime, celui qui à confesser le crime sera libérer et celui qui à nier le crime
fera six mois de prison ferme. Cependant les deux nient le crime commis, ils feront seulement qu’un mois
de prison.

Une étude du jeu montre que la stratégie de confesser le crime (Confesser, Confesser) est un équilibre de
Nash. Ce qui donne aux deux prisonniers de passer 6 mois de prison. On voit clairement que cette stratégie
dominante qui est équilibre de Nash n’est pas efficiente au sens de Pareto car il existe une autre stratégie
(nier, nier) qui n’est pas équilibre de Nash mais qui les fera passer seulement qu’un mois en prison. Le
problème est que les deux prisonniers ne peuvent avoir confiance l’un à l’autre et aussi ils ne peuvent pas
coordonner leurs actions en étant séparés.

On montre que si le jeu du dilemme du prisonnier demeure un jeu qui est joué seulement une fois, alors la
stratégie de la défection sera la meilleure réponse de chaque joueur c’est-à-dire la stratégie (Confesser,
Confesser). Par contre si le jeu de dilemme du prisonnier est répété, alors nous pouvons arriver à des
équilibres plus avantageux comme celui de la stratégie (nier, nier).

7.5 Les jeux répétés

Dans la section précédente le jeu du dilemme du prisonnier est joué qu’une seule fois. La situation sera
différente si ce jeu est répété plusieurs fois. Dans ce cas de nouvelles stratégies possibles de jeu peuvent

4
faire surface. Si un joueur fait défection à une étape du jeu donc l’autre joueur fera aussi défection à l’étape
suivante. Ainsi, dans un jeu répété tu peux ‘punir’ ton adversaire pour ‘mauvais’ comportement. Dans un
jeu répété, chaque joueur a l’opportunité d’établir une réputation pour la coopération.

Nous allons montrer que dans un jeu répété la viabilité d’une stratégie donnée dépend de si le jeu est joué
un nombre fixe de périodes ou un nombre infini de périodes.

Premièrement nous allons supposer que le jeu va se jouer seulement 10 fois. Examinons d’abord ce qui va
se passer à la période 10. A cette dernière période c’est tout comme si le jeu se jouait une fois. Ainsi il n’y
aura pas de coopération et chaque joueur fera défection. Maintenant considérons la période 9. Puisque nous
n’allons pas coopérer à la période 10, si je coopérer à la période 9 l’autre pourra faire défection et me mettre
dans le pétrin, donc je ne vais pas coopérer et ainsi de suite. Dans un jeu du dilemme du prisonnier répété
à un nombre fini de fois il y aura équilibre de défection à chaque période.

Si par contre le jeu est joué de façon infinie, les joueurs peuvent coopérer en espérant que la coopération
présente va induire des coopérations futures. Si ton adversaire refuse de coopérer cette période tu peux aussi
ne pas coopérer à la période suivante. Un économiste au nom de Robert Axelrod a conduit une expérience
avec plusieurs stratégies du dilemme du prisonnier sur ordinateur et à trouver que la stratégie la plus payante
appelée stratégie ‘tit for tat’ est la suivante : Coopérer à la première période du jeu (nier le crime). Pour
toute autre période suivante coopérer si au cours de la période précédente votre adversaire à coopérer. Si
par contre votre adversaire fait défection à la période précédente, vous faite défection aussi. En d’autres
termes tu fais ce que ton adversaire fait la période précédente.

7.6 Renforcement d’un cartel

Nous avons étudié au chapitre 1 qu’il peut exister des comportements de duopole dans lesquels les firmes
fixent les prix, notamment dans le model de duopole de Cournot. On peut montrer que si chaque firme fixait
son prix, le prix d’équilibre de Nash sera égal au prix concurrentiel c’est-à-dire que le prix d’équilibre sera
égal au coût marginal. Le raisonnement est simple. Si une entreprise fixe un prix qui est supérieur au coût
marginal, l’autre entreprise ferait mieux de diminuer ses prix pour vendre plus. Enfin, l’équilibre s’établira
lorsque chaque firme fixe son prix au coût marginal.

Si par contre ce jeu est répété indéfiniment, on peut jouer la stratégie ‘tit for tat’ c’est-à-dire que chaque
firme va diminuer son prix si son adversaire diminue son prix. Ainsi, la menace permanente de voir son
concurrent diminuer son prix si je diminue mon prix va conduire à fixer des prix élevés.

Exemple : La stratégie ‘tit for tat’ est jouée dans la fixation des prix de transport de chemin de fer aux USA
et dans le transport aérien.

5
7.7 Les jeux séquentiels

Jusqu’à présent nous avons travaillé sur des jeux dans lesquels les deux joueurs jouent simultanément.
Cependant dans certains cas un joueur peu avoir l’avantage de jouer avant l’autre. Un exemple palpable est
le model de Stackelberg dans lequel un joueur est ‘leader’ et un autre est ‘follower’.

Supposons que dans un jeu, un premier joueur doit d’abord choisir ‘Haut’ ou ‘Bas’. Le second joueur
observe le choix du premier joueur et joue ‘Gauche’ ou ‘Droite’. Les paiements sont dans la Table 5.

Table 5 : Matrice de paiement d’un jeu séquentiel

Joueur B

Gauche Droite

Haut 1,9 1, 9

Joueur A Bas 0,0 2,1

Observons que ce jeu donne deux équilibres de Nash notamment (Haut, Droite) et (Bas, Droite). Cependant
nous allons montrer que l’un des équilibres du jeu n’est pas raisonnable. Pour se faire nous allons représenter
le jeu sous forme extensive pour mettre en exergue le timing du jeu.

Figure 7.1 : La forme extensive d’un jeu indiquant l’ordre dans lequel les joueurs jouent

6
Dans un jeu séquentiel l’équilibre est déterminé en résolvant le problème en commençant par le dernier
joueur vers le premier jour. Ce type de raisonnement s’appelle le ‘Backward induction’. Ainsi du point de
vue du joueur B, il aimerait que le joueur A choisisse ‘Haut’ et comme cela il gagnera 9 et le joueur A
gagnera 1. Cependant comme l’information est complète et parfaite, le joueur A préfèrerai jouer ‘Bas’ tout
en sachant bien que ce n’est pas dans l’intérêt de B de jouer ‘Gauche’ pour gagner 0 alors qu’il pourra jouer
‘Droite’ pour gagner 2.

Ce que le joueur B pourra donc faire pour forcer le joueur A de jouer ‘Haut’ c’est de le menacer que s’il
joue ‘Droite’ lui il jouera ‘Gauche’. Si le joueur A prend cette menace comme crédible alors il va céder et
jouer ‘Haut’. Par contre si le joueur A voit que ce n’est pas dans l’intérêt de B de jouer ‘Gauche’ il va donc
jouer ‘Bas’. Autre chose c’est que le joueur B pourra recruter un avocat et donner l’ordre à l’avocat de jouer
‘Gauche’ si A venait à jouer ‘Bas’ afin de rendre sa menace crédible.

7.8 Un jeu d’empêchement d’entrée du marché

Dans notre étude du marché d’oligopole, nous avons supposé que le nombre de firme était fixe mais en
réalité il y a des situations d’entrée possible sur le marché. Bien sûr c’est dans l’intérêt des firmes déjà
présentes d’empêcher l’entrée sur le marché d’autres concurrents.

Imaginons une situation dans laquelle une firme en monopole subit la menace d’entrée d’une autre firme.
Si la firme entrante décide de ne plus entrer sur le marché alors elle reçoit un paiement de 1 et le monopoliste
reçoit 9. Si par contre la firme entrante décide d’entrer sur le marché, son paiement dépendra donc de si la
firme monopoliste décide de le combattre ou non. Si la firme monopoliste décide de combattre alors les
deux firmes reçoivent un paiement de 0. Autrement si la firme monopoliste décide ne pas se battre alors elle
reçoit 2 et la firme entrante reçoit 1. Ce jeu est exactement celui que nous avons décrit dans la section
précédente en ce qui concerne les gains de chaque joueur (voir Figure 7.2).

7
Figure 7.2 : Jeu d’entrée sur un nouveau marché sans crédibilité de la menace du monopoleur

Le problème du monopoliste dans ce jeu est qu’il ne peut s’engager fermement à combattre si l’autre firme
faisait son entrée sur le marché. C’est-à-dire qu’une fois que la nouvelle firme fait son entrée sur le marché
la chose la plus rationnelle est de ne pas combattre. Supposons que le monopoliste décide d’acheter une
capacité excédentaire de production qui pourra lui permettre de produire plus d’output que précédemment.
Avec cette nouvelle capacité de production, si nous supposons que le monopoliste reçoit un paiement de 2
s’il décide de se battre en cas d’entré de la nouvelle firme entre sur le marché alors nous aurons le jeu décrit
dans la Figure 7.3. Dans ce cas de figure nous dirons que la menace du monopoliste est crédible et donc la
firme entrante fera mieux de ne pas faire son entrée sur le marché. Ainsi le monopoliste reste en monopole
sur le marché mais avec une capacité de production excédentaire. Cependant cet investissement a donné à
l’entrant potentiel que le monopoleur va toujours défendre son marché.

8
Figure 7.3: Jeu d’entrée sur un nouveau marché avec crédibilité de la menace du monopoleur

Vous aimerez peut-être aussi

pFad - Phonifier reborn

Pfad - The Proxy pFad of © 2024 Garber Painting. All rights reserved.

Note: This service is not intended for secure transactions such as banking, social media, email, or purchasing. Use at your own risk. We assume no liability whatsoever for broken pages.


Alternative Proxies:

Alternative Proxy

pFad Proxy

pFad v3 Proxy

pFad v4 Proxy