Sunteți pe pagina 1din 162

Introduction la Thorie des Jeux

Sebastien
Konieczny
konieczny@cril.univ-artois.fr

CRIL-CNRS
Universite dArtois - Lens

Introduction a` la Theorie
des Jeux p.1/77

Thorie des Jeux

`
Dfinition La theorie
des jeux permet une analyse formelle des problemes
par linteraction strategique

poses
dun groupe dagents rationnels poursuivant des buts qui leur sont propres.

Introduction a` la Theorie
des Jeux p.2/77

Thorie des Jeux

`
Dfinition La theorie
des jeux permet une analyse formelle des problemes
par linteraction strategique

poses
dun groupe dagents rationnels poursuivant des buts qui leur sont propres.

. groupe
. interaction
. stratgique
. rationnels

Introduction a` la Theorie
des Jeux p.2/77

Thorie des Jeux

`
Dfinition La theorie
des jeux permet une analyse formelle des problemes
par linteraction strategique

poses
dun groupe dagents rationnels poursuivant des buts qui leur sont propres.

. groupe
. interaction
. stratgique
. rationnels

Normatif vs Descriptif

Introduction a` la Theorie
des Jeux p.2/77

A quoi sert la thorie des jeux ?


. Jeux de socit (checs, dames, go, ...), Jeux de cartes (bridge, poker, ...)
. Dois-je travailler ou faire semblant ?
. Est-ce que jcoute de la musique ce soir ?
. Enchres, vote
. Comportement animal
. Stratgies militaires/conomiques
. Partages de ressource (marchandage)
. Est-ce quune entreprise doit exploiter ses salaris ?
. Est-ce quune entreprise doit entrer sur un march ou pas ?
. Faut-il contrler les dclarations dimpots sur le revenu ?
. ...

Introduction a` la Theorie
des Jeux p.3/77

Un peu dhistoire...
. Cournot (1838), Borel (1921)
. Zermelo (1913)
. Von Neumann (1928)
. Theory of Games and Economic Behaviour, Von Neumann et
Morgenstern (1944)
. Nash (1950)
. Selten (1965), Harsanyi (1967)

Introduction a` la Theorie
des Jeux p.4/77

Bibliographie

. M. Yildizoglu. Introduction a` la theorie


des jeux. Dunod. 2003.

. D. Kreps. Theorie
des jeux et modelisation
economique
. Dunod. 1990.

. D. Luce, H. Raiffa. Games and Decision. Wiley. 1957.


. P. K. Dutta. Strategies and Games. MIT Press. 1999.
. D. Fudenberg, J. Tirole. Game Theory. MIT Press. 1991.
. J. Von Neumann, O. Morgenstern. Theory of Game and Economic Behavior. Princeton University Press. 1944.

Introduction a` la Theorie
des Jeux p.5/77

Terminologie - Une petite taxonomie...


. Jeux somme nulle (strictement comptitifs) / Jeux somme non-nulle
. Jeux information complte / Jeux information incomplte
. Jeux information parfaite / Jeux information imparfaite
. Jeux coopratifs / Jeux non-coopratifs
. Jeux 2 joueurs / Jeux n joueurs

Introduction a` la Theorie
des Jeux p.6/77

Plan du cours
. Introduction - Formalisation dun jeu - Jeu sous forme normale - Jeu
sous forme extensive - Stratgie
. Concepts de solution - Stratgies dominantes
. Equilibre de Nash - Critre de Pareto - Niveau de scurit - Stratgies
mixtes
. Rsolution par chainage arrire - Menaces crdibles - Equilibres
parfaits en sous-jeux
. Jeux somme nulle
. Jeux rpts - Dilemme itr du prisonnier
. Jeux information incomplte
. Jeux coopratifs - Marchandage

Introduction a` la Theorie
des Jeux p.7/77

Formalisation dun Jeu


Quest-ce quun jeu ?
. Qui? Joueurs
. Quoi? Coups (actions/choix) - Stratgies
. Quand? Droulement du jeu
. Combien? Que rapporte chaque issue aux diffrents joueurs ?

Autres informations importantes:


. Information
. Rptition

Introduction a` la Theorie
des Jeux p.8/77

Jeux sous forme stratgique - Exemple


Joueur 2

Joueur 1

x
y

u
4,2
2,5

v
3,1
9,0

Introduction a` la Theorie
des Jeux p.9/77

Utilit
. Une hypothse de base de la thorie des jeux est de considrer que les
agents sont rationnels, cest--dire quils tentent darriver la situation
la meilleure pour eux.
. On appelle Utilite la mesure de chaque situation aux yeux de lagent.
. L Utilite nest ni une mesure du gain matriel, montaire, etc. mais une
mesure subjective du contentement de lagent.

Introduction a` la Theorie
des Jeux p.10/77

Utilit
. Une hypothse de base de la thorie des jeux est de considrer que les
agents sont rationnels, cest--dire quils tentent darriver la situation
la meilleure pour eux.
. On appelle Utilite la mesure de chaque situation aux yeux de lagent.
. L Utilite nest ni une mesure du gain matriel, montaire, etc. mais une
mesure subjective du contentement de lagent.
. Utiliser une fonction dutilit pour dfinir les prfrences de lagent ne
suppose pas que lagent utilise cette fonction, mais quil raisonne conformment un ensemble de conditions de rationalit. Von Neuman et
Morgenstern (1944), Savage (1954).

Introduction a` la Theorie
des Jeux p.10/77

Jeux sous forme stratgique


Un jeu sous forme stratgique est dfini par :
. un ensemble N = {1, . . . , n} de joueurs
. pour chaque joueur i un ensemble de stratgies Si = {s1 , . . . , sni }
. pour chaque joueur i une fonction de valuation i : S1 . . . Sn IR,
qui chaque ensemble de stratgies associe les gains du joueur i.

Notations :
. On notera s un profil de stratgies {s1 , . . . , sn } o i si Si .
. On note si le profil s des stratgies autres que celles du joueur i :
si = {s1 , . . . , si1 , si+1 , . . . , sn }.
. On note S lespace des stratgies, ie : S = n
i=1 Si

Introduction a` la Theorie
des Jeux p.11/77

Jeux sous forme extensive - Exemple


x
s 2
(4,2)

t
(3,1)

y
u
(2,5)

v
(9,0)

Introduction a` la Theorie
des Jeux p.12/77

Jeux sous forme extensive


Un jeu sous forme extensive est dfini par :
. un ensemble N = {1, . . . , n} de joueurs
. un arbre fini compos de :
. un ensemble de noeuds {A, B, C, . . .} reprsentant les coups
. un ensemble de branches {x, y, z, . . .} reprsentant les alternatives
chaque coup
. une fonction de nommage qui indique chaque noeud quel est le
joueur qui doit jouer
. une fonction de valuation qui associe chaque noeud terminal un
vecteur de nombres reprsentant les gains de chacun des joueurs
. une partition des noeuds en un ensemble densembles dinformations
reprsentant les croyances (imparfaites) des joueurs

Introduction a` la Theorie
des Jeux p.13/77

Jeux sous forme extensive - Ensemble dinformations


Joueur 1
x
s B
(4,2)

t
(3,1)

Joueur 2
u

(2,5)

C v

(9,0)

Introduction a` la Theorie
des Jeux p.14/77

Jeux sous forme extensive - Ensemble dinformations

x
s B
(4,2)

t
(3,1)

y
u
(2,5)

C v

(9,0)

Introduction a` la Theorie
des Jeux p.14/77

Jeux sous forme extensive - Ensemble dinformations

x
u B
(4,2)

v
(3,1)

y
u
(2,5)

C v

(9,0)

Introduction a` la Theorie
des Jeux p.14/77

Jeux sous forme extensive - Ensemble dinformations

x
u B
(4,2)

v
(3,1)

y
u
(2,5)

C v

(9,0)

. Ensembles dinformation : {A} et {B, C}


. Coups simultans
. Incertitude (croyances)

Introduction a` la Theorie
des Jeux p.14/77

Relation entre formes stratgique et extensive


. A chaque jeu sous forme extensive correspond un jeu sous forme
stratgique dans lequel les joueurs choisissent simultanment les
stratgies quils mettront en oeuvre.
. En revanche, un jeu sous forme stratgique peut correspondre
plusieurs jeux sous forme extensive diffrents.

Introduction a` la Theorie
des Jeux p.15/77

Relation entre formes stratgique et extensive


. A chaque jeu sous forme extensive correspond un jeu sous forme
stratgique dans lequel les joueurs choisissent simultanment les
stratgies quils mettront en oeuvre.
. En revanche, un jeu sous forme stratgique peut correspondre
plusieurs jeux sous forme extensive diffrents.
. Une stratgie est la spcification complte du comportement dun
joueur dans nimporte quelle situation (dans un jeu sous forme
extensive cela signifie donc pour chaque ensemble dinformation o
cest ce joueur de jouer).
. Algorithme

Introduction a` la Theorie
des Jeux p.15/77

Stratgie

. Une strategie
pure du joueur i est un plan daction qui prescrit une
action de ce joueur pour chaque fois quil est susceptible de jouer. On
note par Si lensemble des stratgies pures du joueur i et par si une
stratgie pure de ce joueur.

Introduction a` la Theorie
des Jeux p.16/77

Relation entre formes stratgique et extensive


Joueur 2
Forme stratgique :
Joueur 1

x
y

u
4,2
2,5

v
3,1
9,0

Introduction a` la Theorie
des Jeux p.17/77

Relation entre formes stratgique et extensive


Joueur 2
u
4,2
2,5

Forme stratgique :
Joueur 1

x
y
x

Forme extensive :

u B
(4,2)

v
(3,1)

v
3,1
9,0
A

y
u
(2,5)

C v

(9,0)

Introduction a` la Theorie
des Jeux p.18/77

Relation entre formes stratgique et extensive


Joueur 2
s1
4,2
2,5

Forme stratgique :
Joueur 1

x
y
x

Forme extensive :

u B
(4,2)

v
(3,1)

s1: u si x, u si y
s3: v si x, u si y

s2
4,2
9,0
A

s3
3,1
2,5

s4
3,1
9,0

y
u
(2,5)

C v

(9,0)

s2: u si x, v si y
s4: v si x, v si y

Introduction a` la Theorie
des Jeux p.19/77

Elimination de stratgies domines


Joueur 2

Joueur 1

x
y

u
4,2
2,5

v
3,1
9,0

Introduction a` la Theorie
des Jeux p.20/77

Elimination de stratgies domines


Joueur 2

Joueur 1

x
y

u
4,2
2,5

v
3,1
9,0

Introduction a` la Theorie
des Jeux p.20/77

Elimination de stratgies domines


Joueur 2

Joueur 1

x
y

u
4,2
2,5

v
3,1
9,0

Introduction a` la Theorie
des Jeux p.20/77

Elimination de stratgies domines


Joueur 2

Joueur 1

x
y

u
4,2
2,5

v
3,1
9,0

. Une stratgie si est (strictement) domine pour le joueur i si il existe


une stratgie si 0 telle que pour tous les profils si
i (si 0 , si ) > i (si , si )

Introduction a` la Theorie
des Jeux p.20/77

Elimination de stratgies domines


Joueur 2

Joueur 1

x
y

u
4,2
2,5

v
3,1
9,0

. Une stratgie si est faiblement domine pour le joueur i si il existe une


stratgie si 0 telle que pour tous les profils si
i (si 0 , si ) i (si , si )

Introduction a` la Theorie
des Jeux p.20/77

Elimination de stratgies domines


Joueur 2

Joueur 1

x
y
z

u
3,6
5,1
6,0

v
7,1
8,2
6,2

w
4,8
6,1
3,2

Introduction a` la Theorie
des Jeux p.21/77

Elimination de stratgies domines


Joueur 2

Joueur 1

x
y
z

u
3,6
5,1
6,0

v
7,1
8,2
6,2

w
4,8
6,1
3,2

Introduction a` la Theorie
des Jeux p.21/77

Elimination de stratgies domines


Joueur 2

Joueur 1

x
y
z

u
3,6
5,1
6,0

v
7,1
8,2
6,2

w
4,8
6,1
3,2

Introduction a` la Theorie
des Jeux p.21/77

Elimination de stratgies domines


Joueur 2

Joueur 1

x
y
z

u
3,6
5,1
6,0

v
7,1
8,2
6,2

w
4,8
6,1
3,2

Introduction a` la Theorie
des Jeux p.21/77

Elimination de stratgies domines


Joueur 2

Joueur 1

x
y
z

u
3,6
5,1
6,0

v
7,1
8,2
6,2

w
4,8
6,1
3,3

Introduction a` la Theorie
des Jeux p.21/77

Elimination de stratgies domines


. Un jeu est dit rsolvable par limination itrative des stratgies
domines, si on obtient un unique profil en liminant successivement
des stratgies (strictement) domines.
. Les profils obtenus aprs limination itrative des stratgies
(strictement) domines (EISD) ne dpendent pas de lordre choisi pour
llimination des stratgies.
. Par contre, on peut obtenir des profils diffrents lorsque lon choisit des
ordres diffrents pour llimination itrative de stratgies faiblement
domines (EISfD).
. Les rsultats obtenus par EISD sont donc plus robustes que ceux
obtenus par EISfD.
. Problme majeur de cette mthode: tous les jeux ne sont pas rsolvable
par EISD !

Introduction a` la Theorie
des Jeux p.22/77

Equilibre de Nash
Joueur 2

Joueur 1

x
y
z

u
3,0
2,0
0,3

v
0,2
1,1
0,2

w
0,3
2,0
3,0

Introduction a` la Theorie
des Jeux p.23/77

Equilibre de Nash
Joueur 2

Joueur 1

x
y
z

u
3,0
2,0
0,3

v
0,2
1,1
0,2

w
0,3
2,0
3,0

Introduction a` la Theorie
des Jeux p.23/77

Equilibre de Nash
Joueur 2

Joueur 1

x
y
z

u
3,0
2,0
0,3

v
0,2
1,1
0,2

w
0,3
2,0
3,0

Introduction a` la Theorie
des Jeux p.23/77

Equilibre de Nash
Joueur 2

Joueur 1

x
y
z

u
3,0
2,0
0,3

v
0,2
1,1
0,2

w
0,3
2,0
3,0

Introduction a` la Theorie
des Jeux p.23/77

Equilibre de Nash
Joueur 2

Joueur 1

x
y
z

u
3,0
2,0
0,3

v
0,2
1,1
0,2

w
0,3
2,0
3,0

Introduction a` la Theorie
des Jeux p.23/77

Equilibre de Nash
Joueur 2

Joueur 1

x
y
z

u
3,0
2,0
0,3

v
0,2
1,1
0,2

w
0,3
2,0
3,0

Introduction a` la Theorie
des Jeux p.23/77

Equilibre de Nash
Joueur 2

Joueur 1

x
y
z

u
3,0
2,0
0,3

v
0,2
1,1
0,2

w
0,3
2,0
3,0

Introduction a` la Theorie
des Jeux p.23/77

Equilibre de Nash
Joueur 2

Joueur 1

x
y
z

u
3,0
2,0
0,3

v
0,2
1,1
0,2

w
0,3
2,0
3,0

de Nash est une situation telle quaucun joueur


. La notion dequilibre
na intrt dvier (seul) de la situation obtenue.

de Nash est un profil de stratgies s = {s1 , . . . , sn } tel


. Un equilibre
que pour tout joueur i, pour toute stratgie s0 Si :

i (s1 , si ) i (s0 , si )

Introduction a` la Theorie
des Jeux p.23/77

Equilibre de Nash et fonction de meilleure rponse


. La fonction de meilleure rponse du joueur i est la fonction B i qui
associe chaque combinaison de stratgies des autres joueurs s i les
stratgies du joueur i qui maximise son utilit:
Bi (si ) = {si Si t.q. i (si , si ) i (s0i , si ) pour tout s0i Si }

Introduction a` la Theorie
des Jeux p.24/77

Equilibre de Nash et fonction de meilleure rponse


. La fonction de meilleure rponse du joueur i est la fonction B i qui
associe chaque combinaison de stratgies des autres joueurs s i les
stratgies du joueur i qui maximise son utilit:
Bi (si ) = {si Si t.q. i (si , si ) i (s0i , si ) pour tout s0i Si }
. Un quilibre de Nash est un profil s tel que la stratgie du joueur i est
une meilleure rponse:
si Bi (si ) pour tout i N

Introduction a` la Theorie
des Jeux p.24/77

Equilibre de Nash: Proprits


. Un profil (unique) obtenu par limination itrative de stratgies
(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu).

Introduction a` la Theorie
des Jeux p.25/77

Equilibre de Nash: Proprits


. Un profil (unique) obtenu par limination itrative de stratgies
(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu).
. Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,
mais il peut aussi nen avoir aucun !

Introduction a` la Theorie
des Jeux p.25/77

Equilibre de Nash: Proprits


. Un profil (unique) obtenu par limination itrative de stratgies
(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu).
. Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,
mais il peut aussi nen avoir aucun !
. Question: comment choisir un quilibre particulier lorsquil y en a
plusieurs ?

Introduction a` la Theorie
des Jeux p.25/77

Equilibre de Nash: Proprits


. Un profil (unique) obtenu par limination itrative de stratgies
(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu).
. Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,
mais il peut aussi nen avoir aucun !
. Question: comment choisir un quilibre particulier lorsquil y en a
plusieurs ?
0
. Deux quilibres de Nash s = (si , si ) et s0 = (s0
i , si ) sont
0
interchangeables si pour tout i (si , s0
i ) et (si , si ) sont aussi des
quilibres de Nash.

Introduction a` la Theorie
des Jeux p.25/77

Equilibre de Nash: Proprits


. Un profil (unique) obtenu par limination itrative de stratgies
(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu).
. Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,
mais il peut aussi nen avoir aucun !
. Question: comment choisir un quilibre particulier lorsquil y en a
plusieurs ?
0
. Deux quilibres de Nash s = (si , si ) et s0 = (s0
i , si ) sont
0
interchangeables si pour tout i (si , s0
i ) et (si , si ) sont aussi des
quilibres de Nash.

. Deux quilibres de Nash s et s0 sont quivalents si ils donnent la mme


utilit tous les joueurs, i.e. pour tout i N i (s ) = i (s0 ).

Introduction a` la Theorie
des Jeux p.25/77

Critre de Pareto
Joueur 2

Joueur 1

x
y

u
4,4
2,3

v
3,1
7,5

Introduction a` la Theorie
des Jeux p.26/77

Critre de Pareto
Joueur 2

Joueur 1

x
y

u
4,4
2,3

v
3,1
7,5

. Un profil s domine un profil s0 au sens de Pareto si il est au moins aussi


bon pour tous les joueurs et si s est strictement meilleur pour au moins
lun dentre eux, i.e. pour tout si s et s0i s0 on a si s0i et il existe
sj s et s0j s0 tel que sj > s0j .

Introduction a` la Theorie
des Jeux p.26/77

Critre de Pareto
Joueur 2

Joueur 1

x
y

u
4,4
2,3

v
3,1
7,5

. Un profil s domine un profil s0 au sens de Pareto si il est au moins aussi


bon pour tous les joueurs et si s est strictement meilleur pour au moins
lun dentre eux, i.e. pour tout si s et s0i s0 on a si s0i et il existe
sj s et s0j s0 tel que sj > s0j .
. Un profil s domine strictement un profil s0 au sens de Pareto si s est
strictement meilleur pour tous les joueurs, i.e. pour tout s i s et s0i s0
on a si > s0i .

Introduction a` la Theorie
des Jeux p.26/77

Critre de Pareto vs niveau de scurit


Joueur 2

Joueur 1

x
y

u
9,9
8,0

v
0,8
7,7

Introduction a` la Theorie
des Jeux p.27/77

Critre de Pareto vs niveau de scurit


Joueur 2

Joueur 1

x
y

u
9,9
8,0

v
0,8
7,7

. On dfinit le niveau de securit


e dune strategie
si pour le joueur i
comme le gain minimum que peut apporter cette stratgie quel que soit
le choix des autres joueurs, soit

min i (si , si )
si

e dun joueur i comme le niveau de scu. On dfinit le niveau de securit


rit maximal des stratgies de i.

Introduction a` la Theorie
des Jeux p.27/77

Points focaux
. Le problme pos par la multiplicit dquilibres de Nash est un
problme de coordination.
. Pour certains jeux, certains quilibres semblent plus vidents que
dautres aux joueurs. Cela est du certaines conventions sociales. Ces
quilibres de Nash obtenus partir de ces conventions sont appels
points focaux.

Introduction a` la Theorie
des Jeux p.28/77

La guerre des sexes


Joueur 2

Joueur 1

f
c

f
2,1
0,0

c
0,0
1,2

Introduction a` la Theorie
des Jeux p.29/77

La guerre des sexes


Joueur 2

Joueur 1

f
c

f
2,1
0,0

c
0,0
1,2

. Sur cet exemple le niveau de scurit des deux joueurs est 0.

Introduction a` la Theorie
des Jeux p.29/77

La guerre des sexes


Joueur 2

Joueur 1

f
c

f
2,1
0,0

c
0,0
1,2

. Sur cet exemple le niveau de scurit des deux joueurs est 0.


. Supposons que le joueur 1 joue alatoirement f et c avec une
probabilit de 1/2
1 (< (f, 1/2), (c, 1/2) >, f ) = 1/2 2 + 1/2 0 = 1
1 (< (f, 1/2), (c, 1/2) >, c) = 1/2 0 + 1/2 1 = 1/2

Introduction a` la Theorie
des Jeux p.29/77

La guerre des sexes


Joueur 2

Joueur 1

f
c

f
2,1
0,0

c
0,0
1,2

. Sur cet exemple le niveau de scurit des deux joueurs est 0.


. Supposons que le joueur 1 joue alatoirement f et c avec une
probabilit de 1/2
1 (< (f, 1/2), (c, 1/2) >, f ) = 1/2 2 + 1/2 0 = 1
1 (< (f, 1/2), (c, 1/2) >, c) = 1/2 0 + 1/2 1 = 1/2
. Avec cette stratgie le niveau de scurit du joueur 1 est 1/2

Introduction a` la Theorie
des Jeux p.29/77

Stratgies pures - Stratgies mixtes


. Les stratgies que nous avons dfinies et utilises pour le moment sont

pures, cest--dire les options qui se prsentent aux


des strategies
joueurs.

. Une strategie
mixte i est une distribution de probabilit sur
lensemble des stratgies pures.

. Lensemble des stratgies mixtes dun joueur i se note i .


. Lensemble des stratgies pures utilises (i.e. dont la probabilit nest
pas nulle) par une stratgie mixte i est appel le support de la
stratgie mixte.
. Notons pi (sk ) la probabilit associe sk par i , lutilit dun profil de
stratgies mixtes est dfinie par :
n
X Y
i () =
(
pj (sj ))i (s)
sS j=1

Introduction a` la Theorie
des Jeux p.30/77

Stratgie

. Une strategie
pure du joueur i est un plan daction qui prescrit une
action de ce joueur pour chaque fois quil est susceptible de jouer. On
note par Si lensemble des stratgies pures du joueur i et par si une
stratgie pure de ce joueur.

Introduction a` la Theorie
des Jeux p.31/77

Stratgie

. Une strategie
pure du joueur i est un plan daction qui prescrit une
action de ce joueur pour chaque fois quil est susceptible de jouer. On
note par Si lensemble des stratgies pures du joueur i et par si une
stratgie pure de ce joueur.

. Une strategie
mixte du joueur i est une distribution de probabilits p i
dfinie sur lensemble des stratgies pures du joueur i. On note i
lensemble des stratgies mixtes du joueur i et par i une stratgie
mixte de ce joueur.

Introduction a` la Theorie
des Jeux p.31/77

Stratgie

. Une strategie
pure du joueur i est un plan daction qui prescrit une
action de ce joueur pour chaque fois quil est susceptible de jouer. On
note par Si lensemble des stratgies pures du joueur i et par si une
stratgie pure de ce joueur.

. Une strategie
mixte du joueur i est une distribution de probabilits p i
dfinie sur lensemble des stratgies pures du joueur i. On note i
lensemble des stratgies mixtes du joueur i et par i une stratgie
mixte de ce joueur.

. Une strategie
locale du joueur i en un ensemble dinformation A est
une distribution de probabilits sur lensemble des actions disponibles
en cet ensemble dinformation. On note iA lensemble des stratgies
locales du joueur i pour lensemble dinformation A et iA une stratgie
locale de ce joueur en A.

. Une strategie
comportementale du joueur i est un vecteur de stratgies locales de ce joueur, contenant une stratgie locale par ensemble
dinformation de ce joueur. On note i lensemble des stratgies comportementales du joueur i, et i une stratgie comportementale de ce
joueur.

Introduction a` la Theorie
des Jeux p.31/77

Equilibres de Nash en stratgies mixtes


Dfinition Un quilibre de Nash en stratgies mixtes est un profil de stratgies
mixtes tel que pour tout i et tout i i

i (i , i
) i (i , i
)

Introduction a` la Theorie
des Jeux p.32/77

Equilibres de Nash en stratgies mixtes


Dfinition Un quilibre de Nash en stratgies mixtes est un profil de stratgies
mixtes tel que pour tout i et tout i i

i (i , i
) i (i , i
)

Thorme. est un quilibre de Nash si et seulement si pour tout i et tout


si S i

i (i , i
) i (si , i
)

Introduction a` la Theorie
des Jeux p.32/77

Equilibres de Nash en stratgies mixtes


Dfinition Un quilibre de Nash en stratgies mixtes est un profil de stratgies
mixtes tel que pour tout i et tout i i

i (i , i
) i (i , i
)

Thorme. est un quilibre de Nash si et seulement si pour tout i et tout


si S i

i (i , i
) i (si , i
)

Thorme.[Nash, 1950] Tout jeu sous forme strategique


a un equilibre
de

Nash en strategies
mixtes.

Introduction a` la Theorie
des Jeux p.32/77

La guerre des sexes


Joueur 2

Joueur 1

f
c

f
2,1
0,0

c
0,0
1,2

x
1x

. Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x


maximise-t-il son niveau de scurit ?

Introduction a` la Theorie
des Jeux p.33/77

La guerre des sexes


Joueur 2

Joueur 1

f
c

f
2,1
0,0

c
0,0
1,2

x
1x

. Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x


maximise-t-il son niveau de scurit ?
1 (< (f, x), (c, 1 x) >, f )
1 (< (f, x), (c, 1 x) >, c)

=
=

x 2 + (1 x) 0
x 0 + (1 x) 1

=
=

2x
1x

Introduction a` la Theorie
des Jeux p.33/77

La guerre des sexes


Joueur 2

Joueur 1

f
c

f
2,1
0,0

c
0,0
1,2

x
1x

. Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x


maximise-t-il son niveau de scurit ?
1 (< (f, x), (c, 1 x) >, f )
1 (< (f, x), (c, 1 x) >, c)

=
=

x 2 + (1 x) 0
x 0 + (1 x) 1

=
=

2x
1x

max min(2x, 1 x) = 1/3


x

Introduction a` la Theorie
des Jeux p.33/77

La guerre des sexes


Joueur 2

Joueur 1

f
c

f
2,1
0,0

c
0,0
1,2

x
1x

. Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x


maximise-t-il son niveau de scurit ?
1 (< (f, x), (c, 1 x) >, f )
1 (< (f, x), (c, 1 x) >, c)

=
=

x 2 + (1 x) 0
x 0 + (1 x) 1

=
=

2x
1x

max min(2x, 1 x) = 1/3


x

. Le niveau de scurit du joueur 1 est donc de 2/3.

Introduction a` la Theorie
des Jeux p.33/77

La guerre des sexes


Joueur 2

Joueur 1

f
c

f
2,1
0,0

c
0,0
1,2

x
1x

. Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x


maximise-t-il son niveau de scurit ?
1 (< (f, x), (c, 1 x) >, f )
1 (< (f, x), (c, 1 x) >, c)

=
=

x 2 + (1 x) 0
x 0 + (1 x) 1

=
=

2x
1x

max min(2x, 1 x) = 1/3


x

. Le niveau de scurit du joueur 1 est donc de 2/3.


. Que se passe-t-il si le joueur 2 est averti que le joueur 1 va jouer cette
stratgie ?

Introduction a` la Theorie
des Jeux p.33/77

Reprsentation graphique du jeu

2x

1/3

2/3

Introduction a` la Theorie
des Jeux p.34/77

Reprsentation graphique du jeu

0
1/3

2/3

x
1x

Introduction a` la Theorie
des Jeux p.34/77

Reprsentation graphique du jeu

2x

0
1/3

2/3

x
1x

Introduction a` la Theorie
des Jeux p.34/77

La guerre des sexes


Joueur 2
y
1y
f
c
Joueur 1
f 2,1
0,0
c 0,0
1,2
Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure
rponse du joueur 1 ?

Introduction a` la Theorie
des Jeux p.35/77

La guerre des sexes


Joueur 2
y
1y
f
c
Joueur 1
f 2,1
0,0
c 0,0
1,2
Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure
rponse du joueur 1 ?
1 (f, < (f, y), (c, 1 y) >) = y 2 + (1 y) 0 =
2y
1 (c, < (f, y), (c, 1 y) >) = y 0 + (1 y) 1 = 1 y

Introduction a` la Theorie
des Jeux p.35/77

La guerre des sexes


Joueur 2
y
1y
f
c
Joueur 1
f 2,1
0,0
c 0,0
1,2
Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure
rponse du joueur 1 ?
1 (f, < (f, y), (c, 1 y) >) = y 2 + (1 y) 0 =
2y
1 (c, < (f, y), (c, 1 y) >) = y 0 + (1 y) 1 = 1 y
Donc:
. Si 2y > 1 y (y > 1/3), la meilleure rponse du joueur 1 est de jouer f
. Si 2y < 1 y (y < 1/3), la meilleure rponse du joueur 1 est de jouer c
. Si 2y = 1 y (y = 1/3), le joueur 1 est indiffrent entre f et c, il peut
donc jouer lune ou lautre, ou nimporte quelle combinaison des deux.

Introduction a` la Theorie
des Jeux p.35/77

La guerre des sexes


Joueur 2
y
1y
f
c
Joueur 1
f 2,1
0,0
x
c 0,0
1,2
1x
Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure
rponse du joueur 2 ?

Introduction a` la Theorie
des Jeux p.36/77

La guerre des sexes


Joueur 2
y
1y
f
c
Joueur 1
f 2,1
0,0
x
c 0,0
1,2
1x
Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure
rponse du joueur 2 ?
2 (< (f, x), (c, 1 x) >, f )
2 (< (f, x), (c, 1 x) >, c)

=
=

x 1 + (1 x) 0
x 0 + (1 x) 2

=
=

x
2(1 x)

Introduction a` la Theorie
des Jeux p.36/77

La guerre des sexes


Joueur 2
y
1y
f
c
Joueur 1
f 2,1
0,0
x
c 0,0
1,2
1x
Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure
rponse du joueur 2 ?
2 (< (f, x), (c, 1 x) >, f ) = x 1 + (1 x) 0 =
x
2 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 2 = 2(1 x)
Donc:
. Si x > 2(1 x) (x > 2/3), la meilleure rponse du joueur 2 est de jouer f
. Si x < 2(1 x) (x < 2/3), la meilleure rponse du joueur 2 est de jouer c
. Si x = 2(1 x) (x = 2/3), le joueur 2 est indiffrent entre f et c, il peut
donc jouer lune ou lautre, ou nimporte quelle combinaison des deux.

Introduction a` la Theorie
des Jeux p.36/77

La guerre des sexes


Joueur 2
y
1y
f
c
Joueur 1
f 2,1
0,0
x
c 0,0
1,2
1x
Les gains des deux joueurs avec un profil en stratgie mixte sont donc:
1 ()
2 ()

=
=
=
=

x y 2 + x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 1
3xy x y + 1
x y 1 + x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 2
3xy 2x 2y + 2

Introduction a` la Theorie
des Jeux p.37/77

La guerre des sexes


Joueur 2
1/3 2/3
f
c
Joueur 1
f 2,1 0,0 2/3
c 0,0 1,2 1/3
Les gains des deux joueurs avec un profil en stratgie mixte sont donc:
1 () = 3xy x y + 1
2 () = 3xy 2x 2y + 2

Le profil = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un quilibre de Nash en stratgie mixte.

Introduction a` la Theorie
des Jeux p.37/77

La guerre des sexes


Joueur 2
1/3 2/3
f
c
Joueur 1
f 2,1 0,0 2/3
c 0,0 1,2 1/3
Les gains des deux joueurs avec un profil en stratgie mixte sont donc:
1 () = 3xy x y + 1
2 () = 3xy 2x 2y + 2

Le profil = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un quilibre de Nash en stratgie mixte.
Les gains des deux joueurs avec sont :
1 ( ) = 3.2/3.1/3 2/3 1/3 + 1
= 2/3
2 ( ) = 3.2/3.1/3 2.2/3 2.1/3 + 2
= 2/3

Introduction a` la Theorie
des Jeux p.37/77

Reprsentation graphique du jeu


y

2/3

1/3

joueur1

1/3

2/3

Introduction a` la Theorie
des Jeux p.38/77

Reprsentation graphique du jeu


y
joueur2

2/3

1/3

joueur1

1/3

2/3

Introduction a` la Theorie
des Jeux p.38/77

Reprsentation graphique du jeu


y
joueur2

2/3

joueur1

1/3

r
0

1/3

2/3

Introduction a` la Theorie
des Jeux p.38/77

Coopration - Itration - Corrlation


Joueur 2

Joueur 1

f
c

f
2,1
0,0

c
0,0
1,2

. Que se passe-t-il si les 2 joueurs peuvent communiquer avant de


jouer ?

Introduction a` la Theorie
des Jeux p.39/77

Coopration - Itration - Corrlation


Joueur 2

Joueur 1

f
c

f
2,1
0,0

c
0,0
1,2

. Que se passe-t-il si les 2 joueurs peuvent communiquer avant de


jouer ?
1 = 2 = 1/2 2 + 1/2 1 = 3/2

Introduction a` la Theorie
des Jeux p.39/77

Coopration - Itration - Corrlation


Joueur 2

Joueur 1

f
c

f
2,1
0,0

c
0,0
1,2

. Que se passe-t-il si les 2 joueurs peuvent communiquer avant de


jouer ?
1 = 2 = 1/2 2 + 1/2 1 = 3/2

Lorsque tous les joueurs peuvent observer un mme vnement


alatoire, ils peuvent alors saccorder sur des quilibres corrls
. Une stratgie corrle est une distribution de probabilits sur les
profils possibles.

Introduction a` la Theorie
des Jeux p.39/77

Coopration - Itration - Corrlation


Joueur 2

Joueur 1

f
c

f
2,1
0,0

c
0,0
1,2

. Que se passe-t-il si les 2 joueurs peuvent communiquer avant de


jouer ?
1 = 2 = 1/2 2 + 1/2 1 = 3/2

Lorsque tous les joueurs peuvent observer un mme vnement


alatoire, ils peuvent alors saccorder sur des quilibres corrls
. Une stratgie corrle est une distribution de probabilits sur les
profils possibles.
. Que se passe-t-il si la partie est joue plusieurs fois ?

Introduction a` la Theorie
des Jeux p.39/77

Itration: Le dilemme des prisonniers...


Deux personnes arrtes ensemble en possession darmes feu sont
souponns dun dlit fait en commun. Les policiers les sparent et disent
chacun :
. Si un des deux avoue et que lautre navoue rien, le premier est libr,
et le second emprisonn (5 ans);
. Si les deux avouent, les deux iront en prison (4 ans);
. Si aucun des deux navoue, les deux seront seront librs assez vite (2
ans).
B Vous tes un des deux prisonniers, que faites-vous ?

Introduction a` la Theorie
des Jeux p.40/77

[DIP] Le dilemme des prisonniers


Joueur 2

Joueur 1

C
D

C
3,3
5,0

D
0,5
1,1

Introduction a` la Theorie
des Jeux p.41/77

[DIP] Le dilemme itr...


Vous navez pas vraiment les mmes gots que votre voisin en matire de
musique. Il lui arrive souvent dcouter sa musique fond. De mme il
vous arrive (en reprsailles) de mettre votre musique un volume plus que
raisonnable. Ce qui a pour consquences que le lendemain il recommence
nouveau. En dehors de ces priodes agites, vous apprciez les priodes o
aucun de vous ne gne lautre.
Supposons que lon pondre votre satisfaction :
. Vous avez une satisfaction de 5 couter votre musique un volume
important.
. La satisfaction est de 0 lorsque votre voisin met sa musique fond.
. Une soire calme, sans musique vous apporte une satisfaction de 3.
. Le fait dcouter simultanment votre musique mle celle du voisin,
donne une satisfaction de 1.
B Vous savez ce que votre voisin a eu comme comportement les jours
prcdents, que faites-vous aujourdhui?

Introduction a` la Theorie
des Jeux p.42/77

[DIP] Le dilemme . . .
. Introduction par F LOOD et D RESHER la RAND Corp. en 1952
. Jeu somme non-nulle
. 2 joueurs jouent simultanment
. 2 choix de jeux :

. COOP ERER
, i.e. tre gentil, on notera C
. TRAHIR, i.e. tre mchant, on notera D
. Les gains des joueurs, nots S , P , R et T , sont fonction de leur choix
de jeu avec :
(0)
S<P <R<T

Introduction a` la Theorie
des Jeux p.43/77

[DIP] Le dilemme itr . . .


. Les joueurs se rencontrent plusieurs fois
. chaque itration les joueurs ont connaissance des coups prcdents
. Ils ne connaissent pas le terme du jeu
. Le gain dun joueur est le cumul de ses gains dans chaque rencontre
. Pour favoriser la coopration on ajoute la contrainte :
(0)

S + T < 2R

Introduction a` la Theorie
des Jeux p.44/77

[DIP] Dilemme itr des prisonniers (rsum)

Dilemme. . .
. . . itr

Cooperate

Defect

S<P <R<T
S + T < 2R

Cooperate
R=3
Reward
rcompense pour
coopration mutuelle
T =5
Temptation
tentation trahir

Defect
S=0
Suckers payoff
salaire de la dupe
P =1
Punishment
punition pour la trahison
mutuelle

Score du joueur de la ligne.

Introduction a` la Theorie
des Jeux p.45/77

[DIP] Des applications concrtes...


. Deux pays doivent-ils lever des taxes douanires sur les produits
imports de lautre pays.
. Deux entreprises concurrentes doivent-elles essayer de sentendre
pour se partag un march ou se faire concurrence ?
. Deux espces vivant sur un mme territoire doivent-elles cohabiter ou
se disputer la nourriture disponible ?

Introduction a` la Theorie
des Jeux p.46/77

[DIP] Les stratgies


Quelques exemples :
. gentille

. lunatique

. mchante

. majoritaire_gentille

. per_CCD

. majoritaire_mchante

. rancunire

. donnant_donnant

Introduction a` la Theorie
des Jeux p.47/77

[DIP] Exemples (rencontres)


1

10

score de gentille
jeu de gentille

0
C

0
C

0
C

0
C

0
C

0
C

0
C

0
C

0
C

0
C

jeu de mchante
score de mchante

D
5

D
5

D
5

D
5

D
5

D
5

D
5

D
5

D
5

D
5

score de per_CCD
jeu de per_CCD

3
C

3
C

5
D

0
C

0
C

1
D

0
C

0
C

1
D

0
C

jeu de rancunire
score de rancunire

C
3

C
3

C
0

D
5

D
5

D
1

D
5

D
5

D
1

D
5

50

13

33

Introduction a` la Theorie
des Jeux p.48/77

[DIP] Quelle est la meilleure stratgie ?


. qui batte toutes les autres :

Introduction a` la Theorie
des Jeux p.49/77

[DIP] Quelle est la meilleure stratgie ?


. qui batte toutes les autres :
mchante, car gnralisation du dilemme non itr

Introduction a` la Theorie
des Jeux p.49/77

[DIP] Quelle est la meilleure stratgie ?


. qui batte toutes les autres :
mchante, car gnralisation du dilemme non itr
. qui fasse le meilleur score possible face toutes les autres :

Introduction a` la Theorie
des Jeux p.49/77

[DIP] Quelle est la meilleure stratgie ?


. qui batte toutes les autres :
mchante, car gnralisation du dilemme non itr
. qui fasse le meilleur score possible face toutes les autres :
aucune, car meilleure contre mchante et contre rancunire est impossible

Introduction a` la Theorie
des Jeux p.49/77

[DIP] Quelle est la meilleure stratgie ?


. qui batte toutes les autres :
mchante, car gnralisation du dilemme non itr
. qui fasse le meilleur score possible face toutes les autres :
aucune, car meilleure contre mchante et contre rancunire est impossible
B Problme de dfinition du critre dvaluation des stratgies

Introduction a` la Theorie
des Jeux p.49/77

[DIP] Quelle est la meilleure stratgie ?


Sur des confrontations de 100 parties :
. Le gain maximal est de 500 points
. Le gain minimal est de 0 point

Cest ce quobtiennent M CHANTE et G ENTILLE lune contre lautre.

Introduction a` la Theorie
des Jeux p.50/77

[DIP] Quelle est la meilleure stratgie ?


Sur des confrontations de 100 parties :
. Le gain maximal est de 500 points
. Le gain minimal est de 0 point

Cest ce quobtiennent M CHANTE et G ENTILLE lune contre lautre.


Mais...
. 2 gentilles entre elles obtiennent chacune 300 points
. 2 mchantes entre elles obtiennent chacune 100 points
. Chaque stratgie est bonne (au sens du meilleur score) face certaines
et mauvaises face dautres car elle ne sait pas qui elle a affaire.

Introduction a` la Theorie
des Jeux p.50/77

[DIP] Les tournois


. Plusieurs stratgies se rencontrent 2 2, comme pour un tournoi sportif
. Le gain dune stratgie est le cumul de ses scores face chaque
adversaire
. Toutes les parties ont la mme longueur (mme nombre ditrations),
mais les stratgies ne la connaissent pas et ne peuvent pas le savoir

Introduction a` la Theorie
des Jeux p.51/77

[DIP] Exemples (tournoi)


gentille

mchante

per_CCD

rancunire

rancunire

30
0
21
30

50
10
38
14

36
3
24
13

30
9
33
30

Score

81

112

76

102

gentille
mchante
per_CCD

8
1
>
>
>
< 2
Classement
>
3
>
>
:
4

mchante
rancunire
gentille
per_CCD

Introduction a` la Theorie
des Jeux p.52/77

[DIP] Un tournoi
Tournois entre 10 stratgies parmi 12 :
. gentille

. rancunire

. majoritaire_mchante

. mchante

. per_DDC

. mfiante

. lunatique

. per_CCD

. sondeur

. donnant_donnant

. majoritaire_gentille

. donnant_donnant_dur

Nombre de tournois jous par chaque stratgie : 55


B Donnez le classement du tournoi...

Introduction a` la Theorie
des Jeux p.53/77

[DIP] Un tournoi
. gentille

. rancunire

. majoritaire_mchante

. mchante

. per_DDC

. mfiante

. lunatique

. per_CCD

. sondeur

. donnant_donnant

. majoritaire_gentille

. donnant_donnant_dur

donnant_donnant
majoritaire_gentille

Scores :

rancunire
sondeur
lunatique
mchante

:
:
:
:
:
:

42
19
4
1
0
0

Introduction a` la Theorie
des Jeux p.54/77

[DIP] donnant-donnant : une bonne stratgie


Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au
coup prcdent, je coopre (C), sil a trahi (D), je trahis (D).

Introduction a` la Theorie
des Jeux p.55/77

[DIP] donnant-donnant : une bonne stratgie


Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au
coup prcdent, je coopre (C), sil a trahi (D), je trahis (D).
. donnant-donnant ne gagne jamais contre personne !

Introduction a` la Theorie
des Jeux p.55/77

[DIP] donnant-donnant : une bonne stratgie


Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au
coup prcdent, je coopre (C), sil a trahi (D), je trahis (D).
. donnant-donnant ne gagne jamais contre personne !
. Au mieux elle fait le mme score.

Introduction a` la Theorie
des Jeux p.55/77

[DIP] donnant-donnant : une bonne stratgie


Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au
coup prcdent, je coopre (C), sil a trahi (D), je trahis (D).
. donnant-donnant ne gagne jamais contre personne !
. Au mieux elle fait le mme score.
. Mais, au pire elle ne perd que 5 points quel que soit ladversaire et la
longueur de la partie !

Introduction a` la Theorie
des Jeux p.55/77

[DIP] volution cologique


Simulation de lvolution naturelle :
. Chaque stratgie est reprsente par une population de N entits
. On effectue un tournoi entre toutes les entits
. Les entits de faibles stratgies (au sens du classement dans le
tournoi) sont dfavorises, celles stratgie forte sont favorises
. La favorisation est ralise par une redistribution proportionnelle de la
population

Ce cycle est rpt jusqu stabilisation de la population

Introduction a` la Theorie
des Jeux p.56/77

[DIP] Exemples (volution)


400
spiteful
all_c
all_d
per_ccd

350

300

250

200

150

100

50

10

12

14

16

18

20

Introduction a` la Theorie
des Jeux p.57/77

[DIP] Une morale trs morale...


Critres de qualit pour une stratgie (en volution) : [Axelrod,81]
. Gentillesse
. Ractivit
. Pardon
. Simplicit

Introduction a` la Theorie
des Jeux p.58/77

[DIP] Une morale trs morale...


Critres de qualit pour une stratgie (en volution) : [Axelrod,81]
. Gentillesse
. Ractivit
. Pardon
. Simplicit

Les bonnes stratgies au dilemme le sont aussi dans les variantes du


dilemme (asynchrone, avec renoncement, bruits, . . . )

Introduction a` la Theorie
des Jeux p.58/77

[DIP] Une morale trs morale...


Critres de qualit pour une stratgie (en volution) : [Axelrod,81]
. Gentillesse
. Ractivit
. Pardon
. Simplicit

Les bonnes stratgies au dilemme le sont aussi dans les variantes du


dilemme (asynchrone, avec renoncement, bruits, . . . )
Pour plus de dtails sur le dilemme itr des prisonniers :
http://www.lifl.fr/IPD

Introduction a` la Theorie
des Jeux p.58/77

Jeux rpts
. Soit un jeu G = {S, {i }i=1,...,n }, o S est lensemble (fini) des profils
de stratgies et i est la fonction dutilit du joueur i.
. On note (G, T ) le jeu rpt obtenu en jouant T fois le jeu de base G.
. Lorsque le jeu est rpt un nombre infini de fois, on note (G, ) le jeu
correspondant.

Introduction a` la Theorie
des Jeux p.59/77

Jeux rpts
. Soit un jeu G = {S, {i }i=1,...,n }, o S est lensemble (fini) des profils
de stratgies et i est la fonction dutilit du joueur i.
. On note (G, T ) le jeu rpt obtenu en jouant T fois le jeu de base G.
. Lorsque le jeu est rpt un nombre infini de fois, on note (G, ) le jeu
correspondant.
. On peut galement distinguer les jeux rpts un nombre fini, mais
indfini de fois: chaque tour, il y a une probabilit 1 q que le jeu
sarrte.

Introduction a` la Theorie
des Jeux p.59/77

Jeux rpts
. Soit un jeu G = {S, {i }i=1,...,n }, o S est lensemble (fini) des profils
de stratgies et i est la fonction dutilit du joueur i.
. On note (G, T ) le jeu rpt obtenu en jouant T fois le jeu de base G.
. Lorsque le jeu est rpt un nombre infini de fois, on note (G, ) le jeu
correspondant.
. On peut galement distinguer les jeux rpts un nombre fini, mais
indfini de fois: chaque tour, il y a une probabilit 1 q que le jeu
sarrte.
. Facteur dactualisation : Lorsquun jeu est rpt, il se peut que les
gains obtenus litration courante t soient plus/moins importants aux
yeux de lagent que les gains litration suivante t+1 . Pour modliser
cela on peut utiliser un facteur dactualisation .
t = t+1

Le facteur dactualisation = t /t+1 reprsente donc lattrait du joueur


pour les gains actuels.

Introduction a` la Theorie
des Jeux p.59/77

Jeux rpts: Thorme Folk


. Lutilit dun joueur dans un jeu rpt est donc:
i (G, T ) = Tt=0 t i (t)

Introduction a` la Theorie
des Jeux p.60/77

Jeux rpts: Thorme Folk


. Lutilit dun joueur dans un jeu rpt est donc:
i (G, T ) = Tt=0 t i (t)
. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T

Introduction a` la Theorie
des Jeux p.60/77

Jeux rpts: Thorme Folk


. Lutilit dun joueur dans un jeu rpt est donc:
i (G, T ) = Tt=0 t i (t)
. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T
. Si ti (t) = , alors i (G, ) =

Introduction a` la Theorie
des Jeux p.60/77

Jeux rpts: Thorme Folk


. Lutilit dun joueur dans un jeu rpt est donc:
i (G, T ) = Tt=0 t i (t)
. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T
. Si ti (t) = , alors i (G, ) =

. Thorme Folk: Soit un jeu rpt (G, ) avec un facteur


dactualisation suffisamment proche de 1 et = (1 , . . . , 2 ) un
vecteur de gains ralisable de ce jeu, alors il existe un quilibre de
Nash du jeu rpt qui donne comme vecteur de gains.

Introduction a` la Theorie
des Jeux p.60/77

Jeux rpts: Thorme Folk


. Lutilit dun joueur dans un jeu rpt est donc:
i (G, T ) = Tt=0 t i (t)
. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T
. Si ti (t) = , alors i (G, ) =

. Thorme Folk: Soit un jeu rpt (G, ) avec un facteur


dactualisation suffisamment proche de 1 et = (1 , . . . , 2 ) un
vecteur de gains ralisable de ce jeu, alors il existe un quilibre de
Nash du jeu rpt qui donne comme vecteur de gains.
. Lquilibre de Nash en question est un quilibre de Nash parfait en
sous-jeux (voir plus loin). Notion de menace crdible.

Introduction a` la Theorie
des Jeux p.60/77

Jeux rpts: Thorme Folk


. Lutilit dun joueur dans un jeu rpt est donc:
i (G, T ) = Tt=0 t i (t)
. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T
. Si ti (t) = , alors i (G, ) =

. Thorme Folk: Soit un jeu rpt (G, ) avec un facteur


dactualisation suffisamment proche de 1 et = (1 , . . . , 2 ) un
vecteur de gains ralisable de ce jeu, alors il existe un quilibre de
Nash du jeu rpt qui donne comme vecteur de gains.
. Lquilibre de Nash en question est un quilibre de Nash parfait en
sous-jeux (voir plus loin). Notion de menace crdible.
. Ce rsultat signifie que lensemble des quilibres de Nash dun jeu
rpt est immense: quasiment toute squence (finie) de jeu correspond
un quilibre de Nash.

Introduction a` la Theorie
des Jeux p.60/77

Jeux deux joueurs Somme nulle


. Rle central
. le plus simple
. pas de notion de majorit
. pas de coalition

Introduction a` la Theorie
des Jeux p.61/77

Jeux deux joueurs Somme nulle


. Rle central
. le plus simple
. pas de notion de majorit
. pas de coalition
. Strictement Comptitif
. Les joueurs ont des prfrences strictement opposes
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = a

Introduction a` la Theorie
des Jeux p.61/77

Jeux deux joueurs Somme nulle


. Rle central
. le plus simple
. pas de notion de majorit
. pas de coalition
. Strictement Comptitif
. Les joueurs ont des prfrences strictement opposes
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = 0

Introduction a` la Theorie
des Jeux p.61/77

Jeux deux joueurs Somme nulle


. Rle central
. le plus simple
. pas de notion de majorit
. pas de coalition
. Strictement Comptitif
. Les joueurs ont des prfrences strictement opposes
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = 0
. Exemples :
. Jeux de plateau (echecs, dames, . . .)
. Guerre
. ...

Introduction a` la Theorie
des Jeux p.61/77

Jeux deux joueurs somme nulle - Exemple


Joueur 2

Joueur 1

x1
x2
x3
x4

y1
18,-18
0,0
5,-5
9,-9

y2
3,-3
3,-3
4,-4
3,-3

y3
0,0
8,-8
5,-5
0,0

y4
2,-2
20,-20
5,-5
20,-20

Introduction a` la Theorie
des Jeux p.62/77

Jeux deux joueurs somme nulle - Exemple


Joueur 2

Joueur 1

x1
x2
x3
x4

y1
18
0
5
9

y2
3
3
4
3

y3
0
8
5
0

y4
2
20
5
20

Introduction a` la Theorie
des Jeux p.62/77

Jeux deux joueurs somme nulle - Exemple


Joueur 2

Joueur 1

x1
x2
x3
x4

y1
18
0
5
9

y2
3
3
4
3

y3
0
8
5
0

y4
2
20
5
20

. Le joueur 1 tente de maximiser son niveau de scurit


. vx = maxi (minj (xi , yj ))
. Le joueur 2 tente de minimiser le niveau de scurit du joueur 1
. vy = minj (maxi (xi , yj ))

Introduction a` la Theorie
des Jeux p.62/77

Jeux deux joueurs somme nulle - Exemple


Joueur 2

Joueur 1

x1
x2
x3
x4

y1
18
0
5
9

y2
3
3
4
3

y3
0
8
5
0

y4
2
20
5
20

. Le joueur 1 tente de maximiser son niveau de scurit


. vx = maxi (minj (xi , yj ))
. Le joueur 2 tente de minimiser le niveau de scurit du joueur 1
. vy = minj (maxi (xi , yj ))
. Si vx = vy = v , alors tout couple de stratgies (xi , yi ), xi garantissant
v au joueur 1 et yi garantissant v au joueur 2 forment un quilibre de
Nash et sont des stratgies respectivement maximin et minimax pour
les joueurs 1 et 2.

Introduction a` la Theorie
des Jeux p.62/77

Jeux sous forme extensive

x
(3,0,0)
w
(4,2,4)

3
w

(3,2,9)

(1,0,3)
u

(3,2,2)

(2,3,1)

(5,5,5)

(2,3,1)

Introduction a` la Theorie
des Jeux p.63/77

Jeux sous forme extensive

x
(3,0,0)
w
(4,2,4)

3
w

(3,2,9)

(1,0,3)
u

(3,2,2)

(2,3,1)

(5,5,5)

(2,3,1)

. Rcurrence rebours (backward induction)


. On commence par chercher les choix optimaux la dernire
priode (noeuds terminaux).
. On remonte larbre de noeud en noeud, en cherchant chaque
noeud le choix optimal, une fois quon a pris en compte les choix
optimaux pour chaque noeud fils.

Introduction a` la Theorie
des Jeux p.63/77

Jeux sous forme extensive


Tout jeu (fini) sous forme extensive a` information parfaite a un

equilibre
de Nash en strategies
pures (equilibre
obtenable par

recurrence
a` rebours). (Zermelo (1953), Kuhn (1953))

Introduction a` la Theorie
des Jeux p.64/77

Forme extensive - Sous-jeu


1

(2,2)
u

(3,1)
w
(2,-2)

2
z
(-2,2)

w
(-2,2)

z
(2,-2)

Introduction a` la Theorie
des Jeux p.65/77

Forme extensive - Sous-jeu


1

(2,2)
u
(3,1)

v
1
(0,0)

Introduction a` la Theorie
des Jeux p.65/77

Forme extensive - Sous-jeu


1

(2,2)
u
(3,1)

v
1
(0,0)

Un sous-jeu dun jeu sous forme extensive est un jeu compos dun noeud
(qui est un ensemble dinformation singleton), de tous les noeuds successeurs
de ce noeud, de tous les arcs reliant ces noeuds, et des utilits associes
tous les noeuds terminaux successeurs.

Introduction a` la Theorie
des Jeux p.65/77

Forme extensive - Menaces non crdibles


1

Joueur 2
y

x
(2,2)

u
(3,1)

v
(0,0)

Joueur 1

x
y

u
2,2
3,1

v
2,2
0,0

Introduction a` la Theorie
des Jeux p.66/77

Forme extensive - Menaces non crdibles


1

Joueur 2
y

x
(2,2)

u
(3,1)

v
(0,0)

Joueur 1

x
y

u
2,2
3,1

v
2,2
0,0

. lquilibre de Nash xv nest pas crdible car il repose sur la menace


non-crdible du joueur 2 de jouer v .

Introduction a` la Theorie
des Jeux p.66/77

Equilibre parfait en sous-jeux

. Un quilibre de Nash dun jeu sous forme extensive est un equilibre


parfait en sous-jeux si toute restriction du profil de stratgies un sousjeu est un quilibre de Nash pour ce sous-jeu.

Introduction a` la Theorie
des Jeux p.67/77

Equilibre parfait en sous-jeux

. Un quilibre de Nash dun jeu sous forme extensive est un equilibre


parfait en sous-jeux si toute restriction du profil de stratgies un sousjeu est un quilibre de Nash pour ce sous-jeu.

. Pour les jeux informations parfaites, la notion dquilibre parfait en


sous-jeux concide avec la notion de rcurrence rebours.

Introduction a` la Theorie
des Jeux p.67/77

Promesse non crdible

Exploiter 2
Daccord pour travailler
2

(2,-1)

Ne pas exploiter 2

Pas daccord pour travailler

(1,1)

(0,0)

Introduction a` la Theorie
des Jeux p.68/77

Promesse non crdible

Exploiter 2
Daccord pour travailler
2

(2,-1)

Ne pas exploiter 2

Pas daccord pour travailler

(1,1)

(0,0)

. Rputation

Introduction a` la Theorie
des Jeux p.68/77

Le mille-pattes - Limites de la rcurrence rebours

D
(1,1)

d
(0,3)

1
...
D

(2,2)

D
(98,98)

d
(97,100)

D
(99,99)

(100,100)

(98,101)

Introduction a` la Theorie
des Jeux p.69/77

Limites de la rcurrence rebours


. Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur
1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si
le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut
accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.

Introduction a` la Theorie
des Jeux p.70/77

Limites de la rcurrence rebours


. Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur
1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si
le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut
accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.

. Ecrire ce jeu sous forme extensive en ne considrant que les partages


(5,5) et (8.5,1.5) pour 1 et le partage (0.5,0.5) pour 2.

Introduction a` la Theorie
des Jeux p.70/77

Jeux coopratifs 2 joueurs


. Dans les jeux coopratifs on autorise la communication et les accords
entre joueurs avant la partie.
. Tous les messages formuls par un joueur sont transmis sans
modification lautre joueur.
. Tous les accords entre joueurs seront respects.
. Lvaluation des situations par un joueur nest pas perturbe par les
ngociations prliminaires.
. Guerre des sexes

Introduction a` la Theorie
des Jeux p.71/77

Jeu de marchandage - Ensemble de ngociation

L ensemble de negociation
dun jeu de marchandage est lensemble des
issues :

. ralisables
. appartenant lespace de marchandage
. efficientes
. telles quaucune autre issue ne donne plus un joueur et autant
lautre (non pareto-domine)
. individuellement rationnelles
. chaque joueur gagne au moins autant que le gain quil est sur
dobtenir si il ny a pas daccord.

Introduction a` la Theorie
des Jeux p.72/77

Jeu de Marchandage - Solution de Nash


. Invariance a` lechelle

dutilite

Si [R1 , (u1 , v1 )] et [R2 , (u2 , v2 )] sont deux versions du mme jeu de


marchandage, ie si ils ne diffrent que sur les units et lorigine des
fonctions dutilits, alors les deux solutions F ([R1 , (u1 , v1 )]) et
F ([R2 , (u2 , v2 )]) doivent tre les mmes au changement dchelle prs.
. Pareto optimalite
La solution du jeu de marchandage (u0 , v0 ) doit satisfaire les proprits
suivantes :
. u0 u et v0 v
. (u0 , v0 ) est un point de R
. il ny a pas de (u, v) dans R (diffrent de (u0 , v0 )) tel que u u0 et
v v0 .

Introduction a` la Theorie
des Jeux p.73/77

Jeu de Marchandage - Solution de Nash


. Independance

des alternatives non disponibles


Soient deux jeux de marchandage avec le mme point de status quo et
tels que les issues du premier sont incluses dans les issues du second.
Si la solution du second jeu est ralisable dans le premier jeu, alors ce
doit tre aussi la solution du premier jeu :
. Si R1 R2 et F ([R2 , (u , v )]) R1 , alors
F ([R1 , (u , v )]) = F ([R2 , (u , v )])
. Symetrie

Si un jeu de marchandage a les proprits suivantes :


. u = v
. (u, v) R implique (v, u) R
. (u0 , v0 ) = F ([R, (u , v )])
Alors
u0 = v 0

Introduction a` la Theorie
des Jeux p.74/77

Jeu de Marchandage - Solution de Nash


Soit un jeu de marchandage [R, (u , v )], procdons comme suit :
. Changeons lorigine des utilits des joueurs pour que le point (u , v )
soit transform en (0, 0). Soit [R0 , (0, 0)] le jeu correspondant.
. Dans R0 trouver (lunique) point (u00 , v00 ) (u00 > 0 et v00 > 0) tel que u00 v00
est le maximum de tous les produits uv avec (u, v) dans R 0 (u > 0 et
v > 0).

Le point (u00 , v00 ) est la solution de Nash du jeu [R0 , (0, 0)]. La solution de
Nash de [R, (u , v )] est obtenu en inversant la transformation dutilit.

Introduction a` la Theorie
des Jeux p.75/77

Jeu de Marchandage - Solution de Nash


Soit un jeu de marchandage [R, (u , v )], procdons comme suit :
. Changeons lorigine des utilits des joueurs pour que le point (u , v )
soit transform en (0, 0). Soit [R0 , (0, 0)] le jeu correspondant.
. Dans R0 trouver (lunique) point (u00 , v00 ) (u00 > 0 et v00 > 0) tel que u00 v00
est le maximum de tous les produits uv avec (u, v) dans R 0 (u > 0 et
v > 0).

Le point (u00 , v00 ) est la solution de Nash du jeu [R0 , (0, 0)]. La solution de
Nash de [R, (u , v )] est obtenu en inversant la transformation dutilit.

es
desir
ees

Thorme. Lunique solution qui verifie


les 4 propriet
est la
solution de Nash. (Nash (1950))

Introduction a` la Theorie
des Jeux p.75/77

Jeux contre la nature


. Si on considre un jeu deux joueurs dont un des deux joueurs est la
nature, on fait de la dcision dans le risque ou dans lincertain.
. En ce sens la thorie de la dcision peut tre vue comme un cas particulier de la thorie des jeux.

Introduction a` la Theorie
des Jeux p.76/77

Conclusion
. Jeux coopratifs
. Jeux information incomplte
. Rationalit limite

Introduction a` la Theorie
des Jeux p.77/77

S-ar putea să vă placă și