Theorie Des Jeux

Introduction la Thorie des Jeux
Sebastien
Konieczny
konieczny@cril.univ-artois.fr
CRIL-CNRS
Universite dArtois - Lens
Introduction a` la Theorie
des Jeux p.1/77
Thorie des Jeux
`
Dfinition La theorie
des jeux permet une analyse formelle des problemes
par linteraction strategique
poses
dun groupe dagents rationnels poursuivant des buts qui leur sont propres.
des Jeux p.2/77
Thorie des Jeux
`
poses
. groupe
. interaction
. stratgique
. rationnels
des Jeux p.2/77
Thorie des Jeux
`
poses
. groupe
. interaction
. stratgique
. rationnels
Normatif vs Descriptif
des Jeux p.2/77
A quoi sert la thorie des jeux ?

. Jeux de socit (checs, dames, go, ...), Jeux de cartes (bridge, poker, ...)
. Dois-je travailler ou faire semblant ?
. Est-ce que jcoute de la musique ce soir ?
. Enchres, vote
. Comportement animal
. Stratgies militaires/conomiques
. Partages de ressource (marchandage)
. Est-ce quune entreprise doit exploiter ses salaris ?
. Est-ce quune entreprise doit entrer sur un march ou pas ?
. Faut-il contrler les dclarations dimpots sur le revenu ?
. ...
des Jeux p.3/77
Un peu dhistoire...
. Cournot (1838), Borel (1921)
. Zermelo (1913)
. Von Neumann (1928)
. Theory of Games and Economic Behaviour, Von Neumann et
Morgenstern (1944)
. Nash (1950)
. Selten (1965), Harsanyi (1967)
des Jeux p.4/77
Bibliographie
. M. Yildizoglu. Introduction a` la theorie

des jeux. Dunod. 2003.
. D. Kreps. Theorie
des jeux et modelisation
economique
. Dunod. 1990.
. D. Luce, H. Raiffa. Games and Decision. Wiley. 1957.

. P. K. Dutta. Strategies and Games. MIT Press. 1999.
. D. Fudenberg, J. Tirole. Game Theory. MIT Press. 1991.
. J. Von Neumann, O. Morgenstern. Theory of Game and Economic Behavior. Princeton University Press. 1944.
des Jeux p.5/77
Terminologie - Une petite taxonomie...

. Jeux somme nulle (strictement comptitifs) / Jeux somme non-nulle
. Jeux information complte / Jeux information incomplte
. Jeux information parfaite / Jeux information imparfaite
. Jeux coopratifs / Jeux non-coopratifs
. Jeux 2 joueurs / Jeux n joueurs
des Jeux p.6/77
Plan du cours
. Introduction - Formalisation dun jeu - Jeu sous forme normale - Jeu
sous forme extensive - Stratgie
. Concepts de solution - Stratgies dominantes
. Equilibre de Nash - Critre de Pareto - Niveau de scurit - Stratgies
mixtes
. Rsolution par chainage arrire - Menaces crdibles - Equilibres
parfaits en sous-jeux
. Jeux somme nulle
. Jeux rpts - Dilemme itr du prisonnier
. Jeux information incomplte
. Jeux coopratifs - Marchandage
des Jeux p.7/77
Formalisation dun Jeu

Quest-ce quun jeu ?
. Qui? Joueurs
. Quoi? Coups (actions/choix) - Stratgies
. Quand? Droulement du jeu
. Combien? Que rapporte chaque issue aux diffrents joueurs ?
Autres informations importantes:

. Information
. Rptition
des Jeux p.8/77
Jeux sous forme stratgique - Exemple

Joueur 2
Joueur 1
x
y
u
4,2
2,5
v
3,1
9,0
des Jeux p.9/77
Utilit
. Une hypothse de base de la thorie des jeux est de considrer que les
agents sont rationnels, cest--dire quils tentent darriver la situation
la meilleure pour eux.
. On appelle Utilite la mesure de chaque situation aux yeux de lagent.
. L Utilite nest ni une mesure du gain matriel, montaire, etc. mais une
mesure subjective du contentement de lagent.
des Jeux p.10/77
Utilit
. Une hypothse de base de la thorie des jeux est de considrer que les
agents sont rationnels, cest--dire quils tentent darriver la situation
la meilleure pour eux.
. On appelle Utilite la mesure de chaque situation aux yeux de lagent.
. L Utilite nest ni une mesure du gain matriel, montaire, etc. mais une
mesure subjective du contentement de lagent.
. Utiliser une fonction dutilit pour dfinir les prfrences de lagent ne
suppose pas que lagent utilise cette fonction, mais quil raisonne conformment un ensemble de conditions de rationalit. Von Neuman et
Morgenstern (1944), Savage (1954).
des Jeux p.10/77
Jeux sous forme stratgique

Un jeu sous forme stratgique est dfini par :
. un ensemble N = {1, . . . , n} de joueurs
. pour chaque joueur i un ensemble de stratgies Si = {s1 , . . . , sni }
. pour chaque joueur i une fonction de valuation i : S1 . . . Sn IR,
qui chaque ensemble de stratgies associe les gains du joueur i.
Notations :
. On notera s un profil de stratgies {s1 , . . . , sn } o i si Si .
. On note si le profil s des stratgies autres que celles du joueur i :
si = {s1 , . . . , si1 , si+1 , . . . , sn }.
. On note S lespace des stratgies, ie : S = n
i=1 Si
des Jeux p.11/77
Jeux sous forme extensive - Exemple

x
s 2
(4,2)
t
(3,1)
y
u
(2,5)
v
(9,0)
des Jeux p.12/77
Jeux sous forme extensive

Un jeu sous forme extensive est dfini par :
. un ensemble N = {1, . . . , n} de joueurs
. un arbre fini compos de :
. un ensemble de noeuds {A, B, C, . . .} reprsentant les coups
. un ensemble de branches {x, y, z, . . .} reprsentant les alternatives
chaque coup
. une fonction de nommage qui indique chaque noeud quel est le
joueur qui doit jouer
. une fonction de valuation qui associe chaque noeud terminal un
vecteur de nombres reprsentant les gains de chacun des joueurs
. une partition des noeuds en un ensemble densembles dinformations
reprsentant les croyances (imparfaites) des joueurs
des Jeux p.13/77
Jeux sous forme extensive - Ensemble dinformations

Joueur 1
x
s B
(4,2)
t
(3,1)
Joueur 2
u
(2,5)
C v
(9,0)
des Jeux p.14/77
x
s B
(4,2)
t
(3,1)
y
u
(2,5)
C v
(9,0)
des Jeux p.14/77
x
u B
(4,2)
v
(3,1)
y
u
(2,5)
C v
(9,0)
des Jeux p.14/77
x
u B
(4,2)
v
(3,1)
y
u
(2,5)
C v
(9,0)
. Ensembles dinformation : {A} et {B, C}

. Coups simultans
. Incertitude (croyances)
des Jeux p.14/77
Relation entre formes stratgique et extensive

. A chaque jeu sous forme extensive correspond un jeu sous forme
stratgique dans lequel les joueurs choisissent simultanment les
stratgies quils mettront en oeuvre.
. En revanche, un jeu sous forme stratgique peut correspondre
plusieurs jeux sous forme extensive diffrents.
des Jeux p.15/77

. A chaque jeu sous forme extensive correspond un jeu sous forme
stratgique dans lequel les joueurs choisissent simultanment les
stratgies quils mettront en oeuvre.
. En revanche, un jeu sous forme stratgique peut correspondre
plusieurs jeux sous forme extensive diffrents.
. Une stratgie est la spcification complte du comportement dun
joueur dans nimporte quelle situation (dans un jeu sous forme
extensive cela signifie donc pour chaque ensemble dinformation o
cest ce joueur de jouer).
. Algorithme
des Jeux p.15/77
Stratgie
. Une strategie
pure du joueur i est un plan daction qui prescrit une
action de ce joueur pour chaque fois quil est susceptible de jouer. On
note par Si lensemble des stratgies pures du joueur i et par si une
stratgie pure de ce joueur.
des Jeux p.16/77

Joueur 2
Forme stratgique :
Joueur 1
x
y
u
4,2
2,5
v
3,1
9,0
des Jeux p.17/77

Joueur 2
u
4,2
2,5
Forme stratgique :
Joueur 1
x
y
x
Forme extensive :
u B
(4,2)
v
(3,1)
v
3,1
9,0
A
y
u
(2,5)
C v
(9,0)
des Jeux p.18/77

Joueur 2
s1
4,2
2,5
Forme stratgique :
Joueur 1
x
y
x
Forme extensive :
u B
(4,2)
v
(3,1)
s1: u si x, u si y
s3: v si x, u si y
s2
4,2
9,0
A
s3
3,1
2,5
s4
3,1
9,0
y
u
(2,5)
C v
(9,0)
s2: u si x, v si y
s4: v si x, v si y
des Jeux p.19/77
Elimination de stratgies domines

Joueur 2
Joueur 1
x
y
u
4,2
2,5
v
3,1
9,0
des Jeux p.20/77

Joueur 2
Joueur 1
x
y
u
4,2
2,5
v
3,1
9,0
des Jeux p.20/77

Joueur 2
Joueur 1
x
y
u
4,2
2,5
v
3,1
9,0
des Jeux p.20/77

Joueur 2
Joueur 1
x
y
u
4,2
2,5
v
3,1
9,0
. Une stratgie si est (strictement) domine pour le joueur i si il existe

une stratgie si 0 telle que pour tous les profils si
i (si 0 , si ) > i (si , si )
des Jeux p.20/77

Joueur 2
Joueur 1
x
y
u
4,2
2,5
v
3,1
9,0
. Une stratgie si est faiblement domine pour le joueur i si il existe une

stratgie si 0 telle que pour tous les profils si
i (si 0 , si ) i (si , si )
des Jeux p.20/77

Joueur 2
Joueur 1
x
y
z
u
3,6
5,1
6,0
v
7,1
8,2
6,2
w
4,8
6,1
3,2
des Jeux p.21/77

Joueur 2
Joueur 1
x
y
z
u
3,6
5,1
6,0
v
7,1
8,2
6,2
w
4,8
6,1
3,2
des Jeux p.21/77

Joueur 2
Joueur 1
x
y
z
u
3,6
5,1
6,0
v
7,1
8,2
6,2
w
4,8
6,1
3,2
des Jeux p.21/77

Joueur 2
Joueur 1
x
y
z
u
3,6
5,1
6,0
v
7,1
8,2
6,2
w
4,8
6,1
3,2
des Jeux p.21/77

Joueur 2
Joueur 1
x
y
z
u
3,6
5,1
6,0
v
7,1
8,2
6,2
w
4,8
6,1
3,3
des Jeux p.21/77

. Un jeu est dit rsolvable par limination itrative des stratgies
domines, si on obtient un unique profil en liminant successivement
des stratgies (strictement) domines.
. Les profils obtenus aprs limination itrative des stratgies
(strictement) domines (EISD) ne dpendent pas de lordre choisi pour
llimination des stratgies.
. Par contre, on peut obtenir des profils diffrents lorsque lon choisit des
ordres diffrents pour llimination itrative de stratgies faiblement
domines (EISfD).
. Les rsultats obtenus par EISD sont donc plus robustes que ceux
obtenus par EISfD.
. Problme majeur de cette mthode: tous les jeux ne sont pas rsolvable
par EISD !
des Jeux p.22/77
Equilibre de Nash
Joueur 2
Joueur 1
x
y
z
u
3,0
2,0
0,3
v
0,2
1,1
0,2
w
0,3
2,0
3,0
des Jeux p.23/77
Equilibre de Nash
Joueur 2
Joueur 1
x
y
z
u
3,0
2,0
0,3
v
0,2
1,1
0,2
w
0,3
2,0
3,0
des Jeux p.23/77
Equilibre de Nash
Joueur 2
Joueur 1
x
y
z
u
3,0
2,0
0,3
v
0,2
1,1
0,2
w
0,3
2,0
3,0
des Jeux p.23/77
Equilibre de Nash
Joueur 2
Joueur 1
x
y
z
u
3,0
2,0
0,3
v
0,2
1,1
0,2
w
0,3
2,0
3,0
des Jeux p.23/77
Equilibre de Nash
Joueur 2
Joueur 1
x
y
z
u
3,0
2,0
0,3
v
0,2
1,1
0,2
w
0,3
2,0
3,0
des Jeux p.23/77
Equilibre de Nash
Joueur 2
Joueur 1
x
y
z
u
3,0
2,0
0,3
v
0,2
1,1
0,2
w
0,3
2,0
3,0
des Jeux p.23/77
Equilibre de Nash
Joueur 2
Joueur 1
x
y
z
u
3,0
2,0
0,3
v
0,2
1,1
0,2
w
0,3
2,0
3,0
des Jeux p.23/77
Equilibre de Nash
Joueur 2
Joueur 1
x
y
z
u
3,0
2,0
0,3
v
0,2
1,1
0,2
w
0,3
2,0
3,0
de Nash est une situation telle quaucun joueur

. La notion dequilibre
na intrt dvier (seul) de la situation obtenue.
de Nash est un profil de stratgies s = {s1 , . . . , sn } tel

. Un equilibre
que pour tout joueur i, pour toute stratgie s0 Si :
i (s1 , si ) i (s0 , si )
des Jeux p.23/77
Equilibre de Nash et fonction de meilleure rponse

. La fonction de meilleure rponse du joueur i est la fonction B i qui
associe chaque combinaison de stratgies des autres joueurs s i les
stratgies du joueur i qui maximise son utilit:
Bi (si ) = {si Si t.q. i (si , si ) i (s0i , si ) pour tout s0i Si }
des Jeux p.24/77
Equilibre de Nash et fonction de meilleure rponse

. La fonction de meilleure rponse du joueur i est la fonction B i qui
associe chaque combinaison de stratgies des autres joueurs s i les
stratgies du joueur i qui maximise son utilit:
Bi (si ) = {si Si t.q. i (si , si ) i (s0i , si ) pour tout s0i Si }
. Un quilibre de Nash est un profil s tel que la stratgie du joueur i est
une meilleure rponse:
si Bi (si ) pour tout i N
des Jeux p.24/77
Equilibre de Nash: Proprits

. Un profil (unique) obtenu par limination itrative de stratgies
(strictement) domines (EISD) est un quilibre de Nash (et cest le seul
quilibre du jeu).
des Jeux p.25/77

quilibre du jeu).
. Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash,
mais il peut aussi nen avoir aucun !
des Jeux p.25/77

quilibre du jeu).
. Question: comment choisir un quilibre particulier lorsquil y en a
plusieurs ?
des Jeux p.25/77

quilibre du jeu).
plusieurs ?
0
. Deux quilibres de Nash s = (si , si ) et s0 = (s0
i , si ) sont
0
interchangeables si pour tout i (si , s0
i ) et (si , si ) sont aussi des
quilibres de Nash.
des Jeux p.25/77

quilibre du jeu).
plusieurs ?
0
. Deux quilibres de Nash s = (si , si ) et s0 = (s0
i , si ) sont
0
interchangeables si pour tout i (si , s0
i ) et (si , si ) sont aussi des
quilibres de Nash.
. Deux quilibres de Nash s et s0 sont quivalents si ils donnent la mme

utilit tous les joueurs, i.e. pour tout i N i (s ) = i (s0 ).
des Jeux p.25/77
Critre de Pareto
Joueur 2
Joueur 1
x
y
u
4,4
2,3
v
3,1
7,5
des Jeux p.26/77
Critre de Pareto
Joueur 2
Joueur 1
x
y
u
4,4
2,3
v
3,1
7,5
. Un profil s domine un profil s0 au sens de Pareto si il est au moins aussi

bon pour tous les joueurs et si s est strictement meilleur pour au moins
lun dentre eux, i.e. pour tout si s et s0i s0 on a si s0i et il existe
sj s et s0j s0 tel que sj > s0j .
des Jeux p.26/77
Critre de Pareto
Joueur 2
Joueur 1
x
y
u
4,4
2,3
v
3,1
7,5
. Un profil s domine un profil s0 au sens de Pareto si il est au moins aussi

bon pour tous les joueurs et si s est strictement meilleur pour au moins
lun dentre eux, i.e. pour tout si s et s0i s0 on a si s0i et il existe
sj s et s0j s0 tel que sj > s0j .
. Un profil s domine strictement un profil s0 au sens de Pareto si s est
strictement meilleur pour tous les joueurs, i.e. pour tout s i s et s0i s0
on a si > s0i .
des Jeux p.26/77
Critre de Pareto vs niveau de scurit

Joueur 2
Joueur 1
x
y
u
9,9
8,0
v
0,8
7,7
des Jeux p.27/77
Critre de Pareto vs niveau de scurit

Joueur 2
Joueur 1
x
y
u
9,9
8,0
v
0,8
7,7
. On dfinit le niveau de securit

e dune strategie
si pour le joueur i
comme le gain minimum que peut apporter cette stratgie quel que soit
le choix des autres joueurs, soit
min i (si , si )
si
e dun joueur i comme le niveau de scu. On dfinit le niveau de securit

rit maximal des stratgies de i.
des Jeux p.27/77
Points focaux
. Le problme pos par la multiplicit dquilibres de Nash est un
problme de coordination.
. Pour certains jeux, certains quilibres semblent plus vidents que
dautres aux joueurs. Cela est du certaines conventions sociales. Ces
quilibres de Nash obtenus partir de ces conventions sont appels
points focaux.
des Jeux p.28/77
La guerre des sexes

Joueur 2
Joueur 1
f
c
f
2,1
0,0
c
0,0
1,2
des Jeux p.29/77
La guerre des sexes

Joueur 2
Joueur 1
f
c
f
2,1
0,0
c
0,0
1,2
. Sur cet exemple le niveau de scurit des deux joueurs est 0.
des Jeux p.29/77
La guerre des sexes

Joueur 2
Joueur 1
f
c
f
2,1
0,0
c
0,0
1,2

. Supposons que le joueur 1 joue alatoirement f et c avec une
probabilit de 1/2
1 (< (f, 1/2), (c, 1/2) >, f ) = 1/2 2 + 1/2 0 = 1
1 (< (f, 1/2), (c, 1/2) >, c) = 1/2 0 + 1/2 1 = 1/2
des Jeux p.29/77
La guerre des sexes

Joueur 2
Joueur 1
f
c
f
2,1
0,0
c
0,0
1,2

. Supposons que le joueur 1 joue alatoirement f et c avec une
probabilit de 1/2
1 (< (f, 1/2), (c, 1/2) >, f ) = 1/2 2 + 1/2 0 = 1
1 (< (f, 1/2), (c, 1/2) >, c) = 1/2 0 + 1/2 1 = 1/2
. Avec cette stratgie le niveau de scurit du joueur 1 est 1/2
des Jeux p.29/77
Stratgies pures - Stratgies mixtes

. Les stratgies que nous avons dfinies et utilises pour le moment sont
pures, cest--dire les options qui se prsentent aux

des strategies
joueurs.
. Une strategie
mixte i est une distribution de probabilit sur
lensemble des stratgies pures.
. Lensemble des stratgies mixtes dun joueur i se note i .

. Lensemble des stratgies pures utilises (i.e. dont la probabilit nest
pas nulle) par une stratgie mixte i est appel le support de la
stratgie mixte.
. Notons pi (sk ) la probabilit associe sk par i , lutilit dun profil de
stratgies mixtes est dfinie par :
n
X Y
i () =
(
pj (sj ))i (s)
sS j=1
des Jeux p.30/77
Stratgie
. Une strategie
des Jeux p.31/77
Stratgie
. Une strategie
. Une strategie
mixte du joueur i est une distribution de probabilits p i
dfinie sur lensemble des stratgies pures du joueur i. On note i
lensemble des stratgies mixtes du joueur i et par i une stratgie
mixte de ce joueur.
des Jeux p.31/77
Stratgie
. Une strategie
. Une strategie
mixte du joueur i est une distribution de probabilits p i
dfinie sur lensemble des stratgies pures du joueur i. On note i
lensemble des stratgies mixtes du joueur i et par i une stratgie
mixte de ce joueur.
. Une strategie
locale du joueur i en un ensemble dinformation A est
une distribution de probabilits sur lensemble des actions disponibles
en cet ensemble dinformation. On note iA lensemble des stratgies
locales du joueur i pour lensemble dinformation A et iA une stratgie
locale de ce joueur en A.
. Une strategie
comportementale du joueur i est un vecteur de stratgies locales de ce joueur, contenant une stratgie locale par ensemble
dinformation de ce joueur. On note i lensemble des stratgies comportementales du joueur i, et i une stratgie comportementale de ce
joueur.
des Jeux p.31/77
Equilibres de Nash en stratgies mixtes

Dfinition Un quilibre de Nash en stratgies mixtes est un profil de stratgies
mixtes tel que pour tout i et tout i i
i (i , i
) i (i , i
)
des Jeux p.32/77

i (i , i
) i (i , i
)
Thorme. est un quilibre de Nash si et seulement si pour tout i et tout

si S i
i (i , i
) i (si , i
)
des Jeux p.32/77

i (i , i
) i (i , i
)
Thorme. est un quilibre de Nash si et seulement si pour tout i et tout

si S i
i (i , i
) i (si , i
)
Thorme.[Nash, 1950] Tout jeu sous forme strategique

a un equilibre
de
Nash en strategies
mixtes.
des Jeux p.32/77
La guerre des sexes

Joueur 2
Joueur 1
f
c
f
2,1
0,0
c
0,0
1,2
x
1x
. Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x

maximise-t-il son niveau de scurit ?
des Jeux p.33/77
La guerre des sexes

Joueur 2
Joueur 1
f
c
f
2,1
0,0
c
0,0
1,2
x
1x

1 (< (f, x), (c, 1 x) >, f )
1 (< (f, x), (c, 1 x) >, c)
=
=
x 2 + (1 x) 0
x 0 + (1 x) 1
=
=
2x
1x
des Jeux p.33/77
La guerre des sexes

Joueur 2
Joueur 1
f
c
f
2,1
0,0
c
0,0
1,2
x
1x

1 (< (f, x), (c, 1 x) >, f )
1 (< (f, x), (c, 1 x) >, c)
=
=
x 2 + (1 x) 0
x 0 + (1 x) 1
=
=
2x
1x
max min(2x, 1 x) = 1/3

x
des Jeux p.33/77
La guerre des sexes

Joueur 2
Joueur 1
f
c
f
2,1
0,0
c
0,0
1,2
x
1x

1 (< (f, x), (c, 1 x) >, f )
1 (< (f, x), (c, 1 x) >, c)
=
=
x 2 + (1 x) 0
x 0 + (1 x) 1
=
=
2x
1x
max min(2x, 1 x) = 1/3

x
. Le niveau de scurit du joueur 1 est donc de 2/3.
des Jeux p.33/77
La guerre des sexes

Joueur 2
Joueur 1
f
c
f
2,1
0,0
c
0,0
1,2
x
1x

1 (< (f, x), (c, 1 x) >, f )
1 (< (f, x), (c, 1 x) >, c)
=
=
x 2 + (1 x) 0
x 0 + (1 x) 1
=
=
2x
1x
max min(2x, 1 x) = 1/3

x
. Le niveau de scurit du joueur 1 est donc de 2/3.

. Que se passe-t-il si le joueur 2 est averti que le joueur 1 va jouer cette
stratgie ?
des Jeux p.33/77
Reprsentation graphique du jeu
2x
1/3
2/3
des Jeux p.34/77
0
1/3
2/3
x
1x
des Jeux p.34/77
2x
0
1/3
2/3
x
1x
des Jeux p.34/77
La guerre des sexes

Joueur 2
y
1y
f
c
Joueur 1
f 2,1
0,0
c 0,0
1,2
Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure
rponse du joueur 1 ?
des Jeux p.35/77
La guerre des sexes

Joueur 2
y
1y
f
c
Joueur 1
f 2,1
0,0
c 0,0
1,2
1 (f, < (f, y), (c, 1 y) >) = y 2 + (1 y) 0 =
2y
1 (c, < (f, y), (c, 1 y) >) = y 0 + (1 y) 1 = 1 y
des Jeux p.35/77
La guerre des sexes

Joueur 2
y
1y
f
c
Joueur 1
f 2,1
0,0
c 0,0
1,2
1 (f, < (f, y), (c, 1 y) >) = y 2 + (1 y) 0 =
2y
1 (c, < (f, y), (c, 1 y) >) = y 0 + (1 y) 1 = 1 y
Donc:
. Si 2y > 1 y (y > 1/3), la meilleure rponse du joueur 1 est de jouer f
. Si 2y < 1 y (y < 1/3), la meilleure rponse du joueur 1 est de jouer c
. Si 2y = 1 y (y = 1/3), le joueur 1 est indiffrent entre f et c, il peut
donc jouer lune ou lautre, ou nimporte quelle combinaison des deux.
des Jeux p.35/77
La guerre des sexes

Joueur 2
y
1y
f
c
Joueur 1
f 2,1
0,0
x
c 0,0
1,2
1x
Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure
des Jeux p.36/77
La guerre des sexes

Joueur 2
y
1y
f
c
Joueur 1
f 2,1
0,0
x
c 0,0
1,2
1x
2 (< (f, x), (c, 1 x) >, f )
2 (< (f, x), (c, 1 x) >, c)
=
=
x 1 + (1 x) 0
x 0 + (1 x) 2
=
=
x
2(1 x)
des Jeux p.36/77
La guerre des sexes

Joueur 2
y
1y
f
c
Joueur 1
f 2,1
0,0
x
c 0,0
1,2
1x
2 (< (f, x), (c, 1 x) >, f ) = x 1 + (1 x) 0 =
x
2 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 2 = 2(1 x)
Donc:
. Si x > 2(1 x) (x > 2/3), la meilleure rponse du joueur 2 est de jouer f
. Si x < 2(1 x) (x < 2/3), la meilleure rponse du joueur 2 est de jouer c
. Si x = 2(1 x) (x = 2/3), le joueur 2 est indiffrent entre f et c, il peut
donc jouer lune ou lautre, ou nimporte quelle combinaison des deux.
des Jeux p.36/77
La guerre des sexes

Joueur 2
y
1y
f
c
Joueur 1
f 2,1
0,0
x
c 0,0
1,2
1x
Les gains des deux joueurs avec un profil en stratgie mixte sont donc:
1 ()
2 ()
=
=
=
=
x y 2 + x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 1
3xy x y + 1
x y 1 + x (1 y) 0 + (1 x) y 0 + (1 x) (1 y) 2
3xy 2x 2y + 2
des Jeux p.37/77
La guerre des sexes

Joueur 2
1/3 2/3
f
c
Joueur 1
f 2,1 0,0 2/3
c 0,0 1,2 1/3
1 () = 3xy x y + 1
2 () = 3xy 2x 2y + 2
Le profil = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un quilibre de Nash en stratgie mixte.
des Jeux p.37/77
La guerre des sexes

Joueur 2
1/3 2/3
f
c
Joueur 1
f 2,1 0,0 2/3
c 0,0 1,2 1/3
1 () = 3xy x y + 1
2 () = 3xy 2x 2y + 2
Le profil = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un quilibre de Nash en stratgie mixte.
Les gains des deux joueurs avec sont :
1 ( ) = 3.2/3.1/3 2/3 1/3 + 1
= 2/3
2 ( ) = 3.2/3.1/3 2.2/3 2.1/3 + 2
= 2/3
des Jeux p.37/77

y
2/3
1/3
joueur1
1/3
2/3
des Jeux p.38/77

y
joueur2
2/3
1/3
joueur1
1/3
2/3
des Jeux p.38/77

y
joueur2
2/3
joueur1
1/3
r
0
1/3
2/3
des Jeux p.38/77
Coopration - Itration - Corrlation

Joueur 2
Joueur 1
f
c
f
2,1
0,0
c
0,0
1,2
. Que se passe-t-il si les 2 joueurs peuvent communiquer avant de

jouer ?
des Jeux p.39/77

Joueur 2
Joueur 1
f
c
f
2,1
0,0
c
0,0
1,2

jouer ?
1 = 2 = 1/2 2 + 1/2 1 = 3/2
des Jeux p.39/77

Joueur 2
Joueur 1
f
c
f
2,1
0,0
c
0,0
1,2

jouer ?
1 = 2 = 1/2 2 + 1/2 1 = 3/2
Lorsque tous les joueurs peuvent observer un mme vnement

alatoire, ils peuvent alors saccorder sur des quilibres corrls
. Une stratgie corrle est une distribution de probabilits sur les
profils possibles.
des Jeux p.39/77

Joueur 2
Joueur 1
f
c
f
2,1
0,0
c
0,0
1,2

jouer ?
1 = 2 = 1/2 2 + 1/2 1 = 3/2
Lorsque tous les joueurs peuvent observer un mme vnement

alatoire, ils peuvent alors saccorder sur des quilibres corrls
. Une stratgie corrle est une distribution de probabilits sur les
profils possibles.
. Que se passe-t-il si la partie est joue plusieurs fois ?
des Jeux p.39/77
Itration: Le dilemme des prisonniers...

Deux personnes arrtes ensemble en possession darmes feu sont
souponns dun dlit fait en commun. Les policiers les sparent et disent
chacun :
. Si un des deux avoue et que lautre navoue rien, le premier est libr,
et le second emprisonn (5 ans);
. Si les deux avouent, les deux iront en prison (4 ans);
. Si aucun des deux navoue, les deux seront seront librs assez vite (2
ans).
B Vous tes un des deux prisonniers, que faites-vous ?
des Jeux p.40/77
[DIP] Le dilemme des prisonniers

Joueur 2
Joueur 1
C
D
C
3,3
5,0
D
0,5
1,1
des Jeux p.41/77
[DIP] Le dilemme itr...

Vous navez pas vraiment les mmes gots que votre voisin en matire de
musique. Il lui arrive souvent dcouter sa musique fond. De mme il
vous arrive (en reprsailles) de mettre votre musique un volume plus que
raisonnable. Ce qui a pour consquences que le lendemain il recommence
nouveau. En dehors de ces priodes agites, vous apprciez les priodes o
aucun de vous ne gne lautre.
Supposons que lon pondre votre satisfaction :
. Vous avez une satisfaction de 5 couter votre musique un volume
important.
. La satisfaction est de 0 lorsque votre voisin met sa musique fond.
. Une soire calme, sans musique vous apporte une satisfaction de 3.
. Le fait dcouter simultanment votre musique mle celle du voisin,
donne une satisfaction de 1.
B Vous savez ce que votre voisin a eu comme comportement les jours
prcdents, que faites-vous aujourdhui?
des Jeux p.42/77
[DIP] Le dilemme . . .
. Introduction par F LOOD et D RESHER la RAND Corp. en 1952
. Jeu somme non-nulle
. 2 joueurs jouent simultanment
. 2 choix de jeux :
. COOP ERER
, i.e. tre gentil, on notera C
. TRAHIR, i.e. tre mchant, on notera D
. Les gains des joueurs, nots S , P , R et T , sont fonction de leur choix
de jeu avec :
(0)
S<P <R<T
des Jeux p.43/77
[DIP] Le dilemme itr . . .

. Les joueurs se rencontrent plusieurs fois
. chaque itration les joueurs ont connaissance des coups prcdents
. Ils ne connaissent pas le terme du jeu
. Le gain dun joueur est le cumul de ses gains dans chaque rencontre
. Pour favoriser la coopration on ajoute la contrainte :
(0)
S + T < 2R
des Jeux p.44/77
[DIP] Dilemme itr des prisonniers (rsum)
Dilemme. . .
. . . itr
Cooperate
Defect
S<P <R<T
S + T < 2R
Cooperate
R=3
Reward
rcompense pour
coopration mutuelle
T =5
Temptation
tentation trahir
Defect
S=0
Suckers payoff
salaire de la dupe
P =1
Punishment
punition pour la trahison
mutuelle
Score du joueur de la ligne.
des Jeux p.45/77
[DIP] Des applications concrtes...

. Deux pays doivent-ils lever des taxes douanires sur les produits
imports de lautre pays.
. Deux entreprises concurrentes doivent-elles essayer de sentendre
pour se partag un march ou se faire concurrence ?
. Deux espces vivant sur un mme territoire doivent-elles cohabiter ou
se disputer la nourriture disponible ?
des Jeux p.46/77
[DIP] Les stratgies

Quelques exemples :
. gentille
. lunatique
. mchante
. majoritaire_gentille
. per_CCD
. majoritaire_mchante
. rancunire
. donnant_donnant
des Jeux p.47/77
[DIP] Exemples (rencontres)

1
10
score de gentille
jeu de gentille
0
C
0
C
0
C
0
C
0
C
0
C
0
C
0
C
0
C
0
C
jeu de mchante
score de mchante
D
5
D
5
D
5
D
5
D
5
D
5
D
5
D
5
D
5
D
5
score de per_CCD
jeu de per_CCD
3
C
3
C
5
D
0
C
0
C
1
D
0
C
0
C
1
D
0
C
jeu de rancunire
score de rancunire
C
3
C
3
C
0
D
5
D
5
D
1
D
5
D
5
D
1
D
5
50
13
33
des Jeux p.48/77
[DIP] Quelle est la meilleure stratgie ?

. qui batte toutes les autres :
des Jeux p.49/77

mchante, car gnralisation du dilemme non itr
des Jeux p.49/77

. qui fasse le meilleur score possible face toutes les autres :
des Jeux p.49/77

aucune, car meilleure contre mchante et contre rancunire est impossible
des Jeux p.49/77

aucune, car meilleure contre mchante et contre rancunire est impossible
B Problme de dfinition du critre dvaluation des stratgies
des Jeux p.49/77

Sur des confrontations de 100 parties :
. Le gain maximal est de 500 points
. Le gain minimal est de 0 point
Cest ce quobtiennent M CHANTE et G ENTILLE lune contre lautre.
des Jeux p.50/77

Sur des confrontations de 100 parties :
. Le gain maximal est de 500 points
. Le gain minimal est de 0 point
Cest ce quobtiennent M CHANTE et G ENTILLE lune contre lautre.

Mais...
. 2 gentilles entre elles obtiennent chacune 300 points
. 2 mchantes entre elles obtiennent chacune 100 points
. Chaque stratgie est bonne (au sens du meilleur score) face certaines
et mauvaises face dautres car elle ne sait pas qui elle a affaire.
des Jeux p.50/77
[DIP] Les tournois

. Plusieurs stratgies se rencontrent 2 2, comme pour un tournoi sportif
. Le gain dune stratgie est le cumul de ses scores face chaque
adversaire
. Toutes les parties ont la mme longueur (mme nombre ditrations),
mais les stratgies ne la connaissent pas et ne peuvent pas le savoir
des Jeux p.51/77
[DIP] Exemples (tournoi)

gentille
mchante
per_CCD
rancunire
rancunire
30
0
21
30
50
10
38
14
36
3
24
13
30
9
33
30
Score
81
112
76
102
gentille
mchante
per_CCD
8
1
>
>
>
< 2
Classement
>
3
>
>
:
4
mchante
rancunire
gentille
per_CCD
des Jeux p.52/77
[DIP] Un tournoi
Tournois entre 10 stratgies parmi 12 :
. gentille
. rancunire
. mchante
. per_DDC
. mfiante
. lunatique
. per_CCD
. sondeur
. donnant_donnant
. donnant_donnant_dur
Nombre de tournois jous par chaque stratgie : 55

B Donnez le classement du tournoi...
des Jeux p.53/77
[DIP] Un tournoi
. gentille
. rancunire
. mchante
. per_DDC
. mfiante
. lunatique
. per_CCD
. sondeur
. donnant_donnant
. donnant_donnant_dur
donnant_donnant
majoritaire_gentille
Scores :
rancunire
sondeur
lunatique
mchante
:
:
:
:
:
:
42
19
4
1
0
0
des Jeux p.54/77
[DIP] donnant-donnant : une bonne stratgie

Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au
coup prcdent, je coopre (C), sil a trahi (D), je trahis (D).
des Jeux p.55/77

. donnant-donnant ne gagne jamais contre personne !
des Jeux p.55/77

. Au mieux elle fait le mme score.
des Jeux p.55/77

. Au mieux elle fait le mme score.
. Mais, au pire elle ne perd que 5 points quel que soit ladversaire et la
longueur de la partie !
des Jeux p.55/77
[DIP] volution cologique

Simulation de lvolution naturelle :
. Chaque stratgie est reprsente par une population de N entits
. On effectue un tournoi entre toutes les entits
. Les entits de faibles stratgies (au sens du classement dans le
tournoi) sont dfavorises, celles stratgie forte sont favorises
. La favorisation est ralise par une redistribution proportionnelle de la
population
Ce cycle est rpt jusqu stabilisation de la population
des Jeux p.56/77
[DIP] Exemples (volution)

400
spiteful
all_c
all_d
per_ccd
350
300
250
200
150
100
50
10
12
14
16
18
20
des Jeux p.57/77
[DIP] Une morale trs morale...

Critres de qualit pour une stratgie (en volution) : [Axelrod,81]
. Gentillesse
. Ractivit
. Pardon
. Simplicit
des Jeux p.58/77

. Gentillesse
. Ractivit
. Pardon
. Simplicit
Les bonnes stratgies au dilemme le sont aussi dans les variantes du

dilemme (asynchrone, avec renoncement, bruits, . . . )
des Jeux p.58/77

. Gentillesse
. Ractivit
. Pardon
. Simplicit
Les bonnes stratgies au dilemme le sont aussi dans les variantes du

dilemme (asynchrone, avec renoncement, bruits, . . . )
Pour plus de dtails sur le dilemme itr des prisonniers :
http://www.lifl.fr/IPD
des Jeux p.58/77
Jeux rpts
. Soit un jeu G = {S, {i }i=1,...,n }, o S est lensemble (fini) des profils
de stratgies et i est la fonction dutilit du joueur i.
. On note (G, T ) le jeu rpt obtenu en jouant T fois le jeu de base G.
. Lorsque le jeu est rpt un nombre infini de fois, on note (G, ) le jeu
correspondant.
des Jeux p.59/77
Jeux rpts
correspondant.
. On peut galement distinguer les jeux rpts un nombre fini, mais
indfini de fois: chaque tour, il y a une probabilit 1 q que le jeu
sarrte.
des Jeux p.59/77
Jeux rpts
correspondant.
. On peut galement distinguer les jeux rpts un nombre fini, mais
indfini de fois: chaque tour, il y a une probabilit 1 q que le jeu
sarrte.
. Facteur dactualisation : Lorsquun jeu est rpt, il se peut que les
gains obtenus litration courante t soient plus/moins importants aux
yeux de lagent que les gains litration suivante t+1 . Pour modliser
cela on peut utiliser un facteur dactualisation .
t = t+1
Le facteur dactualisation = t /t+1 reprsente donc lattrait du joueur

pour les gains actuels.
des Jeux p.59/77
Jeux rpts: Thorme Folk

. Lutilit dun joueur dans un jeu rpt est donc:
i (G, T ) = Tt=0 t i (t)
des Jeux p.60/77

i (G, T ) = Tt=0 t i (t)
. Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu
de base, on utilise la moyenne des gains du joueur: i (G, T )/T
des Jeux p.60/77

i (G, T ) = Tt=0 t i (t)
. Si ti (t) = , alors i (G, ) =
des Jeux p.60/77

i (G, T ) = Tt=0 t i (t)
. Si ti (t) = , alors i (G, ) =
. Thorme Folk: Soit un jeu rpt (G, ) avec un facteur

dactualisation suffisamment proche de 1 et = (1 , . . . , 2 ) un
vecteur de gains ralisable de ce jeu, alors il existe un quilibre de
Nash du jeu rpt qui donne comme vecteur de gains.
des Jeux p.60/77

i (G, T ) = Tt=0 t i (t)
. Si ti (t) = , alors i (G, ) =

. Lquilibre de Nash en question est un quilibre de Nash parfait en
sous-jeux (voir plus loin). Notion de menace crdible.
des Jeux p.60/77

i (G, T ) = Tt=0 t i (t)
. Si ti (t) = , alors i (G, ) =

. Lquilibre de Nash en question est un quilibre de Nash parfait en
sous-jeux (voir plus loin). Notion de menace crdible.
. Ce rsultat signifie que lensemble des quilibres de Nash dun jeu
rpt est immense: quasiment toute squence (finie) de jeu correspond
un quilibre de Nash.
des Jeux p.60/77
Jeux deux joueurs Somme nulle

. Rle central
. le plus simple
. pas de notion de majorit
. pas de coalition
des Jeux p.61/77

. Rle central
. le plus simple
. pas de coalition
. Strictement Comptitif
. Les joueurs ont des prfrences strictement opposes
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = a
des Jeux p.61/77

. Rle central
. le plus simple
. pas de coalition
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = 0
des Jeux p.61/77

. Rle central
. le plus simple
. pas de coalition
. Pour tout profil de stratgies s, on a 1 (s) + 2 (s) = 0
. Exemples :
. Jeux de plateau (echecs, dames, . . .)
. Guerre
. ...
des Jeux p.61/77
Jeux deux joueurs somme nulle - Exemple

Joueur 2
Joueur 1
x1
x2
x3
x4
y1
18,-18
0,0
5,-5
9,-9
y2
3,-3
3,-3
4,-4
3,-3
y3
0,0
8,-8
5,-5
0,0
y4
2,-2
20,-20
5,-5
20,-20
des Jeux p.62/77

Joueur 2
Joueur 1
x1
x2
x3
x4
y1
18
0
5
9
y2
3
3
4
3
y3
0
8
5
0
y4
2
20
5
20
des Jeux p.62/77

Joueur 2
Joueur 1
x1
x2
x3
x4
y1
18
0
5
9
y2
3
3
4
3
y3
0
8
5
0
y4
2
20
5
20
. Le joueur 1 tente de maximiser son niveau de scurit

. vx = maxi (minj (xi , yj ))
. Le joueur 2 tente de minimiser le niveau de scurit du joueur 1
. vy = minj (maxi (xi , yj ))
des Jeux p.62/77

Joueur 2
Joueur 1
x1
x2
x3
x4
y1
18
0
5
9
y2
3
3
4
3
y3
0
8
5
0
y4
2
20
5
20
. Le joueur 1 tente de maximiser son niveau de scurit

. vx = maxi (minj (xi , yj ))
. Le joueur 2 tente de minimiser le niveau de scurit du joueur 1
. vy = minj (maxi (xi , yj ))
. Si vx = vy = v , alors tout couple de stratgies (xi , yi ), xi garantissant
v au joueur 1 et yi garantissant v au joueur 2 forment un quilibre de
Nash et sont des stratgies respectivement maximin et minimax pour
les joueurs 1 et 2.
des Jeux p.62/77
x
(3,0,0)
w
(4,2,4)
3
w
(3,2,9)
(1,0,3)
u
(3,2,2)
(2,3,1)
(5,5,5)
(2,3,1)
des Jeux p.63/77
x
(3,0,0)
w
(4,2,4)
3
w
(3,2,9)
(1,0,3)
u
(3,2,2)
(2,3,1)
(5,5,5)
(2,3,1)
. Rcurrence rebours (backward induction)

. On commence par chercher les choix optimaux la dernire
priode (noeuds terminaux).
. On remonte larbre de noeud en noeud, en cherchant chaque
noeud le choix optimal, une fois quon a pris en compte les choix
optimaux pour chaque noeud fils.
des Jeux p.63/77

Tout jeu (fini) sous forme extensive a` information parfaite a un
equilibre
de Nash en strategies
pures (equilibre
obtenable par
recurrence
a` rebours). (Zermelo (1953), Kuhn (1953))
des Jeux p.64/77
Forme extensive - Sous-jeu

1
(2,2)
u
(3,1)
w
(2,-2)
2
z
(-2,2)
w
(-2,2)
z
(2,-2)
des Jeux p.65/77

1
(2,2)
u
(3,1)
v
1
(0,0)
des Jeux p.65/77

1
(2,2)
u
(3,1)
v
1
(0,0)
Un sous-jeu dun jeu sous forme extensive est un jeu compos dun noeud
(qui est un ensemble dinformation singleton), de tous les noeuds successeurs
de ce noeud, de tous les arcs reliant ces noeuds, et des utilits associes
tous les noeuds terminaux successeurs.
des Jeux p.65/77
Forme extensive - Menaces non crdibles

1
Joueur 2
y
x
(2,2)
u
(3,1)
v
(0,0)
Joueur 1
x
y
u
2,2
3,1
v
2,2
0,0
des Jeux p.66/77
Forme extensive - Menaces non crdibles

1
Joueur 2
y
x
(2,2)
u
(3,1)
v
(0,0)
Joueur 1
x
y
u
2,2
3,1
v
2,2
0,0
. lquilibre de Nash xv nest pas crdible car il repose sur la menace

non-crdible du joueur 2 de jouer v .
des Jeux p.66/77
Equilibre parfait en sous-jeux
. Un quilibre de Nash dun jeu sous forme extensive est un equilibre

parfait en sous-jeux si toute restriction du profil de stratgies un sousjeu est un quilibre de Nash pour ce sous-jeu.
des Jeux p.67/77
Equilibre parfait en sous-jeux
. Un quilibre de Nash dun jeu sous forme extensive est un equilibre

parfait en sous-jeux si toute restriction du profil de stratgies un sousjeu est un quilibre de Nash pour ce sous-jeu.
. Pour les jeux informations parfaites, la notion dquilibre parfait en

sous-jeux concide avec la notion de rcurrence rebours.
des Jeux p.67/77
Promesse non crdible
Exploiter 2
Daccord pour travailler
2
(2,-1)
Ne pas exploiter 2
Pas daccord pour travailler
(1,1)
(0,0)
des Jeux p.68/77
Promesse non crdible
Exploiter 2
Daccord pour travailler
2
(2,-1)
Ne pas exploiter 2
Pas daccord pour travailler
(1,1)
(0,0)
. Rputation
des Jeux p.68/77
Le mille-pattes - Limites de la rcurrence rebours
D
(1,1)
d
(0,3)
1
...
D
(2,2)
D
(98,98)
d
(97,100)
D
(99,99)
(100,100)
(98,101)
des Jeux p.69/77
Limites de la rcurrence rebours

. Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur
1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si
le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut
accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.
des Jeux p.70/77
Limites de la rcurrence rebours

. Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur
1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si
le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut
accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.
. Ecrire ce jeu sous forme extensive en ne considrant que les partages

(5,5) et (8.5,1.5) pour 1 et le partage (0.5,0.5) pour 2.
des Jeux p.70/77
Jeux coopratifs 2 joueurs

. Dans les jeux coopratifs on autorise la communication et les accords
entre joueurs avant la partie.
. Tous les messages formuls par un joueur sont transmis sans
modification lautre joueur.
. Tous les accords entre joueurs seront respects.
. Lvaluation des situations par un joueur nest pas perturbe par les
ngociations prliminaires.
. Guerre des sexes
des Jeux p.71/77
Jeu de marchandage - Ensemble de ngociation
L ensemble de negociation
dun jeu de marchandage est lensemble des
issues :
. ralisables
. appartenant lespace de marchandage
. efficientes
. telles quaucune autre issue ne donne plus un joueur et autant
lautre (non pareto-domine)
. individuellement rationnelles
. chaque joueur gagne au moins autant que le gain quil est sur
dobtenir si il ny a pas daccord.
des Jeux p.72/77
Jeu de Marchandage - Solution de Nash

. Invariance a` lechelle
dutilite
Si [R1 , (u1 , v1 )] et [R2 , (u2 , v2 )] sont deux versions du mme jeu de

marchandage, ie si ils ne diffrent que sur les units et lorigine des
fonctions dutilits, alors les deux solutions F ([R1 , (u1 , v1 )]) et
F ([R2 , (u2 , v2 )]) doivent tre les mmes au changement dchelle prs.
. Pareto optimalite
La solution du jeu de marchandage (u0 , v0 ) doit satisfaire les proprits
suivantes :
. u0 u et v0 v
. (u0 , v0 ) est un point de R
. il ny a pas de (u, v) dans R (diffrent de (u0 , v0 )) tel que u u0 et
v v0 .
des Jeux p.73/77

. Independance
des alternatives non disponibles

Soient deux jeux de marchandage avec le mme point de status quo et
tels que les issues du premier sont incluses dans les issues du second.
Si la solution du second jeu est ralisable dans le premier jeu, alors ce
doit tre aussi la solution du premier jeu :
. Si R1 R2 et F ([R2 , (u , v )]) R1 , alors
F ([R1 , (u , v )]) = F ([R2 , (u , v )])
. Symetrie
Si un jeu de marchandage a les proprits suivantes :

. u = v
. (u, v) R implique (v, u) R
. (u0 , v0 ) = F ([R, (u , v )])
Alors
u0 = v 0
des Jeux p.74/77

Soit un jeu de marchandage [R, (u , v )], procdons comme suit :
. Changeons lorigine des utilits des joueurs pour que le point (u , v )
soit transform en (0, 0). Soit [R0 , (0, 0)] le jeu correspondant.
. Dans R0 trouver (lunique) point (u00 , v00 ) (u00 > 0 et v00 > 0) tel que u00 v00
est le maximum de tous les produits uv avec (u, v) dans R 0 (u > 0 et
v > 0).
Le point (u00 , v00 ) est la solution de Nash du jeu [R0 , (0, 0)]. La solution de
Nash de [R, (u , v )] est obtenu en inversant la transformation dutilit.
des Jeux p.75/77

Soit un jeu de marchandage [R, (u , v )], procdons comme suit :
. Changeons lorigine des utilits des joueurs pour que le point (u , v )
soit transform en (0, 0). Soit [R0 , (0, 0)] le jeu correspondant.
. Dans R0 trouver (lunique) point (u00 , v00 ) (u00 > 0 et v00 > 0) tel que u00 v00
est le maximum de tous les produits uv avec (u, v) dans R 0 (u > 0 et
v > 0).
Le point (u00 , v00 ) est la solution de Nash du jeu [R0 , (0, 0)]. La solution de
Nash de [R, (u , v )] est obtenu en inversant la transformation dutilit.
es
desir
ees
Thorme. Lunique solution qui verifie

les 4 propriet
est la
solution de Nash. (Nash (1950))
des Jeux p.75/77
Jeux contre la nature

. Si on considre un jeu deux joueurs dont un des deux joueurs est la
nature, on fait de la dcision dans le risque ou dans lincertain.
. En ce sens la thorie de la dcision peut tre vue comme un cas particulier de la thorie des jeux.
des Jeux p.76/77
Conclusion
. Jeux coopratifs
. Jeux information incomplte
. Rationalit limite
des Jeux p.77/77

Theorie Des Jeux

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Theorie Des Jeux

Încărcat de

Drepturi de autor:

Formate disponibile

Introduction la Thorie des Jeux

Thorie des Jeux

Thorie des Jeux

Thorie des Jeux

A quoi sert la thorie des jeux ?

. M. Yildizoglu. Introduction a` la theorie

. D. Luce, H. Raiffa. Games and Decision. Wiley. 1957.

Terminologie - Une petite taxonomie...

Formalisation dun Jeu

Autres informations importantes:

Jeux sous forme stratgique - Exemple

Jeux sous forme stratgique

Jeux sous forme extensive - Exemple

Jeux sous forme extensive

Jeux sous forme extensive - Ensemble dinformations

Jeux sous forme extensive - Ensemble dinformations

Jeux sous forme extensive - Ensemble dinformations

Jeux sous forme extensive - Ensemble dinformations

. Ensembles dinformation : {A} et {B, C}

Relation entre formes stratgique et extensive

Relation entre formes stratgique et extensive

Relation entre formes stratgique et extensive

Relation entre formes stratgique et extensive

Relation entre formes stratgique et extensive

Elimination de stratgies domines

Elimination de stratgies domines

Elimination de stratgies domines

Elimination de stratgies domines

. Une stratgie si est (strictement) domine pour le joueur i si il existe

Elimination de stratgies domines

. Une stratgie si est faiblement domine pour le joueur i si il existe une

Elimination de stratgies domines

Elimination de stratgies domines

Elimination de stratgies domines

Elimination de stratgies domines

Elimination de stratgies domines

Elimination de stratgies domines

de Nash est une situation telle quaucun joueur

de Nash est un profil de stratgies s = {s1 , . . . , sn } tel

Equilibre de Nash et fonction de meilleure rponse

Equilibre de Nash et fonction de meilleure rponse

Equilibre de Nash: Proprits

Equilibre de Nash: Proprits

Equilibre de Nash: Proprits

Equilibre de Nash: Proprits

Equilibre de Nash: Proprits

. Deux quilibres de Nash s et s0 sont quivalents si ils donnent la mme

. Un profil s domine un profil s0 au sens de Pareto si il est au moins aussi

. Un profil s domine un profil s0 au sens de Pareto si il est au moins aussi

Critre de Pareto vs niveau de scurit

Critre de Pareto vs niveau de scurit

. On dfinit le niveau de securit

e dun joueur i comme le niveau de scu. On dfinit le niveau de securit

La guerre des sexes

La guerre des sexes

. Sur cet exemple le niveau de scurit des deux joueurs est 0.

La guerre des sexes

. Sur cet exemple le niveau de scurit des deux joueurs est 0.

La guerre des sexes

. Sur cet exemple le niveau de scurit des deux joueurs est 0.

Stratgies pures - Stratgies mixtes

pures, cest--dire les options qui se prsentent aux

. Lensemble des stratgies mixtes dun joueur i se note i .

Equilibres de Nash en stratgies mixtes