Sunteți pe pagina 1din 162

Introduction la Thorie des Jeux

Sebastien Konieczny
konieczny@cril.univ-artois.fr

CRIL-CNRS dArtois - Lens Universite

` la Theorie Introduction a des Jeux p.1/77

Thorie des Jeux


` Dnition La theorie des jeux permet une analyse formelle des problemes par linteraction strategique poses dun groupe dagents rationnels poursuivant des buts qui leur sont propres.

` la Theorie Introduction a des Jeux p.2/77

Thorie des Jeux


` Dnition La theorie des jeux permet une analyse formelle des problemes par linteraction strategique poses dun groupe dagents rationnels poursuivant des buts qui leur sont propres.

groupe interaction stratgique rationnels

` la Theorie Introduction a des Jeux p.2/77

Thorie des Jeux


` Dnition La theorie des jeux permet une analyse formelle des problemes par linteraction strategique poses dun groupe dagents rationnels poursuivant des buts qui leur sont propres.

groupe interaction stratgique rationnels Normatif vs Descriptif

` la Theorie Introduction a des Jeux p.2/77

A quoi sert la thorie des jeux ?


Jeux de socit (checs, dames, go, ...), Jeux de cartes (bridge, poker, ...) Dois-je travailler ou faire semblant ? Est-ce que jcoute de la musique ce soir ? Enchres, vote Comportement animal Stratgies militaires/conomiques Partages de ressource (marchandage) Est-ce quune entreprise doit exploiter ses salaris ? Est-ce quune entreprise doit entrer sur un march ou pas ? Faut-il contrler les dclarations dimpots sur le revenu ? ...

` la Theorie Introduction a des Jeux p.3/77

Un peu dhistoire...
Cournot (1838), Borel (1921) Zermelo (1913) Von Neumann (1928)
Theory of Games and Economic Behaviour, Von Neumann et Morgenstern (1944)

Nash (1950) Selten (1965), Harsanyi (1967)

` la Theorie Introduction a des Jeux p.4/77

Bibliographie
` la theorie M. Yildizoglu. Introduction a des jeux. Dunod. 2003. D. Kreps. Theorie des jeux et modelisation economique . Dunod. 1990.

D. Luce, H. Raiffa. Games and Decision. Wiley. 1957. P. K. Dutta. Strategies and Games. MIT Press. 1999. D. Fudenberg, J. Tirole. Game Theory. MIT Press. 1991. J. Von Neumann, O. Morgenstern. Theory of Game and Economic Behavior. Princeton University Press. 1944.

` la Theorie Introduction a des Jeux p.5/77

Terminologie - Une petite taxonomie...


Jeux somme nulle (strictement comptitifs) / Jeux somme non-nulle Jeux information complte / Jeux information incomplte Jeux information parfaite / Jeux information imparfaite Jeux coopratifs / Jeux non-coopratifs Jeux 2 joueurs / Jeux n joueurs

` la Theorie Introduction a des Jeux p.6/77

Plan du cours
Introduction - Formalisation dun jeu - Jeu sous forme normale - Jeu sous forme extensive - Stratgie Concepts de solution - Stratgies dominantes Equilibre de Nash - Critre de Pareto - Niveau de scurit - Stratgies mixtes Rsolution par chainage arrire - Menaces crdibles - Equilibres parfaits en sous-jeux Jeux somme nulle Jeux rpts - Dilemme itr du prisonnier Jeux information incomplte Jeux coopratifs - Marchandage

` la Theorie Introduction a des Jeux p.7/77

Formalisation dun Jeu


Quest-ce quun jeu ?
Qui? Joueurs Quoi? Coups (actions/choix) - Stratgies Quand? Droulement du jeu Combien? Que rapporte chaque issue aux diffrents joueurs ?

Autres informations importantes: Information Rptition

` la Theorie Introduction a des Jeux p.8/77

Jeux sous forme stratgique - Exemple


Joueur 2 u 4,2 2,5 v 3,1 9,0

Joueur 1

x y

` la Theorie Introduction a des Jeux p.9/77

Utilit
Une hypothse de base de la thorie des jeux est de considrer que les agents sont rationnels, cest--dire quils tentent darriver la situation la meilleure pour eux.
la mesure de chaque situation aux yeux de lagent. On appelle Utilite nest ni une mesure du gain matriel, montaire, etc. mais une L Utilite mesure subjective du contentement de lagent.

` la Theorie Introduction a des Jeux p.10/77

Utilit
Une hypothse de base de la thorie des jeux est de considrer que les agents sont rationnels, cest--dire quils tentent darriver la situation la meilleure pour eux.
la mesure de chaque situation aux yeux de lagent. On appelle Utilite nest ni une mesure du gain matriel, montaire, etc. mais une L Utilite mesure subjective du contentement de lagent.

Utiliser une fonction dutilit pour dnir les prfrences de lagent ne suppose pas que lagent utilise cette fonction, mais quil raisonne conformment un ensemble de conditions de rationalit. Von Neuman et Morgenstern (1944), Savage (1954).

` la Theorie Introduction a des Jeux p.10/77

Jeux sous forme stratgique


Un jeu sous forme stratgique est dni par : un ensemble N = {1, . . . , n} de joueurs pour chaque joueur i un ensemble de stratgies Si = {s1 , . . . , sni } pour chaque joueur i une fonction de valuation i : S1 . . . Sn IR, qui chaque ensemble de stratgies associe les gains du joueur i. Notations : On notera s un prol de stratgies {s1 , . . . , sn } o i si Si . On note si le prol s des stratgies autres que celles du joueur i : si = {s1 , . . . , si1 , si+1 , . . . , sn }. On note S lespace des stratgies, ie : S = n i=1 Si

` la Theorie Introduction a des Jeux p.11/77

Jeux sous forme extensive - Exemple


x s 2 (4,2) t (3,1)
1

y u (2,5)
2

v (9,0)

` la Theorie Introduction a des Jeux p.12/77

Jeux sous forme extensive


Un jeu sous forme extensive est dni par : un ensemble N = {1, . . . , n} de joueurs un arbre ni compos de : un ensemble de noeuds {A, B, C, . . .} reprsentant les coups un ensemble de branches {x, y, z, . . .} reprsentant les alternatives chaque coup une fonction de nommage qui indique chaque noeud quel est le joueur qui doit jouer une fonction de valuation qui associe chaque noeud terminal un vecteur de nombres reprsentant les gains de chacun des joueurs une partition des noeuds en un ensemble densembles dinformations reprsentant les croyances (imparfaites) des joueurs

` la Theorie Introduction a des Jeux p.13/77

Jeux sous forme extensive - Ensemble dinformations


Joueur 1 x s B (4,2) t (3,1)
A

y u (2,5)
C v

Joueur 2

(9,0)

` la Theorie Introduction a des Jeux p.14/77

Jeux sous forme extensive - Ensemble dinformations

x s B (4,2) t (3,1)

y u (2,5)
C v

(9,0)

` la Theorie Introduction a des Jeux p.14/77

Jeux sous forme extensive - Ensemble dinformations

x u B (4,2) v (3,1)

y u (2,5)
C v

(9,0)

` la Theorie Introduction a des Jeux p.14/77

Jeux sous forme extensive - Ensemble dinformations

x u B (4,2) v (3,1)

y u (2,5)
C v

(9,0)

Ensembles dinformation : {A} et {B, C } Coups simultans Incertitude (croyances)

` la Theorie Introduction a des Jeux p.14/77

Relation entre formes stratgique et extensive


A chaque jeu sous forme extensive correspond un jeu sous forme stratgique dans lequel les joueurs choisissent simultanment les stratgies quils mettront en oeuvre. En revanche, un jeu sous forme stratgique peut correspondre plusieurs jeux sous forme extensive diffrents.

` la Theorie Introduction a des Jeux p.15/77

Relation entre formes stratgique et extensive


A chaque jeu sous forme extensive correspond un jeu sous forme stratgique dans lequel les joueurs choisissent simultanment les stratgies quils mettront en oeuvre. En revanche, un jeu sous forme stratgique peut correspondre plusieurs jeux sous forme extensive diffrents. Une stratgie est la spcication complte du comportement dun joueur dans nimporte quelle situation (dans un jeu sous forme extensive cela signie donc pour chaque ensemble dinformation o cest ce joueur de jouer). Algorithme

` la Theorie Introduction a des Jeux p.15/77

Stratgie
Une strategie pure du joueur i est un plan daction qui prescrit une action de ce joueur pour chaque fois quil est susceptible de jouer. On note par Si lensemble des stratgies pures du joueur i et par si une stratgie pure de ce joueur.

` la Theorie Introduction a des Jeux p.16/77

Relation entre formes stratgique et extensive


Joueur 2 Forme stratgique : Joueur 1 x y u 4,2 2,5 v 3,1 9,0

` la Theorie Introduction a des Jeux p.17/77

Relation entre formes stratgique et extensive


Joueur 2 Forme stratgique : Joueur 1 x y x Forme extensive : (4,2) u B v (3,1) u 4,2 2,5 v 3,1 9,0
A

y u (2,5)
C v

(9,0)

` la Theorie Introduction a des Jeux p.18/77

Relation entre formes stratgique et extensive


Joueur 2 Forme stratgique : Joueur 1 x y x Forme extensive : (4,2) u B v (3,1) s1 4,2 2,5 s2 4,2 9,0
A

s3 3,1 2,5 y u (2,5)

s4 3,1 9,0

C v

(9,0)

s1: u si x, u si y s3: v si x, u si y

s2: u si x, v si y s4: v si x, v si y
` la Theorie Introduction a des Jeux p.19/77

Elimination de stratgies domines


Joueur 2 u 4,2 2,5 v 3,1 9,0

Joueur 1

x y

` la Theorie Introduction a des Jeux p.20/77

Elimination de stratgies domines


Joueur 2 u 4,2 2,5 v 3,1 9,0

Joueur 1

x y

` la Theorie Introduction a des Jeux p.20/77

Elimination de stratgies domines


Joueur 2 u 4,2 2,5 v 3,1 9,0

Joueur 1

x y

` la Theorie Introduction a des Jeux p.20/77

Elimination de stratgies domines


Joueur 2 u 4,2 2,5 v 3,1 9,0

Joueur 1

x y

Une stratgie si est (strictement) domine pour le joueur i si il existe une stratgie si telle que pour tous les prols si
i (si , si ) > i (si , si )

` la Theorie Introduction a des Jeux p.20/77

Elimination de stratgies domines


Joueur 2 u 4,2 2,5 v 3,1 9,0

Joueur 1

x y

Une stratgie si est faiblement domine pour le joueur i si il existe une stratgie si telle que pour tous les prols si
i (si , si ) i (si , si )

` la Theorie Introduction a des Jeux p.20/77

Elimination de stratgies domines


Joueur 2 u 3,6 5,1 6,0 v 7,1 8,2 6,2 w 4,8 6,1 3,2

Joueur 1

x y z

` la Theorie Introduction a des Jeux p.21/77

Elimination de stratgies domines


Joueur 2 u 3,6 5,1 6,0 v 7,1 8,2 6,2 w 4,8 6,1 3,2

Joueur 1

x y z

` la Theorie Introduction a des Jeux p.21/77

Elimination de stratgies domines


Joueur 2 u 3,6 5,1 6,0 v 7,1 8,2 6,2 w 4,8 6,1 3,2

Joueur 1

x y z

` la Theorie Introduction a des Jeux p.21/77

Elimination de stratgies domines


Joueur 2 u 3,6 5,1 6,0 v 7,1 8,2 6,2 w 4,8 6,1 3,2

Joueur 1

x y z

` la Theorie Introduction a des Jeux p.21/77

Elimination de stratgies domines


Joueur 2 u 3,6 5,1 6,0 v 7,1 8,2 6,2 w 4,8 6,1 3,3

Joueur 1

x y z

` la Theorie Introduction a des Jeux p.21/77

Elimination de stratgies domines


Un jeu est dit rsolvable par limination itrative des stratgies domines, si on obtient un unique prol en liminant successivement des stratgies (strictement) domines. Les prols obtenus aprs limination itrative des stratgies (strictement) domines (EISD) ne dpendent pas de lordre choisi pour llimination des stratgies. Par contre, on peut obtenir des prols diffrents lorsque lon choisit des ordres diffrents pour llimination itrative de stratgies faiblement domines (EISfD). Les rsultats obtenus par EISD sont donc plus robustes que ceux obtenus par EISfD. Problme majeur de cette mthode: tous les jeux ne sont pas rsolvable par EISD !

` la Theorie Introduction a des Jeux p.22/77

Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0

Joueur 1

x y z

` la Theorie Introduction a des Jeux p.23/77

Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0

Joueur 1

x y z

` la Theorie Introduction a des Jeux p.23/77

Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0

Joueur 1

x y z

` la Theorie Introduction a des Jeux p.23/77

Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0

Joueur 1

x y z

` la Theorie Introduction a des Jeux p.23/77

Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0

Joueur 1

x y z

` la Theorie Introduction a des Jeux p.23/77

Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0

Joueur 1

x y z

` la Theorie Introduction a des Jeux p.23/77

Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0

Joueur 1

x y z

` la Theorie Introduction a des Jeux p.23/77

Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0

Joueur 1

x y z

de Nash est une situation telle quaucun joueur La notion dequilibre na intrt dvier (seul) de la situation obtenue.
de Nash est un prol de stratgies s = {s Un equilibre 1 , . . . , sn } tel que pour tout joueur i, pour toute stratgie s Si : i (s 1 , si ) i (s , si )

` la Theorie Introduction a des Jeux p.23/77

Equilibre de Nash et fonction de meilleure rponse


La fonction de meilleure rponse du joueur i est la fonction B i qui associe chaque combinaison de stratgies des autres joueurs s i les stratgies du joueur i qui maximise son utilit:
Bi (si ) = {si Si t.q. i (si , si ) i (si , si ) pour tout si Si }

` la Theorie Introduction a des Jeux p.24/77

Equilibre de Nash et fonction de meilleure rponse


La fonction de meilleure rponse du joueur i est la fonction B i qui associe chaque combinaison de stratgies des autres joueurs s i les stratgies du joueur i qui maximise son utilit:
Bi (si ) = {si Si t.q. i (si , si ) i (si , si ) pour tout si Si }

Un quilibre de Nash est un prol s tel que la stratgie du joueur i est une meilleure rponse:
s i Bi (si ) pour tout i N

` la Theorie Introduction a des Jeux p.24/77

Equilibre de Nash: Proprits


Un prol (unique) obtenu par limination itrative de stratgies (strictement) domines (EISD) est un quilibre de Nash (et cest le seul quilibre du jeu).

` la Theorie Introduction a des Jeux p.25/77

Equilibre de Nash: Proprits


Un prol (unique) obtenu par limination itrative de stratgies (strictement) domines (EISD) est un quilibre de Nash (et cest le seul quilibre du jeu). Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash, mais il peut aussi nen avoir aucun !

` la Theorie Introduction a des Jeux p.25/77

Equilibre de Nash: Proprits


Un prol (unique) obtenu par limination itrative de stratgies (strictement) domines (EISD) est un quilibre de Nash (et cest le seul quilibre du jeu). Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash, mais il peut aussi nen avoir aucun ! Question: comment choisir un quilibre particulier lorsquil y en a plusieurs ?

` la Theorie Introduction a des Jeux p.25/77

Equilibre de Nash: Proprits


Un prol (unique) obtenu par limination itrative de stratgies (strictement) domines (EISD) est un quilibre de Nash (et cest le seul quilibre du jeu). Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash, mais il peut aussi nen avoir aucun ! Question: comment choisir un quilibre particulier lorsquil y en a plusieurs ?
Deux quilibres de Nash s = (s = (si , s i , si ) et s i ) sont interchangeables si pour tout i (s i , si ) et (si , si ) sont aussi des quilibres de Nash.

` la Theorie Introduction a des Jeux p.25/77

Equilibre de Nash: Proprits


Un prol (unique) obtenu par limination itrative de stratgies (strictement) domines (EISD) est un quilibre de Nash (et cest le seul quilibre du jeu). Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash, mais il peut aussi nen avoir aucun ! Question: comment choisir un quilibre particulier lorsquil y en a plusieurs ?
Deux quilibres de Nash s = (s = (si , s i , si ) et s i ) sont interchangeables si pour tout i (s i , si ) et (si , si ) sont aussi des quilibres de Nash.

Deux quilibres de Nash s et s sont quivalents si ils donnent la mme utilit tous les joueurs, i.e. pour tout i N i (s ) = i (s ).

` la Theorie Introduction a des Jeux p.25/77

Critre de Pareto
Joueur 2 u 4,4 2,3 v 3,1 7,5

Joueur 1

x y

` la Theorie Introduction a des Jeux p.26/77

Critre de Pareto
Joueur 2 u 4,4 2,3 v 3,1 7,5

Joueur 1

x y

Un prol s domine un prol s au sens de Pareto si il est au moins aussi bon pour tous les joueurs et si s est strictement meilleur pour au moins lun dentre eux, i.e. pour tout si s et si s on a si si et il existe sj s et sj s tel que sj > sj .

` la Theorie Introduction a des Jeux p.26/77

Critre de Pareto
Joueur 2 u 4,4 2,3 v 3,1 7,5

Joueur 1

x y

Un prol s domine un prol s au sens de Pareto si il est au moins aussi bon pour tous les joueurs et si s est strictement meilleur pour au moins lun dentre eux, i.e. pour tout si s et si s on a si si et il existe sj s et sj s tel que sj > sj . Un prol s domine strictement un prol s au sens de Pareto si s est strictement meilleur pour tous les joueurs, i.e. pour tout s i s et si s on a si > si .
` la Theorie Introduction a des Jeux p.26/77

Critre de Pareto vs niveau de scurit


Joueur 2 u 9,9 8,0 v 0,8 7,7

Joueur 1

x y

` la Theorie Introduction a des Jeux p.27/77

Critre de Pareto vs niveau de scurit


Joueur 2 u 9,9 8,0 v 0,8 7,7

Joueur 1

x y

dune strategie On dnit le niveau de securit e si pour le joueur i comme le gain minimum que peut apporter cette stratgie quel que soit le choix des autres joueurs, soit

min i (si , si )
si

dun joueur i comme le niveau de scuOn dnit le niveau de securit e rit maximal des stratgies de i.

` la Theorie Introduction a des Jeux p.27/77

Points focaux
Le problme pos par la multiplicit dquilibres de Nash est un problme de coordination. Pour certains jeux, certains quilibres semblent plus vidents que dautres aux joueurs. Cela est du certaines conventions sociales. Ces quilibres de Nash obtenus partir de ces conventions sont appels points focaux.

` la Theorie Introduction a des Jeux p.28/77

La guerre des sexes


Joueur 2 f 2,1 0,0 c 0,0 1,2

Joueur 1

f c

` la Theorie Introduction a des Jeux p.29/77

La guerre des sexes


Joueur 2 f 2,1 0,0 c 0,0 1,2

Joueur 1

f c

Sur cet exemple le niveau de scurit des deux joueurs est 0.

` la Theorie Introduction a des Jeux p.29/77

La guerre des sexes


Joueur 2 f 2,1 0,0 c 0,0 1,2

Joueur 1

f c

Sur cet exemple le niveau de scurit des deux joueurs est 0. Supposons que le joueur 1 joue alatoirement f et c avec une probabilit de 1/2
1 (< (f, 1/2), (c, 1/2) >, f ) = 1/2 2 + 1/2 0 = 1 1 (< (f, 1/2), (c, 1/2) >, c) = 1/2 0 + 1/2 1 = 1/2

` la Theorie Introduction a des Jeux p.29/77

La guerre des sexes


Joueur 2 f 2,1 0,0 c 0,0 1,2

Joueur 1

f c

Sur cet exemple le niveau de scurit des deux joueurs est 0. Supposons que le joueur 1 joue alatoirement f et c avec une probabilit de 1/2
1 (< (f, 1/2), (c, 1/2) >, f ) = 1/2 2 + 1/2 0 = 1 1 (< (f, 1/2), (c, 1/2) >, c) = 1/2 0 + 1/2 1 = 1/2

Avec cette stratgie le niveau de scurit du joueur 1 est 1/2


` la Theorie Introduction a des Jeux p.29/77

Stratgies pures - Stratgies mixtes


Les stratgies que nous avons dnies et utilises pour le moment sont pures, cest--dire les options qui se prsentent aux des strategies joueurs.
Une strategie mixte i est une distribution de probabilit sur lensemble des stratgies pures.

Lensemble des stratgies mixtes dun joueur i se note i . Lensemble des stratgies pures utilises (i.e. dont la probabilit nest pas nulle) par une stratgie mixte i est appel le support de la stratgie mixte. Notons pi (sk ) la probabilit associe sk par i , lutilit dun prol de stratgies mixtes est dnie par :
n X Y i ( ) = ( pj (sj ))i (s) sS j =1

` la Theorie Introduction a des Jeux p.30/77

Stratgie
Une strategie pure du joueur i est un plan daction qui prescrit une action de ce joueur pour chaque fois quil est susceptible de jouer. On note par Si lensemble des stratgies pures du joueur i et par si une stratgie pure de ce joueur.

` la Theorie Introduction a des Jeux p.31/77

Stratgie
Une strategie pure du joueur i est un plan daction qui prescrit une action de ce joueur pour chaque fois quil est susceptible de jouer. On note par Si lensemble des stratgies pures du joueur i et par si une stratgie pure de ce joueur. Une strategie mixte du joueur i est une distribution de probabilits p i dnie sur lensemble des stratgies pures du joueur i. On note i lensemble des stratgies mixtes du joueur i et par i une stratgie mixte de ce joueur.

` la Theorie Introduction a des Jeux p.31/77

Stratgie
Une strategie pure du joueur i est un plan daction qui prescrit une action de ce joueur pour chaque fois quil est susceptible de jouer. On note par Si lensemble des stratgies pures du joueur i et par si une stratgie pure de ce joueur. Une strategie mixte du joueur i est une distribution de probabilits p i dnie sur lensemble des stratgies pures du joueur i. On note i lensemble des stratgies mixtes du joueur i et par i une stratgie mixte de ce joueur. Une strategie locale du joueur i en un ensemble dinformation A est une distribution de probabilits sur lensemble des actions disponibles en cet ensemble dinformation. On note iA lensemble des stratgies locales du joueur i pour lensemble dinformation A et iA une stratgie locale de ce joueur en A. Une strategie comportementale du joueur i est un vecteur de stratgies locales de ce joueur, contenant une stratgie locale par ensemble dinformation de ce joueur. On note i lensemble des stratgies comportementales du joueur i, et i une stratgie comportementale de ce joueur.
` la Theorie Introduction a des Jeux p.31/77

Equilibres de Nash en stratgies mixtes


Dnition Un quilibre de Nash en stratgies mixtes est un prol de stratgies mixtes tel que pour tout i et tout i i
i (i , i ) i (i , i )

` la Theorie Introduction a des Jeux p.32/77

Equilibres de Nash en stratgies mixtes


Dnition Un quilibre de Nash en stratgies mixtes est un prol de stratgies mixtes tel que pour tout i et tout i i
i (i , i ) i (i , i )

Thorme. est un quilibre de Nash si et seulement si pour tout i et tout si S i i (i , i ) i (si , i )

` la Theorie Introduction a des Jeux p.32/77

Equilibres de Nash en stratgies mixtes


Dnition Un quilibre de Nash en stratgies mixtes est un prol de stratgies mixtes tel que pour tout i et tout i i
i (i , i ) i (i , i )

Thorme. est un quilibre de Nash si et seulement si pour tout i et tout si S i i (i , i ) i (si , i )


Thorme.[Nash, 1950] Tout jeu sous forme strategique a un equilibre de Nash en strategies mixtes.

` la Theorie Introduction a des Jeux p.32/77

La guerre des sexes


Joueur 2 f 2,1 0,0 c 0,0 1,2

Joueur 1

f c

x 1x

Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x maximise-t-il son niveau de scurit ?

` la Theorie Introduction a des Jeux p.33/77

La guerre des sexes


Joueur 2 f 2,1 0,0 c 0,0 1,2

Joueur 1

f c

x 1x

Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x maximise-t-il son niveau de scurit ?
1 (< (f, x), (c, 1 x) >, f ) 1 (< (f, x), (c, 1 x) >, c) = = x 2 + (1 x) 0 x 0 + (1 x) 1 = = 2x 1x

` la Theorie Introduction a des Jeux p.33/77

La guerre des sexes


Joueur 2 f 2,1 0,0 c 0,0 1,2

Joueur 1

f c

x 1x

Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x maximise-t-il son niveau de scurit ?
1 (< (f, x), (c, 1 x) >, f ) 1 (< (f, x), (c, 1 x) >, c) = = x 2 + (1 x) 0 x 0 + (1 x) 1 = = 2x 1x

max min(2x, 1 x) = 1/3


x

` la Theorie Introduction a des Jeux p.33/77

La guerre des sexes


Joueur 2 f 2,1 0,0 c 0,0 1,2

Joueur 1

f c

x 1x

Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x maximise-t-il son niveau de scurit ?
1 (< (f, x), (c, 1 x) >, f ) 1 (< (f, x), (c, 1 x) >, c) = = x 2 + (1 x) 0 x 0 + (1 x) 1 = = 2x 1x

max min(2x, 1 x) = 1/3


x

Le niveau de scurit du joueur 1 est donc de 2/3.

` la Theorie Introduction a des Jeux p.33/77

La guerre des sexes


Joueur 2 f 2,1 0,0 c 0,0 1,2

Joueur 1

f c

x 1x

Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x maximise-t-il son niveau de scurit ?
1 (< (f, x), (c, 1 x) >, f ) 1 (< (f, x), (c, 1 x) >, c) = = x 2 + (1 x) 0 x 0 + (1 x) 1 = = 2x 1x

max min(2x, 1 x) = 1/3


x

Le niveau de scurit du joueur 1 est donc de 2/3. Que se passe-t-il si le joueur 2 est averti que le joueur 1 va jouer cette stratgie ?
` la Theorie Introduction a des Jeux p.33/77

Reprsentation graphique du jeu

2x

0 1/3 2/3 1

x
` la Theorie Introduction a des Jeux p.34/77

Reprsentation graphique du jeu

0 1/3 2/3 1

x 1x
` la Theorie Introduction a des Jeux p.34/77

Reprsentation graphique du jeu

2x

0 1/3 2/3 1

x 1x
` la Theorie Introduction a des Jeux p.34/77

La guerre des sexes


Joueur 2
y 1y f c Joueur 1 f 2,1 0,0 c 0,0 1,2 Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure rponse du joueur 1 ?

` la Theorie Introduction a des Jeux p.35/77

La guerre des sexes


Joueur 2
y 1y f c Joueur 1 f 2,1 0,0 c 0,0 1,2 Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure rponse du joueur 1 ? 1 (f, < (f, y ), (c, 1 y ) >) = y 2 + (1 y ) 0 = 2y 1 (c, < (f, y ), (c, 1 y ) >) = y 0 + (1 y ) 1 = 1 y

` la Theorie Introduction a des Jeux p.35/77

La guerre des sexes


Joueur 2
y 1y f c Joueur 1 f 2,1 0,0 c 0,0 1,2 Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure rponse du joueur 1 ? 1 (f, < (f, y ), (c, 1 y ) >) = y 2 + (1 y ) 0 = 2y 1 (c, < (f, y ), (c, 1 y ) >) = y 0 + (1 y ) 1 = 1 y Donc:

Si 2y > 1 y (y > 1/3), la meilleure rponse du joueur 1 est de jouer f Si 2y < 1 y (y < 1/3), la meilleure rponse du joueur 1 est de jouer c Si 2y = 1 y (y = 1/3), le joueur 1 est indiffrent entre f et c, il peut donc jouer lune ou lautre, ou nimporte quelle combinaison des deux.

` la Theorie Introduction a des Jeux p.35/77

La guerre des sexes


Joueur 2
y 1y f c Joueur 1 f 2,1 0,0 x c 0,0 1,2 1x Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure rponse du joueur 2 ?

` la Theorie Introduction a des Jeux p.36/77

La guerre des sexes


Joueur 2
y 1y f c Joueur 1 f 2,1 0,0 x c 0,0 1,2 1x Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure rponse du joueur 2 ? 2 (< (f, x), (c, 1 x) >, f ) 2 (< (f, x), (c, 1 x) >, c) = = x 1 + (1 x) 0 x 0 + (1 x) 2 = = x 2(1 x)

` la Theorie Introduction a des Jeux p.36/77

La guerre des sexes


Joueur 2
y 1y f c Joueur 1 f 2,1 0,0 x c 0,0 1,2 1x Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure rponse du joueur 2 ? 2 (< (f, x), (c, 1 x) >, f ) = x 1 + (1 x) 0 = x 2 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 2 = 2(1 x) Donc: Si x > 2(1 x) (x > 2/3), la meilleure rponse du joueur 2 est de jouer f

Si x < 2(1 x) (x < 2/3), la meilleure rponse du joueur 2 est de jouer c Si x = 2(1 x) (x = 2/3), le joueur 2 est indiffrent entre f et c, il peut donc jouer lune ou lautre, ou nimporte quelle combinaison des deux.
` la Theorie Introduction a des Jeux p.36/77

La guerre des sexes


Joueur 2
y 1y f c Joueur 1 f 2,1 0,0 x c 0,0 1,2 1x Les gains des deux joueurs avec un prol en stratgie mixte sont donc: 1 ( ) 2 ( ) = = = = x y 2 + x (1 y ) 0 + (1 x) y 0 + (1 x) (1 y ) 1 3xy x y + 1 x y 1 + x (1 y ) 0 + (1 x) y 0 + (1 x) (1 y ) 2 3xy 2x 2y + 2

` la Theorie Introduction a des Jeux p.37/77

La guerre des sexes


Joueur 2
1/3 2/3 f c Joueur 1 f 2,1 0,0 2/3 c 0,0 1,2 1/3 Les gains des deux joueurs avec un prol en stratgie mixte sont donc: 1 ( ) = 3xy x y + 1 2 ( ) = 3xy 2x 2y + 2

Le prol = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un quilibre de Nash en stratgie mixte.

` la Theorie Introduction a des Jeux p.37/77

La guerre des sexes


Joueur 2
1/3 2/3 f c Joueur 1 f 2,1 0,0 2/3 c 0,0 1,2 1/3 Les gains des deux joueurs avec un prol en stratgie mixte sont donc: 1 ( ) = 3xy x y + 1 2 ( ) = 3xy 2x 2y + 2

Le prol = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un quilibre de Nash en stratgie mixte. Les gains des deux joueurs avec sont : 1 ( ) = 3.2/3.1/3 2/3 1/3 + 1 = 2/3 2 ( ) = 3.2/3.1/3 2.2/3 2.1/3 + 2 = 2/3
` la Theorie Introduction a des Jeux p.37/77

Reprsentation graphique du jeu


y

2/3

1/3

joueur1

1/3

2/3

` la Theorie Introduction a des Jeux p.38/77

Reprsentation graphique du jeu


y

joueur2

2/3

1/3

joueur1

1/3

2/3

` la Theorie Introduction a des Jeux p.38/77

Reprsentation graphique du jeu


y

joueur2

2/3

1/3

joueur1

r
0 1/3 2/3 1

x
` la Theorie Introduction a des Jeux p.38/77

Coopration - Itration - Corrlation


Joueur 2 f 2,1 0,0 c 0,0 1,2

Joueur 1

f c

Que se passe-t-il si les 2 joueurs peuvent communiquer avant de jouer ?

` la Theorie Introduction a des Jeux p.39/77

Coopration - Itration - Corrlation


Joueur 2 f 2,1 0,0 c 0,0 1,2

Joueur 1

f c

Que se passe-t-il si les 2 joueurs peuvent communiquer avant de jouer ? 1 = 2 = 1/2 2 + 1/2 1 = 3/2

` la Theorie Introduction a des Jeux p.39/77

Coopration - Itration - Corrlation


Joueur 2 f 2,1 0,0 c 0,0 1,2

Joueur 1

f c

Que se passe-t-il si les 2 joueurs peuvent communiquer avant de jouer ? 1 = 2 = 1/2 2 + 1/2 1 = 3/2 Lorsque tous les joueurs peuvent observer un mme vnement alatoire, ils peuvent alors saccorder sur des quilibres corrls Une stratgie corrle est une distribution de probabilits sur les prols possibles.

` la Theorie Introduction a des Jeux p.39/77

Coopration - Itration - Corrlation


Joueur 2 f 2,1 0,0 c 0,0 1,2

Joueur 1

f c

Que se passe-t-il si les 2 joueurs peuvent communiquer avant de jouer ? 1 = 2 = 1/2 2 + 1/2 1 = 3/2 Lorsque tous les joueurs peuvent observer un mme vnement alatoire, ils peuvent alors saccorder sur des quilibres corrls Une stratgie corrle est une distribution de probabilits sur les prols possibles. Que se passe-t-il si la partie est joue plusieurs fois ?
` la Theorie Introduction a des Jeux p.39/77

Itration: Le dilemme des prisonniers...


Deux personnes arrtes ensemble en possession darmes feu sont souponns dun dlit fait en commun. Les policiers les sparent et disent chacun : Si un des deux avoue et que lautre navoue rien, le premier est libr, et le second emprisonn (5 ans); Si les deux avouent, les deux iront en prison (4 ans); Si aucun des deux navoue, les deux seront seront librs assez vite (2 ans). Vous tes un des deux prisonniers, que faites-vous ?

` la Theorie Introduction a des Jeux p.40/77

[DIP] Le dilemme des prisonniers


Joueur 2 C 3,3 5,0 D 0,5 1,1

Joueur 1

C D

` la Theorie Introduction a des Jeux p.41/77

[DIP] Le dilemme itr...


Vous navez pas vraiment les mmes gots que votre voisin en matire de musique. Il lui arrive souvent dcouter sa musique fond. De mme il vous arrive (en reprsailles) de mettre votre musique un volume plus que raisonnable. Ce qui a pour consquences que le lendemain il recommence nouveau. En dehors de ces priodes agites, vous apprciez les priodes o aucun de vous ne gne lautre. Supposons que lon pondre votre satisfaction : Vous avez une satisfaction de 5 couter votre musique un volume important. La satisfaction est de 0 lorsque votre voisin met sa musique fond. Une soire calme, sans musique vous apporte une satisfaction de 3. Le fait dcouter simultanment votre musique mle celle du voisin, donne une satisfaction de 1. Vous savez ce que votre voisin a eu comme comportement les jours prcdents, que faites-vous aujourdhui?
` la Theorie Introduction a des Jeux p.42/77

[DIP] Le dilemme . . .
Introduction par F LOOD et D RESHER la RAND Corp. en 1952 Jeu somme non-nulle 2 joueurs jouent simultanment 2 choix de jeux : COOP ERER , i.e. tre gentil, on notera C TRAHIR , i.e. tre mchant, on notera D Les gains des joueurs, nots S , P , R et T , sont fonction de leur choix de jeu avec : (0) S<P <R<T

` la Theorie Introduction a des Jeux p.43/77

[DIP] Le dilemme itr . . .


Les joueurs se rencontrent plusieurs fois chaque itration les joueurs ont connaissance des coups prcdents Ils ne connaissent pas le terme du jeu Le gain dun joueur est le cumul de ses gains dans chaque rencontre Pour favoriser la coopration on ajoute la contrainte :
(0)

S + T < 2R

` la Theorie Introduction a des Jeux p.44/77

[DIP] Dilemme itr des prisonniers (rsum)

Dilemme. . . . . . itr

S<P <R<T S + T < 2R

Cooperate

Cooperate R=3 Reward rcompense pour coopration mutuelle


T =5 Temptation tentation trahir

Defect
S=0 Suckers payoff salaire de la dupe P =1 Punishment punition pour la trahison mutuelle

Defect

Score du joueur de la ligne.

` la Theorie Introduction a des Jeux p.45/77

[DIP] Des applications concrtes...


Deux pays doivent-ils lever des taxes douanires sur les produits imports de lautre pays. Deux entreprises concurrentes doivent-elles essayer de sentendre pour se partag un march ou se faire concurrence ? Deux espces vivant sur un mme territoire doivent-elles cohabiter ou se disputer la nourriture disponible ?

` la Theorie Introduction a des Jeux p.46/77

[DIP] Les stratgies


Quelques exemples :
gentille mchante per_CCD rancunire lunatique majoritaire_gentille majoritaire_mchante donnant_donnant

` la Theorie Introduction a des Jeux p.47/77

[DIP] Exemples (rencontres)


1 score de gentille jeu de gentille jeu de mchante score de mchante 0 C
D 5

2 0 C
D 5

3 0 C
D 5

4 0 C
D 5

5 0 C
D 5

6 0 C
D 5

7 0 C
D 5

8 0 C
D 5

9 0 C
D 5

10 0 C
D 5

50

score de per_CCD jeu de per_CCD jeu de rancunire score de rancunire

3 C
C 3

3 C
C 3

5 D
C 0

0 C
D 5

0 C
D 5

1 D
D 1

0 C
D 5

0 C
D 5

1 D
D 1

0 C
D 5

13

33

` la Theorie Introduction a des Jeux p.48/77

[DIP] Quelle est la meilleure stratgie ?


qui batte toutes les autres :

` la Theorie Introduction a des Jeux p.49/77

[DIP] Quelle est la meilleure stratgie ?


qui batte toutes les autres : mchante, car gnralisation du dilemme non itr

` la Theorie Introduction a des Jeux p.49/77

[DIP] Quelle est la meilleure stratgie ?


qui batte toutes les autres : mchante, car gnralisation du dilemme non itr qui fasse le meilleur score possible face toutes les autres :

` la Theorie Introduction a des Jeux p.49/77

[DIP] Quelle est la meilleure stratgie ?


qui batte toutes les autres : mchante, car gnralisation du dilemme non itr qui fasse le meilleur score possible face toutes les autres : aucune, car meilleure contre mchante et contre rancunire est impossible

` la Theorie Introduction a des Jeux p.49/77

[DIP] Quelle est la meilleure stratgie ?


qui batte toutes les autres : mchante, car gnralisation du dilemme non itr qui fasse le meilleur score possible face toutes les autres : aucune, car meilleure contre mchante et contre rancunire est impossible Problme de dnition du critre dvaluation des stratgies

` la Theorie Introduction a des Jeux p.49/77

[DIP] Quelle est la meilleure stratgie ?


Sur des confrontations de 100 parties : Le gain maximal est de 500 points Le gain minimal est de 0 point Cest ce quobtiennent M CHANTE et G ENTILLE lune contre lautre.

` la Theorie Introduction a des Jeux p.50/77

[DIP] Quelle est la meilleure stratgie ?


Sur des confrontations de 100 parties : Le gain maximal est de 500 points Le gain minimal est de 0 point Cest ce quobtiennent M CHANTE et G ENTILLE lune contre lautre. Mais... 2 gentilles entre elles obtiennent chacune 300 points 2 mchantes entre elles obtiennent chacune 100 points Chaque stratgie est bonne (au sens du meilleur score) face certaines et mauvaises face dautres car elle ne sait pas qui elle a affaire.

` la Theorie Introduction a des Jeux p.50/77

[DIP] Les tournois


Plusieurs stratgies se rencontrent 2 2, comme pour un tournoi sportif Le gain dune stratgie est le cumul de ses scores face chaque adversaire Toutes les parties ont la mme longueur (mme nombre ditrations), mais les stratgies ne la connaissent pas et ne peuvent pas le savoir

` la Theorie Introduction a des Jeux p.51/77

[DIP] Exemples (tournoi)


gentille gentille mchante per_CCD rancunire mchante per_CCD rancunire

30 0 21 30 81

50 10 38 14 112

36 3 24 13 76
mchante rancunire gentille per_CCD

30 9 33 30 102

Score

8 1 > > > < 2 Classement > 3 > > : 4

` la Theorie Introduction a des Jeux p.52/77

[DIP] Un tournoi
Tournois entre 10 stratgies parmi 12 :
gentille mchante lunatique donnant_donnant rancunire per_DDC per_CCD majoritaire_gentille majoritaire_mchante mante sondeur donnant_donnant_dur

Nombre de tournois jous par chaque stratgie : 55 Donnez le classement du tournoi...

` la Theorie Introduction a des Jeux p.53/77

[DIP] Un tournoi
gentille mchante lunatique donnant_donnant rancunire per_DDC per_CCD majoritaire_gentille donnant_donnant majoritaire_gentille rancunire sondeur lunatique mchante majoritaire_mchante mante sondeur donnant_donnant_dur

Scores :

: : : : : :

42 19 4 1 0 0

` la Theorie Introduction a des Jeux p.54/77

[DIP] donnant-donnant : une bonne stratgie


Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au coup prcdent, je coopre (C), sil a trahi (D), je trahis (D).

` la Theorie Introduction a des Jeux p.55/77

[DIP] donnant-donnant : une bonne stratgie


Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au coup prcdent, je coopre (C), sil a trahi (D), je trahis (D). donnant-donnant ne gagne jamais contre personne !

` la Theorie Introduction a des Jeux p.55/77

[DIP] donnant-donnant : une bonne stratgie


Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au coup prcdent, je coopre (C), sil a trahi (D), je trahis (D). donnant-donnant ne gagne jamais contre personne ! Au mieux elle fait le mme score.

` la Theorie Introduction a des Jeux p.55/77

[DIP] donnant-donnant : une bonne stratgie


Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au coup prcdent, je coopre (C), sil a trahi (D), je trahis (D). donnant-donnant ne gagne jamais contre personne ! Au mieux elle fait le mme score. Mais, au pire elle ne perd que 5 points quel que soit ladversaire et la longueur de la partie !

` la Theorie Introduction a des Jeux p.55/77

[DIP] volution cologique


Simulation de lvolution naturelle : Chaque stratgie est reprsente par une population de N entits On effectue un tournoi entre toutes les entits Les entits de faibles stratgies (au sens du classement dans le tournoi) sont dfavorises, celles stratgie forte sont favorises La favorisation est ralise par une redistribution proportionnelle de la population Ce cycle est rpt jusqu stabilisation de la population

` la Theorie Introduction a des Jeux p.56/77

[DIP] Exemples (volution)


400 spiteful all_c all_d per_ccd

350

300

250

200

150

100

50

10

12

14

16

18

20

` la Theorie Introduction a des Jeux p.57/77

[DIP] Une morale trs morale...


Critres de qualit pour une stratgie (en volution) : [Axelrod,81] Gentillesse Ractivit Pardon Simplicit

` la Theorie Introduction a des Jeux p.58/77

[DIP] Une morale trs morale...


Critres de qualit pour une stratgie (en volution) : [Axelrod,81] Gentillesse Ractivit Pardon Simplicit Les bonnes stratgies au dilemme le sont aussi dans les variantes du dilemme (asynchrone, avec renoncement, bruits, . . . )

` la Theorie Introduction a des Jeux p.58/77

[DIP] Une morale trs morale...


Critres de qualit pour une stratgie (en volution) : [Axelrod,81] Gentillesse Ractivit Pardon Simplicit Les bonnes stratgies au dilemme le sont aussi dans les variantes du dilemme (asynchrone, avec renoncement, bruits, . . . ) Pour plus de dtails sur le dilemme itr des prisonniers : http://www.lifl.fr/IPD

` la Theorie Introduction a des Jeux p.58/77

Jeux rpts
Soit un jeu G = {S, {i }i=1,...,n }, o S est lensemble (ni) des prols de stratgies et i est la fonction dutilit du joueur i. On note (G, T ) le jeu rpt obtenu en jouant T fois le jeu de base G. Lorsque le jeu est rpt un nombre inni de fois, on note (G, ) le jeu correspondant.

` la Theorie Introduction a des Jeux p.59/77

Jeux rpts
Soit un jeu G = {S, {i }i=1,...,n }, o S est lensemble (ni) des prols de stratgies et i est la fonction dutilit du joueur i. On note (G, T ) le jeu rpt obtenu en jouant T fois le jeu de base G. Lorsque le jeu est rpt un nombre inni de fois, on note (G, ) le jeu correspondant. On peut galement distinguer les jeux rpts un nombre ni, mais indni de fois: chaque tour, il y a une probabilit 1 q que le jeu sarrte.

` la Theorie Introduction a des Jeux p.59/77

Jeux rpts
Soit un jeu G = {S, {i }i=1,...,n }, o S est lensemble (ni) des prols de stratgies et i est la fonction dutilit du joueur i. On note (G, T ) le jeu rpt obtenu en jouant T fois le jeu de base G. Lorsque le jeu est rpt un nombre inni de fois, on note (G, ) le jeu correspondant. On peut galement distinguer les jeux rpts un nombre ni, mais indni de fois: chaque tour, il y a une probabilit 1 q que le jeu sarrte. Facteur dactualisation : Lorsquun jeu est rpt, il se peut que les gains obtenus litration courante t soient plus/moins importants aux yeux de lagent que les gains litration suivante t+1 . Pour modliser cela on peut utiliser un facteur dactualisation .
t = t+1

Le facteur dactualisation = t /t+1 reprsente donc lattrait du joueur pour les gains actuels. ` la Theorie Introduction a des Jeux p.59/77

Jeux rpts: Thorme Folk


Lutilit dun joueur dans un jeu rpt est donc:
t i (G, T ) = T t=0 i (t)

` la Theorie Introduction a des Jeux p.60/77

Jeux rpts: Thorme Folk


Lutilit dun joueur dans un jeu rpt est donc:
t i (G, T ) = T t=0 i (t)

Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu de base, on utilise la moyenne des gains du joueur: i (G, T )/T

` la Theorie Introduction a des Jeux p.60/77

Jeux rpts: Thorme Folk


Lutilit dun joueur dans un jeu rpt est donc:
t i (G, T ) = T t=0 i (t)

Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu de base, on utilise la moyenne des gains du joueur: i (G, T )/T Si ti (t) = , alors i (G, ) =
1 1

` la Theorie Introduction a des Jeux p.60/77

Jeux rpts: Thorme Folk


Lutilit dun joueur dans un jeu rpt est donc:
t i (G, T ) = T t=0 i (t)

Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu de base, on utilise la moyenne des gains du joueur: i (G, T )/T Si ti (t) = , alors i (G, ) =
1 1

Thorme Folk: Soit un jeu rpt (G, ) avec un facteur dactualisation sufsamment proche de 1 et = (1 , . . . , 2 ) un vecteur de gains ralisable de ce jeu, alors il existe un quilibre de Nash du jeu rpt qui donne comme vecteur de gains.

` la Theorie Introduction a des Jeux p.60/77

Jeux rpts: Thorme Folk


Lutilit dun joueur dans un jeu rpt est donc:
t i (G, T ) = T t=0 i (t)

Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu de base, on utilise la moyenne des gains du joueur: i (G, T )/T Si ti (t) = , alors i (G, ) =
1 1

Thorme Folk: Soit un jeu rpt (G, ) avec un facteur dactualisation sufsamment proche de 1 et = (1 , . . . , 2 ) un vecteur de gains ralisable de ce jeu, alors il existe un quilibre de Nash du jeu rpt qui donne comme vecteur de gains. Lquilibre de Nash en question est un quilibre de Nash parfait en sous-jeux (voir plus loin). Notion de menace crdible.

` la Theorie Introduction a des Jeux p.60/77

Jeux rpts: Thorme Folk


Lutilit dun joueur dans un jeu rpt est donc:
t i (G, T ) = T t=0 i (t)

Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu de base, on utilise la moyenne des gains du joueur: i (G, T )/T Si ti (t) = , alors i (G, ) =
1 1

Thorme Folk: Soit un jeu rpt (G, ) avec un facteur dactualisation sufsamment proche de 1 et = (1 , . . . , 2 ) un vecteur de gains ralisable de ce jeu, alors il existe un quilibre de Nash du jeu rpt qui donne comme vecteur de gains. Lquilibre de Nash en question est un quilibre de Nash parfait en sous-jeux (voir plus loin). Notion de menace crdible. Ce rsultat signie que lensemble des quilibres de Nash dun jeu rpt est immense: quasiment toute squence (nie) de jeu correspond un quilibre de Nash.

` la Theorie Introduction a des Jeux p.60/77

Jeux deux joueurs Somme nulle


Rle central le plus simple pas de notion de majorit pas de coalition

` la Theorie Introduction a des Jeux p.61/77

Jeux deux joueurs Somme nulle


Rle central le plus simple pas de notion de majorit pas de coalition Strictement Comptitif Les joueurs ont des prfrences strictement opposes Pour tout prol de stratgies s, on a 1 (s) + 2 (s) = a

` la Theorie Introduction a des Jeux p.61/77

Jeux deux joueurs Somme nulle


Rle central le plus simple pas de notion de majorit pas de coalition Strictement Comptitif Les joueurs ont des prfrences strictement opposes Pour tout prol de stratgies s, on a 1 (s) + 2 (s) = 0

` la Theorie Introduction a des Jeux p.61/77

Jeux deux joueurs Somme nulle


Rle central le plus simple pas de notion de majorit pas de coalition Strictement Comptitif Les joueurs ont des prfrences strictement opposes Pour tout prol de stratgies s, on a 1 (s) + 2 (s) = 0 Exemples : Jeux de plateau (echecs, dames, . . .) Guerre ...

` la Theorie Introduction a des Jeux p.61/77

Jeux deux joueurs somme nulle - Exemple


Joueur 2
y1 18,-18 0,0 5,-5 9,-9 y2 3,-3 3,-3 4,-4 3,-3 y3 0,0 8,-8 5,-5 0,0 y4 2,-2 20,-20 5,-5 20,-20

Joueur 1

x1 x2 x3 x4

` la Theorie Introduction a des Jeux p.62/77

Jeux deux joueurs somme nulle - Exemple


Joueur 2
y1 18 0 5 9 y2 3 3 4 3 y3 0 8 5 0 y4 2 20 5 20

Joueur 1

x1 x2 x3 x4

` la Theorie Introduction a des Jeux p.62/77

Jeux deux joueurs somme nulle - Exemple


Joueur 2
y1 18 0 5 9 y2 3 3 4 3 y3 0 8 5 0 y4 2 20 5 20

Joueur 1

x1 x2 x3 x4

Le joueur 1 tente de maximiser son niveau de scurit vx = maxi (minj (xi , yj )) Le joueur 2 tente de minimiser le niveau de scurit du joueur 1 vy = minj (maxi (xi , yj ))

` la Theorie Introduction a des Jeux p.62/77

Jeux deux joueurs somme nulle - Exemple


Joueur 2
y1 18 0 5 9 y2 3 3 4 3 y3 0 8 5 0 y4 2 20 5 20

Joueur 1

x1 x2 x3 x4

Le joueur 1 tente de maximiser son niveau de scurit vx = maxi (minj (xi , yj )) Le joueur 2 tente de minimiser le niveau de scurit du joueur 1 vy = minj (maxi (xi , yj )) Si vx = vy = v , alors tout couple de stratgies (xi , yi ), xi garantissant v au joueur 1 et yi garantissant v au joueur 2 forment un quilibre de Nash et sont des stratgies respectivement maximin et minimax pour les joueurs 1 et 2. ` la Theorie Introduction a des Jeux p.62/77

Jeux sous forme extensive


3 u (1,0,3) u (2,3,1) w 1 y (3,2,2) x 2 y (2,3,1) x 3 w (3,2,9) u (5,5,5)

x (3,0,0) w (4,2,4)

1 y
2

` la Theorie Introduction a des Jeux p.63/77

Jeux sous forme extensive


3 u (1,0,3) u (2,3,1) w 1 y (3,2,2) x 2 y (2,3,1) x 3 w (3,2,9) u (5,5,5)

x (3,0,0) w (4,2,4)

1 y
2

Rcurrence rebours (backward induction) On commence par chercher les choix optimaux la dernire priode (noeuds terminaux). On remonte larbre de noeud en noeud, en cherchant chaque noeud le choix optimal, une fois quon a pris en compte les choix optimaux pour chaque noeud ls.
` la Theorie Introduction a des Jeux p.63/77

Jeux sous forme extensive


` information parfaite a un Tout jeu (ni) sous forme extensive a equilibre de Nash en strategies pures (equilibre obtenable par ` rebours). (Zermelo (1953), Kuhn (1953)) recurrence a

` la Theorie Introduction a des Jeux p.64/77

Forme extensive - Sous-jeu


1 x (2,2) u (3,1) w (2,-2)

y 2 v r z (-2,2) 1 2 s

w (-2,2)

z (2,-2)

` la Theorie Introduction a des Jeux p.65/77

Forme extensive - Sous-jeu


1 x (2,2) u (3,1) y 2 v 1 (0,0)

` la Theorie Introduction a des Jeux p.65/77

Forme extensive - Sous-jeu


1 x (2,2) u (3,1) y 2 v 1 (0,0)

Un sous-jeu dun jeu sous forme extensive est un jeu compos dun noeud (qui est un ensemble dinformation singleton), de tous les noeuds successeurs de ce noeud, de tous les arcs reliant ces noeuds, et des utilits associes tous les noeuds terminaux successeurs.

` la Theorie Introduction a des Jeux p.65/77

Forme extensive - Menaces non crdibles


1 x (2,2) u (3,1) y 2 v (0,0) Joueur 1 x y u 2,2 3,1 v 2,2 0,0

Joueur 2

` la Theorie Introduction a des Jeux p.66/77

Forme extensive - Menaces non crdibles


1 x (2,2) u (3,1) y 2 v (0,0) Joueur 1 x y u 2,2 3,1 v 2,2 0,0

Joueur 2

lquilibre de Nash xv nest pas crdible car il repose sur la menace non-crdible du joueur 2 de jouer v .

` la Theorie Introduction a des Jeux p.66/77

Equilibre parfait en sous-jeux


Un quilibre de Nash dun jeu sous forme extensive est un equilibre parfait en sous-jeux si toute restriction du prol de stratgies un sousjeu est un quilibre de Nash pour ce sous-jeu.

` la Theorie Introduction a des Jeux p.67/77

Equilibre parfait en sous-jeux


Un quilibre de Nash dun jeu sous forme extensive est un equilibre parfait en sous-jeux si toute restriction du prol de stratgies un sousjeu est un quilibre de Nash pour ce sous-jeu.

Pour les jeux informations parfaites, la notion dquilibre parfait en sous-jeux concide avec la notion de rcurrence rebours.

` la Theorie Introduction a des Jeux p.67/77

Promesse non crdible

Exploiter 2 Daccord pour travailler 2 1 Ne pas exploiter 2

(2,-1)

(1,1)

Pas daccord pour travailler

(0,0)

` la Theorie Introduction a des Jeux p.68/77

Promesse non crdible

Exploiter 2 Daccord pour travailler 2 1 Ne pas exploiter 2

(2,-1)

(1,1)

Pas daccord pour travailler

(0,0)

Rputation

` la Theorie Introduction a des Jeux p.68/77

Le mille-pattes - Limites de la rcurrence rebours

1 D (1,1)

2 d (0,3)

1 D (2,2) R

1 ... D (98,98)

2 d (97,100)

1 D (99,99)

2 d

(100,100)

(98,101)

` la Theorie Introduction a des Jeux p.69/77

Limites de la rcurrence rebours


Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur
1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.

` la Theorie Introduction a des Jeux p.70/77

Limites de la rcurrence rebours


Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur
1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.

Ecrire ce jeu sous forme extensive en ne considrant que les partages (5,5) et (8.5,1.5) pour 1 et le partage (0.5,0.5) pour 2.

` la Theorie Introduction a des Jeux p.70/77

Jeux coopratifs 2 joueurs


Dans les jeux coopratifs on autorise la communication et les accords entre joueurs avant la partie. Tous les messages formuls par un joueur sont transmis sans modication lautre joueur. Tous les accords entre joueurs seront respects. Lvaluation des situations par un joueur nest pas perturbe par les ngociations prliminaires. Guerre des sexes

` la Theorie Introduction a des Jeux p.71/77

Jeu de marchandage - Ensemble de ngociation


L ensemble de negociation dun jeu de marchandage est lensemble des issues :

ralisables appartenant lespace de marchandage efcientes telles quaucune autre issue ne donne plus un joueur et autant lautre (non pareto-domine) individuellement rationnelles chaque joueur gagne au moins autant que le gain quil est sur dobtenir si il ny a pas daccord.

` la Theorie Introduction a des Jeux p.72/77

Jeu de Marchandage - Solution de Nash


` lechelle Invariance a dutilite Si [R1 , (u1 , v1 )] et [R2 , (u2 , v2 )] sont deux versions du mme jeu de marchandage, ie si ils ne diffrent que sur les units et lorigine des fonctions dutilits, alors les deux solutions F ([R1 , (u 1 , v1 )]) et F ([R2 , (u 2 , v2 )]) doivent tre les mmes au changement dchelle prs. Pareto optimalite La solution du jeu de marchandage (u0 , v0 ) doit satisfaire les proprits suivantes : u0 u et v0 v (u0 , v0 ) est un point de R il ny a pas de (u, v ) dans R (diffrent de (u0 , v0 )) tel que u u0 et v v0 .

` la Theorie Introduction a des Jeux p.73/77

Jeu de Marchandage - Solution de Nash


Independance des alternatives non disponibles Soient deux jeux de marchandage avec le mme point de status quo et tels que les issues du premier sont incluses dans les issues du second. Si la solution du second jeu est ralisable dans le premier jeu, alors ce doit tre aussi la solution du premier jeu : Si R1 R2 et F ([R2 , (u , v )]) R1 , alors F ([R1 , (u , v )]) = F ([R2 , (u , v )]) Symetrie Si un jeu de marchandage a les proprits suivantes : u = v (u, v ) R implique (v, u) R (u0 , v0 ) = F ([R, (u , v )]) Alors u0 = v 0

` la Theorie Introduction a des Jeux p.74/77

Jeu de Marchandage - Solution de Nash


Soit un jeu de marchandage [R, (u , v )], procdons comme suit : Changeons lorigine des utilits des joueurs pour que le point (u , v ) soit transform en (0, 0). Soit [R , (0, 0)] le jeu correspondant. Dans R trouver (lunique) point (u0 , v0 ) (u0 > 0 et v0 > 0) tel que u0 v0 est le maximum de tous les produits uv avec (u, v ) dans R (u > 0 et v > 0). Le point (u0 , v0 ) est la solution de Nash du jeu [R , (0, 0)]. La solution de Nash de [R, (u , v )] est obtenu en inversant la transformation dutilit.

` la Theorie Introduction a des Jeux p.75/77

Jeu de Marchandage - Solution de Nash


Soit un jeu de marchandage [R, (u , v )], procdons comme suit : Changeons lorigine des utilits des joueurs pour que le point (u , v ) soit transform en (0, 0). Soit [R , (0, 0)] le jeu correspondant. Dans R trouver (lunique) point (u0 , v0 ) (u0 > 0 et v0 > 0) tel que u0 v0 est le maximum de tous les produits uv avec (u, v ) dans R (u > 0 et v > 0). Le point (u0 , v0 ) est la solution de Nash du jeu [R , (0, 0)]. La solution de Nash de [R, (u , v )] est obtenu en inversant la transformation dutilit.
es desir ees Thorme. Lunique solution qui verie les 4 propriet est la solution de Nash. (Nash (1950))

` la Theorie Introduction a des Jeux p.75/77

Jeux contre la nature


Si on considre un jeu deux joueurs dont un des deux joueurs est la nature, on fait de la dcision dans le risque ou dans lincertain. En ce sens la thorie de la dcision peut tre vue comme un cas particulier de la thorie des jeux.

` la Theorie Introduction a des Jeux p.76/77

Conclusion
Jeux coopratifs Jeux information incomplte Rationalit limite

` la Theorie Introduction a des Jeux p.77/77

S-ar putea să vă placă și