The Orie Des Jeux

Introduction la Thorie des Jeux
Sebastien Konieczny
konieczny@cril.univ-artois.fr
CRIL-CNRS dArtois - Lens Universite
` la Theorie Introduction a des Jeux p.1/77
Thorie des Jeux

` Dnition La theorie des jeux permet une analyse formelle des problemes par linteraction strategique poses dun groupe dagents rationnels poursuivant des buts qui leur sont propres.
Thorie des Jeux

groupe interaction stratgique rationnels
Thorie des Jeux

groupe interaction stratgique rationnels Normatif vs Descriptif
A quoi sert la thorie des jeux ?

Jeux de socit (checs, dames, go, ...), Jeux de cartes (bridge, poker, ...) Dois-je travailler ou faire semblant ? Est-ce que jcoute de la musique ce soir ? Enchres, vote Comportement animal Stratgies militaires/conomiques Partages de ressource (marchandage) Est-ce quune entreprise doit exploiter ses salaris ? Est-ce quune entreprise doit entrer sur un march ou pas ? Faut-il contrler les dclarations dimpots sur le revenu ? ...
Un peu dhistoire...
Cournot (1838), Borel (1921) Zermelo (1913) Von Neumann (1928)
Theory of Games and Economic Behaviour, Von Neumann et Morgenstern (1944)
Nash (1950) Selten (1965), Harsanyi (1967)
Bibliographie
` la theorie M. Yildizoglu. Introduction a des jeux. Dunod. 2003. D. Kreps. Theorie des jeux et modelisation economique . Dunod. 1990.
D. Luce, H. Raiffa. Games and Decision. Wiley. 1957. P. K. Dutta. Strategies and Games. MIT Press. 1999. D. Fudenberg, J. Tirole. Game Theory. MIT Press. 1991. J. Von Neumann, O. Morgenstern. Theory of Game and Economic Behavior. Princeton University Press. 1944.
Terminologie - Une petite taxonomie...

Jeux somme nulle (strictement comptitifs) / Jeux somme non-nulle Jeux information complte / Jeux information incomplte Jeux information parfaite / Jeux information imparfaite Jeux coopratifs / Jeux non-coopratifs Jeux 2 joueurs / Jeux n joueurs
Plan du cours
Introduction - Formalisation dun jeu - Jeu sous forme normale - Jeu sous forme extensive - Stratgie Concepts de solution - Stratgies dominantes Equilibre de Nash - Critre de Pareto - Niveau de scurit - Stratgies mixtes Rsolution par chainage arrire - Menaces crdibles - Equilibres parfaits en sous-jeux Jeux somme nulle Jeux rpts - Dilemme itr du prisonnier Jeux information incomplte Jeux coopratifs - Marchandage
Formalisation dun Jeu

Quest-ce quun jeu ?
Qui? Joueurs Quoi? Coups (actions/choix) - Stratgies Quand? Droulement du jeu Combien? Que rapporte chaque issue aux diffrents joueurs ?
Autres informations importantes: Information Rptition
Jeux sous forme stratgique - Exemple

Joueur 2 u 4,2 2,5 v 3,1 9,0
Joueur 1
x y
Utilit
Une hypothse de base de la thorie des jeux est de considrer que les agents sont rationnels, cest--dire quils tentent darriver la situation la meilleure pour eux.
la mesure de chaque situation aux yeux de lagent. On appelle Utilite nest ni une mesure du gain matriel, montaire, etc. mais une L Utilite mesure subjective du contentement de lagent.
Utilit
Une hypothse de base de la thorie des jeux est de considrer que les agents sont rationnels, cest--dire quils tentent darriver la situation la meilleure pour eux.
la mesure de chaque situation aux yeux de lagent. On appelle Utilite nest ni une mesure du gain matriel, montaire, etc. mais une L Utilite mesure subjective du contentement de lagent.
Utiliser une fonction dutilit pour dnir les prfrences de lagent ne suppose pas que lagent utilise cette fonction, mais quil raisonne conformment un ensemble de conditions de rationalit. Von Neuman et Morgenstern (1944), Savage (1954).
Jeux sous forme stratgique

Un jeu sous forme stratgique est dni par : un ensemble N = {1, . . . , n} de joueurs pour chaque joueur i un ensemble de stratgies Si = {s1 , . . . , sni } pour chaque joueur i une fonction de valuation i : S1 . . . Sn IR, qui chaque ensemble de stratgies associe les gains du joueur i. Notations : On notera s un prol de stratgies {s1 , . . . , sn } o i si Si . On note si le prol s des stratgies autres que celles du joueur i : si = {s1 , . . . , si1 , si+1 , . . . , sn }. On note S lespace des stratgies, ie : S = n i=1 Si
Jeux sous forme extensive - Exemple

x s 2 (4,2) t (3,1)
1
y u (2,5)
2
v (9,0)
Jeux sous forme extensive

Un jeu sous forme extensive est dni par : un ensemble N = {1, . . . , n} de joueurs un arbre ni compos de : un ensemble de noeuds {A, B, C, . . .} reprsentant les coups un ensemble de branches {x, y, z, . . .} reprsentant les alternatives chaque coup une fonction de nommage qui indique chaque noeud quel est le joueur qui doit jouer une fonction de valuation qui associe chaque noeud terminal un vecteur de nombres reprsentant les gains de chacun des joueurs une partition des noeuds en un ensemble densembles dinformations reprsentant les croyances (imparfaites) des joueurs
Jeux sous forme extensive - Ensemble dinformations

Joueur 1 x s B (4,2) t (3,1)
A
y u (2,5)
C v
Joueur 2
(9,0)
x s B (4,2) t (3,1)
y u (2,5)
C v
(9,0)
x u B (4,2) v (3,1)
y u (2,5)
C v
(9,0)
x u B (4,2) v (3,1)
y u (2,5)
C v
(9,0)
Ensembles dinformation : {A} et {B, C } Coups simultans Incertitude (croyances)
Relation entre formes stratgique et extensive

A chaque jeu sous forme extensive correspond un jeu sous forme stratgique dans lequel les joueurs choisissent simultanment les stratgies quils mettront en oeuvre. En revanche, un jeu sous forme stratgique peut correspondre plusieurs jeux sous forme extensive diffrents.

A chaque jeu sous forme extensive correspond un jeu sous forme stratgique dans lequel les joueurs choisissent simultanment les stratgies quils mettront en oeuvre. En revanche, un jeu sous forme stratgique peut correspondre plusieurs jeux sous forme extensive diffrents. Une stratgie est la spcication complte du comportement dun joueur dans nimporte quelle situation (dans un jeu sous forme extensive cela signie donc pour chaque ensemble dinformation o cest ce joueur de jouer). Algorithme
Stratgie
Une strategie pure du joueur i est un plan daction qui prescrit une action de ce joueur pour chaque fois quil est susceptible de jouer. On note par Si lensemble des stratgies pures du joueur i et par si une stratgie pure de ce joueur.

Joueur 2 Forme stratgique : Joueur 1 x y u 4,2 2,5 v 3,1 9,0

Joueur 2 Forme stratgique : Joueur 1 x y x Forme extensive : (4,2) u B v (3,1) u 4,2 2,5 v 3,1 9,0
A
y u (2,5)
C v
(9,0)

Joueur 2 Forme stratgique : Joueur 1 x y x Forme extensive : (4,2) u B v (3,1) s1 4,2 2,5 s2 4,2 9,0
A
s3 3,1 2,5 y u (2,5)
s4 3,1 9,0
C v
(9,0)
s1: u si x, u si y s3: v si x, u si y
s2: u si x, v si y s4: v si x, v si y
Elimination de stratgies domines

Joueur 2 u 4,2 2,5 v 3,1 9,0
Joueur 1
x y

Joueur 2 u 4,2 2,5 v 3,1 9,0
Joueur 1
x y

Joueur 2 u 4,2 2,5 v 3,1 9,0
Joueur 1
x y

Joueur 2 u 4,2 2,5 v 3,1 9,0
Joueur 1
x y
Une stratgie si est (strictement) domine pour le joueur i si il existe une stratgie si telle que pour tous les prols si
i (si , si ) > i (si , si )

Joueur 2 u 4,2 2,5 v 3,1 9,0
Joueur 1
x y
Une stratgie si est faiblement domine pour le joueur i si il existe une stratgie si telle que pour tous les prols si
i (si , si ) i (si , si )

Joueur 2 u 3,6 5,1 6,0 v 7,1 8,2 6,2 w 4,8 6,1 3,2
Joueur 1
x y z

Joueur 2 u 3,6 5,1 6,0 v 7,1 8,2 6,2 w 4,8 6,1 3,2
Joueur 1
x y z

Joueur 2 u 3,6 5,1 6,0 v 7,1 8,2 6,2 w 4,8 6,1 3,2
Joueur 1
x y z

Joueur 2 u 3,6 5,1 6,0 v 7,1 8,2 6,2 w 4,8 6,1 3,2
Joueur 1
x y z

Joueur 2 u 3,6 5,1 6,0 v 7,1 8,2 6,2 w 4,8 6,1 3,3
Joueur 1
x y z

Un jeu est dit rsolvable par limination itrative des stratgies domines, si on obtient un unique prol en liminant successivement des stratgies (strictement) domines. Les prols obtenus aprs limination itrative des stratgies (strictement) domines (EISD) ne dpendent pas de lordre choisi pour llimination des stratgies. Par contre, on peut obtenir des prols diffrents lorsque lon choisit des ordres diffrents pour llimination itrative de stratgies faiblement domines (EISfD). Les rsultats obtenus par EISD sont donc plus robustes que ceux obtenus par EISfD. Problme majeur de cette mthode: tous les jeux ne sont pas rsolvable par EISD !
Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0
Joueur 1
x y z
Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0
Joueur 1
x y z
Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0
Joueur 1
x y z
Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0
Joueur 1
x y z
Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0
Joueur 1
x y z
Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0
Joueur 1
x y z
Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0
Joueur 1
x y z
Equilibre de Nash
Joueur 2 u 3,0 2,0 0,3 v 0,2 1,1 0,2 w 0,3 2,0 3,0
Joueur 1
x y z
de Nash est une situation telle quaucun joueur La notion dequilibre na intrt dvier (seul) de la situation obtenue.
de Nash est un prol de stratgies s = {s Un equilibre 1 , . . . , sn } tel que pour tout joueur i, pour toute stratgie s Si : i (s 1 , si ) i (s , si )
Equilibre de Nash et fonction de meilleure rponse

La fonction de meilleure rponse du joueur i est la fonction B i qui associe chaque combinaison de stratgies des autres joueurs s i les stratgies du joueur i qui maximise son utilit:
Bi (si ) = {si Si t.q. i (si , si ) i (si , si ) pour tout si Si }
Equilibre de Nash et fonction de meilleure rponse

La fonction de meilleure rponse du joueur i est la fonction B i qui associe chaque combinaison de stratgies des autres joueurs s i les stratgies du joueur i qui maximise son utilit:
Bi (si ) = {si Si t.q. i (si , si ) i (si , si ) pour tout si Si }
Un quilibre de Nash est un prol s tel que la stratgie du joueur i est une meilleure rponse:
s i Bi (si ) pour tout i N
Equilibre de Nash: Proprits

Un prol (unique) obtenu par limination itrative de stratgies (strictement) domines (EISD) est un quilibre de Nash (et cest le seul quilibre du jeu).

Un prol (unique) obtenu par limination itrative de stratgies (strictement) domines (EISD) est un quilibre de Nash (et cest le seul quilibre du jeu). Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash, mais il peut aussi nen avoir aucun !

Un prol (unique) obtenu par limination itrative de stratgies (strictement) domines (EISD) est un quilibre de Nash (et cest le seul quilibre du jeu). Un jeu (en stratgies pures) peut avoir plusieurs quilibres de Nash, mais il peut aussi nen avoir aucun ! Question: comment choisir un quilibre particulier lorsquil y en a plusieurs ?

Deux quilibres de Nash s = (s = (si , s i , si ) et s i ) sont interchangeables si pour tout i (s i , si ) et (si , si ) sont aussi des quilibres de Nash.

Deux quilibres de Nash s = (s = (si , s i , si ) et s i ) sont interchangeables si pour tout i (s i , si ) et (si , si ) sont aussi des quilibres de Nash.
Deux quilibres de Nash s et s sont quivalents si ils donnent la mme utilit tous les joueurs, i.e. pour tout i N i (s ) = i (s ).
Critre de Pareto
Joueur 2 u 4,4 2,3 v 3,1 7,5
Joueur 1
x y
Critre de Pareto
Joueur 2 u 4,4 2,3 v 3,1 7,5
Joueur 1
x y
Un prol s domine un prol s au sens de Pareto si il est au moins aussi bon pour tous les joueurs et si s est strictement meilleur pour au moins lun dentre eux, i.e. pour tout si s et si s on a si si et il existe sj s et sj s tel que sj > sj .
Critre de Pareto
Joueur 2 u 4,4 2,3 v 3,1 7,5
Joueur 1
x y
Un prol s domine un prol s au sens de Pareto si il est au moins aussi bon pour tous les joueurs et si s est strictement meilleur pour au moins lun dentre eux, i.e. pour tout si s et si s on a si si et il existe sj s et sj s tel que sj > sj . Un prol s domine strictement un prol s au sens de Pareto si s est strictement meilleur pour tous les joueurs, i.e. pour tout s i s et si s on a si > si .
Critre de Pareto vs niveau de scurit

Joueur 2 u 9,9 8,0 v 0,8 7,7
Joueur 1
x y
Critre de Pareto vs niveau de scurit

Joueur 2 u 9,9 8,0 v 0,8 7,7
Joueur 1
x y
dune strategie On dnit le niveau de securit e si pour le joueur i comme le gain minimum que peut apporter cette stratgie quel que soit le choix des autres joueurs, soit
min i (si , si )
si
dun joueur i comme le niveau de scuOn dnit le niveau de securit e rit maximal des stratgies de i.
Points focaux
Le problme pos par la multiplicit dquilibres de Nash est un problme de coordination. Pour certains jeux, certains quilibres semblent plus vidents que dautres aux joueurs. Cela est du certaines conventions sociales. Ces quilibres de Nash obtenus partir de ces conventions sont appels points focaux.
La guerre des sexes

Joueur 2 f 2,1 0,0 c 0,0 1,2
Joueur 1
f c
La guerre des sexes

Joueur 2 f 2,1 0,0 c 0,0 1,2
Joueur 1
f c
Sur cet exemple le niveau de scurit des deux joueurs est 0.
La guerre des sexes

Joueur 2 f 2,1 0,0 c 0,0 1,2
Joueur 1
f c
Sur cet exemple le niveau de scurit des deux joueurs est 0. Supposons que le joueur 1 joue alatoirement f et c avec une probabilit de 1/2
1 (< (f, 1/2), (c, 1/2) >, f ) = 1/2 2 + 1/2 0 = 1 1 (< (f, 1/2), (c, 1/2) >, c) = 1/2 0 + 1/2 1 = 1/2
La guerre des sexes

Joueur 2 f 2,1 0,0 c 0,0 1,2
Joueur 1
f c
Sur cet exemple le niveau de scurit des deux joueurs est 0. Supposons que le joueur 1 joue alatoirement f et c avec une probabilit de 1/2
1 (< (f, 1/2), (c, 1/2) >, f ) = 1/2 2 + 1/2 0 = 1 1 (< (f, 1/2), (c, 1/2) >, c) = 1/2 0 + 1/2 1 = 1/2
Avec cette stratgie le niveau de scurit du joueur 1 est 1/2

Stratgies pures - Stratgies mixtes

Les stratgies que nous avons dnies et utilises pour le moment sont pures, cest--dire les options qui se prsentent aux des strategies joueurs.
Une strategie mixte i est une distribution de probabilit sur lensemble des stratgies pures.
Lensemble des stratgies mixtes dun joueur i se note i . Lensemble des stratgies pures utilises (i.e. dont la probabilit nest pas nulle) par une stratgie mixte i est appel le support de la stratgie mixte. Notons pi (sk ) la probabilit associe sk par i , lutilit dun prol de stratgies mixtes est dnie par :
n X Y i ( ) = ( pj (sj ))i (s) sS j =1
Stratgie
Une strategie pure du joueur i est un plan daction qui prescrit une action de ce joueur pour chaque fois quil est susceptible de jouer. On note par Si lensemble des stratgies pures du joueur i et par si une stratgie pure de ce joueur.
Stratgie
Une strategie pure du joueur i est un plan daction qui prescrit une action de ce joueur pour chaque fois quil est susceptible de jouer. On note par Si lensemble des stratgies pures du joueur i et par si une stratgie pure de ce joueur. Une strategie mixte du joueur i est une distribution de probabilits p i dnie sur lensemble des stratgies pures du joueur i. On note i lensemble des stratgies mixtes du joueur i et par i une stratgie mixte de ce joueur.
Stratgie
Une strategie pure du joueur i est un plan daction qui prescrit une action de ce joueur pour chaque fois quil est susceptible de jouer. On note par Si lensemble des stratgies pures du joueur i et par si une stratgie pure de ce joueur. Une strategie mixte du joueur i est une distribution de probabilits p i dnie sur lensemble des stratgies pures du joueur i. On note i lensemble des stratgies mixtes du joueur i et par i une stratgie mixte de ce joueur. Une strategie locale du joueur i en un ensemble dinformation A est une distribution de probabilits sur lensemble des actions disponibles en cet ensemble dinformation. On note iA lensemble des stratgies locales du joueur i pour lensemble dinformation A et iA une stratgie locale de ce joueur en A. Une strategie comportementale du joueur i est un vecteur de stratgies locales de ce joueur, contenant une stratgie locale par ensemble dinformation de ce joueur. On note i lensemble des stratgies comportementales du joueur i, et i une stratgie comportementale de ce joueur.
Equilibres de Nash en stratgies mixtes

Dnition Un quilibre de Nash en stratgies mixtes est un prol de stratgies mixtes tel que pour tout i et tout i i
i (i , i ) i (i , i )

i (i , i ) i (i , i )
Thorme. est un quilibre de Nash si et seulement si pour tout i et tout si S i i (i , i ) i (si , i )

i (i , i ) i (i , i )
Thorme. est un quilibre de Nash si et seulement si pour tout i et tout si S i i (i , i ) i (si , i )

Thorme.[Nash, 1950] Tout jeu sous forme strategique a un equilibre de Nash en strategies mixtes.
La guerre des sexes

Joueur 2 f 2,1 0,0 c 0,0 1,2
Joueur 1
f c
x 1x
Soit x la probabilit avec laquelle le joueur 1 joue f, pour quel x maximise-t-il son niveau de scurit ?
La guerre des sexes

Joueur 2 f 2,1 0,0 c 0,0 1,2
Joueur 1
f c
x 1x
1 (< (f, x), (c, 1 x) >, f ) 1 (< (f, x), (c, 1 x) >, c) = = x 2 + (1 x) 0 x 0 + (1 x) 1 = = 2x 1x
La guerre des sexes

Joueur 2 f 2,1 0,0 c 0,0 1,2
Joueur 1
f c
x 1x
max min(2x, 1 x) = 1/3

x
La guerre des sexes

Joueur 2 f 2,1 0,0 c 0,0 1,2
Joueur 1
f c
x 1x
max min(2x, 1 x) = 1/3

x
Le niveau de scurit du joueur 1 est donc de 2/3.
La guerre des sexes

Joueur 2 f 2,1 0,0 c 0,0 1,2
Joueur 1
f c
x 1x
max min(2x, 1 x) = 1/3

x
Le niveau de scurit du joueur 1 est donc de 2/3. Que se passe-t-il si le joueur 2 est averti que le joueur 1 va jouer cette stratgie ?
Reprsentation graphique du jeu
2x
0 1/3 2/3 1
x
0 1/3 2/3 1
x 1x
2x
0 1/3 2/3 1
x 1x
La guerre des sexes

Joueur 2
y 1y f c Joueur 1 f 2,1 0,0 c 0,0 1,2 Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure rponse du joueur 1 ?
La guerre des sexes

Joueur 2
y 1y f c Joueur 1 f 2,1 0,0 c 0,0 1,2 Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure rponse du joueur 1 ? 1 (f, < (f, y ), (c, 1 y ) >) = y 2 + (1 y ) 0 = 2y 1 (c, < (f, y ), (c, 1 y ) >) = y 0 + (1 y ) 1 = 1 y
La guerre des sexes

Joueur 2
y 1y f c Joueur 1 f 2,1 0,0 c 0,0 1,2 Soit y la probabilit avec laquelle le joueur 2 joue f, quelle est la meilleure rponse du joueur 1 ? 1 (f, < (f, y ), (c, 1 y ) >) = y 2 + (1 y ) 0 = 2y 1 (c, < (f, y ), (c, 1 y ) >) = y 0 + (1 y ) 1 = 1 y Donc:
Si 2y > 1 y (y > 1/3), la meilleure rponse du joueur 1 est de jouer f Si 2y < 1 y (y < 1/3), la meilleure rponse du joueur 1 est de jouer c Si 2y = 1 y (y = 1/3), le joueur 1 est indiffrent entre f et c, il peut donc jouer lune ou lautre, ou nimporte quelle combinaison des deux.
La guerre des sexes

Joueur 2
y 1y f c Joueur 1 f 2,1 0,0 x c 0,0 1,2 1x Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure rponse du joueur 2 ?
La guerre des sexes

Joueur 2
y 1y f c Joueur 1 f 2,1 0,0 x c 0,0 1,2 1x Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure rponse du joueur 2 ? 2 (< (f, x), (c, 1 x) >, f ) 2 (< (f, x), (c, 1 x) >, c) = = x 1 + (1 x) 0 x 0 + (1 x) 2 = = x 2(1 x)
La guerre des sexes

Joueur 2
y 1y f c Joueur 1 f 2,1 0,0 x c 0,0 1,2 1x Soit x la probabilit avec laquelle le joueur 1 joue f, quelle est la meilleure rponse du joueur 2 ? 2 (< (f, x), (c, 1 x) >, f ) = x 1 + (1 x) 0 = x 2 (< (f, x), (c, 1 x) >, c) = x 0 + (1 x) 2 = 2(1 x) Donc: Si x > 2(1 x) (x > 2/3), la meilleure rponse du joueur 2 est de jouer f
Si x < 2(1 x) (x < 2/3), la meilleure rponse du joueur 2 est de jouer c Si x = 2(1 x) (x = 2/3), le joueur 2 est indiffrent entre f et c, il peut donc jouer lune ou lautre, ou nimporte quelle combinaison des deux.
La guerre des sexes

Joueur 2
y 1y f c Joueur 1 f 2,1 0,0 x c 0,0 1,2 1x Les gains des deux joueurs avec un prol en stratgie mixte sont donc: 1 ( ) 2 ( ) = = = = x y 2 + x (1 y ) 0 + (1 x) y 0 + (1 x) (1 y ) 1 3xy x y + 1 x y 1 + x (1 y ) 0 + (1 x) y 0 + (1 x) (1 y ) 2 3xy 2x 2y + 2
La guerre des sexes

Joueur 2
1/3 2/3 f c Joueur 1 f 2,1 0,0 2/3 c 0,0 1,2 1/3 Les gains des deux joueurs avec un prol en stratgie mixte sont donc: 1 ( ) = 3xy x y + 1 2 ( ) = 3xy 2x 2y + 2
Le prol = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un quilibre de Nash en stratgie mixte.
La guerre des sexes

Joueur 2
1/3 2/3 f c Joueur 1 f 2,1 0,0 2/3 c 0,0 1,2 1/3 Les gains des deux joueurs avec un prol en stratgie mixte sont donc: 1 ( ) = 3xy x y + 1 2 ( ) = 3xy 2x 2y + 2
Le prol = (< (f, 2/3), (c, 1/3) >, < (f, 1/3), (c, 2/3) >) est donc un quilibre de Nash en stratgie mixte. Les gains des deux joueurs avec sont : 1 ( ) = 3.2/3.1/3 2/3 1/3 + 1 = 2/3 2 ( ) = 3.2/3.1/3 2.2/3 2.1/3 + 2 = 2/3

y
2/3
1/3
joueur1
1/3
2/3

y
joueur2
2/3
1/3
joueur1
1/3
2/3

y
joueur2
2/3
1/3
joueur1
r
0 1/3 2/3 1
x
Coopration - Itration - Corrlation

Joueur 2 f 2,1 0,0 c 0,0 1,2
Joueur 1
f c
Que se passe-t-il si les 2 joueurs peuvent communiquer avant de jouer ?

Joueur 2 f 2,1 0,0 c 0,0 1,2
Joueur 1
f c
Que se passe-t-il si les 2 joueurs peuvent communiquer avant de jouer ? 1 = 2 = 1/2 2 + 1/2 1 = 3/2

Joueur 2 f 2,1 0,0 c 0,0 1,2
Joueur 1
f c
Que se passe-t-il si les 2 joueurs peuvent communiquer avant de jouer ? 1 = 2 = 1/2 2 + 1/2 1 = 3/2 Lorsque tous les joueurs peuvent observer un mme vnement alatoire, ils peuvent alors saccorder sur des quilibres corrls Une stratgie corrle est une distribution de probabilits sur les prols possibles.

Joueur 2 f 2,1 0,0 c 0,0 1,2
Joueur 1
f c
Que se passe-t-il si les 2 joueurs peuvent communiquer avant de jouer ? 1 = 2 = 1/2 2 + 1/2 1 = 3/2 Lorsque tous les joueurs peuvent observer un mme vnement alatoire, ils peuvent alors saccorder sur des quilibres corrls Une stratgie corrle est une distribution de probabilits sur les prols possibles. Que se passe-t-il si la partie est joue plusieurs fois ?
Itration: Le dilemme des prisonniers...

Deux personnes arrtes ensemble en possession darmes feu sont souponns dun dlit fait en commun. Les policiers les sparent et disent chacun : Si un des deux avoue et que lautre navoue rien, le premier est libr, et le second emprisonn (5 ans); Si les deux avouent, les deux iront en prison (4 ans); Si aucun des deux navoue, les deux seront seront librs assez vite (2 ans). Vous tes un des deux prisonniers, que faites-vous ?
[DIP] Le dilemme des prisonniers

Joueur 2 C 3,3 5,0 D 0,5 1,1
Joueur 1
C D
[DIP] Le dilemme itr...

Vous navez pas vraiment les mmes gots que votre voisin en matire de musique. Il lui arrive souvent dcouter sa musique fond. De mme il vous arrive (en reprsailles) de mettre votre musique un volume plus que raisonnable. Ce qui a pour consquences que le lendemain il recommence nouveau. En dehors de ces priodes agites, vous apprciez les priodes o aucun de vous ne gne lautre. Supposons que lon pondre votre satisfaction : Vous avez une satisfaction de 5 couter votre musique un volume important. La satisfaction est de 0 lorsque votre voisin met sa musique fond. Une soire calme, sans musique vous apporte une satisfaction de 3. Le fait dcouter simultanment votre musique mle celle du voisin, donne une satisfaction de 1. Vous savez ce que votre voisin a eu comme comportement les jours prcdents, que faites-vous aujourdhui?
[DIP] Le dilemme . . .
Introduction par F LOOD et D RESHER la RAND Corp. en 1952 Jeu somme non-nulle 2 joueurs jouent simultanment 2 choix de jeux : COOP ERER , i.e. tre gentil, on notera C TRAHIR , i.e. tre mchant, on notera D Les gains des joueurs, nots S , P , R et T , sont fonction de leur choix de jeu avec : (0) S<P <R<T
[DIP] Le dilemme itr . . .

Les joueurs se rencontrent plusieurs fois chaque itration les joueurs ont connaissance des coups prcdents Ils ne connaissent pas le terme du jeu Le gain dun joueur est le cumul de ses gains dans chaque rencontre Pour favoriser la coopration on ajoute la contrainte :
(0)
S + T < 2R
[DIP] Dilemme itr des prisonniers (rsum)
Dilemme. . . . . . itr
S<P <R<T S + T < 2R
Cooperate
Cooperate R=3 Reward rcompense pour coopration mutuelle

T =5 Temptation tentation trahir
Defect
S=0 Suckers payoff salaire de la dupe P =1 Punishment punition pour la trahison mutuelle
Defect
Score du joueur de la ligne.
[DIP] Des applications concrtes...

Deux pays doivent-ils lever des taxes douanires sur les produits imports de lautre pays. Deux entreprises concurrentes doivent-elles essayer de sentendre pour se partag un march ou se faire concurrence ? Deux espces vivant sur un mme territoire doivent-elles cohabiter ou se disputer la nourriture disponible ?
[DIP] Les stratgies

Quelques exemples :
gentille mchante per_CCD rancunire lunatique majoritaire_gentille majoritaire_mchante donnant_donnant
[DIP] Exemples (rencontres)

1 score de gentille jeu de gentille jeu de mchante score de mchante 0 C
D 5
2 0 C
D 5
3 0 C
D 5
4 0 C
D 5
5 0 C
D 5
6 0 C
D 5
7 0 C
D 5
8 0 C
D 5
9 0 C
D 5
10 0 C
D 5
50
score de per_CCD jeu de per_CCD jeu de rancunire score de rancunire
3 C
C 3
3 C
C 3
5 D
C 0
0 C
D 5
0 C
D 5
1 D
D 1
0 C
D 5
0 C
D 5
1 D
D 1
0 C
D 5
13
33
[DIP] Quelle est la meilleure stratgie ?

qui batte toutes les autres :

qui batte toutes les autres : mchante, car gnralisation du dilemme non itr

qui batte toutes les autres : mchante, car gnralisation du dilemme non itr qui fasse le meilleur score possible face toutes les autres :

qui batte toutes les autres : mchante, car gnralisation du dilemme non itr qui fasse le meilleur score possible face toutes les autres : aucune, car meilleure contre mchante et contre rancunire est impossible

qui batte toutes les autres : mchante, car gnralisation du dilemme non itr qui fasse le meilleur score possible face toutes les autres : aucune, car meilleure contre mchante et contre rancunire est impossible Problme de dnition du critre dvaluation des stratgies

Sur des confrontations de 100 parties : Le gain maximal est de 500 points Le gain minimal est de 0 point Cest ce quobtiennent M CHANTE et G ENTILLE lune contre lautre.

Sur des confrontations de 100 parties : Le gain maximal est de 500 points Le gain minimal est de 0 point Cest ce quobtiennent M CHANTE et G ENTILLE lune contre lautre. Mais... 2 gentilles entre elles obtiennent chacune 300 points 2 mchantes entre elles obtiennent chacune 100 points Chaque stratgie est bonne (au sens du meilleur score) face certaines et mauvaises face dautres car elle ne sait pas qui elle a affaire.
[DIP] Les tournois

Plusieurs stratgies se rencontrent 2 2, comme pour un tournoi sportif Le gain dune stratgie est le cumul de ses scores face chaque adversaire Toutes les parties ont la mme longueur (mme nombre ditrations), mais les stratgies ne la connaissent pas et ne peuvent pas le savoir
[DIP] Exemples (tournoi)

gentille gentille mchante per_CCD rancunire mchante per_CCD rancunire
30 0 21 30 81
50 10 38 14 112
36 3 24 13 76
mchante rancunire gentille per_CCD
30 9 33 30 102
Score
8 1 > > > < 2 Classement > 3 > > : 4
[DIP] Un tournoi
Tournois entre 10 stratgies parmi 12 :
gentille mchante lunatique donnant_donnant rancunire per_DDC per_CCD majoritaire_gentille majoritaire_mchante mante sondeur donnant_donnant_dur
Nombre de tournois jous par chaque stratgie : 55 Donnez le classement du tournoi...
[DIP] Un tournoi
gentille mchante lunatique donnant_donnant rancunire per_DDC per_CCD majoritaire_gentille donnant_donnant majoritaire_gentille rancunire sondeur lunatique mchante majoritaire_mchante mante sondeur donnant_donnant_dur
Scores :
: : : : : :
42 19 4 1 0 0
[DIP] donnant-donnant : une bonne stratgie

Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au coup prcdent, je coopre (C), sil a trahi (D), je trahis (D).

Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au coup prcdent, je coopre (C), sil a trahi (D), je trahis (D). donnant-donnant ne gagne jamais contre personne !

Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au coup prcdent, je coopre (C), sil a trahi (D), je trahis (D). donnant-donnant ne gagne jamais contre personne ! Au mieux elle fait le mme score.

Au premier coup je coopre (C), ensuite si mon adversaire a coopr (C) au coup prcdent, je coopre (C), sil a trahi (D), je trahis (D). donnant-donnant ne gagne jamais contre personne ! Au mieux elle fait le mme score. Mais, au pire elle ne perd que 5 points quel que soit ladversaire et la longueur de la partie !
[DIP] volution cologique

Simulation de lvolution naturelle : Chaque stratgie est reprsente par une population de N entits On effectue un tournoi entre toutes les entits Les entits de faibles stratgies (au sens du classement dans le tournoi) sont dfavorises, celles stratgie forte sont favorises La favorisation est ralise par une redistribution proportionnelle de la population Ce cycle est rpt jusqu stabilisation de la population
[DIP] Exemples (volution)

400 spiteful all_c all_d per_ccd
350
300
250
200
150
100
50
10
12
14
16
18
20
[DIP] Une morale trs morale...

Critres de qualit pour une stratgie (en volution) : [Axelrod,81] Gentillesse Ractivit Pardon Simplicit

Critres de qualit pour une stratgie (en volution) : [Axelrod,81] Gentillesse Ractivit Pardon Simplicit Les bonnes stratgies au dilemme le sont aussi dans les variantes du dilemme (asynchrone, avec renoncement, bruits, . . . )

Critres de qualit pour une stratgie (en volution) : [Axelrod,81] Gentillesse Ractivit Pardon Simplicit Les bonnes stratgies au dilemme le sont aussi dans les variantes du dilemme (asynchrone, avec renoncement, bruits, . . . ) Pour plus de dtails sur le dilemme itr des prisonniers : http://www.lifl.fr/IPD
Jeux rpts
Soit un jeu G = {S, {i }i=1,...,n }, o S est lensemble (ni) des prols de stratgies et i est la fonction dutilit du joueur i. On note (G, T ) le jeu rpt obtenu en jouant T fois le jeu de base G. Lorsque le jeu est rpt un nombre inni de fois, on note (G, ) le jeu correspondant.
Jeux rpts
Soit un jeu G = {S, {i }i=1,...,n }, o S est lensemble (ni) des prols de stratgies et i est la fonction dutilit du joueur i. On note (G, T ) le jeu rpt obtenu en jouant T fois le jeu de base G. Lorsque le jeu est rpt un nombre inni de fois, on note (G, ) le jeu correspondant. On peut galement distinguer les jeux rpts un nombre ni, mais indni de fois: chaque tour, il y a une probabilit 1 q que le jeu sarrte.
Jeux rpts
Soit un jeu G = {S, {i }i=1,...,n }, o S est lensemble (ni) des prols de stratgies et i est la fonction dutilit du joueur i. On note (G, T ) le jeu rpt obtenu en jouant T fois le jeu de base G. Lorsque le jeu est rpt un nombre inni de fois, on note (G, ) le jeu correspondant. On peut galement distinguer les jeux rpts un nombre ni, mais indni de fois: chaque tour, il y a une probabilit 1 q que le jeu sarrte. Facteur dactualisation : Lorsquun jeu est rpt, il se peut que les gains obtenus litration courante t soient plus/moins importants aux yeux de lagent que les gains litration suivante t+1 . Pour modliser cela on peut utiliser un facteur dactualisation .
t = t+1
Le facteur dactualisation = t /t+1 reprsente donc lattrait du joueur pour les gains actuels. ` la Theorie Introduction a des Jeux p.59/77
Jeux rpts: Thorme Folk

Lutilit dun joueur dans un jeu rpt est donc:
t i (G, T ) = T t=0 i (t)

t i (G, T ) = T t=0 i (t)
Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu de base, on utilise la moyenne des gains du joueur: i (G, T )/T

t i (G, T ) = T t=0 i (t)
Pour pouvoir comparer le gain dans le cas du jeu rpt celui du jeu de base, on utilise la moyenne des gains du joueur: i (G, T )/T Si ti (t) = , alors i (G, ) =
1 1

t i (G, T ) = T t=0 i (t)
1 1
Thorme Folk: Soit un jeu rpt (G, ) avec un facteur dactualisation sufsamment proche de 1 et = (1 , . . . , 2 ) un vecteur de gains ralisable de ce jeu, alors il existe un quilibre de Nash du jeu rpt qui donne comme vecteur de gains.

t i (G, T ) = T t=0 i (t)
1 1
Thorme Folk: Soit un jeu rpt (G, ) avec un facteur dactualisation sufsamment proche de 1 et = (1 , . . . , 2 ) un vecteur de gains ralisable de ce jeu, alors il existe un quilibre de Nash du jeu rpt qui donne comme vecteur de gains. Lquilibre de Nash en question est un quilibre de Nash parfait en sous-jeux (voir plus loin). Notion de menace crdible.

t i (G, T ) = T t=0 i (t)
1 1
Thorme Folk: Soit un jeu rpt (G, ) avec un facteur dactualisation sufsamment proche de 1 et = (1 , . . . , 2 ) un vecteur de gains ralisable de ce jeu, alors il existe un quilibre de Nash du jeu rpt qui donne comme vecteur de gains. Lquilibre de Nash en question est un quilibre de Nash parfait en sous-jeux (voir plus loin). Notion de menace crdible. Ce rsultat signie que lensemble des quilibres de Nash dun jeu rpt est immense: quasiment toute squence (nie) de jeu correspond un quilibre de Nash.
Jeux deux joueurs Somme nulle

Rle central le plus simple pas de notion de majorit pas de coalition

Rle central le plus simple pas de notion de majorit pas de coalition Strictement Comptitif Les joueurs ont des prfrences strictement opposes Pour tout prol de stratgies s, on a 1 (s) + 2 (s) = a

Rle central le plus simple pas de notion de majorit pas de coalition Strictement Comptitif Les joueurs ont des prfrences strictement opposes Pour tout prol de stratgies s, on a 1 (s) + 2 (s) = 0

Rle central le plus simple pas de notion de majorit pas de coalition Strictement Comptitif Les joueurs ont des prfrences strictement opposes Pour tout prol de stratgies s, on a 1 (s) + 2 (s) = 0 Exemples : Jeux de plateau (echecs, dames, . . .) Guerre ...
Jeux deux joueurs somme nulle - Exemple

Joueur 2
y1 18,-18 0,0 5,-5 9,-9 y2 3,-3 3,-3 4,-4 3,-3 y3 0,0 8,-8 5,-5 0,0 y4 2,-2 20,-20 5,-5 20,-20
Joueur 1
x1 x2 x3 x4

Joueur 2
y1 18 0 5 9 y2 3 3 4 3 y3 0 8 5 0 y4 2 20 5 20
Joueur 1
x1 x2 x3 x4

Joueur 2
y1 18 0 5 9 y2 3 3 4 3 y3 0 8 5 0 y4 2 20 5 20
Joueur 1
x1 x2 x3 x4
Le joueur 1 tente de maximiser son niveau de scurit vx = maxi (minj (xi , yj )) Le joueur 2 tente de minimiser le niveau de scurit du joueur 1 vy = minj (maxi (xi , yj ))

Joueur 2
y1 18 0 5 9 y2 3 3 4 3 y3 0 8 5 0 y4 2 20 5 20
Joueur 1
x1 x2 x3 x4
Le joueur 1 tente de maximiser son niveau de scurit vx = maxi (minj (xi , yj )) Le joueur 2 tente de minimiser le niveau de scurit du joueur 1 vy = minj (maxi (xi , yj )) Si vx = vy = v , alors tout couple de stratgies (xi , yi ), xi garantissant v au joueur 1 et yi garantissant v au joueur 2 forment un quilibre de Nash et sont des stratgies respectivement maximin et minimax pour les joueurs 1 et 2. ` la Theorie Introduction a des Jeux p.62/77

3 u (1,0,3) u (2,3,1) w 1 y (3,2,2) x 2 y (2,3,1) x 3 w (3,2,9) u (5,5,5)
x (3,0,0) w (4,2,4)
1 y
2

3 u (1,0,3) u (2,3,1) w 1 y (3,2,2) x 2 y (2,3,1) x 3 w (3,2,9) u (5,5,5)
x (3,0,0) w (4,2,4)
1 y
2
Rcurrence rebours (backward induction) On commence par chercher les choix optimaux la dernire priode (noeuds terminaux). On remonte larbre de noeud en noeud, en cherchant chaque noeud le choix optimal, une fois quon a pris en compte les choix optimaux pour chaque noeud ls.

` information parfaite a un Tout jeu (ni) sous forme extensive a equilibre de Nash en strategies pures (equilibre obtenable par ` rebours). (Zermelo (1953), Kuhn (1953)) recurrence a
Forme extensive - Sous-jeu

1 x (2,2) u (3,1) w (2,-2)
y 2 v r z (-2,2) 1 2 s
w (-2,2)
z (2,-2)

1 x (2,2) u (3,1) y 2 v 1 (0,0)

1 x (2,2) u (3,1) y 2 v 1 (0,0)
Un sous-jeu dun jeu sous forme extensive est un jeu compos dun noeud (qui est un ensemble dinformation singleton), de tous les noeuds successeurs de ce noeud, de tous les arcs reliant ces noeuds, et des utilits associes tous les noeuds terminaux successeurs.
Forme extensive - Menaces non crdibles

1 x (2,2) u (3,1) y 2 v (0,0) Joueur 1 x y u 2,2 3,1 v 2,2 0,0
Joueur 2
Forme extensive - Menaces non crdibles

1 x (2,2) u (3,1) y 2 v (0,0) Joueur 1 x y u 2,2 3,1 v 2,2 0,0
Joueur 2
lquilibre de Nash xv nest pas crdible car il repose sur la menace non-crdible du joueur 2 de jouer v .
Equilibre parfait en sous-jeux

Un quilibre de Nash dun jeu sous forme extensive est un equilibre parfait en sous-jeux si toute restriction du prol de stratgies un sousjeu est un quilibre de Nash pour ce sous-jeu.
Equilibre parfait en sous-jeux

Un quilibre de Nash dun jeu sous forme extensive est un equilibre parfait en sous-jeux si toute restriction du prol de stratgies un sousjeu est un quilibre de Nash pour ce sous-jeu.
Pour les jeux informations parfaites, la notion dquilibre parfait en sous-jeux concide avec la notion de rcurrence rebours.
Promesse non crdible
Exploiter 2 Daccord pour travailler 2 1 Ne pas exploiter 2
(2,-1)
(1,1)
Pas daccord pour travailler
(0,0)
Promesse non crdible
Exploiter 2 Daccord pour travailler 2 1 Ne pas exploiter 2
(2,-1)
(1,1)
Pas daccord pour travailler
(0,0)
Rputation
Le mille-pattes - Limites de la rcurrence rebours
1 D (1,1)
2 d (0,3)
1 D (2,2) R
1 ... D (98,98)
2 d (97,100)
1 D (99,99)
2 d
(100,100)
(98,101)
Limites de la rcurrence rebours

Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur
1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.
Limites de la rcurrence rebours

Un jeu de partage : Les joueurs 1 et 2 doivent se partager 10 euros. Le joueur
1 choisit dabord un partage quelconque. Le joueur 2 peut accepter ou refuser. Si le joueur 2 refuse, il fait une proposition pour partager 1 euro. Le joueur 1 peut accepter ou refuser. Si le jouer 1 refuse les deux joueurs ne gagnent rien.
Ecrire ce jeu sous forme extensive en ne considrant que les partages (5,5) et (8.5,1.5) pour 1 et le partage (0.5,0.5) pour 2.
Jeux coopratifs 2 joueurs

Dans les jeux coopratifs on autorise la communication et les accords entre joueurs avant la partie. Tous les messages formuls par un joueur sont transmis sans modication lautre joueur. Tous les accords entre joueurs seront respects. Lvaluation des situations par un joueur nest pas perturbe par les ngociations prliminaires. Guerre des sexes
Jeu de marchandage - Ensemble de ngociation

L ensemble de negociation dun jeu de marchandage est lensemble des issues :
ralisables appartenant lespace de marchandage efcientes telles quaucune autre issue ne donne plus un joueur et autant lautre (non pareto-domine) individuellement rationnelles chaque joueur gagne au moins autant que le gain quil est sur dobtenir si il ny a pas daccord.
Jeu de Marchandage - Solution de Nash

` lechelle Invariance a dutilite Si [R1 , (u1 , v1 )] et [R2 , (u2 , v2 )] sont deux versions du mme jeu de marchandage, ie si ils ne diffrent que sur les units et lorigine des fonctions dutilits, alors les deux solutions F ([R1 , (u 1 , v1 )]) et F ([R2 , (u 2 , v2 )]) doivent tre les mmes au changement dchelle prs. Pareto optimalite La solution du jeu de marchandage (u0 , v0 ) doit satisfaire les proprits suivantes : u0 u et v0 v (u0 , v0 ) est un point de R il ny a pas de (u, v ) dans R (diffrent de (u0 , v0 )) tel que u u0 et v v0 .

Independance des alternatives non disponibles Soient deux jeux de marchandage avec le mme point de status quo et tels que les issues du premier sont incluses dans les issues du second. Si la solution du second jeu est ralisable dans le premier jeu, alors ce doit tre aussi la solution du premier jeu : Si R1 R2 et F ([R2 , (u , v )]) R1 , alors F ([R1 , (u , v )]) = F ([R2 , (u , v )]) Symetrie Si un jeu de marchandage a les proprits suivantes : u = v (u, v ) R implique (v, u) R (u0 , v0 ) = F ([R, (u , v )]) Alors u0 = v 0

Soit un jeu de marchandage [R, (u , v )], procdons comme suit : Changeons lorigine des utilits des joueurs pour que le point (u , v ) soit transform en (0, 0). Soit [R , (0, 0)] le jeu correspondant. Dans R trouver (lunique) point (u0 , v0 ) (u0 > 0 et v0 > 0) tel que u0 v0 est le maximum de tous les produits uv avec (u, v ) dans R (u > 0 et v > 0). Le point (u0 , v0 ) est la solution de Nash du jeu [R , (0, 0)]. La solution de Nash de [R, (u , v )] est obtenu en inversant la transformation dutilit.

Soit un jeu de marchandage [R, (u , v )], procdons comme suit : Changeons lorigine des utilits des joueurs pour que le point (u , v ) soit transform en (0, 0). Soit [R , (0, 0)] le jeu correspondant. Dans R trouver (lunique) point (u0 , v0 ) (u0 > 0 et v0 > 0) tel que u0 v0 est le maximum de tous les produits uv avec (u, v ) dans R (u > 0 et v > 0). Le point (u0 , v0 ) est la solution de Nash du jeu [R , (0, 0)]. La solution de Nash de [R, (u , v )] est obtenu en inversant la transformation dutilit.
es desir ees Thorme. Lunique solution qui verie les 4 propriet est la solution de Nash. (Nash (1950))
Jeux contre la nature

Si on considre un jeu deux joueurs dont un des deux joueurs est la nature, on fait de la dcision dans le risque ou dans lincertain. En ce sens la thorie de la dcision peut tre vue comme un cas particulier de la thorie des jeux.
Conclusion
Jeux coopratifs Jeux information incomplte Rationalit limite

The Orie Des Jeux

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

The Orie Des Jeux

Încărcat de

Drepturi de autor:

Formate disponibile

Introduction la Thorie des Jeux

CRIL-CNRS dArtois - Lens Universite

` la Theorie Introduction a des Jeux p.1/77

Thorie des Jeux

` la Theorie Introduction a des Jeux p.2/77

Thorie des Jeux

groupe interaction stratgique rationnels

` la Theorie Introduction a des Jeux p.2/77

Thorie des Jeux

groupe interaction stratgique rationnels Normatif vs Descriptif

` la Theorie Introduction a des Jeux p.2/77

A quoi sert la thorie des jeux ?

` la Theorie Introduction a des Jeux p.3/77

Nash (1950) Selten (1965), Harsanyi (1967)

` la Theorie Introduction a des Jeux p.4/77

` la Theorie Introduction a des Jeux p.5/77

Terminologie - Une petite taxonomie...

` la Theorie Introduction a des Jeux p.6/77

` la Theorie Introduction a des Jeux p.7/77

Formalisation dun Jeu

Autres informations importantes: Information Rptition

` la Theorie Introduction a des Jeux p.8/77

Jeux sous forme stratgique - Exemple

` la Theorie Introduction a des Jeux p.9/77

` la Theorie Introduction a des Jeux p.10/77

` la Theorie Introduction a des Jeux p.10/77

Jeux sous forme stratgique

` la Theorie Introduction a des Jeux p.11/77

Jeux sous forme extensive - Exemple

` la Theorie Introduction a des Jeux p.12/77

Jeux sous forme extensive

` la Theorie Introduction a des Jeux p.13/77

Jeux sous forme extensive - Ensemble dinformations

` la Theorie Introduction a des Jeux p.14/77

Jeux sous forme extensive - Ensemble dinformations

` la Theorie Introduction a des Jeux p.14/77

Jeux sous forme extensive - Ensemble dinformations

` la Theorie Introduction a des Jeux p.14/77

Jeux sous forme extensive - Ensemble dinformations

Ensembles dinformation : {A} et {B, C } Coups simultans Incertitude (croyances)

` la Theorie Introduction a des Jeux p.14/77

Relation entre formes stratgique et extensive

` la Theorie Introduction a des Jeux p.15/77

Relation entre formes stratgique et extensive

` la Theorie Introduction a des Jeux p.15/77

` la Theorie Introduction a des Jeux p.16/77

Relation entre formes stratgique et extensive

` la Theorie Introduction a des Jeux p.17/77

Relation entre formes stratgique et extensive

` la Theorie Introduction a des Jeux p.18/77

Relation entre formes stratgique et extensive

s3 3,1 2,5 y u (2,5)

Elimination de stratgies domines

` la Theorie Introduction a des Jeux p.20/77

Elimination de stratgies domines

` la Theorie Introduction a des Jeux p.20/77

Elimination de stratgies domines

` la Theorie Introduction a des Jeux p.20/77

Elimination de stratgies domines

` la Theorie Introduction a des Jeux p.20/77

Elimination de stratgies domines

` la Theorie Introduction a des Jeux p.20/77

Elimination de stratgies domines

` la Theorie Introduction a des Jeux p.21/77