Documente Academic
Documente Profesional
Documente Cultură
Conclusion25
Bibliographie
2
Introduction
3
I prsentation de la thorie des jeux
1.Historique
4
2. Dfinition
La thorie des jeux peut tre dnie comme ltude mathmatique des
Interactions Stratgiques entre plusieurs agents Rationnels.
Interaction : il y a plusieurs agents (appels aussi joueurs, "dcision makers",
etc...), et ils interagissent : le contentement (appel aussi paiement, gain, utilit,
bien-tre) de chacun ne dpend pas que de lui, mais aussi en partie des autres.
Stratgique : Les joueurs ont le choix entre plusieurs options.
Rationnel : un joueur ne joue pas nimporte comment, il cherche optimiser
son paiement.
3. Hypothses
Rationalit
Cest une hypothse fondamentale. En effet, chaque joueur cherche
maximiser ses gains. Le gain de chacun dpend autant des dcisions des autres
que de sa propre dcision. Il est donc ncessaire quil y ait anticipation de ce
que vont faire les autres et cela repose sur des croyances.
Information Complte
Chaque joueur connat tous les dtails du modle et peut se mettre la place
du modlisateur. Il sait que les autres savent quil sait, quils savent quil sait
quils savent, etc.
5
II typologie des jeux
1. Jeux coopratifs et non coopratifs
Les joueurs peuvent communiquer librement et passer entre eux des accords
qui les lient de faon contraignante.
Ils cherchent lintrt gnral suivi dun partage des gains entre tous les joueurs
(intelligence collective).
Jeux solidaires : les joueurs gagnent ou perdent tous ensemble (ils ne jouent pas
lun contre lautre).
Exemple: Le ct de conduite
6
Jeux non coopratifs
Soit une entreprise 1 et une entreprise 2 ayant leur disposition les actions:
produire et ne pas produire :
Un jeu est somme nulle si la somme des gains est constante : somme gale
zro.
Dans ce type de jeu ce que gagne lun des joueurs lautre le perd.
Par exemple, les checs; le poker; la pierre, papier, ciseau sont des jeux somme
nulle.
Exemple : Jeu de matching :
Deux joueurs annoncent simultanment Pile ou face:
- Si les annonces sont identiques:
*Le joueur 1 reoit 20 que lui paie le joueur 2.
- Si les annonces ne concordent pas:
*Le joueur 1 verse 20 2.
7
La matrice des gains est donc la suivante
J2 Pile Face
J1
Pile (20;-20) (-20;20)
Face (-20;20) (20;-20)
Dit aussi jeux somme positive. Ils reprsentent les situations o les joueurs
peuvent potentiellement gagner sils parviennent cooprer ou coordonner
leurs stratgies.
Alors le rsultat dun tel jeu peut tre:
*(positif; positif): tous les joueurs sont gagnants.
*(ngatif; ngatif):tous les joueurs sont perdants.
Exemple:
Soit deux entreprises ont le choix dans leur politique de communication
entre lancer une compagne de publicit ou ne rien faire .
E1
Lancer la (40;90) (60;50)
compagne
pub
Ne rien faire (25;140) (25;50)
8
3. Jeux simultans et jeux squentiels
Jeux squentiels
Il existe des jeux o les joueurs jouent lun aprs lautre: jeux squentiels.
Celui qui joue en premier est le leader , celui qui joue en deuxime est le
follower .
Le joueur dans ce cas peut savoir ce que lautre a jou avant de prendre sa
dcision.
Exemple :
Un monopoleur peut observer le comportement de la demande des
consommateurs avant de produire.
Un duopoleur peut observer linvestissement en capital de son concurrent
avant de prendre sa propre dcision.
Remarque:
Le duopole: une structure du march oligopolistique dans laquelle deux
entreprises offreuses font face une infinit de demandeurs.
Jeux simultans
Chaque joueur choisit son plan daction complet au dbut du jeu et une fois
pour toutes.
Le joueur ne connat pas les choix effectu par les autres joueurs donc il
doit prvoir les choix des autres.
9
4. Jeux finis
On dit qu'un jeu est fini lorsque l'ensemble des stratgies de chacun des
joueurs est fini.
Le dilemme du prisonnier est un jeu fini car chacun des joueurs n'a que deux
stratgies possibles.
5. Jeux rpts
10
simultanit des choix des joueurs, soit lorsque des vnements alatoires sont
cachs certains joueurs.
(Matrice de gain)
On trouve 2 cas :
Cas 1 : Ici, Les deux entreprise s'ils pratiquent le prix du march tout le monde
gagne.) Situation favorable.
Cas 2 : Si Les deux entreprise se lancent dans une guerre de prix, ou ils sont
diffrent de leurs dcision tout le monde perds.) Situation n'est pas favorable.
11
1) Forme extensive :
Dans tous les jeux, les dcisions peuvent tre reprsentes par un arbre, dont
chaque nud est associ au joueur qui dcide. Chaque option constitue une
branche. Les gains de tous sont associs aux terminaisons ou feuilles de l'arbre.
Un joueur na toutefois pas besoin de savoir comment il est parvenu un nud :
Seul compte l'tat prsent du jeu, et les positions recherches dans le futur. Lorsque
certains mouvements ne sont autoriss quaprs un vnement donn, cet
vnement nest quun des lments matrialiser dans ltat prsent du jeu et n'a
pas besoin de faire partie d'un historique.
Une forme extensive de jeu est un arbre de dcision dcrivant les actions
possibles des joueurs chaque tape du jeu, la squence de tours de jeu des
joueurs, ainsi que l'information dont ils disposent chaque tape pour prendre
leur dcision.
Cette information est reprsente sous forme d'ensembles d'information qui
forment une partition des nuds de l'arbre, chaque classe de la partition
contenant les nuds non distinguables par le joueur une tape du jeu. Si ces
classes sont des singletons, cest--dire que chacune est constitue d'un seul
nud de l'arbre du jeu, le jeu est dit information parfaite, ce qui signifie
que chaque joueur sait tout moment o il se situe dans l'arbre du jeu.
Dans le cas contraire, le jeu est dit information imparfaite. L'information
imparfaite est reprsente sous la forme d'un joueur non rationnel : la Nature ,
joueur qui prend alatoirement certaines dcisions telle ou telle tape du jeu,
orientant la suite du jeu vers une certaine sous-barbe de l'arbre du jeu.
12
100,100
b1
B
b2 750,250
a1
250,750
A b1
a2 B
b2 500,500
Schma n1
Larbre ci-dessous est la forme extensive du jeu reprsentant les gains que
les entreprises A et B obtiendront en entreprenant une compagne de
publicit ou non. Le jeu commence au sommet reprsent par un gros point
et constitue par la mme le choix initial effectu par le premire entreprise
dont on suppose quelle sagit de lentreprise A. les deux premieres
branches de larbre reprsentent ses deux possibilits daction faire la
publicit : a1 ou a2 : ne pas faire de publicit . Au bout de chacune de
ces deux branches apparaissent des nuds partir desquels lentreprise B
peut son tour choisir entre deux actions faire la publicit : b1 ou ne
pas faire : b2 , aprs avoir pris de connaissance de la dcision de A.
lorsque lentreprise B fait son choix, les jeux sarrte et les branches de
larbre se terminent par des nombres reprsentent les gains ou payement
reus par chaque entreprise pour toutes les squences du jeu. Ces gains sont
donns dans lordre dintervention de chaque entreprise. Par exemple, si les
stratgies choisies par les deux entreprises sont (a2, b2), c'est--dire
quaucune entreprise ne dsire faire de publicit, chacune aura un bnfice
de 500. Par contre si lentreprise A dcid de faire la publicit alors que B
refuse, les stratgies (a1, b2 ou inversement), alors lentreprise A
augmentera ses profits de 50% (750). Les stratgies de lentreprise B sont
dans ce cas conditionnelles celle de A. dans ce jeu squentiel on a
13
suppos que B ne prend sa dcision quaprs avoir pris connaissance de
laction entreprise par A. Dans ce cas, en parle
de jeu dynamique information parfaite car lorsque B dcide de son action,
elle sait si A a choisi de faire la publicit ou non.
b1 100,100
a1 b2
750,250
A B
b1 250,750
a2
b2 500,500
Schma n 2
14
IV le dilemme du prisonnier
Quelque part, un crime est commis et la police arrte deux suspects. La
police est certaine que ces deux hommes sont impliqus dans le crime, mais n'ont
aucune preuve. L'un des policiers a eu alors une ide. Il dcide de mettre les
prisonniers dans des cellules spares et leur fait la proposition suivante: Ils ont
le choix entre dnoncer leur complice et passer moins de temps en prison ou ils
peuvent tous deux garder le silence.
Si aucun des prisonniers ne parle, la police n'aura aucune preuve et les deux
prisonniers iront en prison 1 an pour possession d'arme. Si l'un d'eux parle et
l'autre garde le silence, le mouchard sera libre et l'autre ira en prison pour 10 ans.
Si les deux prisonniers se dnoncent mutuellement, alors ils iront en prison pour
8 ans (et non 10 ans, car ils auront aid la justice tous les deux).
P1 Silence P1 Dnonce
P2 Silence 1,1 0,10
P2 Dnonce 10,0 8,8
Ce tableau s'appelle une matrice o nous voyons tous les rsultats possibles
pour les deux "joueurs" (les prisonniers) impliqus dans ce jeu. Le premier nombre
est toujours le rsultat pour le premier prisonnier (P1) et le nombre aprs la virgule
est le rsultat pour le second prisonnier (P2).
15
En analysant la situation dinterdpendance de chacun des prisonniers, il est
vident que pour eux, la meilleure solution est davouer le crime en esprant que
lautre niera. Il y a donc une interdpendance comptitive ou il y aura un gagnant
et un perdant, sauf que si les deux prisonniers adoptent le mme schma de
rflexion alors ils se retrouvent dans une relation de perdant- perdant.
Tout cela est un problme de confiance, que se portent les deux prisonniers.
Mais sils identifient tous les deux quil y a une solution gagnant- gagnant, il y
aura donc une interdpendance cooprative.
Imaginons que nous soyons P1. Nous sommes assis dans notre cellule,
rflchissant ce qu'il faut faire. Nous ignorons ce que fera P2 et nous n'avons
aucun moyen de communiquer. Si P2 nous dnonce, alors il est prfrable pour
nous de le dnoncer galement. Si P2, ne nous dnonce pas, alors notre meilleur
choix est aussi de le dnoncer. Dans les deux cas, peu importe ce que choisit P2,
le dnoncer vous permet de rduire le temps que vous passerez en prison.
Pour P2, la situation est exactement la mme et il aura intrt nous dnoncer
pour les mmes raisons. Certes, P1 peut penser : "Peut-tre que je ne devrais rien
dire, si P2 fait de mme, nous serons libres dans 1 an". Mais si P2 dcide de parler,
vous irez en prison pour 10 ans ! Avez-vous envie de prendre ce risque ? En
gnral, non.
Aussi, la fin du "jeu", les deux prisonniers coperont de 8 ans de prisons.
Cette situation s'appelle l'quilibre de Nash, d'aprs le nom du clbre
mathmaticien John Forbes Nash. Lorsque cet quilibre est atteint, aucun joueur
ne peut ajuster sa stratgie unilatralement pour en tirer profit. C'est exactement ce
qui se passe pour nos deux prisonniers. Imaginons que nous soyons sur le point
d'quilibre de Nash, les deux prisonniers se dnoncent et vont en prison pour 8 ans.
P1 peut changer sa stratgie et garder le silence, mais il ira en prison pour 10 ans
et n'aura rien gagn. La situation est la mme pour P2. Aucun changement
unilatral de stratgie ne peut profiter ces "joueurs".
16
V- Lquilibre du jeu
- 1) Stratgie dominante :
Le concept de stratgie est fondamental dans la thorie des jeux .une stratgie est
la description parfaite et complte de la manire dont une joueur ragit en prsence
de chaque circonstance. Les issues qui dcoulent de lintersection des couples de
stratgie sont consignes lintrieur dune matrice de gains.
Entreprise B
Produire plus Produire moins
Entreprise Produire plus 12 ,22 11 ,32
A Produire moins 22,18 20,27
(Matrice de gain)
Supposons dabord que entreprise a entam le jeu et B ragit ensuite .Si entreprise
A choisi la stratgie produire plus, le meilleur choix pour B est celui de la stratgie
produire moins, puisqu elle lui permet de gagner 32 au lieu de 22 avec la
stratgie produire plus. Si par contre, A choisi la stratgie produire moins, B a
intrt rpondre en utilisant la stratgie produire moins qui lui rapporte 27 au
lieu de 18 . On constate alors que lentreprise B ralise le meilleur gain en
utilisant la stratgie produire moins quelle que soit la stratgie utilise par
lentreprise A. on dit alors que la stratgie produire moins est une stratgie
dominante pour lentreprise B car elle constitue sa meilleure rponse possible
toutes les stratgies de A.
De mme, lorsque B entame le jeu et choisit dabord la stratgie produire plus,
lentreprise A a intrt choisir la stratgie produire moins qui lui rapporte 22
au lieu de 12 avec produire plus. Dans le cas o lentreprise B choisit la
stratgie produire moins, la meilleure rponse pour A est encore celle avec la
stratgie produire moins, qui lui permet de gagner 20 au lieu de 11 . On
17
constate l aussi que la stratgie produire moins est une stratgie dominante pour
lentreprise A, puisque quoi que fasse lentreprise B, elle ralise le meilleur gain
avec cette stratgie.
On constate dans cet exemple, que les deux entreprises ont la mme stratgie
dominante : toute les deux doivent produire moins. Dans ce cas, on dit que le
rsultat final du jeu est quilibre stable pour les deux entreprises et on lappelle
quilibre en stratgie dominante.
Joueur B
gauche droite
Joueur A haut 2, 1 0, 0
bas 0, 0 1, 2
Quand B choisit gauche, les gains pour A sont 2 ou 0. Quand B choisit droite,
les gains pour A sont 0 ou 1. Cela signifie que quand B choisit gauche, A prfre
haut et quand B choisit droite, A prfre bas. Le choix optimal de A dpend donc
de ce quil croit que B fera.
La stratgie (haut, gauche) est un quilibre de Nash. En effet, si A choisi haut,
la meilleure chose que B puisse faire, cest choisir gauche puisque son gain est 1
sil choisit gauche et 0 sil choisit droite.
18
Nous dirons quune paire de stratgies est un quilibre de Nash1 si le choix
de A (ou de B) est optimal compte tenu du choix de B(ou de A).
Une autre faon de dfinir un quilibre de Nash est une situation dont personne
na intrt dvier individuellement, sachant la stratgie de lautre. Ne pas
dvier individuellement veut dire que les individus font un choix optimal qui
maximise leur utilit compte tenu de la stratgie de lautre. Lautre fait le mme
raisonnement compte tenu de la stratgie du premier joueur.
Exemple 1
Le concept dquilibre de Nash montre clairement quil sagit simplement
dune gnralisation de lquilibre de Cournot. Dans le cas de lquilibre de
Cournot, la variable de dcision est la quantit doutput produite qui est une
variable continue et chaque firme choisit loutput qui maximise son profit compte
tenu du choix de lautre firme.
En effet, lorsque le concurrent augmente sa production, la moins mauvaise
solution consiste, pour la firme, diminuer la sienne : ceci limite la baisse du
prix due la hausse de la production du concurrent, sans ncessairement viter la
diminution de la recette totale, et permet de diminuer le cot de production.
Exemple 2
Lquilibre de Bertrand, galement est un quilibre de Nash avec des
stratgies en prix. Chaque firme choisit le prix qui maximise son profit, compte
tenu du choix quelle pense que lautre firme fera.
Tout dabord, un jeu peut avoir plus quun quilibre de Nash. En fait, les
choix (bas, droite) correspondent galement un quilibre de Nash.
Le second est que pour certains jeux, de tels quilibres nexistent pas.
1
John F. Nash junior, n en 1928, a reu le prix Nobel en 1994 avec ReinhartSelten et John Harsanyi pour la thorie des
jeux non coopratifs.
19
3. Les stratgies mixtes :
A. Equilibre de Nash en stratgie mixte :
Certains jeux peuvent ne pas avoir dquilibre de Nash ou en avoir plusieurs. Dans
ces deux situations, il y a donc indtermination. Afin de contourner ce De
dicult, il a t propos de faire intervenir les probabilits au moment de la prise
de dcision, plutt que de retenir une action, les joueurs aectent des probabilits
aux actions parmi les lesquelles ils doivent choisir. On dit alors quils font appel
des stratgies mixtes plutt qu des stratgies pures (probabilit Distribuer une
action est gale 1).
Le recours une approche probabiliste pose le problme du critre dvaluation
des gains, qui ne sont plus certains. Problme qui est rsolu en thorie des jeux
comme en thorie de la dcision par ladoption du principe de lesprance
mathmatique. Il sagit de pondrer les gains associs aux dfrentes issues par la
probabilit de survenance de celles-ci.
Le principal argument avanc pour justifier le recours aux stratgies mixtes est
dordre mathmatique. Nash a montr que tout jeu information complte et
imparfaite comporte au moins un quilibre en stratgies mixtes. Lquilibre
envisag est un quilibre de Nash.
Ainsi accepter les stratgies mixtes lve lhypothse de lventuel non existence
dun quilibre en information complte et imparfaite, et permet de justifier
limportance accorde aux quilibres. Cependant, la prise en compte des stratgies
mixtes nest pas sans inconvnients. Elle ne peut entraner quune augmentation
du nombre dquilibres.
Exemple :
Reprenons le jeu dans lequel deux entreprises A et B ont la possibilit de
lancer un nouveau produit pour lequel les dbouchs sont limits, sans quil ny
ait de compromis
Entre elles si toutes deux dcident de produire.la matrice des gains pour les deux
entreprises devraient ressembler celle prsente dans le tableau 1.
20
Entreprise
B
Produit Ne produit pas
Entreprise Produit 3, 1 1, 3
A Ne produit pas 0, 5 4, 2
Rsoudre le jeu :
Dans ce cas particulier, IL ny a pas dquilibre de Nash.
Il ny a pas de solution naturelle au jeu.
Ayant observ les comportements de deux firmes, on peut considrer que
Enterprise B choisira la stratgie produit et ne produit pas avec la mme
probabilit 1/2.
Enterprise A choisira la stratgie produit avec une probabilit 0,6 et la stratgie ne
produit pas avec une probabilit gale :
1-0,6= 0,4
Soit la matrice prenant en compte les probabilits des stratgies.
Entreprise
B
Produit Ne produit
(q=0,5) pas (q=0,5)
Entreprise Produit (p=0,6) 3, 1 1, 3
A Ne produit pas 0, 5 4, 2
(p=0,4)
21
On calcul ainsi les esprances de gains et on les compare.
La valeur espre dune stratgie est. Le gain que lon sattend recevoir
pondr par les probabilits de choix de lautre joueur.
Si Enterprise A utilis la stratgie mixte P=0,6 et (1-p)=0,4, alors le gain
espr de Enterprise B associ ses stratgies pures est :
EGB (produit) = (0,6 x 1) + (0,4 x 5) = 2,6
EGB (ne produit pas) = (0,6 x 3) + (0,4 x 2) = 2,6
Enterprise B est indiffrent entre ses deux stratgies produit et ne produit pas.
Pour Enterprise A :
EGA (produit) = (0,5 x 3) + (0,5 x 1) = 2
EGA (ne produit pas) = (0,5 x 0) + (0,5 x 4) = 2
Enterprise A est aussi donc indiffrent entre ses deux stratgies pures mais
comme Enterprise A sait que Enterprise B jouera ne produit pas, elle va choisir
ne produit pas car elle gagnera Si Enterprise B choisira de jouer produit
lEnterprise A va choisir la stratgie produit puisque elle gagnera 3.
La solution en stratgie mixte est donc (ne produit pas, ne produit pas) et
(Produit, produit) Limperfection de linformation rend lanalyse nettement
complique. Il y a trs souvent une multiplicit dquilibres de Nash possibles.
Pour les slectionner, on a recours des concepts de solutions plus complexes,
comme lquilibre bay sien ou lquilibre squentiel qui permettent de choisir
entre les quilibres de Nash.
22
videmment, il sut quun seul joueur ne retienne pas sa stratgie dquilibre
pour que celuici ne se ralise pas.
Il peut arriver quil y ait des quilibres de Nash au sens faible avec des
stratgies pures mais cela est plutt exceptionnel, alors que cela est toujours le
cas avec les quilibres en stratgies mixtes.
Se pose galement la question de savoir quelle signification donner au fait
que les joueurs annoncent des probabilits dactions, alors que le but de
modlisateur est dobtenir un ou des rsultats prcis.
En outre, ds que lannonce est faite, le jeu est termin, quelle que soit
lissue. Pourtant derrire la notion de probabilit, il y a lide de rptition qui
permet de se faire une opinion sur le caractre plus
Ou moins probable dun vnement.
23
avant sa concurrente et son logiciel possde une meilleure interface utilisateur)
chacune des deux entreprise se demande prsent si elle doit investir ou non
dans une nouvelle mthode de cryptage.
Elle faut note que lentreprise 2 a une stratgie dominante : elle a intrt
investir puisque, quoique fasse sa concurrente ses gains sont plus important en
investissant. Lentreprise 1 sattende donc ce que lentreprise 2 investisse. Dans
ce cas, le mieux quelle puisse faire est investir galement (elle gagnera alors 20
millions deuros) plutt que de ne pas investir (et perdre 10 millions deuros). Il
apparait clairement que la paire de stratgie (investir, investir) est dans ce jeu un
quilibre de Nash, il est facile de vrifier que cet quilibre est unique.
Mais les gestionnaires doivent tre absolument srs que ceux de lentreprise 2
ont parfaitement compris le jeu et sont rationnels. Si par malheur lentreprise 2 se
trompait est dcidait de ne pas investir, ce serait extrmement coteux que
lentreprise 1 (les mthodes de cryptage devenant alors incompatibles, cela
crerait de la confusion chez le consommateur, et lentreprise 1, parc quelle
domine une grand part du march, perdait 100 millions deuros)
Une telle stratgie est appel stratgie de Maximin, car elle consiste
maximiser le gain minimum pouvant tre obtenue. Si les deux entreprise en des
stratgies du type Maximin il en rsultera que lentreprise 1 ninvestira pas, alors
quau contraire lentreprise 2 investira la stratgie du Maximin est peut risquer
mais ne permet pas de maximiser les profits. (Lentreprise 1, par exemple, perd
10 million au lieu de gagner 20 millions). Remarquons galement que si
lentreprise 1 savait de faon certaine que lentreprise 2 adoptait une stratgie
Maximin elle aurait prfr investir (est gagner 20 millions deuros) plutt que
de suivre sa propre stratgie Maximin qui tait de ne pas investir.
24
Conclusion
La thorie des jeux fournit un cadre d'analyse permettant d'tudier les situations
conflictuelles dans lesquelles les individus ou les firmes sont en interaction.
Lorsque peu de firmes dominent un march ou bien lorsque des pays concluent
un accord sur les politiques commerciales, les agents concerns (individus,
firmes, tats) doivent prendre en compte les ractions des autres et anticiper leurs
propres dcisions. Il sagit alors d'analyser la manire dont les agents
coordonnent ou peuvent coordonner leurs dcisions dans diffrentes
configurations.
25
Bibliographie
http://fr.wikipedia.org/wiki/Th%C3%A9orie_des_jeux
http://www.cril.univartois.fr/~konieczny/enseignement/TheorieDesJe
ux.pdf
WWW.scholarvox.com
26