Referat PDF

Universitatea Politehnica Bucuresti
Master Modele de Decizie, Risc si Prognoza
Jocuri n form extins:

Secvene de luarea a deciziilor
CRACIUN ANA MARIA
2015-2016
Cuprins
1. Introducere n Arborele - Gambit.
1.1. Exemplu
1.2. Dilema prizonierul
1.3. Dilema prizonierul in dou trepte.
2. Inducie invers
2.1. Exemplu
Bibliografie
1. Introducere n Arborele - Gambit.

Fiecare joc secvenial este reprezentat de un arbore .Acesta are un nod de pornire i ramurile
de decizie, atunci cnd o decizie trebuie luat de ctre un juctor. n cazul n care se finalizeaza
procesului de luare a deciziilor este complet, (incasare\ plata) pentru fiecare juctor sunt
comutate. Astfel, deciziile nu trebuie efectuate simultan sau fr a se cunotine de ceilanti
juctori. n plus, jocurile extinse pot fi folosite pentru a descrie jocuri cu micri de simulare.
Arborele de joc poate fi de asemenea utilizat pentru a ncorpora informaia ce pot fie transmise
ntre juctori. Pentru a completa (sau perfectiona) informaiile de joc, jucatorii stiu tot ce e de
tiut: micrile i castigurile ale totii juctoriilor. Cu alte cuvinte, fiecare juctor la fiecare nod
de decizie va avea un set de informaii asociate cu acel nod. Dac exist mai mult de un nod
ntr-un set de informaii, atunci acesta este un joc de informaii incomplete. Dac exist un
singur nod n fiecare set de informaii, acesta este un joc de informaii perfecte. ncepem cu un
exemplu simplu care ilustreaz diferena dintre micri secveniale i micri simultane.
Exemplul 1.1.
Doi juctori aleg o direcie. Juctorul 1 poate alege sus sau jos, n timp ce juctorul 2
poate alege stnga sau dreapta. Acum ne uitm la dou cazuri atunci cnd juctorii alege
secvenial, i n acelai timp.
Metoda Mutari secveniale
Juctorul 1 merge primul , putand alege sa fie n sus sau n jos, apoi juctorul 2, tiind
alegerea juctorul 1, alege fie stnga sau dreapta. La sfritul fiecrei ramuri, castigurile sunt
comutate. Strategia pentru juctorul 1, care merge pentru prima dat n acest joc, este pur i
simplu sus sau jos. Strategiile pentru juctorul 2 sunt mult mai complicate, deoarece acesta
trebuie s contabilizeze alegerile juctor 1 lui.
Stanga stanga (SS)

Stanga dreapta (SD)
Dreapta Stanga (DS)
Dreapt dreapt (DD)
Dac alege sus, apoi stnga; Dac alege jos,

apoi stnga
Dac alege sus, apoi stnga; Dac alege jos,
apoi dreapra
Dac alege sus, apoi stanga; Dac alege jos ,
apoi Stanga
Dac alege sus, apoi dreapta; Dac alege jos,
apoi dreapta
Gambit numara automat nodurile de decizie pentru fiecare juctor. n figura 1 diagrama
2:1 inseamna ca aceasta este nodul 1 i informaiile setului 1 pentru juctorul 2 ; 2: 2 informati
setului 2 pentru juctor 2.
Figura 1: Micri secveniale.

Atunci cnd fiecare juctor are noile informaii stabilite la fiecare nod n cazul n care trebuie s
ia o decizie, acesta are un set de informaii pentru un joc perfect. Odat ce arboreal este
construit i recompenselor calculate acest joc pot fi rezumat n matrice, sau forme strategice al
jocului.
1/2
Sus
Jos
SS
SD
(2,1)
DS
(2,1)
(6,2) (1,4)
(3,2)
(6,2)
DD
(3,2)
(1,4)
Cnd am
folosit Gambit pentru a analiza jocul, se produce Nash de echilibru i
recompenselor corespunztoare pentru fiecrui juctor. Pe Figura 1 diagrama numerele de mai
jos reprezint probabilitatea ca jucatorul s joace in aceast ramura. n acest caz jucatorul 1 ar
trebui s joace tot timpul sus ; juctor 2 ar trebui s joace SD tot timpul. Putei vedea din
matricea c este un echilibru Nash pur. O ultim remarc despre acest lucru este c atunci cnd
privim jocul extins n form strategic, pe Gambit se produce matricea
1/2 11
1
(2,1)
2
12
(2,1)
(6,2) (1,4)
21
22
(3,2)
(3,2)
(6,2)
(1,4)
ij = masura i se iau de la informaiile setului 1, masura j se iau de la informaiile setului 2
O ramur la un nod este, de asemenea, numit o aciune. Daca 21 este strategia juctorului 2 se
va lua msura 2 (dreapta) la informaiile setului 1 (sus), i s ia msura 1 (stnga) la informaii
setului 2 (jos). Cu alte cuvinte, aceasta este strategia DS.
Metoda Mutarilor simultane
Ideea este c juctorii 1 i 2 vor alege mutarea lor, n acelai timp, fr a cunotine micarea
adversarului. Fiecare juctor va face o alegere i se va calcula castigul. Aceasta are n vedere
situaia invers acum modelarea miscarilor simultane, folosind un joc arbore. Acesta este
ilustrat in Figura 2:
Figura 2: Micri simultane

Pare aproape identic cu cel din Figura 1 cu miscari secveniale, dar cu o diferen
crucial, i anume, liniile punctate de conectare nodurile de capt ale juctorului 1. Aceste lini
punctat alatura cele dou noduri ntr-o informaiie stabilita pentru juctor 2.
Ceea ce nseamn c juctorul 2 tie doar c am juctorul 1 a facut o miscare ce a la
dus n informaia 2: 1, dar nu stie exact ce juctorul 1 a ales. Juctor 2 nu tie ce aciune sus
sau jos a fost aleas de 1.
Strategiile pentru a simula micarile de joc sunt foarte simple, deoarece nici un juctor
nu tie ce a ales celalant jucator i, prin urmare, nu poate alege decizia ei pe ceea ce ales
cellalt juctor.
Asta nseamn c S este o strategie a juctorului 2 i D este o strategie pentru juctor 2
, dar S este sus i D este jos, nu este din cauza ca juctorul 2 nu stie dac sus sau
jos a fost aleas de juctor I.
Matricea jocul devine:
1/2
SUS
JOS
S
(2,1)
J
(3,2)
(6,2) (1,4)
Acest joc are un echilibru Nash unic la (SUS, S).

In general, cu cat mai multe informaii un juctor are, cu att mai complicate strategiile
devin. Jocurile de simulare sunt jocuri matriciale, dar intr-o form mai extins.
Exemplul 1.2.
S ia n considerare o versiune a jocului dilemei prizonierului cu matricea:
1/2
Q
C
(5,5) (2,6)
Q
(6,2) (4,4)
C
Q=tac C= marturiseste
Aceasta prezint principalele caracteristici ale dilemei prizonierului n care juctorii pot
face mai bine n cazul n care fiecare s tac, dar din moment ce acestea au fiecare un stimulent
s mrturiseasc ei vor ajunge la (C, C).
Aceasta presupune, desigur, c ei s aleg, fr cunotina de alegere a celuilalt juctor.
Un alt mod de a gndi este de a alege simultan. Iat cum se modeleaza cu un arbore de joc
Figura 3
Figura 3: Dilema prizonierului alegeri simultane.
Figura 4: Dilema prizonierului alegeri secventiale.
Dac eliminm informaiile stabilite la 2: 1 prin seturi de informaii separate pentru

juctor 2, atunci jocul devine un joc de informaie perfecta. Prin aceasta vom intelege ca
jucatorul 1 va alege C sau Q, prin urmare juctor 2 va alegerea C sau Q, cu deplin cunotin a
alegeri primului jucator. Acum ordinea de joc, va face o diferen (dar se va vedea c nu n
acest exemplu) (Figura 4). Juctor 1 are dou strategii: C sau Q. Dar jucatorul 2 are patru
strategii :
(1) n cazul n care Q, atunci Q; Dac C, atunci Q,
(2) Dac Q, atunci Q; Dac C, apoi C,
(3) Dac Q, atunci C; Dac C, atunci Q,
(4) Dac Q, atunci C; Dac C, apoi C.
Matricea devine
1/2
Q
C
(1)
(2) (3) (4)
(5,5) (5,5) (2,6) (2,6)
(6,2) (4,4) (6,2) (4,4)
Este echilibrul Nash daca juctori mrturisesc. (C,2),(C,4). Se pare c cunoatere de celalant
juctor nu afecteaz echilibrul Nash sau rezultatele ulterioare.
Exemplul 1.3. Dilema prizonierul in dou trepte.
O ntrebare fireasc este sa intrebam ce se ntmpl atunci cnd un joc este jucat de
mai multe ori.
S presupunem c fiecare juctor tie c acest joc o s fi jucat din nou n viitor. Ar putea
un suspect s fie att de pregtit s toarne complicele lui dac tia c jocul ar fi jucat din nou?
Sau ar turna complicele su n fiecare etap a jocului? Considerand un joc viitoar va fii
afectat modul in care se va juca n fiecare etap?.
De exemplu, dac am juca de dou ori jocul dilemei prizonierului. Pentru a rspunde la
aceast, s ia n considerare form extins cu dou etape a dilemei prizonierului n Figura5.
Figura 5: Dilema prizonierul in dou trepte

Seturile de informare sunt concepute astfel nct fiecare juctor tie propriile micri,
dar nu si a adversarului. Acest joc in dou etape porneste de la urmtorul joc cu o singur
etap:
1/2
C
D
C
1,1
0,3
D
3,0
2,2
Unde matricea de joc a dilemei prizonierul in dou etape folosind recompensele de la sfrit
este:
1/2
11_
11_
12_
2_1
2_2
4,4
5,0
5,2
6,0
12_
2,5
3,3
3,3
4,1
2_1
2_2
2,5
3,3
3,3
4,1
0,6
1,4
1,4
2,2
Stiind ca Gambit ofer strategiile ca actiunea de a lua la un set de informaii de la

fiecare nod. De exemplu, pentru jucatorul 2 , 2_1 inseamna ca primele informaii de la 2:1, s
ia msuria 2 (Nu mrturiseste); iar pentru a doua informaie stabilita la 2: 2 nu ntreprinde
nicio aciune, unde la a treia informaie stabilita la 2: 3, se ia msuri 1 (mrturiseste).
Echilibrul Nash este format din jucatorul 1 mrturisire n runda 1, si de asemenea,
jucatorul 2 mrturisit n runda 1, amndoi mrturisesc n runda 2.
Nimic nu se schimb in aceast configurare, deoarece nu exist consecine ale
aciunilor trecute.
Toat lumea mrturisete la fiecare rund, cu cu nici un gnd de o runda viitoare.
Scopul acestui joc este de a considerea alegerea unui jucator de a decide pe o strategie de a
putea folosi actiunile trecute, sa faca amenintari pentru viitor sau pur si simplu sa ajunge la
acorduri obligatorii cu privire la aciunile viitoare.
Acest model nu ine cont de asta.
2. Inducie invers
Inducie inversa este un mod simplu de a rezolva un joc cu o informaii perfect. Ea se
bazeaz pe ideea simpla ca juctorii vor ncepe la sfritul arborelui, uitandu-se la
recompense, alegand aciunea cu cea mai mare rasplata, i s lucreze napoi.
Exemplu 2.1
Acesta este un joc de doi juctori cu informaii perfecte. Pentru a gsi echilibrul dat de inducia
inversa vom ncepe la sfritul acestuia incepand cu alegerile ultimului jucator (Figura 6).
Figura 6: Arborele complet

In acest caz, juctorul 1 face ultima alegere. Pentru nodul 1:2, juctor 1 alege clar
ramur 2 cu recompensa (7, 7). Pentru nodul 1:3, juctor 1 va alege ramura 2 cu recompensa
(1,4). n cele din urm, pentru nodul la 1: 4, juctor 1 va alege ramura 3 cu recompense (5,2).
Eliminam toate ramurile terminale pe care juctorul 1 nu le-a ales . Rezultatul este prezentat n
Figura 7.
Figura 7: Arbore redus

Acum va alege juctor 2 utiliznd figura 7. La 2: 1 juctor 2 alege ramura 1 din moment
ce ofer recompense (7, 7). La 2: 2, juctorul alege ramura 2 cu recompensa (8, 8). Eliminarea
tuturor celorlalte ramuri ne d arborele jocul final (Figura 8) :
Figura 8: Arbore final
Folosind Figura 8 , lucrand de la sfarsit la inceput se vedem ca la 1: 1, juctorului 1

va alege ramura 2, care rezult n ctigul (8, 8). Am gsit un echilibru prin inducia inversa.
Echilibrul induciei inverse este c juctorului 1 alege ramur 2 i juctor 2 alege ramur 2.
Bibliografie
Game Theory: An Introduction, Second Edition - E.N. Barron
Loyola University Chicago Chicago, Illinois

Referat PDF

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Referat PDF

Încărcat de

Drepturi de autor:

Formate disponibile

Universitatea Politehnica Bucuresti

Master Modele de Decizie, Risc si Prognoza

Jocuri n form extins:

CRACIUN ANA MARIA

1. Introducere n Arborele - Gambit.

Stanga stanga (SS)

Dac alege sus, apoi stnga; Dac alege jos,

Figura 1: Micri secveniale.

ij = masura i se iau de la informaiile setului 1, masura j se iau de la informaiile setului 2

Figura 2: Micri simultane

Acest joc are un echilibru Nash unic la (SUS, S).

Figura 3: Dilema prizonierului alegeri simultane.

Figura 4: Dilema prizonierului alegeri secventiale.

Dac eliminm informaiile stabilite la 2: 1 prin seturi de informaii separate pentru

Exemplul 1.3. Dilema prizonierul in dou trepte.

Figura 5: Dilema prizonierul in dou trepte

Stiind ca Gambit ofer strategiile ca actiunea de a lua la un set de informaii de la

Figura 6: Arborele complet

Figura 7: Arbore redus

Figura 8: Arbore final

Folosind Figura 8 , lucrand de la sfarsit la inceput se vedem ca la 1: 1, juctorului 1

Loyola University Chicago Chicago, Illinois

S-ar putea să vă placă și