Documente Academic
Documente Profesional
Documente Cultură
Jogos Repetidos
Jogos Repetidos
Introdução
Agentes podem se comportar de maneira diferente em relação a outros agentes
com os quais eles esperam interagir novamente em comparação a outros
agentes com os quais eles esperam nunca mais interagir. Para entender como o
comportamento racional e inteligente pode ser afetado pela estrutura de
futuras interações entre os agentes, estudam-se jogos repetidos.
O modelo para jogos repetidos infinitas vezes captura uma situação na qual
agentes interagem repetidas vezes em um jogo em forma normal G .
Assumiremos que G = (N, (Ai )i ∈N , (ui )i ∈N ), onde Ai é compacto e ui é uma
função contínua e limitada em A = ×j∈N Aj .
A repetição infinita de um jogo G é um jogo em forma extensiva com
informação perfeita e movimentos simultâneos (N, H, P, (ui∗ )i ∈N ), onde
t
H = {∅} ∪ (∪∞ t=1 A ) ∪ A , onde ∅ é a história inicial e A é o conjunto
∞ ∞
t ∞
de todas as seqüências infinitas (a )t=1 de perfis de estratégias de G .
P(h) = N para toda história não terminal, de forma que todos os
jogadores se movem após cada repetição do jogo G .
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Função Utilidade
Podemos impor outras condições nas funções utilidades dos agentes além da
separabilidade fraca. Primeiro, podemos assumir que a função utilidade ui∗ do
jogo repetido é baseada somente na função utilidade do jogo G , isto é,
assumimos que ui∗ ((at )∞ t ∞
t=1 ) ≥ ui ((b )t=1 ) depende apenas da relação entre as
∗
Critério do Desconto
Existe algum número δ ∈ (0, 1), chamado de fator de desconto, tal que a
seqüência de números
P reais vit é pelo menos tão boa quanto a seqüência wit se,
t−1
e somente se, ∞ δ
P∞ t−1
i =1 (vit − wit ) ≥ 0. Como assumimos que vit é limitada,
temos que a série i δ vit é convergente e representa como o agente i
avalia a seqüência (vit ) de utilidades. Quando a função utilidade
P det−1 todos os
agentes tomam esta forma, nos referimos ao perfil ((1 − δ) ∞ t=1 δ vit )i ∈N
como o perfil de utilidades no jogo repetido associado com a seqüência (v t ) de
perfil de utilidades do jogo G .
Note que utilidades que satisfazem este critério do desconto tratam os períodos
de forma diferente, pois o valor de um ganho diminui com o tempo. As outras
condições tratam os períodos de forma simétrica.
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
De acordo com este critério, a seqüência de números reais (vit ) é melhor que a
seqüência (wit ) se, e somente se,
1 X t
T
lim inf (vi − wit ) > 0.
T T t=1
Observação
Critério da Ultrapassagem
De acordo com este critério, a seqüência de números reais (vit ) é melhor que a
seqüência (wit ) se, e somente se,
X
T
lim inf (vit − wit ) > 0.
T
t=1
Observação 1.1
Quando utilizamos este critério, não pode-se definir um perfil de utilidades
t
P det utilidades v do jogo G , pois
do jogo repetido associado a uma seqüência
na grande maioria dos casos de interesse t vi é uma série divergente.
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Exemplos
Um conjunto de estados Qi .
Um estado inicial qi0 ∈ Qi .
Uma função de saída fi : Qi → Ai que especifica uma estratégia do jogo
G para cada estado.
Uma função de transição τi : Qi × A → Qi que associa um estado a cada
par de estado e perfil de estratégias do jogo G .
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Exemplos
C D
C 3,3 0,4
D 4,0 1,1
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Máquina 1
Máquina 2
Máquina 3
Utilidade Minimax
Dado um jogo G = (N, (Ai ), (ui )), uma utilidade minimax para o jogador i,
denotada por vi , é a menor utilidade que os demais jogadores podem forçar
jogador i receber:
vi = min max ui (a−i , ai ).
a−i ∈A−i ai ∈Ai
Mostraremos que existe uma relação entre o conjunto de perfis de utilidade dos
equilíbrios de Nash de um jogo repetido infinitas vezes e o conjunto de perfis de
utilidade possíveis e individualmente racionais do jogo G , quando utilizamos ou
o critério do desconto ou o critério do limite das médias.
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Teorema 2.1
Todo perfil de utilidades de um equilíbrio de Nash do jogo G = (N, (Ai ), (ui ))
repetido infinitas vezes quando se utiliza os critérios do limite das médias ou do
desconto para qualquer fator de desconto δ ∈ (0, 1) é um perfil de utilidades
individualmente racional de G .
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Prova
Prova
P
Seja w = a∈A ( βγa )u(a) um perfil de utilidades P possível e individualmente
racional, onde βa é um número inteiro e γ = a∈A βa . (Note que é sempre
possível escrever um perfil de utilidades possível e individualmente racional
desta forma pois assumimos que αa é um número racional na definição de um
perfil de utilidades possível.) Seja (at ) uma seqüência cíclica de perfis de
estratégia do jogo G onde o ciclo de comprimento γ possui βa repetições do
perfil de estratégias a para todo a ∈ A. Seja si a estratégia para o jogo repetido
do jogador i que escolhe ait em cada período t exceto quando existir algum
período anterior t ′ onde um único jogador diferente de i desviou da estratégia
′
especificada pelo perfil at , neste caso, se j foi o primeiro jogador a desviar em
um tal período t ′ , temos que i jogará a estratégia (p−j )i em todos os períodos
subseqüentes a t ′ independente do que os demais jogadores façam no futuro.
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Prova
Teorema 2.3
Seja w um perfil de utilidades possível e individualmente racional estrito de um
jogo G = (N, (Ai ), (ui )). Para todo ǫ > 0, existe δ ′ < 1 tal que se 1 > δ > δ ′ ,
então o jogo G repetido infinitas vezes quando se utiliza o critério do desconto
com fator de desconto δ possui um equilíbrio de Nash com perfil de utilidades
w ′ satisfaz |w ′ − w | < ǫ.
Prova: Exercício.
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Exemplo
C D
C 3,3 0,4
D 4,0 1,1
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Exemplo
C D
C 2,3 1,5
D 0,1 0,1
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Exemplo
Observação 2.4
Este exemplo nos leva a necessidade de analisar equilíbrios de subjogo
perfeito, pois neste caso todos os jogadores têm que agir otimamente após
cada história.
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Teorema 3.1
Todo perfil de utilidades possível e individualmente racional estrito de um jogo
G = (N, (Ai ), (ui )) é um perfil de utilidades de um equilíbrio de subjogo
perfeito do jogo G repetido infinitas vezes quando consideramos o critério do
limite das médias.
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Prova
P
Seja w = a∈A ( βγa )u(a) um perfil de utilidades possível P e individualmente
racional estrito, onde βa é um número inteiro e γ = a∈A βa . Seja ainda
(ak )γk=1 uma seqüência de perfis de estratégia de G que consiste de βa
repetições de a para cada a ∈ A.
Vamos construir um perfil de estratégias para o jogo repetido que gera uma
seqüência de perfis de estratégias de G que consiste de infinitas repetições do
ciclo (ak )γk=1 . Cada jogador pune um desvio dos demais por um período
limitado de tempo, que por conveniência assumiremos que só inicia após o fim
de um ciclo (ak )γk=1 . Após o período de punição todos os jogadores retomam
as repetições de (ak )γk=1 . Se houverem desvios simultâneos de jogadores esses
são ignorados e não são punidos. Como estamos considerando o critério do
limite das médias, se todos os jogadores, seguem este tipo de estratégia temos
que qualquer trajetória têm perfil de utilidade w .
Formalmente, seja g ∗ = maxi ∈N,a′ ∈Ai ,a∈A ui (a−i , ai′ ) − ui (a), isto é, g ∗ é o
i
maior ganho que qualquer jogador pode ter desviando de qualquer perfil de
estratégias. Como wi > vi , existe um inteiro m∗ grande o suficiente tal que
m∗ (wi − vi ) ≥ γg ∗ para todo i ∈ N. A estratégia de qualquer jogador i pune
qualquer jogador que desvie por m∗ períodos e é descrita pela seguinte
máquina:
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Prova
Qi = {(Normk , d ): ou k = 1 e d = 0, ou 2 ≤ k ≤ γ e
d ∈ {0} ∪ N} ∪ {P(j, t) : j ∈ N e 1 ≤ t ≤ m∗ }.
Prova
Prova
Exemplo
C D
C 2,3 1,5
D 0,1 0,1
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Exemplo
Exemplo
O próximo teorema utiliza estratégias que punem quem não punir para provar
um teorema de Folk Perfeito para o critério da ultrapassagem. Por
simplicidade, construiremos uma estratégia apenas para o caso onde a
trajetória de equilíbrio consiste de repetições de um único perfil de estratégia
individualmente racional estrito.
Teorema 3.2
Para todo perfil de estratégias individualmente racional estrito a∗ de um jogo
G = (N, (Ai ), (ui )), existe um um equilíbrio de subjogo perfeito do jogo G
repetido infinitas vezes quando consideramos o critério da ultrapassagem que
gera a trajetória (at ), onde at = a∗ , ∀t.
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Prova
Qi = {Norm} ∪ {P(j, t) : j ∈ N e t ∈ IN }.
Prova
Prova
De P(j, t):
se a−j = p−j ou al 6= (p−j )l para pelo menos dois jogadores
diferentes de j, ou seja, ou todos punem j ou pelo menos dois
não punem, mude para P(j, t − 1) se t ≥ 2, e para Norm se
t = 1.
se al 6= (p−j )l para um e somente um jogador l , então mude
para P(l , T (j, t)), onde T (j, t) é um inteiro grande o
suficiente tal que a soma da utilidade de l no estado P(j, t) e
nos T (j, t) períodos seguintes se l não desviar é maior ou
igual sua utilidade no estado P(j, t) quando ele desvia mais
T (j, t)vl . (Este número T (j, t) existe pois após t períodos os
jogadores retornariam ao perfil de equilíbrio a∗ e ul (a∗ ) > vl ).
Com este perfil de estratégias, qualquer tentativa de algum jogador de
aumentar sua utilidade desviando sozinho após qualquer história, incluindo
histórias após a qual punição deve ocorrer, não é vantajosa devido a punição
imposta pelos outros jogadores. Um argumento similar ao do Teorema 3.1
prova que este perfil é realmente um equilíbrio de subjogo perfeito. Verifique!
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Teorema 3.3
Seja a∗ um perfil de estratégias individualmente racional e estrito de um jogo
G = (N, (Ai ), (ui )) com dimensionalidade completa em relação a a∗ . Então,
existe δ < 1 tal que para todo δ > δ existe um equilíbrio de subjogo perfeito do
jogo G repetido infinitas vezes quando utilizamos o critério do desconto com
fator de desconto δ que gera a trajetória (at ) na qual at = a∗ para todo t.
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Prova
Prova
Prova
Prova
X
L X
∞
M+ δ k vi + δ k ui (a(i)).
k=1 k=L+1
X
L X
∞
ui (a(j)) + δ k ui (a(j)) + δ k ui (a(j)).
k=1 k=L+1
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Prova
Note que or suposição temos que ui (a(j)) > ui (a(i)). Como ui (a(j)) > vi para
todo i, podemos escolher L tal que M − ui (a(j)) < L(ui (a(j)) − vi ) para todo
i ∈ N e j ∈ {0} ∪ N. Podemos ainda escolher δ ∗ próximo o suficiente de 1 tal
que para todo δ > δ ∗ , i ∈ N e j ∈ {0} ∪ N, temos
X
L X
L
M+ δ k vi < ui (a(j)) + δ k ui (a(j)).
k=1 k=1
desviar em um estado C (j). Suponha agora que estamos em um estado P(j, t),
então a utilidade esperada para qualquer jogador i 6= j desviar da estratégia de
equilíbrio é no máximo igual a:
X
L X
∞
M+ δ k vi + δ k ui (a(i)).
k=1 k=L+1
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Prova
X
t−1 X
∞
δ k ui (p−j , bj (p−j )) + δ k ui (a(j)).
k=0 k=t
X
L X
t−1
M+ δ k vi − δ k ui (p−j , bj (p−j ))
k=1 k=0
X
∞ X
∞
< δ k ui (a(j)) − δ k ui (a(i)).
k=t k=L+1
Definição 4.1
A repetição finita de um jogo G é um jogo em forma extensiva com
informação perfeita e movimentos simultâneos (N, H, P, (ui∗ )i ∈N ), onde
H = {∅} ∪ (∪T t
t=1 A ), onde ∅ é a história inicial.
Uma história a é terminal se, e somente se, a ∈ AT . Após qualquer história não
terminal, cada jogador i escolhe uma ação em Ai . Portanto, como no caso
infinito uma estratégia para o jogador i é uma função que associa uma ação em
Ai para cada seqüência finita de perfis de estratégias de G . Este jogo é
conhecido como a repetição do jogo G durante T períodos.
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Equilíbrio de Nash
O argumento intuitivo por trás dos Teoremas de Folk para jogos repetidos
infinitas vezes é que qualquer perfil de utilidades que seja desejável por todos
os jogadores pode ser um equilíbrio de Nash se todos acreditam que quando se
desviarem da trajetória de equilíbrio serão punidos pelos demais jogadores. No
caso de jogos finitos, este argumento não pode ser aplicado em todos os casos,
pois sempre teremos que os jogadores devem jogar um equilíbrio de Nash no
último período de repetição T . Portanto, quando analisamos o período anterior
T − 1 as ameaças de punição podem se tornar inacreditáveis. O próximo
teorema mostra que no caso especial em que todos os equilíbrios de Nash o
perfil de utilidades é igual ao perfil de utilidades minimax de G (como no caso
do Dilema do Prisioneiro), então em qualquer período os jogadores deverão
utilizar um equilíbrio de Nash de G .
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Teorema 4.2
Se o perfil de utilidades em qualquer equilíbrio de Nash de um jogo em forma
normal G é o perfil (vi )i ∈N de utilidades minimax de G , então para qualquer
valor de T , todo equilíbrio de Nash do jogo G repetido T vezes gera uma
trajetória de perfis de estratégias (a1 , . . . , aT ) do jogo G com a propriedade
que at é um equilíbrio de Nash de G , para todo t = 1, 2, . . . , T .
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Prova
Observação
Este resultado se aplica a uma classe muito pequena de jogos. Por exemplo, se
o jogo G possuir um equilíbrio de Nash a∗ no qual a utilidade de algum jogador
excede sua utilidade minimax, então este jogador pode ser punido no último
período se ele tiver desviado no penúltimo período e a estratégia que seria
utilizada no último período fosse igual a a∗ . Se esta punição não for suficiente,
então existe L grande o suficiente tal que se a∗ for a estratégia a ser jogada nos
últimos L períodos, então qualquer desvio antes destas últimas L jogadas pode
ser punido impondo um pagamento minimax ao jogador que desviar até o fim
do jogo. O valor de L é independente da duração do jogo T . Portanto, para T
grande o suficiente, podemos obter como média das utilidades em um equilíbrio
de Nash do jogo repetido T vezes qualquer perfil de utilidades possível e
individualmente racional estrito. O próximo teorema ilustra este fato.
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Teorema 4.3
Se G = (N, (Ai ), (ui )) tem um equilíbrio de Nash a′ no qual a utilidade de
qualquer jogador i excede sua utilidade minimax vi , então para qualquer perfil
de estratégia a∗ de G individualmente racional estrito e qualquer ǫ > 0, existe
um inteiro T ∗ tal que se T > T ∗ o jogo G repetido T vezes tem um equilíbrio
de Nash no qual o pagamento de cada jogador i difere de ui (a∗ ) por menos que
ǫ.
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Prova
Prova
Teorema 4.4
Se todos os equilíbrios de Nash de um jogo em forma normal G possuem um
único perfil de utilidades, então para qualquer valor de T o perfil de estratégias
escolhido após qualquer história em qualquer equilíbrio de subjogo perfeito do
jogo G repetido T vezes é um equilíbrio de Nash de G .
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Prova
Exemplo
C D E
C 3,3 0,4 0,0
D 4,0 1,1 0,0
E 0,0 0,0 0,0
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Exemplo
Teorema 4.5
Seja a∗ um perfil de estratégias individualmente racionais estrito de
G = (N, (Ai ), (ui )). Assuma que (a) para cada i ∈ N existem dois equilíbrios
de Nash de G que diferem na utilidade do jogador i e (b) existe uma coleção
(a(i))i ∈N de perfis de estratégias individualmente racionais estritos de G tal
que para todo jogador i ∈ N, temos a∗ ≻i a(i) e a(j) ≻i a(i) para todo
j ∈ N − {i}. Então, para todo ǫ > 0, existe um inteiro T ∗ tal que se T > T ∗ o
jogo G repetido T vezes tem um equilíbrio de subjogo perfeito no qual a
utilidade do jogador i difere de ui (a∗ ) por menos de ǫ para todo i ∈ N.
Jogos Repetidos Infinitas Vezes Nash Folk Folk Perfeito Jogos Repetidos Finitas Vezes
Prova