Teoria dos Usos e Gratificações Teoria do Cultivo Teoria do Hiato Comunicativo.
MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...
Transcript of MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...
![Page 1: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/1.jpg)
MC918/MO829Tópicos em Teoria da Computação
Teoria dos Jogos Algorítmica
Rafael C. S. [email protected]
Universidade Estadual de Campinas
2º semestre/2014
![Page 2: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/2.jpg)
IntroduçãoO que é um jogo?O que é a Teoria dos Jogos?• Estudo da interação entre agentes e dos resultados
que possam ocorrer a partir dessa interação
TheoryofGamesandEconomicBehavior,von Neumann e Morgenstern (1944)
2
![Page 3: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/3.jpg)
Prêmio Nobel em Ciências Econômicas 1994
Nash, Harsanyi e Selten: ``fortheirpioneeringanalysisofequilibriainthetheoryofnon-cooperativegames''
3
![Page 4: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/4.jpg)
Prêmio Nobel em Ciências Econômicas 2005
Aumann e Schelling: ``forhavingenhancedourunderstandingofconflictandcooperationthroughgame-theoryanalysis.''
4
![Page 5: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/5.jpg)
Prêmio Nobel em Ciências Econômicas 2007
Hurwicz, Maskin e Myerson: ``forhavinglaidthefoundationsofmechanismdesigntheory.''
5
![Page 6: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/6.jpg)
Prêmio Nobel em Ciências Econômicas 2012
Roth e Shapley: ``forthetheoryofstableallocationsandthepracticeofmarketdesign.''
6
![Page 7: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/7.jpg)
Teoria dos Jogos para Computólogos
O que é Teoria dos Jogos Algorítmica?• Interface entre a Teoria dos Jogos e a computação
Nisan e Ronen, Algorithmic Mechanism Design, STOC'99:``Weconsider algorithmic problems ... where theparticipantscannotbeassumedtofollowthealgorithmbutrathertheirownself-interest. ... thealgorithmdesignershould ensure inadvancethattheagents'interestsarebestservedby behavingcorrectly.''
7
![Page 8: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/8.jpg)
Exemplo: Problemas clássicos revisitados
Problemas computacionais clássicos como:• Balanceamento de carga• Roteamento• Empacotamento
Podem ser repensados utilizando a Teoria dos Jogos
8
![Page 9: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/9.jpg)
Exemplo: Problemas clássicos revisitados
Problemas de economia clássicos como:• Encontrar um equilíbrio de Nash em um jogo• Encontrar um equilíbrio de mercado• Decidir como distribuir n itens a m jogadores
Podem ser repensados utilizando a Teoria daComputação
9
![Page 10: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/10.jpg)
Exemplo: Leilões de anúncios
10
![Page 11: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/11.jpg)
Objetivo
• Apresentar os principais conceitos relacionados aTeoria dos Jogos
• Abordar a Teoria dos Jogos do ponto de vista daTeoria da Computação
• Apresentar problemas e resultados da área de Teoriados Jogos Algorítmica
11
![Page 12: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/12.jpg)
Jogos e conceitos básicos de soluções
12
![Page 13: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/13.jpg)
Dilema do Prisioneiro
• Dois prisioneiros A e B interrogados separadamente• Duas possíveis respostas: confessar ou silenciar• Duração da pena depende das respostas
Duração da pena:
BA
Confessar Silenciar
Confessar 44
51
Silenciar 15
22
13
![Page 14: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/14.jpg)
Análise do Dilema do PrisioneiroB
AConfessar Silenciar
Confessar 44
51
Silenciar 15
22
Análise feita pelo jogador A:
• Se B Confessar, é melhor Confessar e ficar 4 anos presodo que Silenciar e ficar 5 anos preso
• Se B Silenciar, é melhor Confessar e ficar 1 ano preso doque Silenciar e ficar 2 anos preso
Por simetria, para ambos os jogadores, é melhor Confessarindependente da estratégia do outro jogador
14
![Page 15: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/15.jpg)
Jogo da Poluição
• Conjunto de n países• Precisam decidir se poluem ou não poluem• Não poluir custa 3
• Cada país paga 1 por cada país poluente
Suponha que k < n países poluam• Um país que não polui paga k + 3
• Se ele passar a poluir, seu custo será de k + 1
• A única situação estável é quando todos poluem
O custo de um país poderia ser 3, ao invés de n, se ospaíses não fossem egoístas!
15
![Page 16: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/16.jpg)
Jogo do Congestionamento
• Dois motoristas A e B
• Duas rotas possíveis (R1 e R2) de O para D
• Rota R1 é a mais rápida
O D
R2
R1
16
![Page 17: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/17.jpg)
Jogo do CongestionamentoTempo do percurso:
BA
R1 R2
R15
52
1
R21
26
6
Análise feita pelo jogador A:
• Se B escolher R1, é melhor escolher R2
• Se B escolher R2, é melhor escolher R1
A melhor rota para A depende da escolha de B
Se ambos escolherem rotas diferentes, eles não searrependem
17
![Page 18: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/18.jpg)
Pedra-Papel-Tesoura• Dois jogadores A e B• Três possíveis escolhas: pedra, papel, ou tesoura• Pedra quebra tesoura que corta papel que embrulha
pedra
BA
pedra papel tesoura
pedra 00
1-1
-11
papel -11
00
1-1
tesoura 1-1
-11
00
Quem perde ou empata, se arrepende da sua escolha18
![Page 19: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/19.jpg)
Formalização de um jogo simultâneoEm um jogo:• Temos um conjunto N = {1, . . . , n} de jogadores
• Cada jogador i tem um conjunto Si de estratégias
• Um resultado é um vetor (s1, . . . , sn) onde si ∈ Si
• S = S1 × · · · × Sn é o conjunto de resultados
• Cada jogador i tem uma função ui de S em R
• ui(s1, . . . , sn) é a utilidade (ganho) do jogador iquando o resultado é (s1, . . . , sn)
• Alternativamente, podemos considerar uma funçãode custo ci de S em R
▶ Podemos converter usando ci(s) = −ui(s)
19
![Page 20: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/20.jpg)
Racionalidade
Em geral, consideramos que os jogadores são racionais• Isto é, eles buscam maximizar sua utilidade• Ou minimizar o seu custo
Vários dos principais conceitos que veremos se baseiamna racionalidade dos jogadores
20
![Page 21: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/21.jpg)
Formalização do Dilema do PrisioneiroN = {A,B}SA = {Confessar,Silenciar}SB = {Confessar,Silenciar}S = SA × SB
cA(s) =
4, se s = (Confessar,Confessar),1, se s = (Confessar,Silenciar),5, se s = (Silenciar,Confessar),2, se s = (Silenciar,Silenciar)
cB(s) =
4, se s = (Confessar,Confessar),5, se s = (Confessar,Silenciar),1, se s = (Silenciar,Confessar),2, se s = (Silenciar,Silenciar)
21
![Page 22: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/22.jpg)
Formalização do Dilema do PrisioneiroN = {A,B}SA = {Confessar,Silenciar}SB = {Confessar,Silenciar}S = SA × SB
uA(s) =
−4, se s = (Confessar,Confessar),−1, se s = (Confessar,Silenciar),−5, se s = (Silenciar,Confessar),−2, se s = (Silenciar,Silenciar)
uB(s) =
−4, se s = (Confessar,Confessar),−5, se s = (Confessar,Silenciar),−1, se s = (Silenciar,Confessar),−2, se s = (Silenciar,Silenciar)
22
![Page 23: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/23.jpg)
Notação
Considere um jogo dado por• Conjunto N = {1, . . . , n} de jogadores• Para cada jogador i:
▶ Conjunto Si de estratégias do jogador i▶ Função de utilidade ui de S em R
Para um resultado s = (s1, . . . , sn) em S:• s−i é o vetor (s1, . . . , si−1, si+1, . . . , sn)
• (s′i, s−i) é o vetor (s1, . . . , si−1, s′i, si+1, . . . , sn)
Essa notação é útil para comparar duas estratégiasquando os outros jogadores mantém suas escolhas
23
![Page 24: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/24.jpg)
Respostas e Estratégias DominantesUma estratégia si ∈ Si é uma melhor resposta do ques′i ∈ Si para s−i ∈ S−i se
ui(s) = ui(si, s−i) > ui(s′i, s−i)
Uma estratégia si ∈ Si é uma resposta ótima paras−i ∈ S−i se, para todo s′i ∈ Si, temos que
ui(s) = ui(si, s−i) ≥ ui(s′i, s−i)
Uma estratégia si ∈ Si é uma estratégia dominante se,para todo s−i ∈ S−i, temos que si é uma resposta ótimapara s−i
24
![Page 25: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/25.jpg)
Pedra-Papel-TesouraB
Apedra papel tesoura
pedra 00
1-1
-11
papel -11
00
1-1
tesoura 1-1
-11
00
• Papel é uma melhor resposta do que pedra quando ooutro jogador joga papel
• Tesoura é uma resposta ótima quando o outro jogadorjoga papel
• Note que nesse jogo, nenhum dos jogadores tem umaestratégia dominante
25
![Page 26: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/26.jpg)
Dilema do PrisioneiroB
AConfessar Silenciar
Confessar −4−4
−5−1
Silenciar −1−5
−2−2
• Confessar é uma melhor resposta do que Silenciarquando o outro jogador joga Silenciar
• Confessar é uma resposta ótima quando o outro jogadorjoga Silenciar
• Confessar é uma resposta ótima quando o outro jogadorjoga Confessar
• Confessar é uma estratégia dominante para ambos osjogadores
26
![Page 27: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/27.jpg)
Leilão de um item de carta fechada
Um leiloeiro deseja vender um item para um grupo decompradores• Cada comprador deve submeter um único lance• Os lances são submetidos simultaneamente• O comprador com maior lance ganha o leilão• Os perdedores pagam 0
• O vencedor paga um preço p que depende apenasdos lances dos compradores
27
![Page 28: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/28.jpg)
Modelando o leilão
• Cada comprador é um jogador
• Um jogador k acredita que o item vale vk
• Um jogador k submete um lance ℓk (ℓk ∈ R+)
• A utilidade uk(ℓ) de um jogador k é igual a:▶ vk − p(ℓ), se o jogador ganha o item▶ 0, se o jogador não ganha o item
28
![Page 29: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/29.jpg)
Leilão de primeiro preço
p(ℓ) é igual ao maior lance dado
Note que a utilidade uk(ℓ) de um jogador k é igual a:• vk − p(ℓ) = vk − ℓk, se o jogador ganha o item• 0, se o jogador não ganha o item
Um jogador só pode obter utilidade positiva se ℓk < vk
• Isto é, se ele der um lance menor do que o seu realvalor para o item
• Não vale a pena relatar o real valor para o item
29
![Page 30: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/30.jpg)
Leilão de segundo preço (Vickrey)p(ℓ) é igual ao segundo maior lance dado
vk é uma estratégia dominante para o comprador k:• Seja ℓ−k os lances dos outros jogadores• Se max{ℓ−k} > vk, vk é uma resposta ótima:
▶ ℓk ≥ max{ℓ−k} : a utilidade de k é vk −max{ℓ−k} < 0▶ ℓk < max{ℓ−k} : a utilidade de k é 0
• Se max{ℓ−k} ≤ vk, vk é uma resposta ótima:▶ ℓk ≥ max{ℓ−k} : a utilidade de k é vk −max{ℓ−k} ≥ 0▶ ℓk < max{ℓ−k} : a utilidade de k é 0
Note que, se todo jogador relatar vk, então o item éentregue para o comprador com maior vk, maximizandoo bem-estar social
30
![Page 31: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/31.jpg)
Design de MecanismosSub-área da Teoria dos Jogos onde buscamos projetarjogos com características ``interessantes''
No caso do Dilema do Prisioneiro:• as penas são escolhidas para incentivar os
jogadores a confessar
No caso do Leilão de Segundo Preço:• o preço é escolhido para incentivar os jogadores a
relatarem os seus valores reais e consequentementemaximizar o bem-estar social
Veremos mais sobre Design de Mecanismos durante ocurso
31
![Page 32: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/32.jpg)
Equilíbrio
Relembrando:• Uma estratégia si ∈ Si é uma resposta ótima paras−i ∈ S−i se, para todo s′i ∈ Si, temos que
ui(s) = ui(si, s−i) ≥ ui(s′i, s−i)
Um resultado s = (s1, . . . , sn) é um equilíbrio (de Nash)se, para todo jogador i, si é uma resposta ótima para s−i
Isto é, nenhum jogador pode melhorar sua utilidadeatravés de uma mudança individual de estratégia
32
![Page 33: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/33.jpg)
Jogo do Congestionamento
BA
R1 R2
R15
52
1
R21
26
6
• (R1, R2) é um equilíbrio de Nash
• (R2, R1) também é um equilíbrio de Nash
• Ou seja, um jogo pode ter mais de um equilíbrio
Qual equilíbrio irá ocorrer?
33
![Page 34: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/34.jpg)
Pedra-Papel-Tesoura
BA
pedra papel tesoura
pedra 00
1-1
-11
papel -11
00
1-1
tesoura 1-1
-11
00
• Não existe equilíbrio para o jogo Pedra-Papel-Tesoura
• Isto é, um jogo pode não ter equilíbrios
Como você joga Pedra-Papel-Tesoura na vida real?
34
![Page 35: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/35.jpg)
Estratégias mistasPor enquanto, consideramos que cada jogador escolheuma única estratégia
Podemos considerar também estratégias mistas:• O jogador escolhe uma estratégia de forma aleatória• Uma estratégia mista para o jogador i é uma
distribuição de probabilidades no conjunto Si
Estratégias puras:• si ∈ Si é chamada de estratégia pura• Uma estratégia pura si pode ser vista como uma
estratégias mistas onde a probabilidade de si serescolhida é igual a 1
35
![Page 36: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/36.jpg)
Utilidade esperada
Seja σ um vetor de estratégias mistas• Ou seja, para cada jogador i, σi é uma distribuição
de probabilidades em Si
Qual é a utilidade esperada do jogador i para σ?
E[ui(σ)] =∑s∈S
ui(s)Pσ(s),
onde Pσ(s) =∏
j σj(sj)
Dizemos que os jogadores são neutros ao risco
36
![Page 37: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/37.jpg)
Respostas e Estratégias Mista DominantesUma estratégia mista σi é uma melhor resposta do que σ′
i
para σ−i se
E[ui(σ)] = E[ui(σi, σ−i)] > E[ui(σ′i, σ−i)]
Uma estratégia mista σi é uma resposta ótima para σ−i
se, para todo σ′i, temos que
E[ui(σ)] = E[ui(σi, σ−i)] ≥ E[ui(σ′i, σ−i)]
Uma estratégia mista σi é dominante se, para todo σ−i,temos que σi é uma resposta ótima para σ−i
37
![Page 38: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/38.jpg)
Equilíbrio Misto de Nash
Um vetor σ é um equilíbrio misto (de Nash) se, para todojogador i, σi é uma resposta ótima para σ−i
Exemplo: ρ1 = ρ2 = (1/3, 1/3, 1/3) é um equilíbrio mistode Nash para o Pedra-Papel-Tesoura.
Vamos mostrar que esse é de fato um equilíbrio e que eleé único!
38
![Page 39: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/39.jpg)
Equilíbrio misto do Pedra-Papel-Tesoura
Para um par de estratégias mistas (σ, φ):
u1(σ, φ) = 0× (σ1φ1 + σ2φ2 + σ3φ3)
+ 1× (σ1φ3 + σ2φ1 + σ3φ2)
− 1× (σ1φ2 + σ2φ3 + σ3φ1)
= σ1(φ3 − φ2) + σ2(φ1 − φ3) + σ3(φ2 − φ1)
E por simetria,
u2(σ, φ) = φ1(σ3 − σ2) + φ2(σ1 − σ3) + φ3(σ2 − σ1)
39
![Page 40: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/40.jpg)
Equilíbrio misto do Pedra-Papel-Tesoura
u1(σ, φ) = σ1(φ3 − φ2) + σ2(φ1 − φ3) + σ3(φ2 − φ1)
u2(σ, φ) = φ1(σ3 − σ2) + φ2(σ1 − σ3) + φ3(σ2 − σ1)
Se φ = (1/3, 1/3, 1/3), então:• u1(σ, φ) = 0 para qualquer estratégia mista σ
• Isto é, qualquer σ é uma resposta ótima• Isto é, σ = (1/3, 1/3, 1/3) é uma resposta ótima
Por simetria, se σ = φ = (1/3, 1/3, 1/3) ambos osjogadores estão jogando respostas ótimas e temos umequilíbrio.
Mas será que ele é único?40
![Page 41: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/41.jpg)
Equilíbrio misto do Pedra-Papel-Tesoura
u1(σ, φ) = σ1(φ3 − φ2) + σ2(φ1 − φ3) + σ3(φ2 − φ1)
u2(σ, φ) = φ1(σ3 − σ2) + φ2(σ1 − σ3) + φ3(σ2 − σ1)
Suponha que:• (σ, φ) é um equilíbrio e φ ̸= (1/3, 1/3, 1/3)
• Nem σ nem φ são estratégia puras▶ não existe equilíbrio onde um dos jogadores joga
uma estratégia pura
• Sem perda de generalidade, φ1 ≥ φ2 ≥ φ3 e φ1 > φ3
Assim, ou σ1 = 0 ou σ3 = 0
41
![Page 42: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/42.jpg)
Equilíbrio misto do Pedra-Papel-Tesoura
u1(σ, φ) = σ1(φ3 − φ2) + σ2(φ1 − φ3) + σ3(φ2 − φ1)
u2(σ, φ) = φ1(σ3 − σ2) + φ2(σ1 − σ3) + φ3(σ2 − σ1)
Assim, ou σ1 = 0 ou σ3 = 0
Se σ1 = 0:• Se σ3 = 0, então σ2 = 1 (contradição)• Se σ3 > 0, então φ2 = 0 e φ1 = 1 (contradição)
Se σ3 = 0:• Se σ2 = 0, então σ1 = 1 (contradição)• Se σ2 > 0, então φ1 = 0 (contradição)
42
![Page 43: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/43.jpg)
Equilíbrio Misto de Nash
Teorema (Nash, 1951): Todo jogo com um número finitode jogadores e conjuntos finitos de estratégias tem umequilíbrio misto.
Existem jogos sem equilíbrio misto de Nash• com número infinito de jogadores ou• com conjuntos de estratégias infinitos
43
![Page 44: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/44.jpg)
Jogo do Semáforo
BA
Cruzar Parar
Cruzar −100−100
01
Parar 10
00
Dois equilíbrios puros:• (Cruzar,Parar)• (Parar,Cruzar)
44
![Page 45: MC918/MO829 Tópicos em Teoria da Computação Teoria dos ...](https://reader031.fdocuments.net/reader031/viewer/2022012421/6175aa110d8a077ccd06d3eb/html5/thumbnails/45.jpg)
Equilíbrio Misto para o Jogo do SemáforoVamos encontrar um equilíbrio misto:• Jogador A cruza com probabilidade pa
• Jogador B cruza com probabilidade pb
Utilidade do jogador A:
− 100 papb + 1 pa(1− pb) + 0 (1− pa)pb + 0 (1− pa)(1− pb)
= −100 papb + 1 pa(1− pb) = pa(1− 101pb)
Análise de casos:• (1− 101pb) > 0: pa = 1 é a única resposta ótima• (1− 101pb) < 0: pa = 0 é a única resposta ótima• (1− 101pb) = 0: qualquer pa ∈ [0, 1] é resposta ótima
Por simetria, pa = pb = 1/101 é um equilíbrio misto!45