肯定側と否定側に分かれて行う、討論ゲーム です。 …...-1-ワークシート 1 ディベートは、 肯定側と否定側に分かれて行う、討論ゲーム
ゲーム理論とマーケットデザイン入門 --- ゲーム理論編
-
Upload
yosuke-yasuda -
Category
Economy & Finance
-
view
3.431 -
download
1
Transcript of ゲーム理論とマーケットデザイン入門 --- ゲーム理論編
ゲーム理論とマーケットデザイン入門 <ゲーム理論編>
安田洋祐 | 政策研究大学院大学 早稲田大学オープンカレッジ資料(2013年)
1
イントロダクション
2
} テキスト } 天谷研一『図解で学ぶゲーム理論』
} 参考図書 1. ジョン・マクミラン『市場を創る』 2. 安田洋祐「社会を変える新しい経済学」
} 講義用ウェブサイト } https://sites.google.com/site/yosukeyasuda/jp/lecture/wo13
} 第一回:戦略的状況とは何か --- 4~27 } テキスト1~2章
} 第二回:ナッシュ均衡 --- 28~52 } テキスト2~3章
} 第三回:ビジネス競争のゲーム --- 53~74 } テキスト3章
イントロダクション
3
} 第四回:ゲームを後ろから解く --- 75~101 } テキスト4章
} 第五回:長期的関係と協力の発生 --- 102~123 } テキスト7章
【ここまでが「ゲーム理論入門」】 } 第六回:マッチングの理論と実践
} 参考図書1&2 } 第七回:オークションの理論と実践
} テキスト5章、参考図書1 } 第八回:メカニズムデザインの考え方
} 参考図書2 【後半三回は「マーケットデザイン入門」】
ゲーム理論とマーケットデザイン入門 <ゲーム理論編>
Lecture 1: 戦略的状況とは何か
Lecture 1 4
ゲーム理論とは何か?
Lecture 1 5
} ゲーム理論は応用数学の一分野 } 結果があなただけでなく、他の参加者たちの行
動によっても影響をうける状況を分析 } このような状況を戦略的状況(または戦略的な相
互依存関係)と呼ぶ } 対立と協調のメカニズムを明らかにする数学!
⇒そもそも数学は役に立つのだろうか? ⇒戦略的状況(/思考)ってそんなに重要?
天谷(12-13ページ)
数学は役に立つのか?
Lecture 1 6
自然現象 - 自然科学 } 一定のパターンに自然と従
う(自然法則) } 分析対象に直接その理由を
聞くことができない ⇒数学や数理モデルが分析に欠かせない
経済(社会)現象 - 社会科学 } 各人は自分の思うがままに
自由に行動する } 分析対象に理由を聞くこと
ができる ⇒数学がなくても“分析”できるのではないだろうか?
経済学の2つのアプローチ
Lecture 1 7
} 制度的知識: “事実”をじっくりと調べる } 表面的な知識だけでは経済の動きを掴むことが難しい } 理論的な指針がないと、何が“事実”かの特定も困難
} 経済理論: 現象の背後にある“法則”を探す
} 経済理論の構築に数学は絶大な効果を発揮! } 制度的知識を補完:2つのアプローチはどちらも重要
Q: 経済(学)の法則っていったい何? A: 各人は自分にとって得になるように行動する(「イン
センティブに従って行動する」と同じ意味)
伝統的な経済学
Lecture 1 8
} 経済学は理想的な市場の分析をもっぱら行ってきた } 完全競争市場
} 需要と供給が分析のメインツール } 各人のインセンティブは
どこに隠れている?
戦略的思考は重要なのか?
Lecture 1 9
} 需要と供給による分析では、経済活動は需要曲線と供給曲線の交点として描写される } 需要曲線は消費者、供給曲線は生産者の 適化行動の結果
として導くことができる
} 一見すると複雑そうにも見えるこのフレームワークでは、実は戦略的状況が全く発生していない!
Q: なぜ戦略的な状況が発生していないのか? A: その秘密は… ⇒各参加者がプライス・テイカ―だから!(各人は価格
を基準にお互いの影響を考えることなく意思決定)
ゲーム理論はこうして生まれた
Lecture 1 10
Q: 経済学の多くの問題は需給と供給だけで分析できるのだろうか?
A: できない! von Neumann and
Morgenstern (1944) 「社会科学のさまざまな問題
を解くためには、本質的に新しい数学理論が必要!」
⇒ 「ゲーム理論」の誕生!
天谷(14-15ページ)
戦略的状況の例
Lecture 1 11
例: グーグル vs. アップル } グーグルの 適な戦略はグーグルがアップルの行
動をどう予想するかによって決まる } ここでアップルの行動はアップルがグーグルの行動をど
う予想するかによって決まる } グーグルの 適な戦略はグーグルが「アップルが
グーグルの行動をどう予想するか」をどう予想するかによって決まる
} グーグルの 適な戦略はグーグルが「アップルが「グーグルがアップルの行動をどう予想するか」をどう予想するか」によって決まる 以下、無限に続く… (予想の「無限後退」と呼ばれる)
ゲーム理論による静かな革命
Lecture 1 12
} ゲーム理論は「他の参加者の行動をどう予想するか」という問題に首尾一貫した答えを提供 } 戦略的状況をきちんと分析できるようになった!
} ゲーム理論の貢献 } 理想的な市場(完全競争市場)を超えた様々な経済現象の分
析や理解を可能にした } 異なる経済の仕組み(資源配分メカニズム)を理論的に比較
することを可能にした } 一般には「対立と協調のメカニズム」を明らかにした!
} ゲーム理論は1980年代以降の経済学の中身を劇的に変えた! } 「ゲーム理論による経済学の静かな革命」(by 神取道宏)
ゲーム理論が切り拓いた新しい分野
Lecture 1 13
} 市場が未成熟あるいは存在しない状況で経済活動がどのように機能しているのか? } 経済史、開発経済学
} 政府(官僚組織、政治家)はどのように行動するのか? } 政治の経済学
} 私企業の中でなにが起こっているのか? } 組織の経済学、企業統治(コーポレート・ガバナンス)
} 異なる市場経済をどのように比較するか? } 比較制度分析
ノイマン&モルゲンシュテルンの発見
Lecture 1 14
} どんな社会問題も、次の3つの要素からなるゲームとして記述する(/定式化する)ことができる! } 【プレイヤー】 分析対象となる参加者たち } 【戦略】 個々のプレイヤーがとることのできる行動 } 【利得】 起こり得る行動の組み合わせに応じた満足度、効用
Q: ゲームの解(結果・予測)はどうやって与えられる? A: 実はノイマン達は一般的な解を生み出せなかった… } この問題を解決してゲーム理論に魂を吹き込んだのがも
う一人の(若き)天才数学者だった!
天谷(14-15、26-27ページ)
ビューティフル・マインドの生んだ発見
Lecture 1 15
} John Nash (1950)がゲーム理論のザ・解概念を確立! } (ナッシュ)均衡においては、
(誰にとっても)自分一人が行動を変えても得できない
} この解はほぼ常に存在する
} ジョン・ハーサ二とラインハート・ゼルテンがその後ナッシュ均衡を大幅に拡張 } ゲーム理論の爆発的な応用の
きっかけとなる
⇒ゲーム理論による革命!
天谷(14-15ページ)
ノーベル賞:ゲーム理論の3人の父
Lecture 1 16
静かな革命はつづく…
Lecture 1 17
【1994以降のゲーム理論関連のノーベル賞(経済学)】 } 1996: マーリーズ、ヴィックリー
} for their fundamental contributions to the economic theory of incentives under asymmetric information.
} 2001: アカロフ、スペンス、スティグリッツ } for their analyses of markets with asymmetric information.
} 2005: オーマン、シェリング } for having enhanced our understanding of conflict and
cooperation through game-theory analysis.
} 2007: ハーヴィッチ、マスキン、マイヤーソン } for having laid the foundations of mechanism design theory.
18
そしてなんと昨年(2012年)も! 【ロス&シャプレーが「マーケットデザイン」で受賞!!】
Lecture 1
いよいよゲーム理論の中身を見ていこう!
Lecture 1 19
} まずは1時点の(静学的な)ゲームを分析
} 各プレイヤーは独立かつ同時に戦略を決定 } 相手の決定を知らずに自分の戦略を決めるような状況 } 決定のタイミングは文字通り“同時”である必要は無い!
} すべての可能な行動の組み合わせに応じてそれぞれのプレーヤーの利得を定めておかなければいけない } 個々のプレーヤーにとって、利得が高いほど望ましい結果 } 利得の値(絶対値)自体には意味が(ほとんど)無い!
天谷(38-39ページ)
囚人のジレンマ:ストーリー
Lecture 1 20
} AさんとBさんの2人がある犯罪容疑で逮捕された! } 有罪にするだけの証拠がなく、検事は自白が頼り(焦) } そこで、次のような司法取引を容疑者に持ちかけた…
} 2人とも自白すれば、A、Bともに懲役3年 } 2人とも黙秘すれば、A、Bともに懲役1年 } Aが自白、Bが黙秘すれば、Aは釈放、Bは懲役5年 } Bが自白、Aが黙秘すれば、Bは釈放、Aは懲役5年
} まず、このゲームを表の形でまとめてみよう! } プレイヤー、戦略、利得が一目で分かるようになる
天谷(20-21ページ)
囚人のジレンマ:利得表(/利得行列)
Lecture 1 21
} ここでは、懲役の年数(×マイナス)を利得に設定 } (実は他の数字でも同じ「囚人のジレンマ」を表すことが可能)
B A
黙秘 自白
黙秘 -1 -1
0 -5
自白 -5 0
-3 -3
天谷(20-21、38-39ページ)
囚人のジレンマ:利得表による分析
Lecture 1 22
} (黙秘、黙秘)が2人にとって望ましい結果に見えるが…
} 実は相手の戦略によらず「自白」するのが各自の 適戦略! } 各人が合理的に選択する結果、(自白、自白)が実現!
} まさに、囚人の「ジレンマ」が起こってしまう…
B A
黙秘 自白
黙秘 -1 -1
0 -5
自白 -5 0
-3 -3
天谷(22-23ページ)
囚人のジレンマ:注意点
Lecture 1 23
} このゲームでは個々のプレーヤーが 適戦略を持つ } 【 適戦略(支配戦略)】 他のプレーヤーたちがどのような行
動を選択しても、自分がある特定の行動Aを選ぶことによって利得が 大化されるとき、行動Aを「支配戦略」と呼ぶ。
} 支配戦略の組み合わせは必ずナッシュ均衡になる! } 支配戦略が存在しないゲームもたくさんある
} 各人の 適な意思決定 ≠ 全体にとっての効率性 } ナッシュ均衡が全体にとって望ましい結果(パレート効率的な
結果)をもたらすとは限らない! } 「アダム・スミスは間違っていた!」(映画『ビューティフル・マイ
ンド』のナッシュの台詞)を簡潔に体現している
天谷(24-25、40-41ページ)
囚人のジレンマ:別の利得表
Lecture 1 24
} それぞれのプレイヤーにとっての結果の望ましさ: } (裏切、協力)>(協力、協力)>(裏切、裏切)>(協力、裏切)
プレイヤー2 プレイヤー1
協力 裏切り
協力 2 2
3 0
裏切り 0 3
1 1
囚人のジレンマの応用例
Lecture 1 25
現象 プレイヤー 「協力」 「裏切り」
軍拡競争 国 軍縮 軍拡
国際貿易政策 国 関税引き下げ 税率据え置き
男女間の協力 カップル 相手に従う 相手に要求
公共財供給 地域住民 貢献/負担 ただ乗り
森林伐採 きこり 控えめに伐採 とれるだけ伐採
天谷(24-25ページ)
ゲームのルールが変わると…
Lecture 1 26
} 検事が司法取引を提示しなかったら、(黙秘、黙秘)が実現
} 相手の戦略によらず「黙秘」するのが各自の 適戦略に
} 検事が望んでいる結果=(自白、自白)は実現できない… } 司法取引によって初めて囚人の「ジレンマ」が起こる!
B A
黙秘 自白
黙秘 -1 -1
-3 -3
自白 -3 -3
-3 -3
天谷(28-29ページ)
ゲーム理論を活用した制度設計
Lecture 1 27
} 人々に望ましい行動をとらせるためにゲームのルールを変更するような実例はたくさんある!
} 課徴金減免(リニエンシー)制度 } 談合・カルテルを自己申告した企業に課徴金を減免
} インセンティブ契約 } 業績に連動した人事制度や報酬体系
} マーケットデザイン } オークション制度やマッチング・メカニズムへの実装
天谷(30-31ページ)
ゲーム理論とマーケットデザイン入門
Lecture 2: ナッシュ均衡
Lecture 2 28
コーディネーションゲーム:利得表
Lecture 2 29
} 共同作業のために新しいパソコンを購入する
} 相手と異なるOSでは全く意味がないとする } (Mac, Mac)の方が(Win, Win)よりも2人にとってベター
学生2 学生1
Windows Mac
Windows 1 1
0 0
Mac 0 0
2 2
天谷(72-73ページ)
コーディネーションゲーム:分析1
Lecture 2 30
} 適戦略(支配戦略)は存在しない! } 相手がMacなら自分もMac、相手がWinなら自分もWinが得 } 適な行動が相手の行動によって変化する!
} 個人の合理性だけからでは問題を解くことができない } 囚人のジレンマのようにはいかない } 「ナッシュ均衡」の考えを使う必要がある!
} 一見するとベストな結果(Mac, Mac)が選ばれそうだが… } まずはナッシュ均衡の定義をおさらいしよう!
天谷(72-73、48-49ページ)
ナッシュ均衡の定義
Lecture 2 31
} プレーヤーたちの選択した行動の組がナッシュ均衡であるとき
1. (すべてのプレーヤーにとって)自分一人だけが行動を変更しても利得を上げることができない
} 安定的な状況をうまく描写できる
2. プレーヤー同士がお互いの行動を正しく予想してそれに対して 適な行動を選択し合っている
} 合理的な結果の予測として優れている
} 数学的には全く同じ定義でも多様な解釈ができる!
天谷(50-53ページ)
コーディネーションゲーム:分析2
Lecture 2 32
} このゲームには2つナッシュ均衡がある! } (Mac, Mac)と(Win, Win)のどちらもナッシュ均衡 } ナッシュ均衡の見つけ方 →天谷(56-59ページ)
} コーディネーションゲームのように } (一般に)ナッシュ均衡は複数存在する場合がある } プレイヤー全員にとってあるナッシュ均衡よりも別のナッシュ均衡の
方が望ましい場合もある
} 良い均衡(Mac, Mac)ではなく悪い均衡(Win, Win)が選ばれてしまう危険性がある } 「コーディネーションの失敗」と呼ばれる } 失敗を防ぐには? →天谷(74-75ページ)
天谷(72-73ページ)
男女の争い:利得表
Lecture 2 33
} 妻(プレイヤー1)と夫(プレイヤー2)が休みの日にどこに遊びに行くかをそれぞれ決定 } 別々の場所に行くのは2人にとって 悪 } 妻は遊園地、夫は野球観戦の方が好き
夫 妻
遊園地 野球
遊園地 1 2
0 0
野球 0 0
2 1
天谷(80-81ページ)
男女の争い:分析
Lecture 2 34
} このゲームにもナッシュ均衡が2つ! } (遊園地、遊園地)と(野球、野球)のどちらもナッシュ均衡
} 今回は “良い”(“悪い”)均衡は存在しない } 双方にとって「より望ましい均衡」というものがない! } 状況が対称的でどちらの均衡が実現しそうか分からない
} 理論以外の要素ーたとえば慣習や文化、規範などーによってどちらのナッシュ均衡が選ばれるかが決まる } 例)レディファースト →(遊園地、遊園地) } 例)男社会(?) →(野球、野球)
天谷(80-81ページ)
タカ-ハト・ゲーム(別名:チキンゲーム)
Lecture 2 35
} 交渉事に強気(「タカ」戦略)でのぞむか弱気(「ハト」戦略)でのぞむかをそれぞれのプレーヤーが決定 } (ハト、ハト)はどちらも納得の行くもっともらしい結果か? } 相手が「ハト」でくるなら自分は「タカ」を選んだ方が得
プレイヤー2 プレイヤー1
ハト タカ
ハト 1 1
2 0
タカ 0 2
-5 -5
天谷(82-85ページ)
タカ-ハト・ゲーム:ナッシュ均衡
Lecture 2 36
} このゲームにもナッシュ均衡は2つあるが… } ナッシュ均衡は非対称な行動の組:(ハト、タカ)と(タカ、ハト) } 結果は非対称で不公平だが、安定(均衡)になっている!
プレイヤー2 プレイヤー1
ハト タカ
ハト 1 1
2 0
タカ 0 2
-5 -5
天谷(82-85ページ)
ストーリーとしてのナッシュ均衡
Lecture 2 37
} なぜ/どのようにしてナッシュ均衡は実現するのか? } 少なくとも次の4つのストーリー(理由)が考えられる
1. 合理的な推論によって導かれる 2. (理論以外の理由で)結果がそもそも目立つ 3. 話し合いの結果 4. 時間を通じた調整(試行錯誤)
} 状況に応じて、どのストーリーがよくあてはまりそうかは違ってくる
天谷(54-55ページ)
1. 合理的な推論
Lecture 2 38
} 個々のプレーヤーの合理性だけで解けるゲームもある } 合理性:自分にとってより高い利得をもたらす行動を選ぶ } 適戦略(支配戦略)がある場合:例)囚人のジレンマ
} すべてのプレーヤーに支配戦略が無いゲームでも解ける場合がある } 「支配される戦略の逐次消去」(後述)
} (お互いの行動に関する)「正しい予想の共有+合理性」によってナッシュ均衡は実現する! } いかにして正しい予想が形成されるかが重要…
2. 目立つ均衡(フォーカル・ポイント)
Lecture 2 39
} 個々人の推測だけから正しい予想が共有されることも!
} 実験)都内の地下鉄の駅を一つを選んで駅名を紙に書く } 一番多い答えを書いていれば勝ち(利得が1) } それ以外は負け(利得は0) } 周りのプレーヤーが書きそうな駅名をうまく予想するのがミソ ⇒どんな駅名が“目立つ”のかを考えよう!
} 潜在的なナッシュ均衡は駅名の数だけ存在する } しかし、状況によって非常に目立つ均衡がある場合も } トーマス・シェリングが 初に発見⇒「フォーカル・ポイント」
3. 自発的に守られる口約束
Lecture 2 40
} ナッシュ均衡は、ゲームの外部で罰則や報酬がいっさい与えられない状況でも口約束によって達成できる } 相手が口約束にしたがって(ナッシュ均衡の)行動をとるので
あれば、自分にとっても約束した(ナッシュ均衡の)行動を選ぶのが 適!⇒合意が“自己拘束的”
} ナッシュ均衡ではない結果は達成不可能 } 口約束の結果がナッシュ均衡ではないので、少なくとも一人
は約束をやぶって他の行動をとることで得できる人がいる
} ナッシュ均衡=「自己拘束的な合意」
4. 試行錯誤の結果
Lecture 2 41
} 繰り返しゲームを行い経験を積むことで予想を共有
} コーディネーションゲームの例 } エスカレーター(左側と右側どちらに並ぶか) } ビデオテープ規格(VHS vs. ベータ) } キーボード配列(QWERTY型 vs. DVORAK型)
} ゲームが行われる初期の段階でどのような行動がとられたか、という“歴史”が均衡を決定する上で重要 } ポール・デイヴィットが提唱 → 「経路依存性」
合理的なプレーヤーの行動
Lecture 2 42
} 合理的な(利得を 大化する)プレーヤーは } 支配戦略があれば常にそれを選択する } 強く支配される戦略は絶対にとらない
} 戦略Bが戦略Aに「強く支配される」 } 相手がどんな行動をとってきたとしても、自分が戦略Aを選ん
だ場合の利得が戦略Bを選んだときの利得よりも常に大きい
} 戦略Bが戦略Aに「弱く支配される」 } 相手がどんな行動をとってきたとしても、自分が戦略Aを選ん
だ場合の利得が必ず戦略Bを選んだときの利得以上になる
合理的な豚:利得表
Lecture 2 43
} 大豚(プレイヤー1)と子豚(プレイヤー2)が同じオリの中でエサをまっている } エサ箱のスイッチを押すか待つかをそれぞれ決定 } エサは5単位、スイッチを押すのに1だけコストがかかる
子豚 大豚
スイッチ押す 待つ
スイッチ押す -1 4
3 1
待つ -1 5
0 0
天谷(42-43)
合理的な豚:分析
Lecture 2 44
} 子豚には 適戦略(支配戦略)が存在する! } 大豚の行動によらず「待つ」のが常に 適 } 子豚が合理的ならば絶対にスイッチを押さない } 子豚の「スイッチを押す」は可能性から消去される
} 大豚は子豚が「待つ」を選ぶので「スイッチを押す」 } 子豚の行動を織り込んでしぶしぶスイッチを押す羽目に…
} (スイッチを押す、待つ)が実現される } これがこのゲームの唯一のナッシュ均衡 } 合理的な推論からナッシュ均衡が導かれた!
天谷(44-45ページ)
合理的な豚:ナッシュ均衡
Lecture 2 45
} 大豚が「スイッチ押す」、子豚が「待つ」ことに } 一見すると不利な子豚が大豚よりも高い利得を得る } 戦略的な要因をうまく使えば弱者が強者に勝てることも!
子豚 大豚
スイッチ押す 待つ
スイッチ押す -1 4
3 1
待つ -1 5
0 0
天谷(42-43)
合理的な推論で解ける例:利得表
Lecture 2 46
} どのようにして答えを導くことができるだろうか?
} プレイヤーたちの合理性だけからゲームを解いてみよう! } (強く)支配される戦略を見つけることはできるだろうか?
2 1
左 真ん中 右
上 0 1
2 1
1 0
下 3 0
1 0
0 2
支配される戦略の逐次消去
Lecture 2 47
} 強く支配される戦略はとられないことに注目! 1. プレイヤー2の「右」は「真ん中」に強く支配される
} プレイヤー2の「右」を消去
2. プレイヤー1の「下」は「上」に強く支配される } プレイヤー1の「下」を消去
3. プレイヤー2の「左」は「真ん中」に強く支配される } プレイヤー2の「左」を消去
4. (上、真ん中)のみが逐次消去によって生き残る!
} この結果(上、真ん中)は唯一のナッシュ均衡に一致 } 一見すると複雑なゲームでも合理的な推論から解けた! } 逐次消去で残った行動の組にナッシュ均衡は含まれる?
天谷(46-47ページ)
合理的な推論とナッシュ均衡の関係
Lecture 2 48
} 自分が合理的なだけでなく、相手が合理的なこともお互いに知り合っていないと消去が進まない点に注意
} 支配される戦略の逐次消去は多くの場合不十分
} 消去のプロセスが途中で(場合によっては 初から)止まる } 理論的な結果(の予測)をあまり絞ることができない
} ナッシュ均衡の概念の方がより“強い” } 逐次消去の途中でナッシュ均衡においてとられる行動が消去
されることは絶対にない! } もしも逐次消去で唯一の行動の組が生き残った場合には、そ
れは必ずナッシュ均衡になっている!
鹿狩りゲーム:利得表
Lecture 2 49
} 2人のハンターがどちらの獲物を狙うかを決める } 鹿は2人で協力しないと捕えることができない } 兎は自分1人でも必ず捕えることができる=安全な戦略
ハンター2 ハンター1
シカ ウサギ
シカ 3 3
2 0
ウサギ 0 2
2 2
鹿狩りゲーム:分析
Lecture 2 50
} このゲームには2つナッシュ均衡がある! } (シカ、シカ)(ウサギ、ウサギ)のどちらもナッシュ均衡 } コーディネーションゲームの一種と考えられる
} どちらの均衡の方がもっともらしい? } (シカ、シカ)は2人にとって望ましい効率的な均衡だが… } (ウサギ、ウサギ)の方が実現しやすい可能性がある
} 相手がランダムに戦略を選んでくる場合には } 「シカ」よりも「ウサギ」を選ぶ方が(期待)利得が高い!
} 「ウサギ」=リスク支配戦略、(ウサギ、ウサギ)=リスク支配均衡 } この例のように、リスク支配均衡が効率的とは限らない…
鹿狩りゲームの応用1:銀行取り付け
Lecture 2 51
} 銀行が危ないという噂に対して預金者はどうするか } 実際は健全経営なので、急な引き出しがなければ破綻しない } 「引き出さない」→危険、「引き出す」→安全 } みんなが「引き出す」と健全な銀行が破綻してしまう…
預金者2 預金者1
引き出さない 引き出す
引き出さない 2 2
1 -10
引き出す -10 1
0 0
天谷(78-79ページ)
鹿狩りゲームの応用2:イジメ問題
Lecture 2 52
} クラスメートがいじめ問題に立ち向かえるか } どちらの生徒にとっても、いじめが解決するのがベスト } 自分だけ「立ち向かう」といじめの標的になる危険がある } みんなが安全に「見ないフリ」をするといじめは無くならない…
生徒2 生徒1
立ち向かう 見ないフリ
立ち向かう 2 2
0 -10
見ないフリ -10 0
0 0
天谷(78-79ページ)
ゲーム理論とマーケットデザイン入門
Lecture 3: ビジネス競争のゲーム
Lecture 3 53
単純なゲームのビジネスへの応用例
Lecture 3 54
1. 囚人のジレンマ } 価格競争
2. コーディネーション・ゲーム } 出店先の選択
3. タカ-ハト・ゲーム } 新たな投資決定
4. 合理的な豚 } タカ-ハト・ゲームの変形
5. 鹿狩りゲーム } 国債・通貨の空売り
囚人のジレンマ:飲食店の価格競争
Lecture 3 55
} (現状価格、現状価格)が両者にとって望ましいが…
} 相手の戦略によらず「値下げ」するのが各自の 適(支配)戦略!
} 各企業が利潤を増やそうとする結果、(値下げ、値下げ)に! } 消費者にとっては有り難いが、企業にとっては「ジレンマ」…
M屋 Y野家
現状価格 値下げ
現状価格 2 2
3 -1
値下げ -1 3
0 0
天谷(20-25、70-71ページ)
コーディネーション・ゲーム:出店先選択
Lecture 3 56
} 補完的なビジネスなので同じビルに店舗を出店したい
} (ビルB、ビルB)の方が(ビルA、ビルA)よりも望ましいが…
} (ビルA、ビルA)と(ビルB、ビルB)はどちらもナッシュ均衡 } (ビルA、ビルA)に陥る「協調の失敗」を避けることが重要!
旅行代理店 旅行用品店
ビルA ビルB
ビルA 2 2
1 0
ビルB 0 1
3 3
天谷(72-75ページ)
タカ-ハト・ゲーム:航空機の開発投資
Lecture 3 57
} 両者とも投資をすると費用が回収できず、お互い大赤字に!
} (投資する、しない)と(しない、投資する)がナッシュ均衡
} うまく工夫して自社に有利なようにゲームを変えられるか? } たとえば、A社が「しない」場合に社長をクビにできるとすると…
B社 A社
投資する しない
投資する -5 -5
-2 10
しない 10 -2
0 0
天谷(82-85ページ)
合理的な豚:タカ-ハト・ゲームの変形
Lecture 3 58
} A社の社長は「しない」でクビになると、利得が5減るとする
} 一見するとA社にとって状況が不利になった気がするが…
} タカ-ハト・ゲームから合理的な豚にゲームが変わる } (投資する、しない)が唯一のナッシュ均衡に!
B社 A社(の社長)
投資する しない
投資する -5 -5
-2 10
しない 10 -7
0 -5
天谷(42-45、86-87ページ)
鹿狩りゲーム:日本国債の空売り
Lecture 3 59
} 両者とも「空売り」すれば国債が暴落して大もうけできる!
} 自分一人だけ「空売り」しても損するだけ
} (空売り、空売り)と(しない、しない)はどちらもナッシュ均衡 } 投資家の戦略的行動(協調)が国債暴落を引き起こす危険性…
投資家B 投資家A
空売りする しない
空売りする 5 5
0 -5
しない -5 0
0 0
天谷(78-79ページ)
もう少し複雑なゲーム
Lecture 3 60
} 今まで扱ってきたゲームの共通点 1. ゲームを利得表で表すことができた 2. ナッシュ均衡が(ひとつは)必ず存在した
} 今回の講義で取り上げるゲーム 1. 利得表で表すことができない(難しい)ようなゲーム
} 戦略がたくさんある(無限個も含む)ゲーム } プレーヤーが3人以上のゲーム(ただし今回は扱わない)
2. ナッシュ均衡が“ない”ゲーム } 戦略を適切な形で拡張するとナッシュ均衡が“ある” } ほとんどのゲームでこのナッシュ均衡がきちんと存在する
ホテリング・モデル:立地ゲーム
Lecture 3 61
} 【プレイヤー】 (浜辺の)2軒のアイスクリーム屋:AとB } 【戦略】 お店の立地場所:0から100の間の数字 } 【利得】 利益(集客数に比例する) ホテリング・モデルの仮定 } お客は浜辺沿い(0から100)に均一に散らばっている } 個々のお客は自分から近い方のお店に行って、1単位
ずつアイスクリームを購入する } お店が等距離にある場合には半々の確率で店を選ぶ
⇒ナッシュ均衡はどのようになるだろうか?
天谷(88-89ページ)
立地ゲーム:ナッシュ均衡
Lecture 3 62
} このゲームにはナッシュ均衡がひとつだけ存在する } どちらのお店も真ん中(=50)に立地する! } 「 少差別化の原理」(Principle of Minimum Differentiation)
なぜこうなるのだろうか? 2つのお店が 1. 異なる場所を選ぶのは(ナッシュ)均衡にならない
} 相手の立地により近づくと必ずお客が増える
2. 真ん中以外の同じ場所を選ぶのも均衡にはならない } 左右どちらかに少し動くとお客が急に増える
3. 真ん中をともに選ぶ場合はナッシュ均衡になる! } どこに立地を変えても客の数が減ってしまう
天谷(90-91ページ)
立地ゲーム:応用例
Lecture 3 63
} どのような現実の現象を説明できるのか? 1. できるだけ多くの客を獲得することを目的としている 2. ライバル同士が同じ土俵(プラットフォーム)で競争していて 3. 競争の結果として同じような戦略を取り合っている状況
プレイヤー 戦略 現象
政党(民主党と自民党) 政策スタンス 中道的な政策(2大政党制のジレンマ)
コンビニ・チェーン ロケーション 隣り合うコンビニ
テレビ局 放送時間 同ジャンル番組の集中
メーカー 製品の味や外見など 似たような無難な商品(家電、コーラ、etc)
天谷(90-91ページ)
合理性で立地ゲームは解けるか?
Lecture 3 64
} 適戦略(支配戦略)は存在しない!
} 戦略が連続な数ではなく0から100の整数としよう } 実は「支配される戦略の逐次消去」でゲームが解ける!
} 【ステップ1】 0は1に、100は99に強く支配される } 合理的なプレイヤーは端の点(0と100)はとらない⇒消去!
} 【ステップ2】 1は2に、99は98に強く支配される } 合理的なプレイヤーは端の点(1と99)はとらない⇒消去!
(以下このステップが続く)
} 【ステップ50】 49、51はそれぞれ50に強く支配される⇒消去
⇒どちらのプレーヤーも50(真ん中)を選ぶ!
ベルトラン・モデル:価格競争ゲーム
Lecture 3 65
} 【プレイヤー】 2社の製品メーカー:AとB } 【戦略】 製品1単位あたりの価格:0以上の数字 } 【利得】 利益:(価格-コスト) ×需要量 ベルトラン・モデルの仮定 } 右下がりの需要曲線 } 1単位あたりのコストは c } 低い価格をつけた企業が市場需要分をすべて供給する } 企業が同じ価格を付けた場合は半々のシェアを得る ⇒ナッシュ均衡はどのようになるだろうか?
価格競争ゲーム:ナッシュ均衡
Lecture 3 66
} このゲームにはナッシュ均衡が一つだけ存在する } どちらもコストに一致する価格をつける: p(価格) = c (コスト) } つまり利潤がゼロに!
なぜこうなるのか? 2つの企業が 1. 異なる価格を付けるのは(ナッシュ)均衡にならない
} 必ずどちらか片方の企業は価格を変えて得できる 2. コスト以外の同じ価格をつけるにも均衡にならない 3. 限界費用と一致する価格を共につけるのは均衡!
} 値上げしても利潤は0のまま、値下げはマイナスの利益=損
⇒利得表や 適化の手法でなく論理的に均衡を導出!
ベルトラン・パラドックス
Lecture 3 67
} 2企業間の競争で価格が一気に限界費用まで下がる } 1社増えるだけで1企業の独占価格から完全競争価格に!
} 実際には、ベルトランモデルのような価格競争が行われている(ように見える)産業でも価格は急落しない } 現実とのギャップ=「ベルトラン・パラドックス」
ベルトラン・パラドックスを解く3つの理由 } 【製品差別化】 相手よりも高くてもある程度は売れる } 【生産量制約】 安価では市場需要をすべて満たせない } 【動学的競争】 時間を通じて暗黙のカルテル、共謀
クールノー・モデル:数量競争ゲーム
Lecture 3 68
} 【プレイヤー】 2社の製品メーカー:AとB } 【戦略】 製品の生産量:0以上の数字 } 【利得】 利益:(市場価格-限界費用) ×需要量 クールノー・モデルの仮定 } 各企業は独立に価格を設定できない
} 企業の総供給が市場需要に一致する水準で価格が決まる } ここでは、簡易版のゲームを考える
} 各企業は300、400、600個の中から数量を選ぶ } 利得表は次のページで与えられるとする ⇒ナッシュ均衡はどのようになるだろうか?
数量競争ゲーム(簡易版):利得表
Lecture 3 69
} 中程度の生産(400、400)が唯一のナッシュ均衡に! } 利潤を 大にする(300、300)はナッシュ均衡にならない } 価格=コストとなる(600、600)もナッシュ均衡にならない
メーカーB メーカーA
300 400 600
300 1800 1800
2000 1500
1800 900
400 1500 2000
1600 1600
1200 800
600 900 1800
800 1200
0 0
ベルトランかクールノーか?
Lecture 3 70
} 次のような疑問がわいてくるかもしれない } 「どちらのモデルが優れているのか?」 } 「なぜ複数のモデルを必要とするのか?」
} ベルトランとクールノー、どちらのモデルも、各企業が価格と数量(生産設備)を共に選べるような一般的な寡占市場競争の一面を捉えたものと解釈できる
} 状況に応じてより適したモデルを採用すべき } 【ベルトラン】 企業が数量(の上限)を価格よりも早く調整でき
るような産業: 例) ソフトウェア } 【クールノー】 価格の方が数量よりも早く調整されるような産
業: 例) 小麦、セメント
ゲーム理論が変えた寡占市場の見方
Lecture 3 71
} 1970年代まで } 戦略的な状況が生じる寡占市場(不完全競争)を分析する統
一的な視点がなく、バラバラな分析の寄せ集めだった
} 1980年代以降 } ゲーム理論が積極的に応用され、性質の異なる市場を異なる
ゲームとして定式化するようになった } 市場ごとに異なる解が存在するのではなく、ナッシュ均衡とい
う単一の解で様々な寡占市場が統一的に分析できる
⇒きちんと個々の寡占市場の特徴を把握してゲームとして定式化すれば、あとはナッシュ均衡を求めれば良い!
ゼロサムゲーム:マッチング・ペニー
Lecture 3 72
} 2人のプレーヤーがそれぞれコイン(1セント)を置く } 面が揃えば1が、異なれば2が相手に1セントを支払う
} 2人の利得の和が常にゼロ(/一定) } 「ゼロサム(/定和)ゲーム」と呼ぶ
2 1
表 裏
表 1 -1
-1 1
裏 -1 1
1 -1
天谷(60-61ページ)
ナッシュ均衡が“ない”?
Lecture 3 73
} ゼロサムゲームの特徴 } 相手の裏をかくのが常に 適 } お互いが納得できるWin-Winの状況がない
} ゼロサムゲームの例 } 【ポーカー】 ブラフ(はったり)を「かける」か「かけない」 } 【戦争】 「海側」から攻める/守る、「陸側」から攻める/守る } 【テニス】 「中央」にサーブ/備える、「端」にサーブ/備える
} プレーヤーは常に相手の裏をかこうとする } 安定的な状況(ナッシュ均衡)は存在しない??
天谷(62-63ページ)
混合戦略:行動を確率的に選択する
Lecture 3 74
} 混合戦略 } 複数の行動を確率的に混ぜてプレーする } じゃんけんなどで無意識に行っている“戦略”
} 純粋戦略 } 特定の行動を確実に(確率1で)選ぶ:今までの“戦略” } 混合戦略の特殊ケースとみなすことができる
} 戦略を混合戦略に拡張してナッシュ均衡を定義! } すべてのプレーヤーにとって、自分一人だけが(混合)戦略を
変えても得できないような混合戦略の組み合わせ } 合理的なプレーヤーは利得の「期待値」を 大化すると仮定
} ノイマン&モルゲンシュテルンによる「期待効用理論(仮説)」
天谷(62-63ページ)
ゲーム理論とマーケットデザイン入門
Lecture 4: ゲームを後ろから解く
Lecture 4 75
混合戦略で解くマッチング・ペニー
Lecture 4 76
} プレーヤー1は } 表を確率 q、裏を確率 1-q で選ぶとする
} プレーヤー2は } 表を確率 p、裏を確率 1-p で選ぶとする
2 1
表 (p) 裏 (1-p)
表 (q)
1 -1
-1 1
裏 (1-q)
-1 1
1 -1
天谷(60-63ページ)
どうやって均衡を見つけるのか?
Lecture 4 77
} プレーヤーが表と裏をともに正の確率で選ぶのなら、どちらの純粋戦略を選んでも差がないはず } 均衡においてはどちらも同じ期待利得になっている! } もしそうでないとすると、期待利得の大きい行動を確率1で選
び、小さい行動を一切とらないのが 適になり矛盾する
} プレーヤー1の選択が無差別になるためには } -p + (1-p) = p - (1-p), よって p = 0.5. } プレーヤー2の戦略が決定される点に注意!
} プレーヤー2の選択が無差別になるためには } q - (1-q) = -q + (1-q), よって q = 0.5. } プレーヤー1の戦略が決定される点に注意!
天谷(64-67ページ)
混合戦略(ナッシュ)均衡の確認
Lecture 4 78
} 無差別条件から q = p = 0.5 が求まった } これはきちんと混合戦略均衡になっているか?
} どちらのプレーヤーも戦略を切り替えても利得が一定 } 相手が半々で表裏を選ぶ時に、自分も半々で表裏を選ぶの
が 適戦略のひとつにきちんとなっている } お互いに 適な戦略を取り合っている → ナッシュ均衡!
} 混合戦略均衡では、均衡戦略をとる強いインセンティブが無さそうに見えるが… } お互いに相手の裏をかこうとすると自然とナッシュ均衡に!
天谷(64-67ページ)
最適反応曲線による分析
Lecture 4 79
} 相手の混合戦略に対する 適な反応を図示 } 「 適反応(Best Reply)曲線」の交点=混合戦略均衡
q
p
0
1
1
BR2
BR1 0.5
0.5
NE
ナッシュ均衡は常に存在するか?
Lecture 4 80
ナッシュの定理(1950) } プレーヤーの人数と(純粋)戦略の数がともに有限であ
るどのようなゲームにおいても、混合戦略均衡を含めれば少なくとも一つはナッシュ均衡が存在する!
} 有限ではないゲームにも多くの場合ナッシュ均衡は存在 } ホテリング、ベルトラン・モデルなどはいずれも戦略数が無限
} ナッシュ均衡が全く存在しない特殊なゲームの例 } 【整数ゲーム】 一番大きな数字を書いたプレーヤーが勝ち } (敗者には)勝者よりも常に大きい数を言うインセンティブが…
変形版マッチング・ペニー
Lecture 4 81
} (表、表)の利得が(-1, 1)から(-2, 2)に変化 } プレーヤー2にとって表は一見すると有利な戦略に } 表を選ぶ確率(p’)は0.5よりも増えそうだが…
} 混合戦略均衡を解いてみよう!
2 1
表 (p’) 裏 (1-p’)
表 (q’)
2 -2
-1 1
裏 (1-q’)
-1 1
1 -1
天谷(64-67ページ)
無差別条件を使って解く!
Lecture 4 82
} プレーヤー1の選択が無差別になるためには } -2p’ + (1-p’) = p’ - (1-p’), よって p’ = 0.4.
} プレーヤー2の選択が無差別になるためには } 2q’ - (1-q’) = -q’ + (1-q’), よって q’ = 0.4.
} 混合戦略の組 (p’, q’) = (0.4, 0.4) が唯一のナッシュ均衡 } 変形前の均衡 (p, q) = (0.5, 0.5) はもはや安定ではない } 均衡においてプレイヤー2は、一見すると有利に見える「表」を
以前よりも低い40%の確率でしか選択しない!
天谷(64-67ページ)
おまけ:サッカーのPK
Lecture 4 83
} (混合戦略)ナッシュ均衡はどうなるだろうか? } キーパー(1/3、4/9、2/9)、キッカー(15/31、6/31、10/31)
キッカー キーパー
左 (x) 真ん中 (y) 右 (1-x-y)
左 (p)
40 60
100 0
80 20
真ん中 (q)
80 20
0 100
80 20
右 (1-p-q)
80 20
100 0
20 80
動学的なゲーム:参入ゲーム
Lecture 4 84
} プレーヤーは2種類の企業 } 既存企業と(潜在的な)参入企業
} まずはじめに参入企業がこの独占市場に「参入する」か「しない」かを決定する } 後者の場合ゲームはただちに終了
} 参入企業は 0、既存企業は 4 の利得を得る } 前者の場合、既存企業が次の意思決定を行う
} 参入が起こった場合に既存企業は「価格競争」するか「しない」かを決定する } 前者の場合、両企業はそれぞれ -1 の損失を被る } 後者の場合、両企業はそれぞれ 1 の利得を得る
天谷(94-95ページ)
「ゲームの木」による描写
Lecture 4 85
} 参入ゲームは以下のような「木」として表現できる
(0,4)
(-1,-1)
(1,1)
参入企業
独占企業
しない
参入する
価格競争
しない
天谷(96-97ページ)
利得表を書いて分析すると…
Lecture 4 86
} ふたつのナッシュ均衡が存在する } 左下(しない、価格競争)はもっともらしい均衡か?
独占企業 参入企業
価格競争 しない
参入する -1 -1
1 1
しない 4 0
4 0
天谷(98-99ページ)
動学ゲーム分析で気を付けること
Lecture 4 87
} 時間を通じた動学ゲームにはナッシュ均衡が複数存在する場合が多い → これ自体は問題ではないが… } 一部の均衡が信憑性のない「から脅し」に依存している
} ゲームを「後ろから解く」ことによって、信憑性のない均衡をきちんと排除することができる! } 「バックワード・インダクション(後方帰納法)」と呼ぶ
} この考えを解概念としてフォーマルに一般化すると } 「部分ゲーム完全均衡」となる(本講義では省略)
天谷(100-103ページ)
バックワード・インダクション解
Lecture 4 88
( ,4)
(-1, )
( , )
参入企業
独占企業
しない
参入
価格競争
しない
天谷(104-105ページ)
逐次手番による男女の争い
Lecture 4 89
} もしも妻が先に戦略を決めて、夫が妻の選択を見た後で戦略を決める場合には何が起こるだろうか? } 妻の戦略は「遊園地」か「野球」の2つ } 夫の戦略は実は4つ! ← 妻の戦略に応じて変更できるから
夫 妻
遊園地 野球
遊園地 1 2
0 0
野球 0 0
2 1
逐次版男女の争い:利得表による分析
Lecture 4 90
} このゲームには3つのナッシュ均衡が存在 } (遊、遊遊’), (遊、遊野’), (野、野野’) → もっともらしいのは? } バックワード・インダクションは (遊、遊野’) を選ぶ!
夫 妻
遊, 遊’ 遊, 野’ 野, 遊’ 野, 野’
遊園地 1 3
1 3
0 0
0 0
野球 0 0
3 1
0 0
3 1
天谷(98-99ページ)
逐次手番ゲームの例:Not 21
Lecture 4 91
} 2人のプレーヤーが交互に数字を数え上げていく } 各プレーヤーは1~3個の連続した数字を数える } 後に21の数字を数えたプレーヤーが負け } 「Not XX」は一昔前に結構流行ったゲーム(のハズ)
} 先手もしくは後手に必勝戦略(必勝法)はあるだろうか? } あるとしたらそれはいったいどんな戦略か?
} ネタバレになってしまうので必勝法は講義で… } もしも数字が他の数だったらどのように必勝法は変わる?
ツェルメロの定理と“必勝法”
Lecture 4 92
} どのような動学的な2人ゲームにおいても 1. 結果が「勝ち」か「負け」しかなく 2. プレイヤーが交互に行動を選択し 3. 過去のプレーをすべて観察することができ 4. 偶然の要素による影響が全くなく 5. 必ず有限回の手番でゲームが終わる
のであれば、どちらかのプレイヤーに必ず必勝戦略がある } 【必勝戦略】 相手がどんなプレーをしてきても、必ず自分が
終的に勝利できるような(動学的な)戦略
} 上の条件を満たせば必勝法は必ず存在する! } オセロ、チェス、将棋、囲碁には必ず必勝戦略がある!
ツェルメロの定理の注意点
Lecture 4 93
} 結果が「勝ち」「負け」「引き分け」の場合には… 1. 先手に必勝戦略がある 2. 後手に必勝戦略がある 3. どちらのプレーヤーにも「 低でも引き分けに持ち込むこと
ができる」ような戦略がある (例: 三目並べ) のいずれかが必ず成り立つ
} 必勝戦略の求め方については何も教えてくれない } 複雑なゲームで必勝戦略を求めるのは現実的には不可能 } 「必ず必勝法がある」ことと「必勝法が見つかる」は違う } オセロ(8×8)ですら、まだ先手・後手必勝どちらかは不明
【復習】クールノーの数量競争ゲーム
Lecture 4 94
} 【プレイヤー】 2社の製品メーカー:AとB } 【戦略】 製品の生産量:0以上の数字 } 【利得】 利益:(市場価格-限界費用) ×需要量 クールノー・モデルの仮定 } 各企業は独立に価格を設定できない
} 企業の総供給が市場需要に一致する水準で価格が決まる
} ここでは、簡易版のゲームを考える } 各企業は300、400、600個の中から数量を選ぶ } 利得表は次のページで与えられるとする
⇒これを逐次手番(Aが先に決定)にするとどうなるだろうか?
シュタッケルベルグ・モデル
Lecture 4 95
} クールノー・モデルの逐次手番バージョン } メーカーA(リーダー)が先に生産量を決定 } それを見た後にB(フォロワー)が生産量を決定
} ゲームを後ろから解くと… } メーカーAの生産量と利潤が増えて、Bのそれらは減る
} 「コミットメント」による利益
} Aは少なくともクールノー・モデルの利潤は獲得できる } 400を選べばクールノー・モデルと同じ結果になるから
} Bは情報をたくさん得ているが、むしろ利得は低下してしまう } 戦略的な状況では情報が多いほど有利とは限らない!
数量競争ゲーム(簡易版):利得表
Lecture 4 96
} Aの生産量に対してBは 適な生産量を選んでくる } これを織り込むと、Aの 適な生産量は600になる } クールノー・モデルのナッシュ均衡よりもAの利益は増える!
メーカーB メーカーA
300 400 600
300 1800 1800
2000 1500
1800 900
400 1500 2000
1600 1600
1200 800
600 900 1800
800 1200
0 0
参入ゲーム:再考
Lecture 4 97
} いったん参入が起これば価格競争は起こらない } もし独占企業が事前に「価格競争」にコミットできたら…
(0,4)
(-1,-1)
(1,1)
参入企業
独占企業
しない
参入
価格競争
しない
天谷(106-107ページ)
参入ゲームとコミットメント
Lecture 4 98
} 事後的には(いったん参入が起こったら) 適な価格競争「しない」を選ばないことにコミットすると…
(0,4)
(-1,-1)
(1,1)
参入企業
独占企業
しない
参入
価格競争
しない
天谷(108-109ページ)
航空機の開発投資:国際貿易競争
Lecture 4 99
} このゲームには2つの(非対称)ナッシュ均衡が存在 } B社にもしもコミットメント・パワーがあるとどうなるか?
} もちろん、「投資する」にコミットするのが 適! } 現実にはどのようなコミットメント装置が考えられるか?
A社 ╲ B社 投資する しない
投資する -5 -5 10 -2
しない -2 10 0 0
政府がゲームを変える:戦略的貿易政策
Lecture 4 100
} もしも政府がB社への補助金にコミットできたら? } B社が投資を行ったら、(結果によらず)5だけ補助金を出す } このような戦略的通商政策は結果を改善できる
} B社にとって「投資する」のが支配戦略になる } (投資する、しない)はもはやナッシュ均衡ではない!
A社 ╲ B社 投資する しない
投資する -5 0 10 -2
しない -2 15 0 0
コミットメントの具体例
Lecture 4 101
} 家電量販店などの「 低価格保証」 } 他店よりも1円でも高い商品があれば値下げします } 事後的には 適ではない「価格競争」にコミットすることにより、
ライバル店の値下げを牽制する効果が期待できる!
} 代理人(エージェント)へ交渉や仕事を依頼する } 代理人には条件を譲歩する権限が無い } 交渉の余地がないことをコミットすることができる
} ソフトウェアの「オープンソース」化 } 市場を独占化しないことにコミットする } ユーザーが安心してそのソフトを使えるように
天谷(108-109、116-117ページ)
ゲーム理論とマーケットデザイン入門
Lecture 5: 長期的関係と協力の発生
Lecture 5 102
長期的関係
Lecture 5 103
} ここまでの分析では、プレーヤーたちがゲームを一回だけプレーするという状況を扱ってきた } 現実には、同じ相手と同様のゲームを繰り返す場合がある } 繰り返しゲーム → 長期的関係を自然に描写できる
} 囚人のジレンマで協力することができる場合がある!
} 1回限りでは裏切るのが得 → 協調達成は不可能だった } いったん裏切ると、協調関係が崩れて将来相手から協力して
もらえなくなる、という脅し(お仕置き)が有効に
} 長期的な関係によって多様な結果が実現できるように } 契約を使っても同じ結果が実現できるかもしれないが…
天谷(178-179ページ)
長期的関係のメリット 契約のデメリット
Lecture 5 104
契約は長期的関係と比べて以下の短所がある } 逸脱や裏切りを裁判所が見破ることは難しい
} そもそも「協力」の定義や意味合い自体が曖昧
} 裏切り行為を当事者が立証するのはコストがかかる
} そもそも裁判所や契約を監督する第三者がいない場合 } 例) 過去や途上国での経済活動、地球温暖化など
⇒ 短期的(近視眼的)な利益の追求と長期的な損失とのト
レードオフを分析する 善のツールが繰り返しゲーム!
繰り返しゲーム
Lecture 5 105
} 繰り返しゲームは同じプレーヤー達が同一のゲーム(「ステージゲーム」と呼ぶ)をT回繰り返す } Tが有限: 有限回繰り返しゲーム } Tが無限: 無限回繰り返しゲーム
} プレーヤー達は過去のプレー(「歴史」と呼ぶ)をすべて観察することができる } 「完全観測」(Perfect Monitoring)の仮定 } 不完全観測のケースについては複雑なので扱わない…
} 繰り返しゲーム全体の利得はどう定義するか } 有限回: ステージゲームの利得の和 } 無限回: 将来利得の割引現在価値の和
天谷(180-181ページ)
2回繰り返し「囚人のジレンマ」
Lecture 5 106
} 2期目は実質的に通常の(1回だけの)囚人のジレンマ } 1期目にどうプレーしても、2期目の結果は(裏切り、裏切り)
} ゲームを後ろから解くと、毎期(裏切り、裏切り)が実現 } 繰り返しても(協力、協力)は実現できない…
プレーヤー2 プレーヤー1
協力 裏切り
協力 2 2
3 -1
裏切り -1 3
0 0
天谷(196-197ページ)
有限回繰り返しゲーム
Lecture 5 107
} 動学ゲームの一種 → 後ろ( 終期)から解くべし! 1. 一番 後のステージゲームのナッシュ均衡を求める 2. その結果をもとに、 後から二番目のゲームを分析 3. 以下、順番に 初までさかのぼって全体のゲームの均衡
(これを「部分ゲーム完全均衡」と呼ぶ)を求める
} ステージゲームにナッシュ均衡が一つしかない場合 } 毎期(それまでの歴史と関係なく)そのナッシュ均衡をプレーし
続けるのが、唯一の部分ゲーム完全均衡となる
} ステージゲームのナッシュ均衡が複数の場合 } 様々な結果が均衡として実現できる → 詳しくは後述
天谷(196-197ページ)
有限回繰り返しベルトランゲーム
Lecture 5 108
} ベルトランゲームを有限回(T)回繰り返してプレーし
た場合に、価格カルテルは実現できるだろうか?
} 明示的なカルテルは違法 → 暗黙のカルテルを考える
} 強制力のある合意や契約が結べないときに、参加企業
たちが自発的に価格カルテルを維持できるだろうか?
} ベルトランモデルにはナッシュ均衡は一つだけ
} どちらの企業も「価格=コスト」を選択する
} 毎期そのナッシュ均衡(価格競争)が実現してしまう…
世界の終わりが分かるとお金は使えない?
Lecture 5 109
もしも世界がT期後に終わるとすると…
1. T期 → 次の期が無いので誰もお金を受け取らない
2. T-1期 → お金を受け取っても来期は絶対使えない
} 実質的に今期が 終期 → 誰もお金を受け取らない
3. T-2期 → お金を受け取っても将来に使うことは無理
} やはり誰もお金を受け取ろうとしない
} 以下、1期にさかのぼるまでこの議論は続く…
4. 世界の終わりが分かった瞬間に紙幣は紙くずに!?
有限回繰り返しゲームの罠
Lecture 5 110
} Tはどんなに大きい数でも構わない } いつかこの世界(人類の歴史)は終わる → Tは有限 } 疑問) だとすると、今すぐお金が使えなくなるのでは?
} 「有限の長さでゲームが終わる」のと「T期でゲームが終わることが確実に分かっている」のは全く異なる状況 } ゲームを後ろから解くためには、プレーヤーたちがいつゲー
ムが終わるのかをお互いに正確に知っている必要がある } 知らない場合には、常に将来の可能性を考慮するはず!
} 例) 今期裏切ったら、将来お仕置きされるかもしれない…
} 実は「無限回繰り返しゲーム」として分析する方が適切
将来の価値を「割り引く」とは?
Lecture 5 111
} 無限回繰り返しゲームでは、将来の利得を「割り引く」 } 来期の利得は、今期と比べて小さく(δ倍で)評価される } この(1より小さい)δを「割引因子」(discount factor)と呼ぶ } 割引因子が大きい = 将来を重視(忍耐強い) } 割引因子が小さい = 現在を重視(刹那的?)
} さまざまな理由によって将来は割り引かれる } 利子の存在: 金銭リターンは利回りで調整して評価する } 主観的割引: 今すぐもらえる利得を将来の利得より重視する } ゲーム終了リスク: ゲームが終わる危険性を考慮する
天谷(184-185ページ)
ベルトラン・パラドクスのおさらい
Lecture 5 112
} ベルトランモデルのナッシュ均衡では、利潤は0に! } しかし、価格競争をしている(ように見える)多くの寡占市
場では、価格はコストよりも高いのでは? } 例) 隣接するファーストフード店、ガソリンスタンドなど
⇒ どうやって企業は超過利潤を獲得しているのか? } 製品差別化 } 生産設備の制約(供給するためには設備投資が必要) } 長期的な相互依存関係: 談合やカルテル
} 有限回繰り返し => 価格競争に陥ってしまう… } 無限回繰り返し => どうなる??
無限回の繰り返しベルトランゲーム
Lecture 5 113
} 次の「トリガー戦略」を使うことで、割引因子が十分に大きければ(δ ≥ 1/2)談合を実現することができる } 個々の企業は、誰かが値下げを行うまでは独占価格をつける } もしも値下げが観察されたら、次の期からはずっとステージ
ゲームのナッシュ均衡をプレーし続ける } 価格=コストで、価格競争に突入する } 一度裏切ると、来期からはずっと利潤が0に…
t t+1 t+2 … 独占価格 π π π …
カルテル破り 2π 0 0 …
天谷(182-183、186-189ページ)
割引因子に関する条件の求め方
Lecture 5 114
2/11
......2
2
2
≥⇔−
≤⇔
++≤⇔
+++≤
δπδδ
π
πδδππ
πδδπππ
S := a+ ra+ r2a+...rS := ra+ r2a+ r3a+...S − rS = (1− r)S = a
⇒ S = a1− r
} 次の公式を使って簡単に
計算することができる
【等比級数の公式】 } 初項: a } 公比(1未満の): r
天谷(182-183、186-189ページ)
無限回繰り返し「囚人のジレンマ」
Lecture 5 115
} 繰り返しが有限回だと協力は絶対に達成できない } ゲームを後ろから解くと、毎期(裏切り、裏切り)が実現
} 無限回の場合にはゲームに終わり( 終期)が無い } うまくお仕置きの仕組みを作ると(協力、協力)が実現できる
プレーヤー2 プレーヤー1
協力 裏切り
協力 2 2
3 -1
裏切り -1 3
0 0
天谷(182-183、186-189ページ)
協力を達成するための条件
Lecture 5 116
} 次の形で定義される「トリガー戦略」を考える } 初の期には(協力、協力)をプレーする } 過去に誰も裏切らない限り、(協力、協力)をプレーし続ける } もしも誰かが裏切った場合には、次の期以降ずっと(その後に
何が起きようが)(裏切り、裏切り)をプレーし続ける
} 協力を達成するためには、裏切りがもたらす将来の損失が短期的な利益よりも大きくないといけない
3/121
1
...221...2223 22
≥⇔−
≤⇔
++≤⇔+++≤
δδδ
δδδδ
天谷(182-183、186-189ページ)
(ナッシュ回帰の)フォーク定理
Lecture 5 117
} プレーヤーたちの割引因子が十分に大きい(将来をほとんど割り引かない)とき、ステージゲームのナッシュ均衡利得を(全員にとって)上回るすべての利得の組み合わせを、部分ゲーム完全均衡として達成することができる
} フォーク定理はトリガー戦略を使って証明できる 1. 目標とする利得を獲得できるような戦略をまずは計画する 2. この長期的な戦略から誰も逸脱しない限り、全員で計画に
従ってプレーを続ける 3. もしも誰かが逸脱した場合には、次の期以降ずっと(その
後に何が起きようが)ナッシュ均衡をプレーし続ける
フォーク定理のイメージ図
Lecture 5 118
(2, 2)
(0, 0)
(-1, 3)
(3, -1)
実現可能な利得の集合
ナッシュ均衡
共有地の悲劇と共有地の統治
Lecture 5 119
} 一般に、共有資源(コモンズ)の管理は難しい } 各人に消費/利用し過ぎるインセンティブが発生 } 例) 漁場の乱獲、森林破壊、環境汚染、温泉の枯渇 } 「共有地の悲劇」(Tragedy of Commons)と呼ばれる
} 伝統的な経済学による解決策 } 私有化: 共有地を区切って私有化してしまう } 政府管理: 政府に直接管理を委ねて、利用料を適切に課す
} 「共有地の統治」 by オストロム(2009年ノーベル賞) } 共有地を地元住民が(長期的関係を通じて)自分たちで統治
有限回繰り返しゲーム再考
Lecture 5 120
} 次の利得表のゲームが2回続けてプレーされるとする } ステージゲームのナッシュ均衡はどうなるだろうか? } (A、X)の組を第1期に均衡でプレーすることはできるか?
1 ╲ 2 X Y Z
A 7, 7 4, 8 1, 9
B 8, 4 5, 5 0, 0
C 9, 1 0, 0 0, 0
複数のナッシュ均衡をうまく使う
Lecture 5 121
} ステージゲームにナッシュ均衡が3つある } 第2期はこの3つのどれかをプレーせざるを得ない } 第1期のプレーに応じて、第2期のプレーを変えられる!
1 ╲ 2 X Y Z
A 7, 7 4, 8 1, 9
B 8, 4 5, 5 0, 0
C 9, 1 0, 0 0, 0
複数のナッシュ均衡をうまく使う
Lecture 5 122
} ステージゲームにナッシュ均衡が3つある } 第2期はこの3つのどれかをプレーせざるを得ない } 第1期のプレーに応じて、第2期のプレーを変えられる!
1 ╲ 2 X Y Z
A 7, 7 4, 8 1, 9
B 8, 4 5, 5 0, 0
C 9, 1 0, 0 0, 0
1が裏切った場合
2が裏切った場合
(A,X)がプレーされた場合
有限回の繰り返しでも協力が達成できる!
Lecture 5 123
} 第1期に協力=(A、X)をプレーした場合 } 第2期には(B、Y)をプレーすることになる } 総利得: 7 + 5 = 12
} 第1期に裏切ってCをプレーした場合 } 第2期には(A、Z)が選ばれお仕置きされる } 総利得: 9 + 1 = 10
} 裏切ると第2期の利得が大きく下がってしまう } これはナッシュ均衡が複数あるからできること } 3期以上のケースでも同様の議論で協力の達成が可能