■戦略型ゲームと展開型ゲーム 戦略型はプレーヤーの利得が利得票によって表されある戦略をとるゲーム、展 開型ゲームは時間軸の概念も取り入れて考えるゲーム ■ナッシュ均衡と部分ゲーム完全均衡 ナッシュ均衡・・・お互いが自分の戦略を変えることによって自分の利得を上 げることが出来ない状態 ナッシュ均衡を展開型ゲームでそのまま使おうとすると問題が起きる。ナッシ ュ均衡ではあるが現実的な状態としておかしい状態が起こり得る。そのため、 展開型ゲームでは部分ゲーム完全均衡というナッシュ均衡より上位の概念を考 える。展開型ゲームの均衡状態は部分ゲーム完全均衡である。 部分ゲーム完全均衡・・・展開型ゲームのゲーム木は情報集合をもとに部分ゲ ームにわけることができるが、その全ての部分ゲームにおいてナッシュ均衡と なる戦略の組 ■協力ゲームと非協力ゲーム 協力ゲームは先に拘束力のあるルール(ルールを破られた時にペナルティを与 えることの出来るゲーム)を結ぶゲーム。非協力ゲームは提案反応型交渉と双 方要求型交渉に著者はわけている。提案反応型交渉は交互提案型交渉(交互に 一方が要求を提案して相手がそれに反応する) 双方要求型交渉は、お互いが同時に要求を出し続け、探り合いや消耗戦が起こ るようなゲーム。交渉力(どのような戦略をとるか)と効率性(どのような要 因で合意に至るか、妥協するか)がキー ■最後通牒ゲーム 繰り返しゲームの例。AとBが10万円わけるときに、Aが相手にいくらわたすか 1万円刻みで提案する。Bは受諾するか拒否するか選べ、拒否するとA・B両者の 利得が0になる。ゲームはBが受諾/拒否した時点で終了。部分ゲーム完全均衡 はAが0万円提案してBが受諾する時または1万円提案してBが受諾するとき(0万 円のときのBの最適戦略の定義による異なる) ■無限回繰り返しゲーム 無限回繰り返しゲームでは、相手が拒否すれば、再びAが提案するゲーム。交 渉に費やされる時間によって価値が下がることを表すために割引因子を導入す る。利得は回数が増えるにつれ、割引因子δによって割り引かれる。ピザの奪 い合いを例とすると、ピザがゲームを繰り返すことで冷めて価値がなくなるイ メージ。 ■交互提案交渉 特徴として・・・(1)結果はすぐに妥結する、(2)自分の提案で妥結する方が有 利、(3)我慢強さ(割引因子が1に近い)が結果に正の影響。 ■サブゲーム完全均衡 交互提案交渉では答えのパターンは1つに決まる。各回のゲームでは、過去の 受諾/拒否は判断と関係なく、現在よりも将来のことしか考えない。プレーヤ ーAがxAを要求したとき、Bは受諾すると(1-xA)の利得、拒否すると自分の提案 時にMBを要求する。MBはBがもらうことのできる最大利得。MBは次の時点で得 られる利得なので、割引因子δBをかけて、1-xA≧δBMBならば受諾する。Aか らみると、最低利得mA≧1-δBMB。定式化よりmAとMAの範囲が定義され、式を 同時に満たす時mAとmBが求まり(これをxA*、xB*と表し、相手に受け入れられ る限界ぎりぎりの利得を意味する)、サブゲームで得られる利得は一つに決ま る。このときの連立法的式を基本方程式といい、その解がサブゲーム完全均衡 。 交互完全均衡を仮定すると唯一解が出ることがわかった。 ■交互提案交渉の問題点 これまでは反応のタイミングは離散的に与えられ決まっていたが、そのタイミ ングを選ぶ戦略もある。提案から反応までをt、反応から提案までをsとすると 、その大小によってAの利得は変わってくる。Aの提案→Bの反応→Bの提案→Aの 反応のとき、Aの利得はsA+tBが長いと大きくなる。 tの決め方は2パターン考えられる。最初からtを固定しているとtAが長いほど (回答を保留するほど)Aの利得は上がる。反応のたびにtが選べるとすると、 tAは0になる。Bからすれば、次の自分の利益をあげたいから、sAとsBを固定す るとすぐに反応する。AもBが拒否しようと受諾しようとtA分だけ価値が下がる ので、tAは短い方がいい。sもtも0で待ち時間なしで提案、反応を即繰り返す ことが均衡。だた、現実的でない。 ■マネーバーニングモデル 均衡解が唯一に求まるということが成立しない場合の例。要求を拒否されると 一定以上交渉に応じない、拒否された側はΔ期後に応じるということを選べる というモデル。 Aの方がよりひねくれている(応じない期間が長い)として、AとBがnΔとΔ後 に応答するとする場合、Bが損する形になる。1-δA≦x≦1ならばn回目に δA(x,1-x)で妥結する。重要なのは、xの均衡解が不等式で範囲で与えられる こと。逐次的に反応時間を決めると、交互提案交渉は均衡解が唯一に定まる ということと反する。 ・割引因子はどのように与えられるものなのか? 外生的に与えられ、プレーヤーの特性によって与えられるのではないか。 ・経済学には金利的なもので1年後の価値を現在価値に割り戻すようなものな のではないか? 扱うものによって割引因子は違うのではないか。人や物によってベースとなる 割引因子は違ってくる。 ■双方要求型交渉 プレーヤーA・Bが同時に要求、双方の得られる利得の和が1以下ならば全てナ ッシュ均衡、結果は複数。 消耗戦とは、互いの要求の和が1より大きい時、時間が経つにつれて受け入れ 確率が上がっていく状態(確率的に受け入れる)。単位時間当たり受け入れ確 率が大きいほど、累積受け入れ確率は弱気になる。受諾と待ちの利得期待値が 等しい時、部分ゲーム完全均衡。均衡状態では(今すぐ受け入れる時の利得= 1-xB)と(Δ待つ間にBが先に受け入れた時の利得)+(Δ経ってAが受け入れ る時の利得)が等しい。問題点は均衡解でxAとxBが区別できないこと。 ■頑固なプレーヤーの仮定 頑固なプレーヤー・・・決して相手の要求を受け入れず、同じ自分の要求を出 し続ける頑固なタイプのプレーヤー(⇔合理的なタイプ)。自分は頑固かどう かわかるが、相手はどちらか不明な場合なときを考える、相手が頑固か否かを ベイズ理論で推定。相手が見かけ上頑固である限り、相手が頑固である確率を 推定する、仮定した相手の属性に対して最適な行動をとる。相手が頑固な場合 →拒否し続けることが最適 相手が頑固だと判断するまでの時間を潜在的消耗時間TA、TBとして導入、Tが 長いとゲーム当初に要求を受け入れる可能性がある。 ・どこまでが確定的に決まって、確率的にきまるのか? 確定的に決まるのは、TAが決まると受け入れる可能性がなくなるという判断。 Bは期待値としてゲームを受け入れる前に確率的にAの要求を受け入れる。 ・TA・TBはゲームが始まってから決まるのか? 相手が頑固かどうか判断する閾値zAは外生的に決定、したがってTも予めわか っている。自分の方がTが長ければ、消耗戦にしたくないので最初の時点でゲ ームを決めてしまおうとすることが起こる。 ・割引因子はこのゲームに入っているのか? 計算結果に影響を及ぼさないが、割引因子は入っている。割引因子があるため に、最初に受け入れるという行動が起こる。 相対的に消耗時間が長いプレーヤーは、本当に要求したい要求よりも引き下げ るのが均衡状態になる。ただし、頑固なタイプの要求がどのように決まるかは わからないという問題点がある。 外生的にzAを与えるということをどう与えるかという議論があるが、本の結論 としては、zAをどのように与えるかはわからないとのことだった。 ■まとめ 交互提案型交渉の場合は割引率δが大きい方が利得も高まる、自分の提案で妥 結した方が有利、複数均衡が求まる場合がある、反応時間が0という非現実的 な解になる可能性がある 相互提案型交渉では、消耗戦に基本的に突入する、頑固なプレーヤーの存在の 仮定で消耗戦の問題を解決でき、潜在的消耗時間の定義でゲーム開始時に確定 的/確率的に妥結するという表現ができるが、相手が頑固である確率zAと最初 の要求は不明 ・非協力ゲームを交互提案型と相互提案型にわけているが、分類の根拠や背景 はあるのか? 「わたしなりの定義」らしい。ゲームの仮定をおくことで、わからなかった部 分を明らかにしていくというのが目的だったのではないか。 ・ゲームの最初の時点で妥結する確率というのは何で決まる? 将来的にロスする期待利得をカバーできる確率で決まる、zAが結局かかわって きて、zAがどう決まるかわからないので、結局わからない。zAがわかればわか るというのがこの結論か。