マルチンゲール 発表:大山 11:10〜 ■マルチンゲールの定義 ・n期までの確率変数の推移がわかっているとき,(n+1)期の条件付確率の期待値はn 期の値と等しい というのが定義. ■条件付期待値の定義 ・Bが成立するときの次のAの期待値を示す. ・条件付期待値の性質として,加方性があるということと,条件つき確率と同様に 確率と期待値の積で表すことができることがある. ■マルチンゲールの例(ギャンブラー問題) ・マルコフ連鎖の例とは異なり,掛け金も変動する定式化となる. ・公平な賭け(勝ち負けの確率が1/2)のとき,マルチンゲールとなる. ・その場合は,公平なゲームの場合は,ギャンブラーは財を成すことができない. 何回やっても利得がない.(マルチンゲールの性質) ・また,次期の今回の期待利得の差がマイナスの時は優マルチンゲール,プラスの 時は劣マルチンゲールという. =コメント= H:回遊や避難の最適停止問題は優マルチンゲールであろう.劣マルチンゲールは常 に利得を得ることになるので,交通行動の表現には導入しづらい印象. H:こういった期待利得の差という書き方をするというのは面白い. ■任意停止定理 ・有名な戦略として,倍々戦略がある.勝つ確率が正であれば,いつか勝てるよう に思えるが,実際にはうまくいかない.それをマルチンゲールで示す. ■任意停止定理 ・賭けをやめる時刻を停止時刻Tとする. ・Tは存在,Yの最大値が存在するという条件下での問題. ・所持金Yがa以下又はb以上になったら終了する問題を考える. ・a側で停止する確率,b側で停止する確率は,bとaの差,最初の所持金とaの差の比 率で決まる. ・停止時刻の期待値はET=-abとなる.これは,勝ちも負けも関係ない場合の期待値 である. ・破産側(a側)で停止する問題を考える.まず任意停止定理よりワルドの方程式が導 かれる.これは,1回の利得平均と時間の期待値と所持金の差の期待値に関する公 式である. ・ワルドの方程式を用いて,破産時刻はEV0=x/(1-2p)と最初の所持金と1回ごとの 勝つ確率で比率で表すことができる. =コメント= ・ポートの車の台数,1か‐1になるかという議論で使える.オペレーションレヴェ ルで検討することができるのではないか. ・オペレーションの根拠を期待率を用いて行うことや時間軸上でどのようにオペレー ションするかを説明しているものである. ・回遊の終わりをどのように定義するか.臨界歩行距離等の指標を取り入れるので はないか. ・空間として,回遊の終わりの空間というものがあって,停止場所,停止時刻をど のようにデザインするかという概念整理にも使えそう. ・回遊の場合は,pが認知のレベルである.どう取り扱うか. ・何個目の駐車場ではいるか.秘書の面接問題もマルチンゲールで使われる例. ・避難では,移動はlossなので,loss-loss-loss-gain-loss-loss-loss-gain-loss. を定式化するということだろう.