第22回BinNセミナー

●日下部貴彦(東京大学)：空間行動の観測自動化に向けた諸課題といくつかの実装提案

■近年のデータ拡大
データの中には，分析に利用する目的で能動的に取りに行く能動的なもの(PTやPPなど)と，それ以外の目的で取得される受動的なもの(交通系ICカード，ETC2.0など)がある．受動的なデータは膨大であり，その利用機会を喪失してはいけない．

■商用車によるプローブデータの利用
商用車によるプローブデータは，一日で7GB（BS放送10日分）ある，車種はトラック（・バス）で合計４万台，タクシーはない．これを可視化してみただけで，ある程度の傾向が読み取れる．
ＭＭに落とすことも考えられるが，計算コストが高い．そのため，別手法として，標準地域メッシュの第三次メッシュに集計し，流入量，流出量，区間交通量，密度，平均速度といった集計量を見ることを考える．こうすると，平常時と災害時で平均速度分布が違うということも見ることができる．
ただし，メッシュでもまだ扱いやすいとは言えない．35億レコードについて数分で分析はできるが，瞬時とは言えないため，試行錯誤に使えるような形式ではない．早く集計できることに価値があるのではないか．
現在はクラスタリングにより中間データを生成し，within-dayの分析からday-to-dayの分析へ展開することを考えている．

■対話して学習するプローブパーソン調査手法
PT調査は人々の移動行動を知る上で重要な調査であるものの，アンケートに毎日答えてもらうのは，被験者の手間を考慮すると実質的には不可能といえる．これに対し，移動軌跡を自動で取得するPP調査では，被験者の負担は減っているといえる．しかしながら，分析に必要な回答項目はPPとPTで変わらないため，自動推定のモデルを作るのに別途調査を実施する必要がある．
これについて，朝倉ら(2000)の移動滞在判別を用いたトリップ目的推定を行い，必要に応じて被験者に質問し，学習するアルゴリズムをつくり，単純ベイズを仮定して計算してみた．シミュレーション上は，習慣的な行動については比較的よく推定できることがわかった．被験者への質問回数も減少している．一方，習慣的でないトリップについては推定が困難である．また，移動滞在判別を15分間の行動軌跡を使って行っているため，現時点が移動中なのか滞在中なのかは15分後にしかわからず，ボトルネックとなっている．

===
■質疑
羽藤：
相関ということでいうと，分散をクラスタリングで保持しているということだが，相関係数を保持しておくほうが後々いいことがあるとかないか？リンクとリンクの相関など．

日下部：
全部のメッシュ(20万)に対して相関係数をとることは不可能．少なくとも真面目に取ろうとすると無理．近いところだけなら可能かもしれない．計算寄りな方法をつかって，そこから分析になるかと思う．分析をするときに，計算を軽くするのにいい方法を考えないといけない．

羽藤：
クエリーがあるかどうかは重要だが，エージェント型のシミュレーションでパラメタリゼーションする際に，課題なのか，と考えて質問した．面白そう．モデルのスケールにもよるだろう．

山田：
携帯GPSとかの大きいデータもあって，処理はしているが，それでもメモリが２テラ必要．

日下部：
２テラにローディングする時点で何分もかかるから，もうちょっと早くしたいときに使う手法を考えている．処理はやればできる．

山田：
世界的なレベルでいうと，プローブデータよりはるかに大きなサイズのものがある．商用車のプローブデータはないから貴重だが．それ以外のプローブデータに関しては，日本はそこまで行ってないが，本当に使うのであれば，そういう大きい規模のものを対象にしてもいいのでは．みんな抱え込んでいるから．

羽藤：
融合して使いたいということを表明すべき．使いたいの？

日下部：
今のところ，どういうことをしたらいいのかをまだ考えている．

羽藤：
情報大公開も失敗しているし，研究者は抑制的．小池先生の全天候型など広いものもあるが．

日下部：
データ取得の解像度が低めのものはある．一口にプローブといっても種類は様々．

羽藤：
何に使うか，が重要だろう．

大田：
マシンスペックはどれくらいなのか．ＡＷＳ？

日下部：
クラウドは使えてない．クラウドでマシンリソースをいくらでも増やせる，というわけではない．単体でそれなりのスペックのものを使うことを考えている．

大田：
コモディティで，権利関係がＯＫなら，すっきりするのではないか

山下：
アクティビティデータシミュレーションのところで，個人のデータはかなりとっているが，世帯の構成がどうなっているかが行動に効いていると思うが，どう考慮されているか？

日下部：
あまり考えられていないが，キャリブレーションでどうにかなるか．データの取得という面では，ＰＴと同じような枠組みで考えている．

山下：
単身の男性のほうがすごい動いている，というのを見たことがある．

羽藤：
この前，残業が増えると，子育てがしんどくなって出生率が減るというモデルをみたことがある．これから単身高齢者も増えることもあり必要になってくるのが，長期にわたる相互作用をモデリングすること．問題はライフステージの規模のモデリングだと思うが，それは興味の対象外か．世帯をジェネレートさせる方法は古典的にある．相乗りを考えると，人々が制限しあってとかがあるので，個人ベースの行動モデルの限界はあるだろう．

大山：
移動滞在判別のところは何がネックになっている？

日下部：
判別するのが難しい．

大山：
点のまとまりで？

日下部：
携帯落として，というのと滞在行動とは区別できない．例えば駅が難しく，電車を待っているのか，駅で活動しているのか，判別できない．そういうエラーがあるところをとらないようにすると，滞在の閾値を長くとるしかなく，滞在しているのにもかかわらず推定がまわらないとかいう問題がでてくる．

大山：
最終的には目的以外の移動手段とかも含めて，どのくらいこのinterative PPでやるのか？

日下部：
調査自体をどのように設定するのかにもよる．

羽藤：
都市デザインという話からすると，微視的な状態（喜ぶ，つまんない，とか）１メートル四方の行動を考えようとすると，もっと細かな状態量を識別したいというニーズもある．加速度データだけだとそうだが，ＧＰＳも組み合わせると，「駅回りにいるならこの加速度はきく，きかない」ととか，一日だけ完全にとっておいて，毎日データの差分だけとるとか．

瀬谷：
平均速度を求めるのが難しそう．通っていないリンクもあるだろう．

日下部：
もともと定義として，走っている車の総旅行時間と総距離でとれる．

瀬谷：
メッシュに落としたら，ユーザーは外部から使えるというのがあるなら，加速度とか，事故分析している人が使えたりするのか．メッシュだと使うのが難しいのではないか．

日下部：
ひやりはっととかに使えるかと思う．せっかくドットスケールのものがあるのにそれを使わないとういのはどういうものなのかということも思う.

羽藤：
結局対策側は，ここの路線で事故が多いっていうのを知りたいから，メッシュだとそれがわからない，それを超えたものが出てこない．わかりやすいが．

日下部：
サービスレベルの変動をあぶりだしてやりたい．ある日だけ様子が違うところだけを.
羽藤：
情報大公開の失敗がそれをどう乗り越えるのか．

日下部：
その次のステップは，そのためのデータを集めてくるということになるのかもしれない．

羽藤：
桑原先生が熊本地震のときにすぐ分析結果を出したが．でもNEXCOのデータでわかったのではないか．

●近松京介(東京大学)：Levy過程と空間相関問題

■離散選択モデルにおける空間相関
目的地選択モデルでは，ゾーンを選択肢とする選択問題を考えることが多い．その際，ゾーン間で相関がある場合がある．この場合の相関とは，類似している選択肢や距離の近い選択肢の間に発生すると考えられる．
通常は，相関を無視しうるほどゾーンを大きく取るという対処がなされてきた．しかし，4次5次メッシュを考えていくようになると，ゾーン間の相関を無視することはできない.

■空間選択の意思決定フレームワーク
マクロな選択とミクロな選択の組み合わせ，対象物との距離に応じた解像度の違いが現れると仮定する．一見，この仮定は空間相関には関係ないように思われるかもしれないがそうではない．というのは，離散選択問題における相関は，選択肢を集約して見ているときに現れるから．遠い目的地は集約して見ていると考えると，遠い選択肢同士に相関が現れることになる．

■スケールパラメータの構造化
従来型のモデルでは，相関の強さを意思決定地点によらずに一定と仮定してきた．これは，池袋にいる人にとっての渋谷と原宿の相関の強さと，渋谷にいる人にとっての渋谷と原宿の相関の強さが同じと仮定していることになる．これでは，遠い目的地を集約して見ているという先ほどの意思決定フレームワークを表現できない．そこで，選択肢までの距離によって相関の強さを表すスケールパラメータを構造化した．

■推定結果
相関係数に着目すると，空間相関は１kmメッシュではほぼ無視できるが，500mメッシュでは相関係数が0.448となっており，無視することができないことがわかる．
また，構造化したスケールパラメータに着目すると，選択肢までの距離に対する相関の強さに変曲点が現れる場合とそうでない場合とで推定結果が大きく異なっている．変曲点が現れない場合(構造化に使ったパラメータのうちkを1とした場合)には，スケールパラメータの構造化パラメータαが1に近くなり，モデル構造がMNLとなってしまう．これに対し，kを1.75とした場合にはαが適切に推定されている．ここから，人が空間を個別に選択肢として認知できる距離には閾値があることが言える．

===
■質疑
福田：
選択肢ごとにスケールパラメータを設定しているように聞こえたが，スケールパラメータはネストに固有のパラメータのはずなので選択肢ごとに設定することはできないのではないか．

近松：
選択肢ごとではなく，ネスト(駅)までの距離で構造化している．

福田：
隣あっているメッシュのみ相関するという仮定では，実際に近くてもメッシュをひとつはさめば相関していないということになる．その克服はなされているのか．

近松：
最寄り駅でネストを組んでいるので，隣り合わない空間選択肢も相関関係にある.
羽藤:
鉄道のネットワークで繋がっているもの同士が相関していると仮定している．メッシュとして隣り合っていても鉄道で繋がっていなければ相関していないということになる．

ジアン：
アロケーションパラメータはどう設定しているのか．

近松：
推定したのはNLなのでアロケーションパラメータはない．

ジアン：
αというのは何なのか．

近松：
アロケーションパラメータではなく，スケールパラメータの構造化に用いたただのパラメータ．

瀬谷：
相関をどこに仮定しているのか．

近松：
目的地選択モデルの空間相関は，空間計量経済学のそれと違い，選択肢の類似度をあらゆるネストで表現している．空間計量経済学では地価の相関などの被説明変数の空間による相関を考えるが，目的地選択モデルは，空間離散選択肢に対し，その選ばれやすさという視点から相関を考えている．

(聴講者)：
MNLモデルと一致すると，どのような問題があるのか．

近松：
NLにおけるスケールパラメータの比を推定しているのだが，それが1であるときはMNL(ネスト内の選択肢に相関が一切ない)，0に近づけば近づくほどネスト内の選択肢の相関が強いというのがそもそものNLの仮定．

寺部：
なぜk=1.75をとりあげたのか

近松：
それが最終尤度が最も高かったから．

寺部：
本来kは連続的に変化させられるよね．

近松：
αとkは同時推定できないため，今回はkは離散的に与えてαを推定した．

寺部：
k=1.75は人間の感覚としてどのくらいなのか．

近松：
500m~1kmくらいまでは離散的に見がちということ．

中西：
人間の認知構造として500mぐらいまでを離散的に見ているのか，それとも土地利用がそのようになっているからそのように見えてるのかは分からない．

近松：
確かにそのとおり．そのように考えたことはなかったので新たな視点として考えてみる．

●山下良久(社会システム)：鉄道需要予測と空間相関問題

1972年以前は比較的短期的に計画を立てており，それ以降は計画の見直し頻度が15年ごととなっている．需要分析に基づく計画検討は1972年からなされた．

■1972年の需要予測方法
東京圏を40ゾーンに分割．予測対象は通勤者のみとし，通勤者の利用経路について最短経路配分を行って予測した．

■1985年の需要予測方法
4段階推定法の需要予測を始め，分担・配分に関して非集計ロジットモデルを導入した．その際の説明変数は，所要時間・運賃・乗り換え・アクセスイグレスコストであった．
当時の指摘：
ネットワークが高密度なため，選択可能な利用経路が独立といえないケースが多く存在している．
→当時から経路の相関について問題意識がもたれている．

■2000年の需要予測方法
東京圏を1812ゾーンに分割．鉄道の経路別交通量の予測に，非集計構造化プロビットモデルを使用．データとして，分担にはPTデータ，配分には大都市交通センサスデータを使用した．

[プロビットモデル適用に向けた課題]
誤差項に多変量正規分布を仮定することにより，以下の２つの問題が持ち上がった．
・個人ごとに利用区間が異なる選択肢間の共分散をどう考えるか
・計算時間の短縮をいかにはかるか
計算時間に関しては，シミュレーション法(GHK法)を用いることで対応した．
選択肢間の共分散について，屋井先生，岩倉先生などが精力的に取り組まれ，構造化プロビットモデルが生まれた．

[構造化プロビットモデル]
誤差項を相互に独立な２つの項に分離して表現したモデル．
1. 経路の長さに依存する誤差
　 →重複区間長がLijとなるような経路i,経路jの共分散はLij(σ)^2
2. 経路に固有の誤差
　 →異なる経路では共分散がゼロ．
これにより，個人ごとの選択肢間の類似性を表現した

2000年には，構造化プロビットモデルの適用に加え，私事など他の目的のトリップも対象に需要予測を行った．当時は車両内混雑が問題となっていたこともあり，混雑抵抗指標なども説明変数に追加した．
構造化プロビットモデルによる予測精度の向上も確認されている．（大宮ー神田間を例に）

■2016年の需要予測方法
使用するモデル自体に新規性はないものの，より細かい考慮が可能となるように工夫している．東京圏を2843ゾーンに分割し，年齢階層を考慮し，鉄道駅へのアクセスに複数手段を考慮している．アクセスに複数手段を考慮することにより，バス事業再編の鉄道利用への影響などが考慮できる．
具体的には，鉄道駅・アクセス交通機関選択モデルをNLで書き，乗換に関して，上下移動・水平移動・待ち時間を分解してそれぞれ変数化している．

■今後の需要予測の方向性
近年，列車遅延・駅の混雑問題が深刻化している．
(例)階段付近の車両に乗客が集中
　　大規模開発により駅容量が逼迫

そこで，駅の改良等を行ったときの列車遅延や駅構内混雑に与える効果分析が必要と考えられる．乗客が乗車位置を決定する際には，乗車駅・降車駅の駅構造・車両の混雑状況等を考慮していることが既往研究からわかっている．
→それぞれを明示的に考慮した分析が必要．
→膨大な類似経路の存在がある．

===
■質疑
(聴講者)：
今の60代と昔の60代ではパラメータが違う気がするが，年齢階層を分けるとやはりモデルの精度はあがるのか．

山下：
検討はできていない．経路交通量の場合については断面交通量でしか検証できないので難しい．年齢層を15年後も同じものを使って良いかなどはまだ検討していない．

羽藤：
PTとかだと三古さんが変数効果の分析をやっている．大都市交通センサスでは検討されていないのか．

山下：
年齢階層別にセンサスを使って3時点でパラメータを推定したことがある．時間価値は変化しているが，同じ年代で時間価値が変化しているのが特徴．最近改良している路線では所要時間は変わらなくても値段が高いという路線が増えているせいなのではないかと考えている．

羽藤：
変数効果を構造化したら安定するかもね．

大山：
組合せ数が増えれば増えるほど，相関の議論というか，何が相関しているのかがわかりづらくなる気がする．実務では相関についてどういう議論がなされているのか．配分結果は相関の考慮によって変わるだろうが，あっているかどうかは直感レベルでなされるのか．

山下：
構造化プロビットなどはそう．最後の話題についてはまだぜんぜん考えられていない．

太田：
全体的にとてもハード寄りな気がするが，実際に鉄道会社がやっていることは車両レベル・時刻表レベルの改変．今このようなものが求められているのか．この方向性で精緻化していくのはどうなのか．

山下：
長期的な計画を考えたときに，マーケティング的な要素がどう効いてくるのかは今わからない．

太田：
路線の西高東低みたいなのは，背景に地権があったりしている．こういう需要予測に時刻表が入らないのが不思議だといつも思っていた．なぜ時空間ネットワークを使わないのか．

山下：
時刻表の中から列車の本数などを入れつつ列車種別も細かく見ている．今までは路線の予測をやっているので，本当は列車種別の選択を入れる必要があるだろうが・・・路線の大規模的な度数をどう考えるのかが大事．ハイパーパスの考え方を入れて列車種別を考慮してやっていくということはしているものの，いかんせん路線の予測をするという柱は変わっていない．

前田：
一個の界隈の中に数個駅があるときの相関ってどう考えるのか．

山下：
ひとつのゾーンのなかにひとつの駅しか考えないほど小さくゾーンを取っている．

羽藤：
真の目的地と降り立った駅は同じゾーンにあるという仮定なのか．

山下：
駅のアクセスは別で良い．

（聴講者）：
予測モデルとしていろんな変数を取り込んでいるが，将来は個人が選択を自分でやるかどうかという問題がある．ネットのサービスで検索してしまえば良い話で，説明変数間の比較とかはサービス側がやってしまうということがある．個人は結果だけもらって考えないというような場合では配分結果は変わるのではないか．

山下：
変わる変わらないで言うと変わるだろうが，長期的な話なので・・・

羽藤：
あてるあてないでいうと，情報システムがどんな情報を与えているのかを入れ込む必要がある．実際の変数の効果を融合してやっていくことが本来的には必要．長期的なものに関してはそこまでやっていない．平均的なことを見ていくものだから．
先ほどの，予測がいつまでも線なのかというときっと線なのだろうと思う．臨海部をどうやって開発していくか，どんな線を引くかという問題が都市計画とセットの問題で重要視されているし，今後リニアが開通するなら，名古屋のネットワークをどう配分問題として入れ込んでやるかも大事．
ネットワークの信頼性についてはまだ検討されていないみたいだから，復興が早いネットワーク設計をどのようにするのかという問題はハードとしてかなり重要な問題だと思う．ソフトはソフトで重要だが，それはナビゲーションをどうするかという問題だろう．こちら側の問題は都市としての問題，ポテンシャルの問題だろうから，目的地のこと，駅を降りた先の行動を入れ込んだ問題設定をすることのほうがきっと重要．

羽藤：
相関の問題に関して，構造化プロビットモデルでは，選択肢を識別できてはいなさそう．なぜか．

山下：
拡大誤差なのでは．

羽藤：
ネストの中の選択肢が識別できるのか．あと本当に観測ができるのか．リアルタイムのODデータをどう作れるのかが課題だろう．災害対応のためにも．そういう話題はあがらないのか．

山下：
路線が切れたときのシミュレーションや配分はやっているものの，今の需要予測モデルを時間帯ごとに使うことにしているので，列車が動き出したときに人も一緒に動くという仮定になる．人がその情報を得て，動くとか動かないみたいな問題を扱ったほうがいいような気がする．

羽藤：
差分だけとるならデータからやるほうがよさそうだね．

●瀬谷創(神戸大学)：離散的空間相関の記述と交通行動分析への展開

■ガソリンスタンドの空間競争と撤退行動のモデル化
○研究の背景
ガソリンスタンドの過疎化が進展している．燃費の改善もあり，仕方のない部分もあるがライフラインとしての役割もあるため看過はできない．これまでは撤退に関して統計的分析は行われてこなかった．そこで，中国・四国地方の撤退情報を用いて，撤退がアクセシビリティに与える影響についての分析を行った．

○モデル構築
撤退時期などのデータが不確定であるため，時間軸に関しては無視したうえでモデル化する．2項プロビットモデルによって存続か撤退かを選択するものが考えられる．ただし空間的な競争の考慮が必要なため，
・ゲーム理論/社会的相互作用
・空間計量経済学
の二つのアプローチで空間競争をモデル化しようと考えた．
ゲーム理論のアプローチではモデル式の中に近隣のSSの撤退確率を直接入れている．この際，近隣の撤退に対する主観的期待確率はモデルから予測される客観的確率に一致するとし，繰り返し計算によってモデルを推定している．
空間計量経済学のモデル式では，誤差項の分散が不均一になってしまうという問題がある．逆行列の計算が必要なため，計算負荷が大きいということもあるが，こちらは計算負荷が大きくならないような推定方法の提案がなされている．

○モデル推定結果
どちらのモデルでも競争の項は負の効果となっているため，周囲の店舗がつぶれやすいほど残りやすいということが言える．エネオスやノンブランドはつぶれにくい傾向があるということもわかった．また人口密度が低いときにはセルフの方がつぶれやすいということもわかる．
課題としては，立地環境について交通量が考慮できないため，速度として入れていること，価格戦略は本来撤退のプロビット式と同時方程式になるはずだが考慮できていないことがあげられる．また，熊本地震とガソリン価格変動についても考えたいが，今回用いたデータ源では熊本のガソリン価格が表示されていないことから現段階では難しいといえる．

■ヘドニック分析における空間異質性
場所によって地価の回帰係数が異なるということを扱う．
(1)不動産市場をセグメンテーションしたうえで
(2)場所によって回帰係数を変える
という流れである．
○研究の目的
これまで空間可変回帰（SVC)モデルは，ヘドニックの実証で使いたい場合が多かったが，方法論の部分では未確立であった．新たなSVCモデルの開発と，GWRモデルとの比較，茨城県の洪水リスクに対して実証適用が目的である．
GWRではローカルな多重共線性の問題があるため補正項をつけたモデルによって推定されるが，空間相関レンジが変数によって異ならないという非現実的な仮定が置かれている．また，ローカルに変数を推定するために，解釈に困ることがあるという問題もある．

○提案手法
提案モデルのESFのアプローチは固有ベクトルによるフィルタリングを行うもの．平均成分を取って対称行列にし，そこから固有ベクトルを取る．隣接行列の固有行列は固有値が大きければ大域的なパターン，小さければローカルなパターンを見ることができる．
グリフィスによって説明変数と固有ベクトルの交差項により空間相関を考慮するモデルが提案されたが，ノイズを含んでしまう．その解決のため，ランダム効果であるとして固有値が大きい程分散が大きいとした．また，固有値をαでパラメタライズし，αを含めて推定する．

○実験結果
モンテカルロ法による実験では，説明変数が空間相関を受けない項と受ける項を3パターンおいて成分を発生させて行った．RE-ESFは概してGWRよりもより良いモデルであるということができた．
実証では，地価にハザードマップが影響していたか，ということに関して着目したが，結果としては提案モデルでは常総市では浸水が反映されていない，他のモデルだと浸水が反映されているという解釈が難しい．
今後の課題としては実証分析の不足と他のモデルとの比較がある．

■離散的空間記述のこれから
似たような他分野の手法との関係性について整理していく必要がある．また，要素を経済変数のみで与え，重み行列を内生的に求める研究や，欠損がネットワークに含まれないことの問題に対して補完手法を考える研究もある．SSが地方では価格競争が小さく，都心では大きいという現実に対して，空間相関パラメータの空間可変化や空間的な分布を考えたモデルのフィットも考えたい．
===
■質疑
近松：
ESFは固有値の大きさによって空間相関の分布を分けて重ねた結果現状があるとして推定しているが，これはWの推定問題ではないのか．

瀬谷：
初期値Wを隣接行列から最初に与えてしまっている．固有ベクトルから有意なものを持ってきているためWはこのアプローチでは大きな影響を与えない．

近松：
空間相関と人間の認知を考えないと，スケールは自由でそれによって空間相関は大きく変わってくる．人間一人が認知をするとき細かく区切れば相関はでてきて，その時のものを用いてマクロな方にくり込んで計算できるのではないか．

瀬谷：
TXを例にすれば，駅のすぐ近くだけ地価が上がり，一方で土浦では下がってくる．スケールだけではなく領域の取り方によっても変わってくる．

近松：
空間相関の影響を階層で分けて重ねていくほどにモデルは複雑化するが，そのあたりの研究はどのようなのだろうか．

瀬谷：
例えば，立地について同じ棟であることと近くの建物であることというのをどちらも考慮するような研究はある．

庄司：
手法の比較で推定結果では大きな差がないとき２つの手法を分けて使う意味はどうなのだろうか
瀬谷：
今回に関しては２つの流派でやることが目的であった．

庄司：
ブランドをダミー変数とすると，他の変数が社内戦略に依存するのではないか

瀬谷：
今回のガソリンスタンドについては尤度比が低い地理的な変数のみで説明するのが難しかった．

羽藤：
グループインタラクションは？

瀬谷：
距離の逆数です．

羽藤：
本当は可変で，その正負や構造そのものを推定することは可能なのか．

福田：
複数均衡は存在しない．相互作用項を考えれば可変にできる．一方で項を入れていくと自由度が下がるためその部分をどうするのか．

瀬谷：
αを計算するだけというように考えていく

福田：
折衷案があればよいかもしれない．

●Giancarlos Troncoso Parady(UT):A Cross-Nested Dynamic Logit Model of Evacuation Behavior Using Conditional Choice Probabilities: A Case Study of the Great East Japan Earthquake

■避難行動の記述における着目点
今回は，「避難参加及び開始時刻」と「目的地選択」に着目して避難行動を記述する．その際，避難以外の活動とその目的地選択に着目しながら、避難行動における意思決定プロセスの相互作用について考慮する必要がある．

■モデルのフレームワーク
東日本大震災時の気仙沼市をとりあげてケーススタディをすることを念頭にモデルを作る．
地震発生後から15分ごとに意思決定を行うとし、発災後1時間における行動の選択を考察する．
モデルとして，動学化したクロスネスティッドモデルを用いる．動的モデルを推定する場合，いくつかの仮定が必要となる．ベルマンの最適性原理を仮定する場合，最終地点までのあらゆる経路について価値関数を計算しなければならないため計算負荷が高い．また，不確定要素の多い避難行動において，ベルマン型のfully recursive modelは適切ではないと考える．

■条件付確率を用いた動的モデルの記述
本研究では，CCP(conditional choice probability)を使ってモデルを単純化する．この場合、意思決定には効用の差のみが関係する．
ただ、CCPを用いて書き直した動的モデルでも計算負荷は依然として高い．そこでひとつ仮定を導入する．
避難行動における最終目的は安全な場所へ避難することだと仮定し，避難を「リニューアルアクション」と扱う.つまり，行動として避難を選択する場合には，次期の活動の効用を考慮しない．避難以外の行動を選択する場合には，その行動の目的地に応じて次期に避難を選択する場合の効用を計算して考慮する．
これにより「避難」「その他の活動」「ステイ」の効用関数を分類する．
効用関数は時間、前期活動と目的地選択によって定める．

これらの仮定に基づいてモデルを作り，アロケーションパラメータを固定して推定した．
今後の課題として，条件付価値関数の計算負荷を減らす努力が必要といえる．

===
■質疑
前田:
データはどこから手に入れたのか．

Gian:
国土交通省から

前田:
データの偏りについてはどうなっているのか．

Gian:
高齢者が多い．本来の年齢分布に対してデータは偏っていると思う．

前田:
親世代が最も他の活動を選ぶ可能性が高いのではないか．

Gian:
年齢層によるセグメンテーションはかけてみたが，今回の推定では有意な結果がでなかった

近松:
アロケーションパラメータは具体的にどのように与えたのか

Gian:
選択肢の所属するネストの数がｎの時にアロケーションパラメータはすべて1/nとして単純化している．今回はどの選択肢も，目的地ネストと行動ネストの２つのネストに所属しているのでアロケーションはそれぞれ1/2になる．
経路選択ではないので構造化が難しい．

三木:
効用関数が時間によっても変化するとは具体的にどういうことなのか

Gian:
「時間」とは出発時間を指す

三木:
結局どの時点においても効用は同じなのか？

Gian:
第一期に避難するときだけは定数項が入れてあるが、それ以降は全て同じ.

山田:
元のデータをCSISからもらったという話だが、このデータは生存者のものだけ（偏りがある）

Gian:
生存者バイアスは毎回指摘される．依然として課題である．

福田：
避難行動を動的モデルで記述するうえで気を付けたことはあるか．
Rustのモデルではより長期的な効用を考慮していると思うが．

Gian:
期待効用を選択仕事に別に計算し，時間を有限で(1時間で)推定していること．

羽藤:
空間相関をどのようにパラメータに反映したか．

Gian:
μは全ての選択肢において一定としているが，その値から推定結果の選択肢間相関は強いといえる．

●大山雄己(東京大学)：まとめ

デンソーに勤める友人との会話で，「データの蓄積がすごいからグーグルには勝てないだろう」といわれた．交通分野におけるモデリングの強みとはなんだろうか．
政策を行う人，モデリングをする人，情報収集をする人の連携が必要．どのようなデータからモデリングを行っていくのかが大切．たとえば瀬谷さんの発表から，社会的データと空間相関のつながりが見えてきた．相関のモデルというのがどこまで選択に活きるのだろうか．

日下部：
グーグルに勝てないというのは，それはそうだろう．だが，ビッグデータ，パッシブなデータだけではどうにもならない話というのは数多い．アクティブな調査をして何かをつかむというのはこの分野の強みだろう．

大山：
個人的には政策評価と交通分野に固有な理論に興味があるため，一生懸命考えていきたい．特に近松さんと山下さんの発表では空間相関の部分が面白かった．引き続き勉強していきたい．