課題3, 4 <全体> 作図 GIS - 方位とスケールバーは"必ず"入れる - 色や線幅のオーダーは揃える RやPython - 解像度に注意.ジャーナル用/印刷のことを考えると,600dpi で出力しておくと安心 作図のイロハについては英語の教科書"Semiology of Graphics: Diagrams, Networks, Maps"が研究室にあります 推定 - 有効桁数は揃える.パラメータ値は小数点以下3桁,t値は小数点以下2桁が目安. - 表は横線のみ.エクセルのスクショを貼り付けるのはやめましょう(禁忌です) - 計算時間は計測する癖をつける(コードに仕込んでおく) 毎年言っている気がするので,来年の夏学期ゼミ/スタートアップゼミから 表現のルールについて説明するパートを入れてもいいかもしれません. <小島パート> RL 羽藤:式と変数の設定の説明が最初にあった方がいいですね。変数=価値関数の値が変わってないからじゃない?まあでも漸化してるからな、、 月田:使っている最短経路が出たというのは実感に則していて良かった。ららぽーと周辺(最短経路から外れたところ)に集まったのは、そこに細かいリンクが集まっている分、期待効用のログサムの和の部分だけ効用が上がったのではないか。 EM 羽藤:シークエンスで変わる変数が入ってないね。 浦田:エラーでてるけど,(ヘッセ行列は)出たんですかね?? 浦田:4つ目と5つ目の変数の両方を消したほうがいいかも. 羽藤:距離とか単純な変数だけで最初は回して、だんだん変数足していくと、いいモデルがビルドできると思います。ブラックボックスにならないように、計算過程を書き出しておったほうがいいかも。 小林:EMの繰り返しごとにパラメータがどのように更新されているかを細かく見てデバッグするのがいいと思う。具体的にはfunctionの中にprint()を入れる。 <増田さん> 増田さん RL RLはパラメタ推定のコードを回して、一般化RLモデルと正規化時間割引率RLモデルの両方を回した。 後者では時間割引率betaに距離を乗じて、リンクごとに割り引かれるという問題を解決している。 後者のモデルでは尤度比が向上しているが、直感と反するパラメータになることも。 説明変数の説明と推定パラメータ→直感と合う。 第一次産業に従事する人は市外への移転紅葉が低い。 クラス分けありモデルでは繰り返し計算が収束せず。→変数を変えてトライ。 尤度ひが上昇→補助金優先クラスと復興期間優先クラスに。 効用と人口流出の二つを目的関数にしたケースを考察。 小林さん 正規化時間割引率の方は、いくつかのパラメータに依存している。説明の豊かさ的には、一般化の方が良さそう。 →見たい事柄に集中して考えると良いかも。 浦田さん 初期尤度が手法によって違うのは? 月田さん 全てのパラメターを0にしているのが初期尤度。正規化時間割引率の方はbeta=0.5になっている。この0.5にリンク長をかけているので、その分違う。 浦田さん 初期尤度は揃えた方が良さそうなので、betacみたいにしてやる方法もあるので。 最終尤度が上がっているので、正規化のやつの方が良さそうだけど。 前田さん クラス無しの方は良くて、クラスありの方ではt値が下がってしまう。サンプル数が少ないので仕方がないかな、と思った。 人口流出最小化の目的関数はコスト関数は入れなかったんですか? ー回らなくて... コスト関数を入れないと無限に回し続けてしまうので。 小林さん 計算時間についても見てもらうと良いかな。 増田さん EMの繰り返しはどのくらいが?どうやって決めてる? 前田さん ある程度ループをして収束してない結果は捨てて、という手段を取る。そこの回数は20くらいが妥当かな、と。 前と後の尤度の差分で収束を判定している。 <望月発表> RL ちゃんと回らなかった.推定したパラメータで配分のコードに入れると,交通量が負になり,それが解決しなかった. 「経路長さ,戻る,右左折,公園,時間割引率」に関して適当なパラメータを置いた. 公園を追加すると,かなり増加量が増えた.駅北側にたすと少し関係なさそうなところまで増えた EM 尤度の単調増大がEMの特徴→abs 収束しにくかった 初期値をクラス分けなしの時の推定パラメータ+誤差項,とすると,比較的安定して求められるようになった. アニーリングにすることで局所解に陥りにくい. クラス1 支援金額などあまり関係なく決める人たち →お金がある人は市外で,お金がない人は公営 →年間所得が低かったり,世帯主年齢が高かったり クラス2 支援金額や地震後経過年数によりしっかり選ぶ人たちで分かれているのではないか. →クラス2(配分は市内に全振り.) →年間所得が高かったり,世帯主年齢が低かったり >小林さん EMの頭よかった >前田さん absのは,前田さんがやってる時はLLが上がっていくとは限らなかったので… >前田さん 配分を公平にしたいなら公平になるように少しいじったら? ##########村橋パート############# 小林:RLについて… 村橋:時間割引率をsetした。discountはなかったんだと思う 月田:setの方は、時間割引率は固定してパラメタを推定しようていうもので、もう一方は時間割引率自体も推定しようとうもの 小林:時間割引率が0-1になってないのは? 村橋:discountのまま表に書いちゃった、書き方が違うからそうなった 小林:修正済み尤度比高くなているが? 村橋:書き間違えた、こんなに高くなるはずはない 浦田:所得のグラフは他の変数とかもみると良さそう 前田:一番結果が良かったのを採用してその時のクラス別の所得を比較しているのはいいと思うが、所得の図が不思議な図だなと思った、所得の切り方が等間隔でなくて不思議に思った 政策評価は設定を変えてやっていて良いと思った 最後のグラフに関しては..公営住宅は予算に含まれない設定になっていたから、補助金額の予算が少ない時は公営住宅に多く流れるようになっちゃった(書き方が悪かったかも) 私も公営住宅を建設するのにどれくらいおかながかかるかを考慮してなかったからこうなった感じがする 設定ごとの比較がわかりやすくて良かった 月田:推定の時の初期値をみてみて解の安定性をみるのがいいかも <増橋発表> βを1:非現実的(合理的,最短経路;完全方法的,都市的な説明変数が効く?) 0:災害時(非合理的,Lengthが小さくなる βを小さく(0.02) リターンダミーは0or10のダミー変数→重みをつけている オーダーが違うとおかしくなるので操作する β(0.5) 都市設備の方はt値が出なくなったが,lengthが大きくなったのは直感通り β(0.8) これ以上大きくするのは非現実的? >浦田:経済系ではβ:0.99,1とかが標準.FosgerauのRLも1 βと説明変数の関係 近視的はすごい後戻りする,大局的のときは事前に考える(returnが小さい) >浦田:データセットは一緒だから,βと説明変数の関係性を解釈をするのは不適 尤度比上昇割合 >浦田:尤度比検定があります. 割合 クラスを特徴づける説明変数になっていそう パラメータの比較 >羽藤:パラメータの比較はモデル内でやって相対値を出して,それをモデル間でやるようにしていください >浦田:パラメータ値は同一効用関数の中の相対的な重みを表しています >羽藤:パラメータは,確率計算におけるモデル内の比較で決まるものなので,モデル間で同じ説明変数のパラーメタを比較するのはおかしいです.弾力性を計算して,その値を比べるようにしてください >羽藤:図がみやすいねー ましかし工夫してみようとしてるのはえらいね 工夫はだいじ. 海岸からの距離は興味あるよなー 1クラスあたりの変数多すぎ 減らしてやってみた >浦田:一次産業ダミーも,t値が全部0なので,うまく回った感じはしないですが,,海岸距離のように選択肢ごとにわけてもダメだったですか? >羽藤:モデルの変数粘り強くやってるのはいい傾向です。 >羽藤;比較する場合は,どっちかダメでも入れておいたほうがいいね. 推定結果の見せ方が小林っぽいな,笑. パラメータ値は小数点以下3桁ですかね、、 表は横線のみ。 >浦田:有意ではない変数が入っていると,多重共線性が疑われることがあります.一度全部入れてみて,有意でない説明変数は抜いていくやり方もあります.NaNのパラメータ値が大きいので,結果におかしな影響を与えていそうなので,時間があれば,抜いてみてもよかったかと思います. 目的関数の最適化 いろんな予算設定 >羽藤:この図いいね. >浦田:復興期間のパラメータどうなってましたっけ? -------------------------------------- 月田:ダミーを0,10に置いてるのはそういう意図(パラメータのオーダーを揃えている) 浦田:実際リターンしてる人いるの?パラメータから抜いた方がいいのでは? 月田:Fosgerauでは-20で固定しているからそういうやり方もあったかも 浦田:リターンの人がほとんどいないとすると,固定したほうがいいですね.尤度最大化の計算の中で,単に,リターンする確率を0に近づけたほうが,尤度が高くなるというパラメータが推定されてしまって,他の説明変数が効かなくなるということになる気がします. 固定しないほうが,尤度比が大きくなって,うれしいってことで,先輩方は固定しなかったのかもしれませんが,,モデルの結果として,リターンの選択確率を小さくして,戻らない・他の方向は等確率,とする結果しか出なくなり,モデルの意味はなくなりますね. 月田:同じデータを使っているので,おかしい?βとパラメータとの関係も直感に反している? 小林:パラメータの推定で線で繋ぐのは...比較したいのであれば,パラメータ比をとった方がいい. 増橋:たしかにデータが同じなのでこの比べ方は不適切だった 前田;海岸距離とか,第一次産業従事とか世帯固有のパラメータ.選択確率はそもそも選択肢間効用の比. 全部に入れちゃうと,基準が定まらないので,どこかを固定した方がいい ヘッセが0になっちゃう 復興期間に対して効用が増加している,という話があったが復興期間のパラメータが正だから ますはし:パラメータの正負がおかしくて直感に反した結果出ているので気をつけたい 近藤パート(小島) 羽藤 チャット t値とパラメータが一致してる推定結果、初めてみた!!!! ループは禁則だからね。 羽藤チャット これなんでだろ。 小林チャット 桁落ち? (近藤) リンクが片方向だった? 浦田チャット Dにつかないと,マイナス無限大になるとか? 羽藤チャット へー、感度あるね。おもしろい。 月田チャット 応プロの時のモデルはRLですか? 羽藤チャット>月田チャット そう 羽藤チャット クラス数増やそうとかは思いませんでしたか? この対策やったのは福島ですよね。 もう演習なのでは。。 質疑応答 月田 応プロも今回も両方ともRLですか? 近藤 両方とも割引率固定のRL 月田 応プロの時は割引率1ですか? 近藤 0.98とか1に近いもの 応プロの時は、津波を想定したので標高とかが入っていた 月田 出発地・目的地というのが? 近藤 応プロの時は、避難しない時に効用がある時を考え、出発地・到着地のダミーがあるモデル 月田 高いときに太くなっている? 近藤 太いのが今回、細いのが応プロのやつ 下から濃い色が見えていると応プロの時は少なかったが、今回は多い 月田 トンネルや山に登るところで増えている、高いところで増えているのはなんでだろう 後でゆっくりみてコメントします 前田 世帯人数を入れて推定してくれた 世帯人数が多い方が効用が高いわけではなく、これは選択肢で違いを見れるために入れた。 近藤 世帯人数が多いほど、市街の再建をする 前田 その解釈が合っている 次のスライド 公営を選択した人がクラス1で、それ以外がクラス2 これはパラメータ設定が良くない パラメータの関係が結果に表れている 浦田チャット 全体に,verificationみたいなコメントばかりになっていますが,色々と工夫して,やってみることが大事だと思います.はじめての推定だったと思いますが,何回も繰り返すと,何がおかしくて,何がおかしくないかにたどり着くのが早くなってくると思います.一度目でいきなり出来る人はいません.t値とはなにか,パラメータ値はどういう意味を示すのか,がわかっていなさそうな点が気になりました.(授業の準備行きます.最初,レクチャーなので,TAの方はゆっくり来てください.) 小林 理解が足りていないと、 コードを先輩からずっと引き継いでいると、ブラックボックス化ししまう。 小林 6月はまた新しいプログラミング課題 これはそんなに難しくない 6月は経済系や、行動モデルの輪読 ちょっと応用的なもの B4は夏は研究を進めていくために、忙しくなるが気をつけてね。 <チャット> 12:30:57 開始 羽藤英二 : 講義? 12:31:54 開始 羽藤英二 : 会議に移動しながらなんで、途中で抜けます。 12:33:07 開始 Junji Urata : 発表資料どこか上がってます? 12:33:16 開始 増橋 佳菜 : すみません…PCの出力サウンドをオフにしてもPCから声が出てしまうパニックになっています… 12:33:27 開始 Hikaru Tsukida に Ayumi Maeda(プライベート) : 画面録画お願いします 12:34:21 開始 Junji Urata : マイクのよこの上>ボタンを押すとどうにかできるかも 12:35:11 開始 Aiko Kondo : 議事録は自分の前の発表者のものを取るのであっていますか? 12:36:04 開始 増橋 佳菜 : @浦田先生  ありがとうございます,,,解決しました… 12:36:12 開始 Risa KOBAYASHI : 小島ー増田ー望月ー村橋ー増橋ー近藤 の順番でお願いします 12:37:07 開始 羽藤英二 : 式と変数の設定の説明が最初にあった方がいいですね。 12:39:43 開始 羽藤英二 : シークエンスで変わる変数が入ってないね。 12:42:38 開始 Junji Urata : エラーでてるけど,出たんですかね?? 12:43:13 開始 Junji Urata : 4つ目と5つ目の変数の両方を消したほうがいいかも. 12:43:57 開始 羽藤英二 : 距離とか単純な変数だけで最初は回して、だんだん変数足していくと、いいモデルがビルドできると思います。 12:44:56 開始 羽藤英二 : ブラックボックスにならないように、計算過程を書き出しておったほうがいいかも。 12:46:20 開始 羽藤英二 : 変数=価値関数の値が変わってないからじゃない? 12:48:47 開始 羽藤英二 : まあでも漸化してるからな、、 12:51:18 開始 羽藤英二 : nldrlって何? 12:52:33 開始 羽藤英二 : βを推定するタイプってことね。 12:55:36 開始 羽藤英二 : 距離はmldrlで標準化してステップごとに乗じてるから、入ってない?のか。 12:59:37 開始 羽藤英二 : 変数の相関をチェックするといいね。 12:59:44 開始 Junji Urata : 初期尤度は,なぜこんなに違うの?  最短距離で動いている人と,回遊している人で全然違うかも(基礎分析がいるが). 13:02:27 開始 羽藤英二 : 計算時間も意識しておくといいです。クロック数とデータサイズと選択肢数などから見積もれるようになるので、意識してみてください。 13:02:51 開始 Junji Urata : 復興期間は,全部の選択肢に入ってますか?  2クラスにしただけで,t値が,ここまで落ちるのが不思議ですね. 13:04:11 開始 羽藤英二 : 制約に張り付いてるだけだよね。 13:05:02 開始 羽藤英二 : パラメータが安定してるということですよ。 13:05:08 開始 Junji Urata : 流出最小化なのに,市外再建に150万,というのはなぜなんでしょうか? 13:05:13 開始 羽藤英二 : t値が大きいのは 13:06:13 開始 羽藤英二 : 初球尤度は、ステップすうのせいですよね。 13:07:02 開始 Hikaru Tsukida : β=1/(1+exp(-γ)) 13:13:02 開始 Hikaru Tsukida : ↑(訂正)β=1/(1+exp(γ))です. 13:13:19 開始 Junji Urata : RLの初期尤度は,リンクごとの逐次選択との比較して,1/接続リンク数の確率を想定して計算するのが,妥当かなと思います. 13:13:24 開始 羽藤英二 : 関数が直交してるなら、組み合わせて意味があるんだけど、両方補助金で共通だからね、、 13:16:32 開始 Junji Urata : ちなみに,β=1/(1+exp(γ))でγの値を推定した場合,計算しているt値は,γが0から有意に離れているかどうかなので,ここで出しているt値は,ベータが1/2から有意に離れているかという計算になります. 13:17:40 開始 Junji Urata : L-BFGS-Bとかで,ベータの範囲を0~1と設定して計算すれば,算出してくれるベータのt値は0との比較の値になります. 13:21:53 開始 羽藤英二 : 解釈ちゃんとできてるね。 13:22:32 開始 羽藤英二 : 論文書くときは大切ですから、考察の癖はつけた方がいいです。 13:25:37 開始 羽藤英二 : 負!!! 13:26:28 開始 羽藤英二 : 新規性あるな。 13:26:30 開始 増橋 佳菜 : @望月くん、ごめん、さっき月田さんがガンマ正に修正してました…チャットで… 13:27:28 開始 羽藤英二 : 二人ともだもんね。なんかありそう。 13:27:36 開始 羽藤英二 : なんだろ 13:27:37 開始 Junji Urata : 望月EM> 0.17*5は,0.17*10^5 ですね? 散布図でかぶっていると見づらいので,小さい値を足し引きしてずらすか,セルで切って,頻度を示した図にするか,など工夫するといいと思います. 13:27:47 開始 羽藤英二 : うーん、、 13:27:58 開始 羽藤英二 : ちょー木になる、 13:28:01 開始 Junji Urata : 配分でマイナスになるっていうことは,アルゴリズムを見直したほうがよさそう. 13:28:22 開始 羽藤英二 : 確率がマイナスってこと? 13:28:37 開始 羽藤英二 : なんだろうな。 13:29:20 開始 Junji Urata : 一人ずつ経路に配分して,足し合わせたら,負になることはないので,確率を使っているんでしょうね. 13:29:49 開始 Junji Urata : 不安になるので,absつけちゃうよね.計算コストはそんなに大きくないですし. 13:30:24 開始 Junji Urata : 確率使っても,確率が負でなければ,負にならないか.. 13:36:42 開始 羽藤英二 : 表紙が萌える。 13:37:39 開始 羽藤英二 : 比較して、いいものを掲載という手順は正しいですね。 13:37:54 開始 羽藤英二 : 有効桁に注意。 13:38:25 開始 羽藤英二 : t値は小数点以下2桁ですかね。 13:39:16 開始 Junji Urata : 左の図の凡例は?? 13:41:33 開始 羽藤英二 : グラデーションより色変えた方がわかりやすそう。 13:42:00 開始 羽藤英二 : 表は縦線なし、横線のみで書いてください。 13:42:39 開始 Junji Urata : V=exp{ ~~~~ } の書き方は変ですね. 13:43:18 開始 羽藤英二 : EMなんかもうちょといいひょうげんがあってもいいかもなー 13:44:27 開始 Junji Urata : 尤度比と修正済み尤度比の差が大きすぎる気が,, 13:46:20 開始 羽藤英二 : 需要曲線とか書くのがいいのかなー、 13:46:39 開始 羽藤英二 : お、この図はいいね。 13:59:42 開始 羽藤英二 : リターンがちょっとアレですね、、 14:03:42 開始 Junji Urata : ダミー変数を10にしようとは考えたことないですね..リターンって選択肢集合に入れないとダメなんですかね.. 14:04:51 開始 Junji Urata : 経済系では,β=0.99とか1.0とかが標準です.FosgreauのRLもβ=1.0ですね. 14:07:38 開始 Junji Urata : データセットは一緒なので,現象としてp.11の考察するのはやりすぎだと思います.gRLのモデル構造(βと説明変数の関係性)の解釈・理解としては,役立っているかもしれませんが. 14:09:45 開始 Junji Urata : サイクリックしてるんじゃないんですか? 14:11:33 開始 Junji Urata : 尤度比検定というものがあります. 14:14:29 開始 羽藤英二 : パラメータの比較はモデル内でやって相対値を出して、それをモデル感でやるようにしてください。 14:15:11 開始 羽藤英二 : パラメータ値は同一効用関数の中の相対的な重みを示しています。 14:15:27 開始 Junji Urata : パラメータは,確率計算におけるモデル内の比較で決まるものなので,モデル間で同じ説明変数のパラーメタを比較するのはおかしいです.弾力性を計算して,その値を比べるようにしてください. 14:15:40 開始 羽藤英二 : 図が見やすいねー 14:16:16 開始 羽藤英二 : ましかし工夫してみようとしてるのはえらいね。 14:16:23 開始 羽藤英二 : 工夫はだいじ。 14:17:09 開始 羽藤英二 : 海岸からの距離は興味あるよなー 14:18:38 開始 Junji Urata : 一次産業ダミーも,t値が全部0なので,うまく回った感じはしないですが,,海岸距離のように選択肢ごとにわけてもダメだったですか? 14:18:49 開始 羽藤英二 : モデルの変数粘り強くやってるのはいい傾向です。 14:19:21 開始 羽藤英二 : 比較する場合は、どっちかダメでも、入れておいた方がいいね。 14:20:49 開始 羽藤英二 : 推定結果の見せ方が小林っぽいな、笑。 14:21:21 開始 羽藤英二 : パラメータ値は小数点以下3桁ですかね、、 14:21:47 開始 羽藤英二 : 表は横線のみ。 14:22:08 開始 Junji Urata : 有意ではない変数が入っていると,多重共線性が疑われることがあります.一度全部入れてみて,有意でない説明変数は抜いていくやり方もあります.NaNのパラメータ値が大きいので,結果におかしな影響を与えていそうなので,時間があれば,抜いてみてもよかったかと思います. 14:22:54 開始 羽藤英二 : この図いいね。 14:24:04 開始 Junji Urata : 復興期間のパラメータってどうなってましたっけ? 14:24:09 開始 Junji Urata : プラス? 14:32:50 開始 Junji Urata : リターンの人がほとんどいないとすると,固定したほうがいいですね.尤度最大化の計算の中で,単に,リターンする確率を0に近づけたほうが,尤度が高くなるというパラメータが推定されてしまって,他の説明変数が効かなくなるということになる気がします. 固定しないほうが,尤度比が大きくなって,うれしいってことで,先輩方は固定しなかったのかもしれませんが,,モデルの結果として,リターンの選択確率を小さくして,戻らない・他の方向は等確率,とする結果しか出なくなり,モデルの意味はなくなりますね. 14:37:35 開始 羽藤英二 : t値とパラメータが一致してる推定結果、初めてみた!!!! 14:38:14 開始 羽藤英二 : ループは禁則だからね。 14:38:44 開始 羽藤英二 : これ、なんでだろ。 14:39:06 開始 Risa KOBAYASHI : 桁落ち? 14:39:49 開始 Junji Urata : Dにつかないと,マイナス無限大になるとか? 14:41:32 開始 羽藤英二 : へー、感度あるね。おもしろい。 14:42:57 開始 Hikaru Tsukida : 応プロの時のモデルはRLですか? 14:43:40 開始 羽藤英二 : そう。 14:45:30 開始 羽藤英二 : クラス数増やそうとかは思いませんでしたか? 14:46:13 開始 羽藤英二 : この対策やったのは福島ですよね。 14:46:53 開始 羽藤英二 : もう演習なのでは。。 14:49:14 開始 Junji Urata : 全体に,verificationみたいなコメントばかりになっていますが,色々と工夫して,やってみることが大事だと思います.はじめての推定だったと思いますが,何回も繰り返すと,何がおかしくて,何がおかしくないかにたどり着くのが早くなってくると思います.一度目でいきなり出来る人はいません.t値とはなにか,パラメータ値はどういう意味を示すのか,がわかっていなさそうな点が気になりました.(授業の準備行きます.最初,レクチャーなので,TAの方はゆっくり来てください.)