解釈は分野によって様々だ

水曜日です。

今日は会議労をやり、その後はﾃﾝｻｰﾌ労をやりました。

ﾃﾝｻｰﾌ労は今日も無限にハマりました。視界にコードが多く、厳しい。

その他、チーム内技術共有会がありました。会は強化学習の話になり、状態が1次のマルコフ性を持つ場合とそうでない場合は違う手法を使うというような話が出ました。私は1次のマルコフ性を持たない場合というのを ${P(S_t)}$ と考えていたのですが、どうやら正解は ${P(S_t|S_{t-1}, ..., S_0)}$ のようでした。

私はよわい NLPer なのでとりあえずデータが独立しているような簡単な状態から考える癖があり、マルコフ性があるという場合には「直前の状態に対する依存がある」という風に制約が増えると捉えていました。一方、強化学習勢はそもそも過去の状態の系列に依存しているのは当然なのでマルコフ性を「直前の状態だけ考慮すればよい」という条件の緩和として捉えていたのでした。

たいへん興味深い現象です。

そんなこんなで、帰りの電車ではアサシンズプライド6巻を読み進めました。突然の百合が生成されたり、ヒロインズの親世代が超パワーでバトルするシーンが描かれるなどよさが盛り沢山でした。

帰宅後はFEHでアーダンさん（固い、強い、遅い）の育成をやり、Rust（chapter 3.3, 3.4）をやりました。

以上です。寝ます。