2016-10-21から1日間の記事一覧

ルールを見つけるゲーム

今日も定時出社できました。天才か。 久々に「バンディット問題の理論とアルゴリズム」を読みました。4、5章はとばして6章。最適腕識別のお話でした。 最適腕識別と累積報酬和の最大化では同じ方策を用いるのがよいとはいえないという話と、最適腕からeの誤…