今日は定時出社に成功しました。 MLP「バンディット問題の理論とアルゴリズム」の続きを読みました。 前回e-貪欲法だとO(log T)を達成できることもあるけどできないよね(適当)、っていう話だったのですが、今日読んだところで紹介されていたKL-UCBを使うと…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。