昨晩は早寝をしましたが、今日もたいへんな眠さがありました。 MLP「バンディット問題の理論とアルゴリズム」の続きを読みました。 前回は確率的バンディット問題のregretの下限について、まで読みました。今日はe-貪欲法のregretの上限についてです。 e-貪…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。