報酬見込みがあまりに短期的すぎる、と明確に自認したのは最近のことである。 どうも私は、その瞬間その瞬間での報酬を重視し、将来的に獲得できる見込みの報酬を軽視するという行動戦略らしい。 強化学習でいう割引報酬率γが大きい、という形だろうか。 そ…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。