Sign in

KF-LAX: Kronecker-faktorisierte Krümmungsschätzung für die Optimierung von Regelgrößen beim Verstärkungslernen

By Mohammad Firouzi
Eine zentrale Herausforderung für gradientenbasierte Optimierungsmethoden im modellfreien Verstärkungslernen besteht darin, einen Ansatz zu entwickeln, der probeneffizient ist und eine geringe Varianz aufweist. In dieser Arbeit wenden wir die Kronecker-faktorisierte Krümmungsschätzungstechnik (KFAC) auf einen kürzlich vorgeschlagenen Gradientenschätzer für die Optimierung von Kontrollvariablen, RELAX, an, um die Probeneffizienz der Verwendung dieser... Show more
December 11, 2018
=
0
Loading PDF…
Loading full text...
Similar articles
Loading recommendations...
=
0
x1
KF-LAX: Kronecker-factored curvature estimation for control variate optimization in reinforcement learning
Click on play to start listening