Sign in

Konzentration von kontraktiver stochastischer Approximation und verstärkendem Lernen

By Siddharth Chandak and others
Unter Verwendung einer Martingalkonzentrationsungleichung werden Konzentrationsgrenzen 'ab dem Zeitpunkt n0 n_0 ' für stochastische Approximationsalgorithmen mit kontraktiven Karten und sowohl Martingaldifferenz als auch Markovrauschen abgeleitet. Diese werden auf Reinforcement-Learning-Algorithmen angewendet, insbesondere auf asynchrones Q-Learning und TD(0).
October 26, 2021
=
0
Loading PDF…
Loading full text...
Similar articles
Loading recommendations...
=
0
x1
Concentration of Contractive Stochastic Approximation and Reinforcement Learning
Click on play to start listening