Sign in

Effizientes modellfreies Verstärkungslernen mit dem Gaußschen Prozess

By Ying Fan and others
Effizientes Verstärkungslernen nutzt normalerweise Demonstrations- oder gute Erkundungsstrategien. Durch die Anwendung von Posterior Sampling in modellfreier RL unter der Hypothese von GP schlagen wir einen Gaußschen Prozess-Algorithmus für Posterior Sampling Reinforcement Learning (GPPSTD) im kontinuierlichen Zustandsraum vor, der theoretische Begründungen und empirische Ergebnisse liefert. Wir liefern auch theoretische und empirische... Show more
December 11, 2018
=
0
Loading PDF…
Loading full text...
Similar articles
Loading recommendations...
=
0
x1
Efficient Model-Free Reinforcement Learning Using Gaussian Process
Click on play to start listening