Sign in

Unsicherheitsgetriebene Trajektorienverkürzung für die Datenerweiterung beim Offline-Verstärkungslernen

By Junjie Zhang and others at
LogoTsinghua University
Ausgestattet mit der trainierten Umgebungsdynamik können modellbasierte Offline-Verstärkungslernalgorithmen (RL) häufig erfolgreich gute Richtlinien aus Datensätzen fester Größe lernen, sogar aus einigen Datensätzen mit schlechter Qualität. Leider kann jedoch nicht garantiert werden, dass die generierten Stichproben aus dem trainierten Dynamikmodell zuverlässig sind (z. B. können einige synthetische Stichproben außerhalb des Stützbereichs... Show more
July 26, 2023
=
0
Loading PDF…
Loading full text...
Similar articles
Loading recommendations...
=
0
x1
Uncertainty-driven Trajectory Truncation for Data Augmentation in Offline Reinforcement Learning
Click on play to start listening