Sign in

Langfristige Planung und Situationsbewusstsein in OpenAI Five

By Jonathan Raiman and others
Zu verstehen, wie Wissen über die Welt in modellfreien Methoden des Deep Reinforcement Learning repräsentiert wird, ist eine große Herausforderung angesichts der Black-Box-Natur seines Lernprozesses in hochdimensionalen Beobachtungs- und Aktionsräumen. AlphaStar und OpenAI Five haben gezeigt, dass Agenten ohne explizite hierarchische Makroaktionen trainiert werden können, um übermenschliche Fähigkeiten in Spielen... Show more
December 13, 2019
=
0
Loading PDF…
Loading full text...
Similar articles
Loading recommendations...
=
0
Summary