Modellbasierte Offline-Richtlinienoptimierung mit Adversarial Network