Tiefgelernte Pfadplanung über randomisierte belohnungsgebundene Ziele und potenzielle Weltraumanwendungen