TGRL: Ein Algorithmus für lehrergeführtes Verstärkungslernen