Modellfreie adaptive optimale Steuerung sequentieller Fertigungsprozesse mittels Reinforcement Learning