End-zu-End-zeitliche Aktionserkennung mit Transformator