MTLE: Ein Multitasking-Lern-Encoder für visuelle Merkmalsdarstellungen für Video- und Filmbeschreibungen