Multimodaler Transformator für Comics Text-Lückentext