Wiederkehrende affine Transformation für die Text-zu-Bild-Synthese