Generación de Preguntas Naturales a partir de Imágenes para Asistentes Multimodales