Hacia el Mejor Diseño de Experimentos para Evaluar la Salida del Sistema de Diálogo