Aprovechar la Variación de las Secuencias de Retorno para la Política de Exploración