Control lógico temporal de los procesos generales de decisión de Markov mediante un refinamiento aproximado de las políticas