Evitar la Manipulación de Incentivos en RL Profunda a través de la Aprobación Desacoplada