Aprendizaje de Refuerzo Engañoso Bajo Manipulaciones Adversarias sobre Señales de Costos