Control Robusto Consciente de Fallas a través del Aprendizaje de Refuerzo Adversarial