Aprendizaje Reforzado de PAC sin Retroalimentación del Mundo Real