Modelado de recompensas a través del Metaaprendizaje