DMoERM: Recetas de Mezcla de Expertos para un Modelado Efectivo de Recompensas