Integración de aprendizaje reforzado multiagente independiente y centralizado para la optimización de la red de señales de tráfico