Optimierung als Schätzung mit Gaußschen Prozessen in Banditensettings