Schnelle Entwicklung hochwertiger Unterrichtsdaten und Bewertungsmaßstäbe für große Sprachmodelle mit minimalem menschlichen Aufwand: Eine Fallstudie über Japanisch