Datenverteilungseigenschaften treiben emergentes Lernen mit wenigen Schüssen in Transformatoren voran