Stil über Substanz: Bewertungsverzerrungen für große Sprachmodelle