Quantifizierung der Kontamination bei der Bewertung der Codegenerierungsfähigkeiten von Sprachmodellen