Unüberwachtes kontrastives Lernen von Schallereignisdarstellungen