Benchmarking von Halluzinationen in großen Sprachmodellen basierend auf einem unbeantwortbaren mathematischen Wortproblem