ShortGPT: Schichten in großen Sprachmodellen sind redundanter als erwartet