Hierarchisches maskiertes 3D-Diffusionsmodell für Video-Outpainting