Schwach überwachte 3D-Posenschätzung aus einem einzelnen Bild mit Multi-View-Konsistenz