Sign in

Erlernen latenter Repräsentationen zur Stilkontrolle und -übertragung in der End-to-End-Sprachsynthese

By Ya-Jie Zhang and others
In diesem Artikel führen wir den Variational Autoencoder (VAE) in ein End-to-End-Sprachsynthesemodell ein, um die latente Repräsentation von Sprechstilen unbeaufsichtigt zu erlernen. Die durch VAE erlernte Stildarstellung zeigt gute Eigenschaften wie Entwirren, Skalieren und Kombinieren, was die Stilkontrolle erleichtert. Stilübertragung kann in diesem Rahmen erreicht werden, indem zuerst die Stildarstellung... Show more
February 14, 2019
=
0
Loading PDF…
Loading full text...
Similar articles
Loading recommendations...
=
0
Summary