Открытые разработки корпорации Google по синтезу речи (Tacotron 2) позволяют генерировать речь достаточно высокого качества. Однако, в синтезированной речи всё ещё присутствуют моменты, требующие улучшений. Предлагается использовать подход супер-разрешения, введённый в состязательных нейронных сетях (GAN) на этапе постобработки сгененированной речи для улучшения показателей плавности речи и удаления излишнего сглаживания.
Дата присуждения | июн. 2019 |
---|
Язык оригинала | английский |
---|
Учреждение | - Кафедра программирования ММФ
|
---|
Руководитель | Евгений Николаевич Павловский (Научный руководитель) |
---|
Generating high quality synthetic speech using GAN as vocoder post-processing
Шэн, Л. (Автор). июн. 2019
Диссертация студента: Выпускная квалификационная работа › ВКР магистра