Аннотация
Данная работа посвящена разработке алгоритма распознавания дикторов в потоке нескольких голосов с использованием глубинных нейронных сетей и специальных способов аугментации (расширения) данных для обучения.В процессе разработки предложенного алгоритма основным методом исследования являлось применение нейросетевого подхода, а также использовались стандартные методы математической статистики.
В результате проведенного исследования был разработан алгоритм распознавания на основе рекуррентных сетей, а также получен прирост точности распознавания с помощью специального способа аугментации (расширения) данных для обучения.
Предложенный алгоритм может быть использован для решения вопросов безопасности при обработке телефонных звонков, записей со звукозаписывающих устройств в общественных местах и т.п.
Дата присуждения | июн. 2019 |
---|---|
Язык оригинала | русский |
Учреждение |
|
Руководитель | Евгений Николаевич Павловский (Научный руководитель) |