Аннотация
В статье описываются результаты первого соревнования по обработке речи для малоресурсных языков России. Задания по обработке речи, как правило, требуют больших объемов данных. Задачей соревнования было оценить качество работы современных моделей на данных малоресурсных языков, а также привлечь внимание экспертов к полевым данным (на примере данных проекта Lingvodoc). Задачи соревнования включали идентификацию языка и транскрипцию в МФА. В соревновании участвовали три команды. В статье описываются наборы данных, подготовленные в рамках соревнования, а также анализируются решения участников. Наборы данных могут переиспользоваться для улучшения обработки речи и развития инструментов NLP для языковых сообществ и лингвистов.
Переведенное название | LowResourceEval2021: дорожка по обработке речи для малоресурсных языков |
---|---|
Язык оригинала | английский |
Название основной публикации | Computational Linguistics and Intellectual Technologies |
Подзаголовок основной публикации | Papers from the Annual International Conference “Dialogue” (2021) |
Место публикации | Москва |
Издатель | Российский государственный гуманитарный университет |
Число страниц | 12 |
Том | Выпуск 20 |
ISBN (печатное издание) | 978-5-7281-3032-1, 978-5-7281-3031-4 |
DOI | |
Состояние | Опубликовано - 2021 |
Предметные области OECD FOS+WOS
- 1.02 КОМПЬЮТЕРНЫЕ И ИНФОРМАЦИОННЫЕ НАУКИ