LowResourceEval2021: a shared task on speech processing for lowresource languages

Переведенное название: LowResourceEval­2021: дорожка по обработке речи для малоресурсных языков

Elena Klyachko, Даниил Витальевич Гребенкин, Дарья Игоревна Носенко, Oleg Serikov

Результат исследования: Публикации в книгах, отчётах, сборниках, трудах конференцийстатья в сборнике материалов конференциинаучнаярецензирование

Аннотация

В статье описываются результаты первого соревнования по обработке речи для малоресурсных языков России. Задания по обработке речи, как правило, требуют больших объемов данных. Задачей соревнования было оценить качество работы современных моделей на данных малоресурсных языков, а также привлечь внимание экспертов к полевым данным (на примере данных проекта Lingvodoc). Задачи соревнования включали идентификацию языка и транскрипцию в МФА. В соревновании участвовали три команды. В статье описываются наборы данных, подготовленные в рамках соревнования, а также анализируются решения участников. Наборы данных могут переиспользоваться для улучшения обработки речи и развития инструментов NLP для языковых сообществ и лингвистов.
Переведенное названиеLowResourceEval­2021: дорожка по обработке речи для малоресурсных языков
Язык оригиналаанглийский
Название основной публикацииComputational Linguistics and Intellectual Technologies
Подзаголовок основной публикацииPapers from the Annual International Conference “Dialogue” (2021)
Место публикацииМосква
ИздательРоссийский государственный гуманитарный университет
Число страниц12
ТомВыпуск 20
ISBN (печатное издание)978-5-7281-3032-1, 978-5-7281-3031-4
DOI
СостояниеОпубликовано - 2021

Предметные области OECD FOS+WOS

  • 1.02 КОМПЬЮТЕРНЫЕ И ИНФОРМАЦИОННЫЕ НАУКИ

Fingerprint

Подробные сведения о темах исследования «LowResourceEval­2021: дорожка по обработке речи для малоресурсных языков». Вместе они формируют уникальный семантический отпечаток (fingerprint).

Цитировать