Аннотация
Извлечение именованных сущностей – одна из самых востребованных на практике задач извлечения информации – предполагает поиск в тексте упоминаний имен, организаций, топонимов и других сущностей. Соревнование RuNNE посвящено задаче извлечения вложенных именованных сущностей. Разметка данных допускает следующие случаи: внутри одной именованной сущности находится другая именованная сущность. Так, например в сущность класса Organization “Московский драматический театр имени М. Н. Ермоловой” вложена сущность типа Person – “М. Н. Ермоловой”. Соревнование проводится на материале корпуса NEREL(Loukachevitch et al., 2021), собранного из новостных текстов WikiNews на русском языке. В корпусе NEREL представлено 29 классов различных сущностей, а глубина вложенности сущностей достигает 6 уровней разметки.
В рамках соревнования RuNNE мы предлагаем участникам рассмотреть few shot постановку задачи. Задача предполагает извлечение вложенных именованных сущностей, В обучающем множестве большая часть типов именованных сущностей встречается достаточно часто, а некоторое количество специально отобранных типов – встречается всего несколько раз. В тестовом множестве все типы сущностей представлены одинаково. В данной статье мы описываем соревнование RuNNE, подводим его итоги и проводим сравнение решений, полученных от участников.
В рамках соревнования RuNNE мы предлагаем участникам рассмотреть few shot постановку задачи. Задача предполагает извлечение вложенных именованных сущностей, В обучающем множестве большая часть типов именованных сущностей встречается достаточно часто, а некоторое количество специально отобранных типов – встречается всего несколько раз. В тестовом множестве все типы сущностей представлены одинаково. В данной статье мы описываем соревнование RuNNE, подводим его итоги и проводим сравнение решений, полученных от участников.
Переведенное название | Соревнование RuNNE-2022: извлечение вложенных именованных сущностей |
---|---|
Язык оригинала | английский |
Число страниц | 9 |
DOI | |
Состояние | Опубликовано - 18 июн. 2022 |
Событие | International conference on Computational Linguistics and Intellectual Technologies "Dialogue 2022" - Москва, Российская Федерация Продолжительность: 15 июл. 2022 → 18 июл. 2022 https://www.dialog-21.ru/ |
Конференция
Конференция | International conference on Computational Linguistics and Intellectual Technologies "Dialogue 2022" |
---|---|
Сокращенный заголовок | Dialogue 2022 |
Страна/Tерритория | Российская Федерация |
Город | Москва |
Период | 15.07.2022 → 18.07.2022 |
Адрес в сети Интернет |
Предметные области OECD FOS+WOS
- 1.02 КОМПЬЮТЕРНЫЕ И ИНФОРМАЦИОННЫЕ НАУКИ