Complex approach towards algoritm learning for anaphora resolution in Russian language

O. A. Gureenkova, T. V. Batura, A. A. Kozlova, A. N. Svischev

Результат исследования: Научные публикации в периодических изданияхстатья

Аннотация

The paper considers applying of ensemble algorithm based on rules and machine learning for anaphora resolution in Russian language. Ensemble presents combination of formal rules, a machine learning algorithm Extra Trees and an algorithm for working with imbalanced learning sets Balance Cascade. Complexity of the approach lies in generation of complex features from rules and vectorization of syntactic context, with context data obtained from algorithms mystem (Yandex), SyntaxNet (Google) and Word2Vec.

Язык оригиналаанглийский
Страницы (с-по)89-97
Число страниц9
ЖурналKomp'juternaja Lingvistika i Intellektual'nye Tehnologii
Том1
Номер выпуска16
СостояниеОпубликовано - 2017

Fingerprint Подробные сведения о темах исследования «Complex approach towards algoritm learning for anaphora resolution in Russian language». Вместе они формируют уникальный семантический отпечаток (fingerprint).

  • Цитировать