Нейросетевая модель на основе системы переходов для извлечения составных объектов и их атрибутов из текстов на естественном языке

Скачать текст статьи в формате PDF

Авторы: Ехлаков Ю. П., Грибков-Егор-Игоревич Е. И.

Аннотация: Извлечение структурированной информации из текстов отзывов и обращений пользователей представляет собой задачу с большой научной и коммерческой ценностью. Однако современные методы извлечения информации из текстов либо не учитывают структурные взаимосвязи в извлекаемых знаниях, либо имеют низкую точность их извлечения. В работе предлагается нейросетевая модель на основе системы переходов для извлечения составных объектов и их атрибутов. Модель использует принцип многозадачного обучения, при котором в рамках одной модели происходит извлечение составных частей объектов и определение связей между ними. Качество работы предложенной модели проверено на задачах обработки отзывов из магазинов Amazon и Ali-Express и обработки запросов пользователей программных продуктов из магазина Google Play. Результаты экспериментов демонстрируют рост качества извлечения связей между фрагментами на величину от 0,07 до 0,172 F1 в зависимости от задачи.

Ключевые слова: обработка естественного языка, машинное обучение, нейронные сети, анализ тональности

Библиография статьи: Ехлаков Ю. П. Нейросетевая модель на основе системы переходов для извлечения составных объектов и их атрибутов из текстов на естественном языке / Ю. П. Ехлаков, Е. И. Грибков-Егор-Игоревич // Доклады ТУСУР. – 2020. – Т. 23, № 1. – С. 47–52. DOI: 10.21293/1818-0442-2020-23-1-47-52

Адрес редакции

  634050, г. Томск, пр. Ленина, 40, МК, каб. 310/2

  (3822) 701-582, внутр.: 1456

  journal@tusur.ru

 

Масленников Виктор Николаевич

Ответственный секретарь редакции журнала

  634050, г. Томск, пр. Ленина, 40, МК, каб. 310/2

  (3822) 51-21-21, внутр.: 1460

  vnmas@tusur.ru