Система автоматического разрешения омографии на основе семантической связи слов смежных предложений в текстовом отрывке

Скачать текст статьи в формате PDF

Авторы: Чемерилов В. В., Фадеев А. С.

Аннотация: Описана методика автоматического разрешения омографии в вопросительных предложениях на основе смысловой связи с ответом. Данная методика впервые рассматривает семантические связи слов за пределами одного предложения при разрешении омографии. В качестве входных данных использовались результаты анализа семантических классов слов семантико-синтаксического анализатора Semsin. На основе данной методики был разработан программный алгоритм, позволяющий автоматически маркировать омографы SSML-тегом, который меняет акустические характеристики синтезированной речи. На специальной тестовой выборке, состоящей из сверхфразовых единств, был проведен эксперимент по оценке качества работы алгоритма, давший положительные результаты. В ходе работы также были выявлены недочеты, которые связаны с ошибками анализа семантических классов слов семантико-синтаксического анализатора Semsin и невозможностью распознавания контекста в пределах одного предложения.

Ключевые слова: анализатор semsin, сверхфразовое единство, вопросительное предложение, омографы, разрешение омографии, синтез русской речи по тексту, семантическая связь предложений

Библиография статьи: Чемерилов В. В. Система автоматического разрешения омографии на основе семантической связи слов смежных предложений в текстовом отрывке / В. В. Чемерилов, А. С. Фадеев // Доклады ТУСУР. – 2018. – Т. 21, № 3. – С. 42–48. DOI: 10.21293/1818-0442-2018-21-3-42-48

Масленников Виктор Николаевич

Ответственный секретарь редакции журнала

  634050, г. Томск, пр. Ленина, 40, МК, каб. 310/2

  (3822) 51-21-21, внутр.: 1460

  vnmas@tusur.ru