Система автоматического разрешения омографии на основе семантической связи слов смежных предложений в текстовом отрывке
Скачать текст статьи в формате PDF
Авторы: Чемерилов В. В., Фадеев А. С.
Аннотация: Описана методика автоматического разрешения омографии в вопросительных предложениях на основе смысловой связи с ответом. Данная методика впервые рассматривает семантические связи слов за пределами одного предложения при разрешении омографии. В качестве входных данных использовались результаты анализа семантических классов слов семантико-синтаксического анализатора Semsin. На основе данной методики был разработан программный алгоритм, позволяющий автоматически маркировать омографы SSML-тегом, который меняет акустические характеристики синтезированной речи. На специальной тестовой выборке, состоящей из сверхфразовых единств, был проведен эксперимент по оценке качества работы алгоритма, давший положительные результаты. В ходе работы также были выявлены недочеты, которые связаны с ошибками анализа семантических классов слов семантико-синтаксического анализатора Semsin и невозможностью распознавания контекста в пределах одного предложения.
Ключевые слова: семантическая связь предложений, синтез русской речи по тексту, разрешение омографии, омографы, вопросительное предложение, сверхфразовое единство, анализатор semsin
Библиография статьи: Чемерилов В. В. Система автоматического разрешения омографии на основе семантической связи слов смежных предложений в текстовом отрывке / В. В. Чемерилов, А. С. Фадеев // Доклады ТУСУР. – 2018. – Т. 21, № 3. – С. 42–48. DOI: 10.21293/1818-0442-2018-21-3-42-48