Программный комплекс для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах

Скачать текст статьи в формате PDF

Авторы: Рахманенко И. А.

Аннотация: Статья посвящена программному комплексу для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах. В качестве основы для построения данного комплекса были использованы модели Гауссовых смесей и универсальная фоновая модель (GMM-UBM система). Разработанный комплекс позволяет производить обучение универсальной фоновой модели (UBM), моделей дикторов и производить тестирование речевых сегментов на принадлежность заданной модели диктора. Комплекс позволяет производить отбор речевых признаков с помощью алгоритмов жадного добавления-удаления и генетического алгоритма. Произведена экспериментальная оценка скорости работы модуля обучения универсальной фоновой модели в различных реализациях – на центральном процессоре, на процессоре видеокарты и в комбинированном варианте. Реализованный модуль обучения УФМ с комбинированными вычислениями на центральном процессоре и процессоре видеокарты, по сравнению с обучением УФМ на центральном процессоре, позволяет уменьшить время работы на 36,95%, по сравнению с обучением на процессоре видеокарты – на 10%.

Ключевые слова: распознавание диктора, верификация диктора, гауссовы смеси, gmm-ubm-система, обработка речи, программный комплекс, параллельные вычисления, gpu, cuda

Библиография статьи: Рахманенко И. А. Программный комплекс для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах / И. А. Рахманенко // Доклады ТУСУР. – 2017. – Т. 20, № 1. – С. 70–74. DOI: 10.21293/1818-0442-2017-20-1-70-74

Масленников Виктор Николаевич

Ответственный секретарь редакции журнала

  634050, г. Томск, пр. Ленина, 40, МК, каб. 310/2

  (3822) 51-21-21, внутр.: 1460

  vnmas@tusur.ru