Программный комплекс для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах — Журнал «Доклады Томского государственного университета систем управления и радиоэлектроники»

Аннотация: Статья посвящена программному комплексу для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах. В качестве основы для построения данного комплекса были использованы модели Гауссовых смесей и универсальная фоновая модель (GMM-UBM система). Разработанный комплекс позволяет производить обучение универсальной фоновой модели (UBM), моделей дикторов и производить тестирование речевых сегментов на принадлежность заданной модели диктора. Комплекс позволяет производить отбор речевых признаков с помощью алгоритмов жадного добавления-удаления и генетического алгоритма. Произведена экспериментальная оценка скорости работы модуля обучения универсальной фоновой модели в различных реализациях – на центральном процессоре, на процессоре видеокарты и в комбинированном варианте. Реализованный модуль обучения УФМ с комбинированными вычислениями на центральном процессоре и процессоре видеокарты, по сравнению с обучением УФМ на центральном процессоре, позволяет уменьшить время работы на 36,95%, по сравнению с обучением на процессоре видеокарты – на 10%.

Ключевые слова: распознавание диктора, верификация диктора, гауссовы смеси, gmm-ubm-система, обработка речи, программный комплекс, параллельные вычисления, gpu, cuda

Библиография статьи:
Рахманенко И. А. Программный комплекс для идентификации диктора по голосу с применением параллельных вычислений на центральном и графическом процессорах / И. А. Рахманенко // Доклады Томского государственного университета систем управления и радиоэлектроники. – 2017. – Т. 20, № 1. – С. 70–74. DOI: 10.21293/1818-0442-2017-20-1-70-74