Методика идентификации автора исходного кода программы на основе multi-view-представлений

Скачать текст статьи в формате PDF

Авторы: Куртукова А. В.

Аннотация: Представлена новая методика идентификации автора программного кода, основанная на multi-view-подходе. Це-лью исследования является повышение точности и устойчивости идентификации авторства за счет объединения различных представлений программного кода: исходного кода, абстрактного синтаксического дерева, графа пото-ка управления и дизассемблированного кода. Для построения моделей использовались современные методы ма-шинного обучения, позволяющие интегрировать и анализировать комплексные признаки из разных источников. Проведенные эксперименты показали, что разработанная multi-view-архитектура обеспечивает значительное улучшение качества идентификации по сравнению с традиционными подходами, использующими только одно представление кода. Так, на задачах с закрытым множеством авторов достигнуты значения точности и F1-макро до 0,97, а на открытых множествах отмечена высокая устойчивость к появлению новых авторов и вариативности стилей программирования. В задаче верификации автора комплексные признаки позволили достичь точности до 0,98 и снизить EER до 0,04.

Ключевые слова: верификация, авторство, графовое представление, дизассемблер, исходный код, программное обеспечение

Библиография статьи: Куртукова А. В. Методика идентификации автора исходного кода программы на основе multi-view-представлений / А. В. Куртукова // Доклады ТУСУР. – 2025. – Т. 28, № 3. – С. 59–65. DOI: 10.21293/1818-0442-2025-28-3-59-65

Адрес редакции

  634050, г. Томск, пр. Ленина, 40, МК, каб. 310/2

  (3822) 701-582, внутр.: 1456

  journal@tusur.ru