Graph-RAG: гибридный поиск с графовой структурой для обеспечения полноты и согласованности при анализе нормативно-технических документов

DOI: 10.21293/1818-0442-2025-28-4-110-120

Скачать текст статьи в формате PDF

Аннотация: Представлено исследование архитектуры Graph-RAG, которая является расширением Retrieval-Augmented Generation с интеграцией графа знаний применительно к задачам обработки технической документации, ориен-тированной на проверку соответствия требованиям стандартизации (ГОСТ, ОСТ, ТУ), а также верификации ис-полнения пунктов технического задания. Валидация проведена на корпусе из 100 документов общей протяжен-ностью 12480 страниц, включая своды правил, технические условия, отчетные формы и спецификации оборудо-вания. Все документы прошли предварительную аннотацию по трем критериям: 1) наличие ссылок на норма-тивы; 2) четкая структура требований; 3) наличие кросс-ссылок внутри документа и между документами. В срав-нительный анализ включены современные архитектуры: Vanilla RAG, FiD, FLARE, HyDE, ModernBERT и Graph-RAG на базе Qwen3-32B. Эксперименты показывают, что Graph-RAG превосходит ближайший аналог (Qwen3 + HyDE) по точности (EM) на 16,8 процентных пункта (п.п.), а по согласованности фактов – на 10,3 п.п. с p < 0,001 (t-тест, n = 300 запросов). Все выводы подкреплены статистически значимыми результатами.

Ключевые слова: нормативно-технические документы, тз, анализ документации, графовая сеть, llm, rag

Авторы и правообладатели:

Библиография статьи:
Семенов Р. Э. Graph-RAG: гибридный поиск с графовой структурой для обеспечения полноты и согласованности при анализе нормативно-технических документов / Р. Э. Семенов // Доклады Томского государственного университета систем управления и радиоэлектроники. – 2025. – Т. 28, № 4. – С. 110–120. DOI: 10.21293/1818-0442-2025-28-4-110-120

Адрес редакции

  634050, г. Томск, пр. Ленина, 40, МК, каб. 310/2

  (3822) 701-582, внутр.: 1456

  journal@tusur.ru