Graph-RAG: гибридный поиск с графовой структурой для обеспечения полноты и согласованности при анализе нормативно-технических документов
DOI: 10.21293/1818-0442-2025-28-4-110-120
DOI: 10.21293/1818-0442-2025-28-4-110-120
Аннотация: Представлено исследование архитектуры Graph-RAG, которая является расширением Retrieval-Augmented Generation с интеграцией графа знаний применительно к задачам обработки технической документации, ориен-тированной на проверку соответствия требованиям стандартизации (ГОСТ, ОСТ, ТУ), а также верификации ис-полнения пунктов технического задания. Валидация проведена на корпусе из 100 документов общей протяжен-ностью 12480 страниц, включая своды правил, технические условия, отчетные формы и спецификации оборудо-вания. Все документы прошли предварительную аннотацию по трем критериям: 1) наличие ссылок на норма-тивы; 2) четкая структура требований; 3) наличие кросс-ссылок внутри документа и между документами. В срав-нительный анализ включены современные архитектуры: Vanilla RAG, FiD, FLARE, HyDE, ModernBERT и Graph-RAG на базе Qwen3-32B. Эксперименты показывают, что Graph-RAG превосходит ближайший аналог (Qwen3 + HyDE) по точности (EM) на 16,8 процентных пункта (п.п.), а по согласованности фактов – на 10,3 п.п. с p < 0,001 (t-тест, n = 300 запросов). Все выводы подкреплены статистически значимыми результатами.
Ключевые слова: нормативно-технические документы, тз, анализ документации, графовая сеть, llm, rag
Авторы и правообладатели:
—
Библиография статьи:
Семенов Р. Э. Graph-RAG: гибридный поиск с графовой структурой для обеспечения полноты и согласованности при анализе нормативно-технических документов / Р. Э. Семенов // Доклады Томского государственного университета систем управления и радиоэлектроники. – 2025. – Т. 28, № 4. – С. 110–120. DOI: 10.21293/1818-0442-2025-28-4-110-120