Разработка НГУ победила на конкурсе Yandex Open Source
Разработка НГУ победила на конкурсе Yandex Open Source
Конкурс проходил при поддержке платформы для разработчиков SourceCraft в треке «Искусственный интеллект». В число лучших вошёл проект RAGU (Retrieval‑Augmented Generation & Understanding), созданный командой под руководством доцента НГУ Ивана Бондаренко. Разработка позволяет снижать «галлюцинации» нейросетей и эффективно справляться со сложными запросами.
RAGU – это модульный движок GraphRAG, предназначенный для тех случаев, когда простого векторного поиска уже не хватает и нужно строить полноценные графы знаний по текстовым документам. Он позволяет собирать, хранить и гибко опрашивать структурированные данные, опираясь на граф связей между понятиями, а не только на похожесть формулировок.
– Сырой текст автоматически режется на устойчивые фрагменты, из них нейросеть выделяет сущности и связи, после чего RAGU собирает граф, объединяет дублирующиеся узлы и разбивает сеть на кластеры по алгоритму Лейдена, – описал суть работы Иван Бондаренко.
В результате получился универсальный конструктор систем интеграции языковых моделей с базами знаний. Когда у пользователя возникает вопрос, особенно сложный, система позволяет сгенерировать ответ, основанный именно на знаниях о предметной области, причём корректно, быстро и без галлюцинаций. Тем самым, RAGU помогает искусственному интеллекту опираться на формальную модель знаний, извлечённых из документов, а не на общие статистические ассоциации.
Сейчас наработки RAGU уже используются в системе «Менон» – цифровом помощнике абитуриента НГУ, который отвечает на вопросы о поступлении, учебных программах и жизни в университете. В отличие от стандартных поисковых сервисов, «Менон» ведёт с пользователем диалог и формулирует ответы своими словами, опираясь на специально структурированную базу данных об университете.
– Такую систему можно адаптировать и для других отраслей – от строительства до работы с нормативной документацией. Везде, где есть архив документов или база знаний и нужно эффективно использовать её при принятии решений, важна система, которая, с одной стороны, хорошо понимает язык, а с другой – умеет строить формальную модель знаний на основе текстов, – подчеркнул Бондаренко.
Победа на конкурсе даёт проекту и репутационный, и практический эффект, поскольку победителям выдают гранты на использование ресурсов Yandex Cloud для развития открытых проектов.
В ближайших планах разработчиков – научить систему ещё лучше понимать «живую» человеческую речь и сложные диалоги.
Фото из архива редакции «Навигатора»



Комментарии