Интеграция баз знаний (RAG)

Name: Mockarty
Author: Mockarty

Mockarty поддерживает подключение внешних баз знаний для обогащения ответов ИИ-агентов документацией вашей компании, API-спецификациями, стандартами кодирования и другими справочными материалами.

URL-адреса в примерах: Во всех примерах используется localhost:5770 как адрес Mockarty по умолчанию. Если ваш экземпляр работает на удалённом сервере, замените localhost:5770 на реальный адрес (например, https://mockarty.company.com или http://192.168.1.50:5770). Подробнее — в разделе Полезные функции и советы.

Страница MCP Marketplace с подключённой базой знаний RAG

Что такое RAG?

Простое объяснение: Представьте, что вы наняли нового разработчика. Он умный, но не знает API вашей компании, стандарты кодирования или внутренние инструменты. RAG – это как дать ему поисковый справочник. Прежде чем ответить на вопрос, он сначала заглядывает в справочник, поэтому его ответы точные и специфичные для вашей компании.

RAG (Retrieval-Augmented Generation) – это паттерн, при котором ИИ ищет релевантную информацию в базе знаний перед генерацией ответа. Вместо того чтобы полагаться только на обучающие данные модели, RAG извлекает ваши конкретные документы и добавляет их в контекст разговора.

Это означает, что ваши ИИ-агенты могут:

Знать API-спецификации вашей компании и генерировать точные моки
Следовать формату отчётов и стандартам кодирования вашей команды
Ссылаться на внутреннюю документацию при ответах на вопросы
Давать контекстные рекомендации на основе истории вашего проекта

Как это работает в Mockarty

Базы знаний интегрируются через MCP Marketplace как тип источника RAG. После подключения ИИ-агент получает два инструмента:

Инструмент	Описание
`search_knowledge`	Поиск в базе знаний релевантных документов и контекста
`list_knowledge_collections`	Список доступных коллекций/датасетов документов

Когда пользователь задаёт вопрос ИИ-агенту, агент может автоматически искать релевантный контекст в базе знаний перед ответом.

Сравнение провайдеров

Прежде чем углубляться в детали, краткое сравнение для выбора:

Провайдер	Простота настройки	Требования к ресурсам	Лучше всего для	Лицензия
AnythingLLM	Очень просто (1 контейнер, drag & drop)	Низкие (~1 контейнер, ~1 ГБ RAM)	Быстрый старт, маленькие команды, прототипирование	MIT
RAGFlow	Средне (несколько контейнеров, нужна настройка)	Средние (3+ контейнера, ~4 ГБ RAM)	Сложные документы (PDF с таблицами, изображениями)	Apache 2.0
Dify	Средне (несколько контейнеров)	Средне-высокие (5+ контейнеров, ~4 ГБ RAM)	Продвинутые воркфлоу, визуальный конструктор	Apache 2.0
R2R	Продвинуто (несколько контейнеров с PostgreSQL)	Высокие (4+ контейнера, ~8 ГБ RAM)	Production RAG с графами знаний, мультимодальность	MIT
Custom API	Зависит от реализации	Зависит	Полный контроль, существующая RAG-инфраструктура	N/A

Рекомендация для начинающих: Начните с AnythingLLM – это один Docker-контейнер с веб-интерфейсом и загрузкой документов перетаскиванием. Вы можете переключиться на более продвинутого провайдера позже, не меняя конфигурацию Mockarty.

Поддерживаемые RAG-провайдеры

RAGFlow

Лучше всего для: Глубокого понимания документов (таблицы, изображения, сложная вёрстка)

Лицензия Apache 2.0
Отличный парсинг PDF/DOCX (движок DeepDoc)
Встроенная поддержка MCP-сервера
REST API на порту 9380

Быстрый старт:

git clone https://github.com/infiniflow/ragflow.git
cd ragflow
docker compose -f docker/docker-compose-base.yml up -d

URL по умолчанию: http://localhost:9380

После запуска:

Откройте интерфейс RAGFlow по адресу http://localhost:9380
Создайте датасет и загрузите документы
Получите API-ключ в настройках

AnythingLLM

Лучше всего для: Простейшей настройки (один контейнер, перетаскивание файлов)

Лицензия MIT
Встроенная векторная БД (LanceDB)
Один Docker-контейнер
Веб-интерфейс с drag & drop загрузкой

Быстрый старт:

docker run -d -p 3001:3001 \
  --name anythingllm \
  -v anythingllm_data:/app/server/storage \
  mintplexlabs/anythingllm

URL по умолчанию: http://localhost:3001

После запуска:

Откройте AnythingLLM по адресу http://localhost:3001
Пройдите мастер настройки
Создайте workspace и загрузите документы
Получите API-ключ в Settings > Developer

Dify

Лучше всего для: Продвинутых RAG-воркфлоу с визуальным конструктором

Лицензия Apache 2.0
Визуальный редактор воркфлоу
30+ вариантов векторных БД
Двунаправленная поддержка MCP

Быстрый старт:

git clone https://github.com/langgenius/dify.git
cd dify/docker
docker compose up -d

URL по умолчанию: http://localhost:3000

После запуска:

Откройте Dify по адресу http://localhost:3000
Создайте Базу знаний и загрузите документы
Получите API-ключ в настройках

R2R (SciPhi)

Лучше всего для: Production-grade RAG с графами знаний

Лицензия MIT
REST-first дизайн API
Поддержка графов знаний
Мультимодальная загрузка (текст, изображения, аудио)

Быстрый старт:

git clone https://github.com/SciPhi-AI/R2R.git
cd R2R
docker compose -f compose.full.yaml --profile postgres up -d

URL по умолчанию: http://localhost:7272

Кастомный RAG API

Вы можете подключить любую RAG-систему с REST API, которая предоставляет:

POST /search — эндпоинт, принимающий {"query": "...", "top_k": 5}
GET /collections — список доступных коллекций документов
GET /health — эндпоинт проверки соединения

Руководство по настройке

Способ 1: Через пресеты (рекомендуется)

Перейдите в Администрирование > Настройки ИИ > MCP Marketplace
Найдите секцию Пресеты баз знаний (RAG) в верхней части
Нажмите на карточку нужного провайдера (например, RAGFlow)
Заполните URL и данные аутентификации
Нажмите Сохранить
Система автоматически обнаружит инструменты search_knowledge и list_knowledge_collections

Способ 2: Ручная настройка

Перейдите в Администрирование > Настройки ИИ > MCP Marketplace
Нажмите Добавить интеграцию
Выберите База знаний (RAG) как тип источника
Введите URL вашего RAG-сервера
Настройте аутентификацию:
- RAGFlow: Bearer токен (API-ключ из настроек RAGFlow)
- AnythingLLM: Bearer токен (API-ключ из настроек разработчика)
- Dify: Bearer токен (API-ключ из настроек Dify)
- R2R: Bearer токен или API-ключ
- Кастомный: Зависит от вашего API
Укажите в Описании название провайдера (например, “ragflow”, “anythingllm”) для автоматического определения
Нажмите Сохранить, затем Проверить соединение

Привязка к ИИ-функциям

После добавления базы знаний:

Откройте любую ИИ-функцию (например, Конструктор моков, API Тестер)
Нажмите иконку шестерёнки для открытия настроек ИИ
В разделе MCP Tools найдите вашу базу знаний
Отметьте инструмент search_knowledge
ИИ-агент теперь будет автоматически искать в базе знаний при необходимости

Подробное руководство по настройкам ИИ, выбору MCP-инструментов и пользовательским промптам см. в документации ИИ-функции.

Сценарии использования

Генерация моков по реальным API-спецификациям

Загрузите ваши OpenAPI/Swagger-спецификации в базу знаний. Когда вы попросите ИИ создать мок:

Пользователь: "Создай мок для сервиса оплаты"
Агент: [ищет в базе знаний "payment service API"]
Агент: [находит OpenAPI-спецификацию с эндпоинтами, схемами, примерами]
Агент: [создаёт точный мок с реальными структурами данных]

Генерация отчётов в формате компании

Загрузите шаблоны отчётов и прошлые отчёты:

Пользователь: "Сгенерируй отчёт по нагрузочному тестированию"
Агент: [ищет "шаблон отчёта по нагрузочному тестированию"]
Агент: [находит шаблон компании с обязательными разделами]
Агент: [генерирует отчёт в правильном формате]

Онбординг и документация

Загрузите внутреннюю документацию, вики и гайды:

Пользователь: "Как настроить сторы в Mockarty?"
Агент: [ищет в базе знаний "настройка сторов"]
Агент: [находит внутренний гайд с конвенциями команды]
Агент: [отвечает с точными инструкциями для вашей команды]

Соблюдение стандартов кодирования

Загрузите стандарты кодирования и гайды по стилю:

Пользователь: "Сгенерируй тестовый скрипт для API заказов"
Агент: [ищет "стандарты тестовых скриптов"]
Агент: [применяет конвенции именования, обязательные проверки и т.д.]

Архитектура

RAG-адаптер в MCP Marketplace:

Автоматически определяет тип провайдера по имени/описанию сервера
Использует специфичные для провайдера API-эндпоинты для поиска и листинга
Форматирует ответы с указанием источников (имя документа, процент совпадения)
Поддерживает аутентификацию для каждого пользователя через переопределение заголовков

Советы

Начните с RAGFlow или AnythingLLM для простейшего опыта настройки
Используйте конкретные названия коллекций при поиске для лучшей точности
Загружайте целевые документы, а не весь массив знаний целиком
Поддерживайте документы в актуальном состоянии — результаты RAG настолько хороши, насколько хороши исходные данные
Используйте переопределение заголовков, если разным пользователям нужны разные API-ключи для RAG-системы
Следите за Token Budget в настройках ИИ – результаты базы знаний потребляют токены контекста

Устранение проблем

Проверка соединения не проходит

Убедитесь, что RAG-сервер запущен: curl http://your-rag-server:port/health
Проверьте, что URL в Mockarty совпадает с реальным адресом RAG-сервера (обратите внимание на сетевые особенности Docker – localhost внутри контейнера указывает на сам контейнер)
Убедитесь, что API-ключ корректен и не истёк

ИИ-агент не использует базу знаний

Убедитесь, что инструмент search_knowledge включён в настройках ИИ (иконка шестерёнки) для конкретной функции, которую вы используете
Проверьте, что база знаний содержит документы, релевантные вашему запросу – попробуйте поискать напрямую в UI RAG-провайдера
ИИ решает, когда искать, на основе релевантности. Если ваш вопрос общий, ИИ может пропустить поиск. Будьте конкретны в промптах.

Плохие результаты поиска

Загружайте небольшие, целевые документы вместо больших монолитных файлов
Используйте осмысленные имена файлов – некоторые провайдеры индексируют их
При использовании RAGFlow экспериментируйте с разными стратегиями разбиения в настройках датасета
Убедитесь, что документы в поддерживаемом формате (PDF, DOCX, TXT, Markdown поддерживаются всеми провайдерами)