Услуга · AI-ассистенты

AI-ассистенты,
которые понимают бизнес

Корпоративные чат-боты на LLM с доступом к вашим документам, CRM и базам знаний. Без галлюцинаций, с контролем ответов и логами.

запуск MVP
4–6 нед
нагрузки на поддержку
−40%
доступность
24/7
AI-ассистенты и чат-боты на LLM
Боли

Знакомо? Работаем именно с этим

Поддержка не справляется

Повторяющиеся вопросы забивают команду, SLA тикетов растёт, клиенты уходят в чат-боты конкурентов.

База знаний мёртвая

Документация есть, но сотрудники её не читают. Онбординг занимает недели, ответы приходят с задержкой.

Обычный ChatGPT — не вариант

Данные клиентов и документы нельзя отправлять в публичные API. Нужен контур, который остаётся у вас.

Готовые конструкторы ограничены

Tilda- и Jivo-боты работают по скриптам. Реальный диалог с контекстом они не ведут.

Решение

Что входит в разработку

LLM с RAG по вашим данным

Подключаем Llama 3, Mistral, YandexGPT или GigaChat. Ассистент отвечает по вашим документам, а не выдумывает.

Интеграции с бизнес-системами

CRM (Bitrix24, amoCRM), Helpdesk, 1С, внутренние API. Ассистент создаёт тикеты, заявки, отчёты.

On-premise или частное облако

Разворачиваем на ваших серверах или в изолированном контуре. Никакой отправки данных наружу.

Каналы общения

Telegram, WhatsApp, виджет на сайте, Teams, Slack. Единое ядро — много фронтов.

Контроль качества ответов

Гардрейлы, политики, логирование, ручная модерация спорных кейсов, A/B-тесты промптов.

Аналитика и дообучение

Дашборды с темами запросов, провалами, конверсиями. Регулярное дообучение на реальных диалогах.

Процесс

Путь от брифа до запуска

Шаг 01

Бриф и данные

Разбираем сценарии, собираем корпус документов и диалогов. 3–5 дней.

Шаг 02

MVP с RAG

Поднимаем ассистента на ваших данных, подключаем основной канал. 2–3 недели.

Шаг 03

Интеграции и приёмка

Подключаем CRM и внутренние системы, замеряем качество, настраиваем гардрейлы. 1–2 недели.

Шаг 04

Запуск и развитие

Переводим в production, мониторим, дообучаем. Поддержка по SLA.

Стек

Технологии

LLM
  • Llama 3.1/3.3
  • Mistral
  • YandexGPT
  • GigaChat
  • Qwen 2.5
RAG-ядро
  • LangChain
  • LlamaIndex
  • Qdrant
  • PGVector
  • ChromaDB
Инфраструктура
  • Docker
  • Kubernetes
  • vLLM
  • Ollama
  • Nginx
Интеграции
  • Bitrix24
  • amoCRM
  • Telegram Bot API
  • WhatsApp Business
Стоимость

Пакеты разработки

Окончательная смета формируется после диагностики. Ниже — типовые варианты.

MVP-ассистент

от 120 000 ₽ единоразово · 2–3 недели

Простой корпоративный бот на одной LLM. Без глубокой работы с документами.

  • 1 LLM (облачная или локальная)
  • 1 канал: Telegram или виджет на сайт
  • До 10 сценариев / FAQ-блоков
  • Базовая аналитика
  • Деплой на вашу VM или в наш контур
Оставить заявку
Популярный

Ассистент с RAG

от 280 000 ₽ единоразово · 4–6 недель

Полноценный ассистент, который отвечает по вашим документам и базе знаний.

  • 1 LLM + RAG по корпусу документов
  • 1 канал (Telegram, виджет или мессенджер)
  • Гардрейлы и логирование всех ответов
  • Дашборд с темами и качеством
  • 1 месяц поддержки после запуска
Оставить заявку

Корпоративный

от 550 000 ₽ единоразово · 6–10 недель

Если ассистент должен работать сразу в нескольких каналах и интегрироваться с CRM/Helpdesk.

  • 2 канала общения
  • Интеграция с CRM (Bitrix24, amoCRM) или Helpdesk
  • Продвинутые гардрейлы, модерация
  • Дашборды качества и конверсии
  • 1 месяц поддержки + обучение вашей команды
Оставить заявку
Примеры

Как это работает у клиентов

−40% тикетов

B2B-платформа

Ассистент закрывает типовые обращения 1-й линии, операторы фокусируются на сложных кейсах.

+25% NPS

EdTech

AI-тьютор помогает студентам ночью и в выходные — раньше эти вопросы просто терялись.

Частые вопросы

Что спрашивают чаще всего

Ассистент будет «выдумывать» ответы?

Нет. Мы используем RAG и гардрейлы: если в документах нет ответа, ассистент честно говорит об этом и предлагает оператора. Все ответы логируются.

Данные уйдут в OpenAI или Сбер?

Только если вы сами выберете этот сценарий. По умолчанию рекомендуем on-premise LLM (Llama/Mistral/Qwen) — данные не покидают ваш контур.

Сколько стоит поддержка после запуска?

Три уровня: • Базовая — от 15 000 ₽/мес. Мониторинг, реакция на инциденты в рабочее время, мелкие правки до 4 часов в месяц. • Стандарт — от 45 000 ₽/мес. Мониторинг, доработки до 15 часов в месяц, регулярное дообучение моделей, ежеквартальный отчёт. • Расширенная — от 120 000 ₽/мес. Выделенная часть инженера, SLA по договору, дежурство по расписанию.

Можно ли дообучить под наш стиль общения?

Да. Используем few-shot промпты и при необходимости LoRA fine-tuning на ваших реальных диалогах с клиентами.

Начните с экспресс-диагностики

15 000 ₽, 3–5 рабочих дней. Разберём вашу задачу и дадим письменные рекомендации: с какого сценария начать, какая архитектура подойдёт, какой бюджет реалистичен. Если зайдём в проект — стоимость засчитываем в счёт первого этапа.

Заказать диагностику mail@xencom.ru
Ответим в течение рабочего дня