Автоматизация

AI для обработки документов: от OCR до извлечения данных

Как современные LLM и OCR-модели меняют работу с договорами, счетами и заявками — и почему старые RPA-роботы больше не справляются.

9 минут
Автоматизация
Xencom · Блог
AI для обработки документов: от OCR до извлечения данных

Если вы всё ещё нанимаете операторов, чтобы разобрать накладные, сверить счета с заказами или ввести данные из анкет в CRM — у вас есть процесс стоимостью от 30 до 300 тыс. ₽/мес за каждые 1000 документов в месяц. Современные AI-конвейеры снимают большую часть этой нагрузки. Разбираем, как это устроено в 2026 году.

Три поколения автоматизации документов

Первое поколение — жёсткие OCR-шаблоны. Работают, если документ строго одинаковый. Любое изменение формы — новый шаблон. Типичный случай: старые системы обработки банковских платёжек, где любой контрагент с нестандартным бланком ломает конвейер.

Второе поколение — RPA-роботы. UiPath, Blue Prism, «Primo». Умеют «кликать» по интерфейсам и переносить данные между системами. Проблема: при любом изменении интерфейса или формата документа робот падает. Стоимость поддержки съедает экономию.

Третье поколение — AI-конвейер на LLM. Модель видит документ «как человек», понимает смысл, извлекает нужные поля независимо от формы. Не ломается при смене шаблонов. Именно здесь сейчас происходит самый большой прирост эффективности.

Из чего состоит современный AI-конвейер

Пайплайн для обработки документов в production выглядит так:

  1. Классификация: LLM или классификатор определяет тип документа (договор, счёт, накладная, анкета).
  2. OCR: современные модели — DocTR, PaddleOCR, LayoutLM — извлекают текст с учётом структуры страницы.
  3. Извлечение полей: LLM с RAG по вашим шаблонам находит нужные данные (ИНН, сумма, дата, позиции).
  4. Верификация: проверка по правилам, сравнение с эталонами, валидация форматов.
  5. Эскалация: спорные случаи с низкой уверенностью уходят человеку. Остальное — прямо в ERP/CRM.

Точность на реальных корпусах обычно 94–98% после настройки. Для оставшихся 2–6% держится ручная проверка.

Конкретный кейс: накладные в логистике

Типовая задача: компания получает 5000 накладных в месяц от разных поставщиков, операторы вводят позиции в 1С. Шаблонов нет, бланки разные, каждый поставщик делает по-своему.

До AI:

  • 4 оператора, 6 часов в день.
  • Стоимость работы: ~240 тыс. ₽/мес.
  • Задержка ввода: до 3 дней.
  • Ошибки: 1.5–2% (человеческий фактор).

После внедрения AI-конвейера:

  • 1 оператор проверяет эскалированные случаи (~5% потока).
  • Стоимость решения: 60 тыс. ₽/мес (хостинг + поддержка).
  • Задержка: 15 минут.
  • Ошибки: 0.4%.

Окупаемость проекта (единоразовое внедрение 850 тыс. ₽) — 5 месяцев.

Что изменили LLM в этом поле

Три вещи, которых раньше не было:

1. Устойчивость к форматам. Раньше для каждого нового типа документа нужно было писать правила и шаблоны. LLM извлекает поля из произвольного бланка, если в промпте описано, что именно искать.

2. Контекстное понимание. Модель различает «наличную оплату» и «безналичную» не по ключевому слову, а по смыслу всего предложения. Это снимает целый класс ошибок.

3. Естественная обработка ошибок. Если документ плохого качества, LLM честно возвращает «поле не читается» вместо того, чтобы выдать мусор. Это проще эскалировать человеку.

Отдельный сюжет — приём документов от внешних пользователей (формы заявок с прикреплёнными PDF/JPG). Здесь начинается территория 152-ФЗ: каждая загрузка с ПДн требует корректно оформленного согласия. О типичных ошибках в формулировках согласий и UX-паттернах — в нашей подробной статье на эту тему.

Когда AI не нужен (и даже вреден)

Не все документы стоит автоматизировать через AI:

  • Строго одинаковые формы, 100+ в день: классический OCR быстрее, дешевле и надёжнее.
  • Юридически значимые документы, где критична каждая буква: AI как помощник — ок, AI без проверки — нет.
  • Поток меньше 500 документов в месяц: окупаемость под вопросом. Ручная обработка дешевле.

Инфраструктура: что нужно

Для типового развёртывания:

  • LLM: Llama 3.3 70B или Qwen 2.5 72B. Если данные чувствительные — on-premise.
  • OCR: PaddleOCR или LayoutLM для русского. Tesseract — только для базовых задач.
  • Оркестрация: Temporal, Airflow или Celery — для управления очередью и ретраев.
  • Хранилище: S3 (или аналог) для входящих документов + PostgreSQL для метаданных.
  • Мониторинг: Grafana с дашбордами по точности, throughput, стоимости.

Типовой стартовый кластер: 1×H100 или 2×A100 + 4-ядерный хост. На нём комфортно работает до 50 тыс. документов/мес.

С чего начать

Практический алгоритм внедрения:

  1. Выберите самый болезненный процесс. Не тот, где «было бы круто», а где операторы реально завалены.
  2. Соберите 200–500 исторических документов с эталонными результатами обработки.
  3. Запустите PoC за 3 недели. Цель — замерить точность и покрытие на ваших данных.
  4. Считайте экономику честно. Если PoC показал 85% точности, а нужно 95% — либо доводим, либо признаём, что процесс ещё не созрел для автоматизации.
  5. Запустите на 10% потока и сравните с ручной обработкой. Через месяц переносите остальные 90%.

Итог

AI-автоматизация документов — одна из самых быстроокупаемых AI-задач в 2026 году: 5–9 месяцев до окупаемости, точность 94–98%, устойчивость к изменениям форм. Главная сложность — не технологии, а правильный выбор процесса и честная оценка экономики.

Если у вас есть процесс, в котором операторы тонут в бумагах — на 30-минутном звонке разберём, годится ли он под AI, и если да — сколько это будет стоить.

Читать дальше

Другие статьи

AI-ассистенты
Xencom · Блог
AI-агенты vs AI-ассистенты: чем они отличаются и какому бизнесу что реально нужно в 2026
18 мая 2026 г. 10 минут

AI-агенты vs AI-ассистенты: чем они отличаются и какому бизнесу что реально нужно в 2026

Разбираемся, в чём принципиальная разница между AI-ассистентом и AI-агентом, почему «агенты» — главный технологический тренд 2026 по версии Сбера и ФинТеха, и какие задачи стоит решать через одно, а какие — через другое. С таблицей, антипаттернами и расчётом бюджета.

Читать
Compliance
Xencom · Блог
152-ФЗ в 2026: оборотные штрафы 3%, обязательная УПД и ЭТТН — чек-лист малого бизнеса до сентября
16 мая 2026 г. 12 минут

152-ФЗ в 2026: оборотные штрафы 3%, обязательная УПД и ЭТТН — чек-лист малого бизнеса до сентября

Разбираем три самых жёстких регуляторных удара 2025–2026 года: оборотные штрафы до 3% выручки за утечку ПДн (с 30.05.2025), переход на УПД как единственный формат первички (с 01.01.2026) и обязательная электронная транспортная накладная (с 01.09.2026). Со ссылками на нормы, реальными штрафами 2026 и чек-листом по подготовке.

Читать
AI-ассистенты
Xencom · Блог
GigaChat MAX vs YandexGPT 5 Pro vs DeepSeek: что выбрать бизнесу под 152-ФЗ в 2026
14 мая 2026 г. 11 минут

GigaChat MAX vs YandexGPT 5 Pro vs DeepSeek: что выбрать бизнесу под 152-ФЗ в 2026

Сравниваем три актуальные LLM для российского бизнеса в мае 2026: цены, контекст, fine-tuning, юридические аспекты под 152-ФЗ и проект ФЗ о доверенных моделях ИИ. С таблицей, типовыми сценариями и расчётом стоимости на реальных нагрузках.

Читать

Обсудим ваш AI-проект?

Расскажите о задаче — на 30-минутном звонке подскажем, с чего начать и чего избегать.