Инженерные разборы внедрений. Что пробовали, что выкинули и почему получилось сложнее, чем казалось.
В каждом разборе мы показываем задачу, архитектуру системы и подходы, которые попробовали по дороге. Включая те, которые выкинули. Под спойлерами — полные инженерные карты для тех, кто хочет понять, как всё устроено на уровне компонентов.
Мы намеренно пишем про ошибки и тупики. По нашему опыту, именно они объясняют, почему система устроена так, а проект занял столько времени. Готовый результат без этого контекста выглядит либо тривиально, либо неправдоподобно.
Агент сам инициирует продажу в мобильном приложении. 17 триггеров, чтобы попасть в момент, многослойный комплаенс, чтобы пройти регулятора. Почти половина правок за 10 недель разработки выросла из живых диалогов с реальными клиентами.
Одна галлюцинация — и водитель не выходит на линию.
Формула уверенности из 30+ параметров, 8 маркеров для фильтра галлюцинаций. Каждое правило появилось после конкретного провала.
Заявка пациента могла растягиваться почти на два часа: оператор вручную собирал данные из чата, программы, клиник, согласований и документов.
Это не помощник для ответов, а система, которая учитывает общий чат пациента, историю обращений, запись, гарантийные письма и готовит корректное действие в CRM.
Самую опасную норму юрист вспоминает уже в зале суда, когда её называет другая сторона.
Движок сам добавляет нормы, которыми бьёт оппонент. Пофразовые фильтры не дают переврать закон, а качество меряется против эталонных ответов юристов.
Диспетчер спрашивает про один узел, а ответ разнесён по нескольким системам, где одна и та же станция записана по-разному и значит в каждой разное.
Маршрутизатор вместо общего поиска: на каждый вопрос система выбирает нужный источник и не путает план с фактом. Доступ только на чтение, к управлению движением помощник не подключён.
Заказчик уже запускал LLM-агентов в продакшене и не видел, что внутри: какой промпт ушёл в модель, сколько стоил ответ и был ли он верным.
Слой наблюдаемости — трейсинг каждого вызова, учёт стоимости по токенам и оценка качества на каждом шаге, поднятый рабочим эталоном в собственном Kubernetes заказчика. Стандартный OpenTelemetry, без привязки к SDK вендора.
Проект-координатор держит в голове, кто что пообещал на прошлой неделе. Год подряд этот фокус не удерживает ни один человек.
Третий месяц роль закрывает AI-агент на нашей собственной команде. Пороги между потерянным сигналом и шумом, эталонный набор под каждую команду, граница автономии — только обратимые действия.
Живая платформа для игр на вечеринках на PHP и Node, несколько лет legacy. Технический долг рос быстрее новых фич, и большой командой это перестало разгребаться.
Строим разработческий харнес: legacy замораживаем как исполнимую спеку, обкладываем тестами и переписываем по одной ручке, чтобы систему вели пара человек с агентами. Первая часть: авторизация уже в новом коде.
Эти четыре внедрения дали не только клиентские системы. Из повторяющейся боли вокруг требований, наборов проверки и регрессий вырос отдельный слой платформы.
Разбор слоя, который вырос из четырёх внедрений и превращает документы, живые диалоги и ошибки из продакшна в требования, проверочные наборы и регрессионный контур. Внутри платформы мы называем его datasetgen.
Готовим полные разборы, опубликуем по мере готовности.
AI-агенты на 1-й линии поддержки. Разбор частотных категорий, где детерминированный бот давал плохой результат. Закрыли 10 самых частых типов запросов с качеством >80%. Плюс речевая аналитика: голос + чаты, контроль соответствия скриптам.
AI-агентский слой поверх Oracle CMS. 12 категорий обращений 2-й линии. Агенты повторяют работу оператора: получают обращение, категоризируют, уточняют у клиента, запрашивают внутренние системы, пишут контрагенту. Ключевое: агент не теряет контекст между итерациями.
Ответим, подходит ли задача для AI-агентов, и если да, предложим конкретный план.
Заявка отправлена
Ответим в течение дня на указанный email.
или напишите напрямую — ilya@manaraga.ai