Почему стандартные ИТ-контракты не подходят для ИИ
Традиционные соглашения об уровне сервиса фокусируются на инфраструктуре. Вы получаете гарантию доступности сервера 99.9% времени. Для систем искусственного интеллекта этот показатель вторичен. Исправно работающий сервер может транслировать галлюцинации нейросети или выдавать ошибочные прогнозы. Бизнес принимает решения на основе этих данных и теряет деньги.
Разработка SLA для искусственного интеллекта требует перехода от оценки аптайма к оценке вероятностей. Вы должны зафиксировать математические ожидания от работы алгоритма в юридической плоскости. Это защищает бюджет от некомпетентности разработчиков и деградации моделей.
Внедрение ИИ без детального SLA перекладывает все технологические риски с разработчика на бизнес. Грамотный контракт превращает неопределенность алгоритмов в прогнозируемые операционные расходы.
Ключевые метрики качества в AI-контрактах
Программный код в классическом ПО предсказуем. Нейросети работают иначе. Вы фиксируете показатели эффективности, которые напрямую влияют на прибыль. Мы разделяем их на три категории.
Точность и качество ответов
Для классификаторов и прогнозных моделей вы устанавливаете пороги Precision и Recall. Если система одобряет кредиты, вы ограничиваете процент ложноположительных решений. Для генеративных моделей (LLM) мы прописываем отсутствие токсичного контента и соответствие ответов базе знаний компании. Вы определяете F1-score как основной интегральный показатель качества в тексте договора.
Скорость работы (Latency)
Пользователи покидают сервис, если ожидание ответа превышает три секунды. Для голосовых ассистентов этот порог составляет 500 миллисекунд. SLA устанавливает время генерации первого токена (TTFT) и общую скорость инференса. Вы вводите штрафные санкции за задержки в часы пиковых нагрузок.
Пропускная способность
Система должна обрабатывать заданное количество запросов в секунду (RPS). Вы прописываете требования к масштабируемости. Разработчик гарантирует, что при росте нагрузки точность модели останется на прежнем уровне.

- Метрики классификации: точность, полнота, специфичность.
- Метрики регрессии: средняя абсолютная ошибка (MAE), корень из среднеквадратичной ошибки (RMSE).
- Метрики LLM: уровень галлюцинаций, соответствие контексту, скорость генерации.
Управление дрейфом данных и старением моделей
Модели машинного обучения теряют актуальность. Поведение потребителей меняется, рыночные условия трансформируются. Этот процесс называют Data Drift. Если разработчик не обновляет модель, ее точность падает через несколько месяцев после запуска. Стандартный договор подряда не учитывает этот риск.
Ваш SLA должен обязывать исполнителя проводить регулярный мониторинг входящего потока данных. Вы устанавливаете периодичность проверок распределения признаков. Разработчик берет на себя обязательство по регламентному дообучению (Retraining) системы. Вы платите за актуальность алгоритма, а не за факт его существования на сервере.
Ответственность за ошибки и галлюцинации
Полное отсутствие ошибок в ИИ невозможно. Вы внедряете понятие Error Budget (бюджет ошибок). Это допустимый объем неверных срабатываний, который не влечет штрафов. Как только система превышает этот лимит, исполнитель выплачивает компенсацию или бесплатно проводит работы по оптимизации.
Бюджет ошибок позволяет соблюсти баланс между инновациями и стабильностью. Вы даете разработчику право на контролируемый риск в обмен на жесткие гарантии в критических ситуациях.
Критические инциденты требуют немедленной реакции. К ним относятся утечки конфиденциальных данных через промпты, дискриминация пользователей или выдача оскорблений. Вы классифицируете такие события по высшему уровню приоритета (Severity 1) с временем исправления в течение нескольких часов.
Процедура приемки и регулярный аудит
Вы не можете верить отчетам исполнителя на слово. SLA фиксирует методику объективной проверки. Мы рекомендуем использовать три инструмента контроля.
- Золотой датасет (Golden Set). Вы создаете эталонный набор данных с заранее известными правильными ответами. Модель проходит через него ежемесячно. Снижение показателей на этом наборе — повод для финансовой претензии.
- Независимый аудит. Вы сохраняете право привлекать третью сторону для оценки кода и весов модели. Разработчик обязуется предоставить доступ к логам инференса.
- Контрольные выборки. Вы регулярно проверяете случайные 5% ответов системы вручную или с помощью более мощной «модели-судьи».
Разработка SLA для ИИ объединяет экспертизу в Data Science и договорном праве. Вы получаете инструмент, который заставляет технологии работать на бизнес-результат. Мы помогаем составить такие соглашения, которые минимизируют юридические и технические риски при внедрении нейросетей в ваши бизнес-процессы.