Процесс создания и настройки систем искусственного интеллекта кардинально отличается от классической разработки программного обеспечения. Если при написании сайта или мобильного приложения результат предсказуем, то обучение модели — это всегда эксперимент с вероятностным исходом. Именно поэтому стандартный договор подряда здесь не работает и несет огромные риски для заказчика. Грамотный договор на обучение нейросети должен учитывать специфику работы с данными, распределение вычислительных мощностей и неопределенность результата.
В нашей практике мы часто сталкиваемся с ситуацией, когда компании тратят миллионы рублей на аренду GPU-кластеров и зарплаты ML-инженеров, но на выходе получают модель, которая «галлюцинирует» или не справляется с бизнес-задачами. При этом юридически предъявить претензии исполнителю невозможно, так как в договоре отсутствуют четкие метрики качества и критерии приемки обученной модели.
Техническое задание и метрики успеха
Ключевая ошибка при заключении сделки — размытые формулировки предмета договора. Фразы вроде «обучить нейросеть распознавать лица» недопустимы. Юридическая защита начинается с детального Технического задания (ТЗ), которое становится неотъемлемой частью контракта.
В договоре необходимо зафиксировать:
- Исходное состояние. Обучается ли модель с нуля (Pre-training) или производится дообучение уже существующей (Fine-tuning)? Это влияет на объем прав и стоимость.
- Датасеты. Кто предоставляет данные? Если данные предоставляет заказчик, исполнитель должен гарантировать их конфиденциальность и удаление после завершения работ.
- Метрики приемки (KPI). Конкретные показатели: Accuracy, F1-score, WER (для распознавания речи) и другие. Например: «Точность классификации на тестовой выборке не ниже 95%». Без этих цифр вы обязаны будете оплатить даже нерабочий алгоритм.
Интеллектуальная собственность: кому принадлежат веса?
Вопрос прав на результаты обучения — самый острый. В процессе ML-разработки создается несколько объектов интеллектуальной собственности: код архитектуры, скрипты предобработки данных и, самое главное, веса нейросети (параметры модели).
Заказчику важно понимать, что веса — это по своей сути база данных (ст. 1334 ГК РФ). Если в договоре на обучение нейросети не прописано явное отчуждение исключительных прав на веса заказчику, исполнитель может оставить их себе. Это означает, что конкуренты могут получить доступ к технологии, обученной за ваши деньги.
Мы рекомендуем использовать конструкцию договора авторского заказа или договора на создание программы для ЭВМ с условием о полном переходе прав на заказчика с момента подписания акта. Особое внимание следует уделить правам на производные произведения, если используется Open Source модель с лицензией типа Apache 2.0 или MIT.
Вычислительные ресурсы и бюджет
Обучение современных моделей требует колоссальных вычислительных мощностей. Стоимость аренды серверов с видеокартами (GPU) может превышать гонорар самих разработчиков. В договоре должно быть четко определено:
- За чей счет арендуются мощности?
- Что происходит, если гипотеза не подтвердилась, а бюджет на облака исчерпан?
- Кто администрирует доступ к серверам и отвечает за безопасность данных в облаке?
Рекомендуется устанавливать этапы (milestones) с промежуточной проверкой метрик. Если на середине обучения видно, что модель не сходится (loss function не падает), заказчик должен иметь право остановить работы и не оплачивать дальнейшее сжигание бюджета.
Конфиденциальность данных (NDA)
При обучении модели исполнитель получает доступ к «сырым» данным бизнеса, которые могут содержать коммерческую тайну или персональные данные клиентов. Стандартного NDA здесь недостаточно.
Необходимо прописать запрет на:
1. Использование данных заказчика для обучения моделей других клиентов (Data Leakage).
2. Сохранение копий датасета на локальных машинах разработчиков.
3. Передачу данных субподрядчикам без письменного согласия.
Также стоит учитывать риск «атак на извлечение данных» (Model Inversion Attacks). Исполнитель должен гарантировать, что применил методы обфускации или дифференциальной приватности, чтобы из готовой нейросети невозможно было восстановить конкретные записи из обучающей выборки.
Заключая договор, помните: вы платите не за процесс настройки алгоритмов, а за рабочий бизнес-инструмент. Юридическая обвязка должна мотивировать разработчика достичь результата, а не просто потратить машинное время.

- Юридическая помощь в решении проблемных ситуаций
- Консультации юриста онлайн проводятся Пн-Пт, с 10:00 до 18:00 часов
