Процесс создания и настройки систем искусственного интеллекта кардинально отличается от классической разработки программного обеспечения. Если при написании сайта или мобильного приложения результат предсказуем, то обучение модели — это всегда эксперимент с вероятностным исходом. Именно поэтому стандартный договор подряда здесь не работает и несет огромные риски для заказчика. Грамотный договор на обучение нейросети должен учитывать специфику работы с данными, распределение вычислительных мощностей и неопределенность результата.

В нашей практике мы часто сталкиваемся с ситуацией, когда компании тратят миллионы рублей на аренду GPU-кластеров и зарплаты ML-инженеров, но на выходе получают модель, которая «галлюцинирует» или не справляется с бизнес-задачами. При этом юридически предъявить претензии исполнителю невозможно, так как в договоре отсутствуют четкие метрики качества и критерии приемки обученной модели.

Техническое задание и метрики успеха

Ключевая ошибка при заключении сделки — размытые формулировки предмета договора. Фразы вроде «обучить нейросеть распознавать лица» недопустимы. Юридическая защита начинается с детального Технического задания (ТЗ), которое становится неотъемлемой частью контракта.

В договоре необходимо зафиксировать:

  • Исходное состояние. Обучается ли модель с нуля (Pre-training) или производится дообучение уже существующей (Fine-tuning)? Это влияет на объем прав и стоимость.
  • Датасеты. Кто предоставляет данные? Если данные предоставляет заказчик, исполнитель должен гарантировать их конфиденциальность и удаление после завершения работ.
  • Метрики приемки (KPI). Конкретные показатели: Accuracy, F1-score, WER (для распознавания речи) и другие. Например: «Точность классификации на тестовой выборке не ниже 95%». Без этих цифр вы обязаны будете оплатить даже нерабочий алгоритм.

Интеллектуальная собственность: кому принадлежат веса?

Вопрос прав на результаты обучения — самый острый. В процессе ML-разработки создается несколько объектов интеллектуальной собственности: код архитектуры, скрипты предобработки данных и, самое главное, веса нейросети (параметры модели).

Заказчику важно понимать, что веса — это по своей сути база данных (ст. 1334 ГК РФ). Если в договоре на обучение нейросети не прописано явное отчуждение исключительных прав на веса заказчику, исполнитель может оставить их себе. Это означает, что конкуренты могут получить доступ к технологии, обученной за ваши деньги.

Мы рекомендуем использовать конструкцию договора авторского заказа или договора на создание программы для ЭВМ с условием о полном переходе прав на заказчика с момента подписания акта. Особое внимание следует уделить правам на производные произведения, если используется Open Source модель с лицензией типа Apache 2.0 или MIT.

Вычислительные ресурсы и бюджет

Обучение современных моделей требует колоссальных вычислительных мощностей. Стоимость аренды серверов с видеокартами (GPU) может превышать гонорар самих разработчиков. В договоре должно быть четко определено:

  • За чей счет арендуются мощности?
  • Что происходит, если гипотеза не подтвердилась, а бюджет на облака исчерпан?
  • Кто администрирует доступ к серверам и отвечает за безопасность данных в облаке?

Рекомендуется устанавливать этапы (milestones) с промежуточной проверкой метрик. Если на середине обучения видно, что модель не сходится (loss function не падает), заказчик должен иметь право остановить работы и не оплачивать дальнейшее сжигание бюджета.

Конфиденциальность данных (NDA)

При обучении модели исполнитель получает доступ к «сырым» данным бизнеса, которые могут содержать коммерческую тайну или персональные данные клиентов. Стандартного NDA здесь недостаточно.

Необходимо прописать запрет на:
1. Использование данных заказчика для обучения моделей других клиентов (Data Leakage).
2. Сохранение копий датасета на локальных машинах разработчиков.
3. Передачу данных субподрядчикам без письменного согласия.

Также стоит учитывать риск «атак на извлечение данных» (Model Inversion Attacks). Исполнитель должен гарантировать, что применил методы обфускации или дифференциальной приватности, чтобы из готовой нейросети невозможно было восстановить конкретные записи из обучающей выборки.

Заключая договор, помните: вы платите не за процесс настройки алгоритмов, а за рабочий бизнес-инструмент. Юридическая обвязка должна мотивировать разработчика достичь результата, а не просто потратить машинное время.

VFS Consulting Юридические решения нового поколения
Договор на обучение нейросети: защита инвестиций в AI
+7 (495) 266-06-93
  • Юридическая помощь в решении проблемных ситуаций
  • Консультации юриста онлайн проводятся Пн-Пт, с 10:00 до 18:00 часов

    Получить консультацию

    Кейсы из практики

    ai

    Спор о правах на дообученную модель LLM для техподдержки

    Клиент (крупный ритейлер) заказал у IT-интегратора дообучение (fine-tuning) открытой языковой модели на своих внутренних регламентах. Договор был рамочным. После завершения работ интегратор заявил, что полученные веса модели принадлежат ему, и потребовал лицензионных отчислений за каждое использование бота. Мы доказали в ходе переговоров, что переработка модели производилась исключительно на данных заказчика и за его счет, что согласно ст. 1296 ГК РФ дает приоритет заказчику.

    Результат

    ai

    Взыскание убытков за перерасход облачных мощностей при обучении

    В договоре на обучение нейросети для генерации видео не был зафиксирован лимит бюджета на аренду GPU-кластера. Исполнитель не оптимизировал гиперпараметры, из-за чего обучение затянулось, а счет за облачные вычисления превысил смету в 4 раза (на 2 млн рублей). Заказчик отказался платить сверх сметы. Мы представляли интересы заказчика и через техническую экспертизу доказали, что перерасход возник из-за непрофессионализма исполнителя и ошибок в архитектуре.

    Результат

    Часто задаваемые вопросы

    Вопросы о юридическом сопровождении ML-разработки

    Кто несет ответственность, если нейросеть не обучилась до нужной точности?
    Зависит от договора. Если это договор подряда (работа на результат) и метрики были зафиксированы, отвечает исполнитель. Если договор возмездного оказания услуг (работа как процесс) — риски часто лежат на заказчике.
    Можно ли использовать открытые датасеты для коммерческого обучения?
    Нужно проверять лицензию каждого датасета. Многие данные (например, CC BY-NC) запрещены для коммерческого использования. Нарушение может привести к иску и запрету использования модели.
    Как защитить веса модели от кражи исполнителем?
    Помимо передачи прав в договоре, используйте технические средства защиты (шифрование, обфускация) и организационные меры (разграничение доступа, NDA с большими штрафами).

    Консультация юриста

    Заполните форму, и наш эксперт свяжется с вами для бесплатной консультации





      Нажимая кнопку, вы соглашаетесь с политикой конфиденциальности