Прозрачное обучение генеративного ИИ: кто будет в выигрыше?

...

Последние поправки к законопроекту о регулировании ИИ обязывают разработчиков раскрывать охраняемые авторским правом материалы, которые используются при обучении моделей генеративного искусственного интеллекта. С одной стороны, это означает для них дополнительную нагрузку, но с другой — значительно снижает некоторые риски.

Риски создания генеративного ИИ
Обязанность раскрывать материалы
Дополнительные меры
Альтернатива

Риски создания генеративного ИИ

В последние годы алгоритмы генеративного искусственного интеллекта приобрели широкую популярность по всему миру. Яркий пример — ChatGPT. За несколько месяцев 2023 года посещаемость сайта компании Open AI, разработавшей этот чат-бот, выросла в 36 раз, с 16 до 667 миллионов посетителей в месяц.

Для обучения нейросетей используются материалы, охраняемые авторским правом. Использовать информацию, которая находится в свободном доступе, разработчики могут довольно редко. Это неудивительно, так как зачастую она содержится в устаревших источниках — общественным достоянием творчество автора становится только по прошествии 70 лет после его смерти.

Признание действий разработчика с материалами, которые охраняются авторским правом, незаконным использованием интеллектуальной собственности в соответствии со статьей 1270 гражданского кодекса РФ, означает для организации существенные риски.

Компанию могут обязать к выплате компенсации в размере до 5 млн рублей по статье 1301 гражданского кодекса РФ, или привлечь к уголовной ответственности ее представителей путем лишения свободы на срок до 6 лет по статье 146 уголовного кодекса РФ.

Количество, исков, поданных авторами в отношении разработчиков нейросетей, сегодня активно растет. Широкую огласку, к примеру, получили иски фотостока Getty Images к Stability AI (Stable Diffusion), а также иски трех художников к Stability AI, DeviantArt Inc и Midjourney.

Правомерно использовать объект интеллектуальной собственности организации могут только с согласия авторов. Это далеко не всегда возможно даже при использовании одного объекта компанией. Когда же нейросети используют тысячи таких объектов, запрашивать разрешение на их использование нереально в принципе.

В англо-саксонском праве сегодня существует так называемая "Доктрина добросовестного применения". Свободное использование предусматривает и российское право. Однако в данном случае применять объекты интеллектуальной собственности можно только в научных целях - коммерческого использование исключается.

Обязанность раскрывать материалы

Созданием законопроекта о регулировании ИИ Еврокомиссия начала заниматься в 2021 году. Как сообщает ИА Reuters, в апреле этого года от некоторых разработчиков документа поступило предложение дополнить его таким образом, чтобы обязать компании раскрывать защищенные авторским правом материалы, которые используются ими для обучения нейросетей. Данная инициатива объясняется стремлением Европарламента установить баланс между правами авторов и развитием нейросетей.

"Раскрытие материалов, использованных для обучения нейросети, позволит сделать их работу более прозрачной, раскрывая, к примеру, факты использования объектов интеллектуальной собственности, которые уже не охраняются авторским правом или используются с согласия автора", — считает Софья Шарыпова, юрисконсульт практики интеллектуальной собственности юридической компании ЭБР.

Другие разработчики законопроекта предлагали полностью запретить использование материалов для обучения нейросетей, но от этой идеи было решено отказаться, сообщает ИА Reuters. Это представляется разумным шагом со стороны Еврокомиссии, так как введение данного запрета негативно сказалось бы на развитии генеративного ИИ.

"После его принятия разработчики стали бы обучать модели генеративного ИИ при помощи устаревших материалов. Это позволило бы им создавать только "старомодный" ИИ, отстающий в развитии и не учитывающий данные за последние 70 лет. Продукт скорее напоминал бы слепок разума из прошлого века, нежели на передовую умную машину будущего", — пояснил Павел Катков, юрист, экономист, член Комитета ТПП РФ по предпринимательству в сфере медиакоммуникаций.

Дополнительные меры

Дополнительным стимулом раскрывать материалы, используемые для обучения нейросетей, для разработчиков выступит принятие федеральных законов.

"В будущем целесообразно принять международное соглашение. Учитывая современные реалии, вряд ли это будет уровень ООН, но на уровне БРИКС, ЕАЭС, ЕС это вполне возможно и выполнимо", — отмечает Павел Катков.

Также необходимо, чтобы разработчики начали выплачивать авторские отчисления авторам объектов интеллектуальной собственности, на которых обучается нейросеть. Компания Nvidia, например, уже планирует платить авторам изображений, лицензируемых Getty Image и Adobe.

Альтернатива

Стоит отметить, что законопроект о регулировании ИИ — не единственный способ направить развитие нейросетей в нужное русло. Не менее эффективным инструментом видится свод требований и рекомендаций к разработчикам. Ориентируясь на них, компании будут стремиться в некоторых случаях обучать нейросети на объектах интеллектуальной собственности, срок охраны авторскими правами у которых истек.

"Этим сегодня уже занимается Adobe. Компания использует для функции "Светлячок" модель, обучавшуюся на изображениях, которые уже не охраняются авторским правом", — отметила Софья Шарыпова.

Полезные ссылки:

ИИ в правосудии: новые возможности и риски

Откуда взялось открытое письмо разработчикам GPT-4+

Искусственный интеллект как защита: использование машинного обучения для обеспечения безопасности компании