В начале 2023 года ChatGPT стал самым быстрорастущим потребительским приложением в истории, достигнув 100 миллионов ежемесячных активных пользователей в январе, прежде чем был вытеснен приложением Threads от Meta.
Но, как показывает практика, с ростом ИИ растет и количество исков от творческого сообщества против его «большой языковой модели» — LLaMA (Large Language Model Meta AI) — это программное обеспечение ИИ, предназначенное для создания убедительно органичного и грамотного текста в ответ на запросы пользователя.
«Вместо того, чтобы программироваться традиционным способом (инженерами, которые создают тысячи страниц кода), большая языковая модель «тренируется» путем копирования огромных объемов текста и извлечения из него выразительной информации. Текст называется учебным набором данных», — поясняется в иске, поданном в Окружной суд Северного округа Калифорнии, где расположена материнская компания Facebook.
Сара Сильверман, Кристофер Голден и Ричард Кадри против OpenAI и Meta
Meta выпустила LLaMA в феврале 2023 года. А уже летом 2023 года комик Сара Сильверман, а также присоединившиеся к Саре авторы Кристофер Голден и Ричард Кадри подали в окружной суд США иски на Meta и OpenAI (американская научно-исследовательская организация, занимающаяся разработками в области искусственного интеллекта) по двойному обвинению в нарушении авторских прав.
В исках утверждается, среди прочего, что ChatGPT от OpenAI и LLaMA от Meta обучались на незаконно полученных наборах данных, содержащих произведения этих авторов, которые, по их словам, были приобретены на сайтах «теневых библиотек», таких как Bibliotik, Library Genesis, Z-Library и других, отмечая, что эти книги «доступны в массовом порядке через торрент-системы».
В иске к OpenAI трио авторов (Сильверман, Голден и Кадри) предлагает доказательства того, что по запросу ChatGPT обобщает их книги, нарушая их авторские права. Первой книгой, которая была обобщена ChatGPT, стала «Бедвотер» Сильверман, а также книга Голдена «Арарат» и книга Кадри «Песочный человек Слим», которые также были использованы в качестве примера. В иске говорится о том, что чат-бот никогда не пытался «воспроизвести любую информацию относительно владельцев авторских прав, которую истцы включили в свои опубликованные произведения».
Что касается отдельного иска против Meta, то в нем утверждается, что книги авторов были доступны в наборах данных, которые Meta использовала для обучения своих моделей LLaMA — квартета моделей ИИ с открытым исходным кодом, которые компания представила в феврале 2023 года.
В иске поэтапно изложено, почему истцы считают, что наборы данных имеют незаконное происхождение — в документе Meta, описывающем LLaMA, компания указывает на источники своих учебных наборов данных, один из которых называется ThePile, собранный компанией под названием EleutherAI. В иске отмечается, что ThePile был описан в документе EleutherAI как собранный из «копии содержимого частного трекера Bibliotik». Bibliotik и другие перечисленные «теневые библиотеки», говорится в иске, являются «вопиюще незаконными».
В обоих исках авторы утверждают, что они «не давали согласия на использование их защищенных авторским правом книг в качестве учебного материала» для моделей ИИ компаний. Их иски содержат по шесть пунктов различных видов нарушений авторских прав, халатности, неправомерного обогащения и недобросовестной конкуренции. Среди других требований авторов, основными являются возмещение убытков и возврат прибыли.
На слушании по делу Сары Сильверман в ноябре 2023 года федеральный судья заявил, что отклонит часть иска, поданного группой авторов, включая комика Сару Сильверман, которые утверждают, что приложение Meta’s LLaMA AI нарушает их авторские права.
Судья Винс Чхабрия заявил, что утверждение авторов о том, что текст, сгенерированный LLaMA, нарушает их авторские права, просто не выдерживает критики. «Когда я делаю запрос к LLaMA, я не прошу копию книги Сары Сильверман — я даже не прошу отрывок», — заметил Чхабрия, отметив, что, согласно теории авторов, сравнение текста, сгенерированного ИИ-приложением, и книги Сильверман должно было бы показать их сходство.
Однако, судья сказал, что не отклонит дело с предубеждением, то есть авторам будет разрешено изменить и повторно подать свои иски. Более того, основная претензия иска — то, что использование Meta неавторизованных копий для обучения своей модели ИИ является правонарушением — остается.
Группа авторов против OpenAI
Вслед за Сарой Сильверман, Кристофером Голденом и Ричардом Кадри, другая группа авторов из Соединенных Штатов, включая лауреата Пулитцеровской премии Майкла Чабона, подала иск против OpenAI в федеральный суд в Сан-Франциско, обвинив программу, которую поддерживает Microsoft, в неправомерном использовании их произведений для обучения популярного чат-бота на основе ИИ ChatGPT.
Чабон, драматург Дэвид Генри Хван и авторы Мэтью Клам, Рэйчел Луиза Снайдер и Айелет Вальдман заявили в своем иске в сентябре 2023 года, что OpenAI скопировала их произведения без разрешения, чтобы научить ChatGPT отвечать на текстовые подсказки человека.
Этот иск является по меньшей мере третьим предложенным коллективным иском о нарушении авторских прав, поданным авторами против OpenAI, поддерживаемым Microsoft.
На компании, включая Microsoft, Meta Platforms и Stability AI, также подавали иски владельцы авторских прав из-за использования их работ в обучении ИИ.
В новом иске из Сан-Франциско говорится, что такие произведения, как книги, пьесы и статьи, являются особенно ценными для обучения в ChatGPT как «лучшие примеры высококачественного, развернутого письма».
Истцы имеют авторские права на свои книги и письменные работы, и никогда не давали согласия на их использование в качестве учебных материалов для LLaMA.
Произведения Чабона («Чудо-мальчики», «Удивительные приключения Кавалера и Клея», «Союз полицейских на идише»), Хвана («М. Бабочка», «Чинлиш», «Желтое лицо», «Золотое дитя») и произведения других истцов «содержат информацию об управлении авторскими правами, которая предоставляет сведения о произведении, защищенном авторским правом, включая название произведения, его ISBN или регистрационный номер авторского права, имя автора и год публикации», — как отмечается в иске.
Иски против ИИ только набирают обороты
Во всех этих исках выдвигаются похожие заявления: ИИ может «генерировать текст в стиле определенного автора» или «обеспечивать углубленный анализ» книг авторов только потому, что книги были «скопированы» без разрешения авторов как часть их «учебных данных», как указано в жалобе Open AI. Эти данные содержат копии, якобы собранные с печально известных пиратских сайтов.
Решение об отклонении некоторых вышеуказанных исков авторов было принято после того, как другой федеральный судья отклонил аналогичные требования по иску группы художников против компаний Stability AI, Midjourney и Deviant Art (об этом читайте нашу статью «Искусственный интеллект: что с правами и защитой?» — https://kopirait.com.ua/3784-2/), которые занимаются разработкой ИИ. Судья Уильям Оррик заявил, что он «не уверен, что обвинения, основанные на результатах работы систем, могут выдержать без доказательств того, что изображения были существенно похожи на работы художников».
Подобные иски — это не просто головная боль для OpenAI, Meta и других ИИ-компаний; они ставят под сомнение сами границы авторского права. Каждый раз, когда кто-то затрагивает тему авторского права, мы будем видеть судебные иски, сосредоточенные вокруг этого вопроса, еще много лет подряд, пока не только международное право, но и локальные законы в каждой стране мира не урегулируют соответствующие вопросы использования результатов интеллектуальной собственности средствами ИИ.
Meta / OpenAI / авторское право / интеллектуальная собственность / иски / искусственный интеллект



