ШІ – допомога чи піратство? Позови до OpenAI та Meta

На початку 2023 року ChatGPT став найбільш швидкозростаючим споживчим додатком в історії, досягнувши 100 мільйонів щомісячних активних користувачів у січні, перш ніж був витіснений додатком Threads від Meta.

Але, як показує практика, зі зростанням ШІ зростає і кількість позовів від творчої спільноти проти його «великої мовної моделі» – LLaMA  (Large Language Model Meta AI) – це програмне забезпечення ШІ, призначене для створення переконливо органічного та грамотного тексту у відповідь на запити користувача.

«Замість того, щоб програмуватися традиційним способом (інженерами, які створюють тисячі сторінок коду), велика мовна модель «тренується» шляхом копіювання величезних обсягів тексту і вилучення з нього виразної інформації. Текст називається навчальним набором даних», – пояснюється в позові, поданому до Окружного суду Північного округу Каліфорнії, де розташована материнська компанія Facebook.

Сара Сільверман, Крістофер Голден та Річард Кадрі проти  OpenAI та Meta

Meta випустила LLaMA у лютому 2023 року. А вже влітку 2023 року комік Сара Сільверман, а також автори Крістофер Голден і Річард Кадрі, які приєдналися до Сари, подали до окружного суду США позови на Meta та  OpenAI (американська науково-дослідна організація, що займається розробками в галузі штучного інтелекту) за подвійним звинуваченням у порушенні авторських прав.

У позовах стверджується, серед іншого, що ChatGPT від OpenAI і LLaMA від Meta навчалися на незаконно отриманих наборах даних, що містять твори цих авторів, які, за їхніми словами, були придбані на сайтах «тіньових бібліотек», таких як Bibliotik, Library Genesis, Z-Library та інших, зазначаючи, що ці книги «доступні в масовому порядку через торрент-системи».

У позові до OpenAI тріо авторів (Сільверман, Голден і Кадрі) пропонує докази того, що за запитом ChatGPT узагальнює їхні книги, порушуючи їхні авторські права. Першою книгою, яка була підсумована ChatGPT, стала «Бедвотер» Сільверман, а також книга Голдена «Арарат» і книга Кадрі «Пісочна людина Слім», які також були використані як приклад. У позові йдеться про те, що чат-бот ніколи не намагався «відтворити будь-яку інформацію щодо власників авторських прав, яку позивачі включили до своїх опублікованих творів”.

Що стосується окремого позову проти Meta, то в ньому стверджується, що книги авторів були доступні в наборах даних, які Meta використовувала для навчання своїх моделей LLaMA – квартету моделей ШІ з відкритим вихідним кодом, які компанія представила в лютому 2023 року.

У позові поетапно викладено, чому позивачі вважають, що набори даних мають незаконне походження – у документі Meta, що описує LLaMA, компанія вказує на джерела своїх навчальних наборів даних, один з яких називається ThePile, зібраний компанією під назвою EleutherAI. У позов зазначається, що ThePile був описаний в документі EleutherAI як зібраний з «копії вмісту приватного трекера Bibliotik». Bibliotik та інші перелічені «тіньові бібліотеки», йдеться в позові, є «кричуще незаконними».

В обох позовах автори стверджують, що вони «не давали згоди на використання їхніх захищених авторським правом книг як навчального матеріалу» для моделей ШІ компаній. Їхні позови містять по шість пунктів різних видів порушень авторських прав, недбалості, неправомірного збагачення та недобросовісної конкуренції. Серед інших вимог авторів, основними є відшкодування збитків та повернення прибутку.

На слуханні по справі Сари Сільверман у листопаді 2023 року федеральний суддя заявив, що відхилить частину позову, поданого групою авторів, включаючи коміка Сару Сільверман, які стверджують, що додаток Meta’s LLaMA AI порушує їхні авторські права.

Суддя Вінс Чхабрія заявив, що твердження авторів про те, що текст, згенерований LLaMA, порушує їхні авторські права, просто не витримує критики. «Коли я роблю запит до LLaMA, я не прошу копію книги Сари Сільверман – я навіть не прошу уривок», – зауважив Чхабрія, зазначивши, що, згідно з теорією авторів, порівняння тексту, згенерованого ШІ-додатком, і книги Сільверман мало б показати їхню схожість.

Однак, суддя сказав, що не відхилить справу з упередженням, тобто авторам буде дозволено змінити та повторно подати свої позови. Більше того, основна претензія позову – те, що використання Meta неавторизованих копій для навчання своєї моделі ШІ є правопорушенням – залишається.

Група авторів проти OpenAI

Слідом за Сарою Сільверман, Крістофером Голденом та Річардом Кадрі, інша  група авторів зі Сполучених Штатів, включаючи лауреата Пулітцерівської премії Майкла Чабона, подала позов проти OpenAI до федерального суду в Сан-Франциско, звинувативши програму, яку підтримує Microsoft, у неправомірному використанні їхніх творів для навчання популярного чат-бота на основі ШІ ChatGPT.

Чабон, драматург Девід Генрі Хван і автори Метью Клам, Рейчел Луїза Снайдер і Айєлет Вальдман заявили у своєму позові у вересні 2023 року, що OpenAI скопіювала їхні твори без дозволу, щоб навчити ChatGPT відповідати на текстові підказки людини.

Цей позов є щонайменше третім запропонованим колективним позовом про порушення авторських прав, поданим авторами проти OpenAI, що підтримується Microsoft.

На компанії, включаючи Microsoft, Meta Platforms і Stability AI, також подавали позови власники авторських прав через використання їхніх робіт у навчанні ШІ.

У новому позові з Сан-Франциско йдеться про те, що такі твори, як книги, п’єси і статті, є особливо цінними для навчання в ChatGPT як «найкращі приклади високоякісного, розгорнутого письма».

Позивачі мають авторські права на свої книги і письмові роботи, і ніколи не давали згоди на їх використання в якості навчальних матеріалів для LLaMA.

Твори Чабона («Чудо-хлопчики», «Дивовижні пригоди Кавалера та Клея», «Спілка поліцейських на їдиші»), Хвана («М. Метелик», «Чінліш», «Жовте обличчя», «Золоте дитя») та твори інших позивачів «містять інформацію про управління авторськими правами, яка надає відомості про твір, захищений авторським правом, включаючи назву твору, його ISBN або реєстраційний номер авторського права, ім’я автора та рік публікації», – як зазначається у позові.

Позови проти ШІ тільки набирають обертів

У всіх цих позовах висуваються схожі заяви: ШІ може «генерувати текст у стилі певного автора» або «забезпечувати поглиблений аналіз» книг авторів лише тому, що книги були «скопійовані» без дозволу авторів як частину їхніх «навчальних даних», як зазначено у скарзі Open AI. Ці дані містять копії, нібито зібрані з сумнозвісних піратських сайтів.

Рішення про відхилення деяких вищевказаних позовів авторів було прийнято після того, як інший федеральний суддя відхилив аналогічні вимоги за позовом групи художників  проти компаній Stability AI, Midjourney і Deviant Art (про це читайте нашу статтю «Штучний інтелект: що з правами та захистом?» – https://kopirait.com.ua/3784-2/), які займаються розробкою ШІ. Суддя Вільям Оррік заявив, що він «не впевнений, що звинувачення, засновані на результатах роботи систем, можуть витримати без доказів того, що зображення були суттєво схожі на роботи художників».

Подібні позови – це не просто головний біль для OpenAI, Meta та інших ШІ-компаній; вони ставлять під сумнів самі межі авторського права. Щоразу, коли хтось зачіпає тему авторського права, ми будемо бачити судові позови, зосереджені навколо цього питання, ще багато років поспіль, допоки не тільки міжнародне право, але й локальні закони в кожній країні світу не врегулюють відповідні питання використання результатів інтелектуальної власності засобами ШІ.

/ / / / /

X