Позови проти інструментів штучного інтелекту, створених компаніями Stability AI, Midjourney та DeviantArt
Було подано позов проти Stable Diffusion, інструменту для створення колажів 21-го століття, який порушує права художників, з причин, що штучний інтелект (ШІ) має бути справедливим та етичним для всіх.
Адже стурбованість порушенням прав ШІ від письменників, художників, програмістів та інших творців зростає щодня по світу. ШІ швидко навчається на величезній кількості творів, захищених авторським правом, без згоди авторів і без компенсацій за використання прав.
Від імені трьох позивачів-художників – Сари Андерсен, Келлі МакКернан і Карли Ортіс – подано колективний позов проти Stability AI, DeviantArt і Midjourney за використання Stable Diffusion, інструменту для створення колажів 21-го століття, який реміксує захищені авторським правом роботи мільйонів художників, чиї роботи були використані в якості навчальних даних.
Stable Diffusion – це програмний продукт штучного інтелекту (ШІ), випущений у серпні 2022 року компанією Stability AI. Stable Diffusion містить несанкціоновані копії мільйонів – і, можливо, мільярдів – захищених авторським правом зображень. Ці копії були зроблені без відома чи згоди авторів.
Навіть якщо припустити, що номінальна сума збитків становить 1 долар за зображення, вартість цього незаконного привласнення становитиме приблизно 5 мільярдів доларів. (Для порівняння, найбільшою крадіжкою творів мистецтва в історії була крадіжка 13 робіт з Музею Ізабелли Стюарт Гарднер у 1990 році, нині їхня вартість оцінюється в 500 мільйонів доларів).
Stable Diffusion належить до категорії систем штучного інтелекту, які називаються генеративним ШІ. Ці системи навчаються на певному типі творчих робіт – наприклад, тексті, програмному коді або зображеннях – а потім реміксують ці роботи, щоб отримати (або “згенерувати”) більше робіт такого ж типу.
Скопіювавши п’ять мільярдів зображень – без згоди авторів, – “Стабільна дифузія” використовує математичний процес дифузії для зберігання стислих копій цих навчальних зображень, які, в свою чергу, рекомбінуються для отримання інших зображень. Коротше кажучи, це інструмент для створення колажів 21-го століття.
Отримані зображення можуть зовні нагадувати або не нагадувати навчальні зображення. Тим не менш, вони отримані з копій навчальних зображень і конкурують з ними на ринку. Як мінімум, здатність Stable Diffusion наповнити ринок практично необмеженою кількістю зображень, що порушують авторські права, завдасть незворотної шкоди ринку мистецтва та митцям.
Навіть генеральний директор Stability AI Емад Мостак прогнозує, що “майбутні моделі (ШІ) будуть повністю ліцензованими”. Але Stable Diffusion – це не так. Це паразит, який, якщо йому дозволити розмножуватися, завдасть непоправної шкоди митцям зараз і в майбутньому.
Метод дифузії був винайдений у 2015 році дослідниками ШІ зі Стенфордського університету. На діаграмі нижче, взятій з дослідження Стенфордської команди, показано дві фази процесу дифузії з використанням навчальних даних у формі спіралі.
Перший етап дифузії полягає в тому, що ми беремо зображення (або інші дані) і поступово додаємо до нього більше візуального шуму в кілька кроків. (Цей процес зображено у верхньому рядку діаграми.) На кожному кроці ШІ фіксує, як додавання шуму змінює зображення. На останньому кроці зображення “розсіюється” в практично випадковому шумі.
Другий етап схожий на перший, але у зворотному порядку. (Цей процес зображено в нижньому рядку діаграми, який читається справа наліво). Зафіксувавши кроки, які перетворюють певне зображення на шум, ШІ може виконати ці кроки у зворотному порядку. Починаючи з випадкового шуму, ШІ застосовує кроки у зворотному порядку. Видаляючи шум (або “знешумлюючи”) дані, ШІ створює копію оригінального зображення.
На діаграмі реконструйована спіраль (червоним кольором) має деякі нечіткі частини в нижній половині, яких немає в оригінальній спіралі (синім кольором). Хоча червона спіраль є просто копією синьої спіралі, в комп’ютерній термінології вона називається копією з втратами, тобто деякі деталі втрачаються при перекладі. Це стосується численних форматів цифрових даних, зокрема MP3 і JPEG, які також створюють сильно стиснуті копії цифрових даних, опускаючи дрібні деталі.
Коротше кажучи, дифузія – це спосіб, за допомогою якого програма штучного інтелекту з’ясовує, як відновити копію навчальних даних за допомогою денойзинга. Оскільки це так, з точки зору авторського права це нічим не відрізняється від MP3 або JPEG – способу зберігання стислої копії певних цифрових даних.
Запамʼятайте назви компаній та сервісів, які ще не раз, на нашу думку, опиняться в центрі скандалів щодо порушення авторських прав, якщо не змінять своє ставлення та політику роботи алгоритмів. Все просто – поєднайте виплату роялті авторам та роботу ШІ і тоді це буде прекрасний приклад для поєднання та імплементації людського та штучного. Бо поки в основі винайдення твору стоїть автор.
Stability AI
Компанія Stability AI, заснована Емадом Мостаком, базується в Лондоні.
Stability AI фінансує LAION, німецьку організацію, яка створює дедалі більші набори даних зображень – без згоди чи компенсації оригінальним художникам – для використання компаніями, що займаються штучним інтелектом.
Stability AI є розробником Stable Diffusion. Stability AI навчила Stable Diffusion, використовуючи набір даних LAION. Stability AI також випустила платний додаток DreamStudio, який пакує Stable Diffusion у веб-інтерфейс.
DeviantArt
DeviantArt був заснований у 2000 році і вже давно став однією з найбільших спільнот художників в Інтернеті.
Як показали Саймон Віллісон та Енді Байо, тисячі, а можливо, й мільйони зображень у LAION були скопійовані з DeviantArt і використані для навчання Stable Diffusion.
Замість того, щоб стати на захист своєї спільноти художників, захистивши їх від навчання ШІ, DeviantArt вирішила випустити платний додаток DreamUp, побудований на основі Stable Diffusion. У свою чергу, потік мистецтва, створеного штучним інтелектом, заполонив DeviantArt, витіснивши художників-людей.
Коли в листопаді 2022 року під час сесії запитань і відповідей у прямому ефірі члени управлінської команди DeviantArt, включно з генеральним директором Моті Леві, не змогли пояснити, чому вони зрадили свою мистецьку спільноту, прийнявши Stable Diffusion, водночас навмисно порушивши власні умови надання послуг і політику конфіденційності.
Midjourney
Midjourney був заснований у 2021 році Девідом Хольцем у Сан-Франциско. Midjourney пропонує генератор текстових зображень через Discord та веб-додаток.
Хоча компанія позиціонує себе як “дослідницьку лабораторію”, Midjourney створила велику аудиторію платних клієнтів, які професійно використовують генератор зображень Midjourney. Хольц каже, що хоче, аби Midjourney “зосередилася на тому, щоб робити все красивим і мистецьким”.
З цією метою Хольц зізнався, що Midjourney навчається на “великому шматку інтернету”. Хоча, коли його запитали про етичність масового копіювання навчальних зображень, він відповів: «Не існує спеціальних законів щодо цього». А коли Хольца запитали, чи можна дозволити художникам відмовитися від навчання, він відповів: «Ми розглядаємо це питання. Зараз завдання полягає в тому, щоб з’ясувати, які правила існують».
Як же працює штучний інтелект?
У 2020 році дослідники з Каліфорнійського університету в Берклі вдосконалили метод дифузії двома способами:
Вони показали, як дифузійна модель може зберігати свої навчальні зображення в більш стислому форматі, не впливаючи на її здатність реконструювати високоточні копії. Ці стислі копії навчальних зображень відомі як латентні зображення.
Дослідники виявили, що ці латентні зображення можна інтерполювати – тобто, змішувати математично – для отримання нових похідних зображень.
Зображення в червоній рамці було інтерпольоване з двох “вихідних” зображень піксель за пікселем. Виглядає як два напівпрозорих зображення обличчя, накладених одне на одне, а не єдине переконливе обличчя.
Зображення в зеленій рамці було згенеровано по-іншому. У цьому випадку два вихідні зображення були стиснуті в латентні зображення. Після того, як ці латентні зображення були інтерпольовані, це нове інтерпольоване латентне зображення було реконструйовано в пікселі за допомогою процесу згладжування. Порівняно з попіксельною інтерполяцією, перевага очевидна: інтерполяція на основі латентних зображень виглядає як єдине переконливе людське обличчя, а не як накладання двох облич.
Незважаючи на різницю в результатах, з точки зору авторського права, ці два способи інтерполяції еквівалентні: вони обидва створюють похідні роботи шляхом інтерполяції двох вихідних зображень.
Вже в 2022 році дослідники з Мюнхена вдосконалили техніку дифузії. Вони з’ясували, як керувати процесом знебарвлення за допомогою додаткової інформації. Цей процес називається кондиціонуванням. (Один з цих дослідників, Робін Ромбах, зараз працює в Stability AI як розробник Stable Diffusion).
Найпоширенішим інструментом для навчання є короткі текстові описи, також відомі як текстові підказки, які описують елементи зображення, наприклад, “собака в бейсболці, який їсть морозиво”. Це породило домінуючий інтерфейс Stable Diffusion та інших генераторів зображень зі штучним інтелектом: перетворення текстової підказки на зображення.
Однак інтерфейс текстових підказок має й іншу мету. Він створює шар магічної дезорієнтації, яка ускладнює користувачам пошук очевидних копій навчальних зображень (хоча і не робить його неможливим). Проте, оскільки вся візуальна інформація в системі походить від захищених авторським правом навчальних зображень, створені зображення – незалежно від зовнішнього вигляду – обов’язково є творами, похідними від цих навчальних зображень.
Історії постраждалих авторів від штучного інтелекту

Зображення з публічного акаунту Сари Андерсен https://www.instagram.com/ sarahandersencomics/
Сара Андерсен
Сара Андерсен – карикатуристка та ілюстраторка. Закінчила Коледж мистецтв Мерілендського інституту у 2014 році. Зараз живе в Портленді, штат Орегон. Її напівавтобіографічний комікс “Карлючки Сари” (Sarah’s Scribbles) знаходить гумор у житті інтроверта. Її графічний роман FANGS був номінований на премію Айснера.
Сара також написала книгу “Alt-Right Manipulated My Comic” (“Права кнопка миші маніпулювала моїм коміксом”). Потім A.I. Claimed It for the New York Times.

Зображення з публічного акаунту Келлі МакКернан https://www.instagram.com/ kelly_mckernan/
Келлі МакКернан
Келлі МакКернан – незалежна художниця з Нешвіла. Вона закінчила Університет штату Кеннесоу в 2009 році і працює художницею на повну ставку з 2012 року. Келлі створює оригінальні картини аквареллю та акриловою гуашшю для галерей, приватних замовлень та інтернет-магазину. Крім того, що Келлі має велику кількість прихильників у соціальних мережах, вона ділиться навчальними матеріалами та проводить майстер-класи, подорожує по США для участі у заходах та комікс-конвенціях, а також створює ілюстрації для книг, коміксів, ігор тощо.

Ultimum, 30х40, олія, Chimerical, Spoke Art Gallery, 2016 http://www.karlaortizart.com/fine-art/
Карла Ортіс
Карла Ортіс – пуерториканська художниця, всесвітньо визнана та відзначена багатьма нагородами. Завдяки своєму винятковому дизайнерському чуттю, реалістичному рендерингу та персонажним оповіданням, Карла брала участь у багатьох великобюджетних проектах у кіно, телебаченні та індустрії відеоігор. Карла також є постійним ілюстратором для великих видавництв і компаній, що займаються рольовими іграми.
Фігуративне та загадкове мистецтво Карли було представлене у таких відомих галереях, як Spoke Art та Hashimoto Contemporary у Сан-Франциско, Nucleus Gallery, Thinkspace та Maxwell Alexander Gallery у Лос-Анджелесі, а також Galerie Arludik у Парижі. Зараз вона живе в Сан-Франциско зі своїм котом Баді.
інтелектуальна власність / авторське право / позов / штучний інтелект



