истории

Cоцсети завалило изображениями в стиле мультфильмов студии Ghibli. Их создал новый генератор картинок OpenAI Однако самому Миядзаки они, скорее всего, не понравятся. Да и вообще, к этичности новой системы есть много вопросов

16:53, 27 марта 2025

Источник: Meduza

25 марта 2025 года компания OpenAI объявила, что встроила продвинутый генератор изображений прямо в модель GPT-4o. До этого система перенаправляла соответствующие запросы другой своей ИИ-модели DALL-E. Довольно быстро пользователи обнаружили, что теперь с помощью GPT-4o можно не только генерировать изображения по запросу, но и обрабатывать фотографии в определенном стиле. Например, делать их похожими на кадры из мультфильмов японской студии Ghibli — именно таких картинок они сгенерировали больше всего на текущий момент. При этом в компании не раскрывают, на каких именно данных тренировали свою ИИ-модель. Из-за чего в очередной раз встал вопрос об этичности использования работ, защищенных авторским правом, при обучении нейросетей.

В анонсе OpenAI подчеркивает практическую пользу нового инструмента. По словам разработчиков, теперь ИИ может не просто генерировать тематические иллюстрации, но также учитывать множество пожеланий пользователей, придавая изображению дополнительный смысл. Кроме того, GPT-4o может добавлять конкретный текст на изображение (например, надписи на футболках, дорожных знаках), делая его более реалистичным и осмысленным.

OpenAI 4o Image Generation

OpenAI

У нового инструмента действительно много способов применения. Например, пользователи уже генерируют с его помощью стикеры, обложки для видео на ютьюбе, рекламные постеры и макеты сайтов. Кроме того, GPT-4o справляется и с обычной обработкой изображений — убирает лишние элементы с фото (или, наоборот, добавляет что-то новое), а также редактирует отдельные части картинки.

Но в соцсетях завирусилась другая функция, которую теперь может выполнять чат-бот OpenAI, а именно стилизация фотографий. В результате они становятся похожими на кадры из мультфильмов японской анимационной студии Ghibli. За сутки пользователи сгенерировали сотни подобных изображений, «скармливая» искусственному интеллекту все подряд, от фото из личных архивов и кадров из фильмов до изображений известных людей и популярных мемов.

Ставший мемом турецкий стрелок Юсуф Дикеч на летних Олимпийских играх в Париже

Скриншот из трансляции / Olympics 2024

Изображение, которое сгенерировал пользователь heyBarsee с помощью GPT-4o

Илон Маск на предвыборном митинге Дональда Трампа в Пенсильвании. 5 октября 2024 года

Evan Vucci / AP / Scanpix / LETA

Изображение, которое сгенерировал пользователь TheJasonRink с помощью GPT-4o

Стилизация под мультфильмы Хаяо Миядзаки наиболее популярная, но не единственная, которую может выполнить GPT-4o. Например, система может адаптировать изображение, сделав его похожим на кадр из мультфильма Pixar, анимационного сериала «Южный Парк» или шоу «Маппеты». В последних двух случаях популярной стала стилизация фото с переговоров Дональда Трампа и Владимира Зеленского.

Новая функция оказалась настолько востребованной, что Open AI даже пришлось отложить ее запуск для пользователей, у которых нет платной подписки. При этом глава компании Сэм Альтман поддержал вирусный тренд, сменив аватарку в соцсети икс на стилизованную, — теперь он тоже похож на персонажа мультфильма Ghibli. Даже Илон Маск, которому принадлежит конкурирующий чат-бот Grok, не остался в стороне от всеобщего увлечения и прорекламировал свой DOGE, хотя в последние годы он часто критикует OpenAI.

При этом Grok, у которого с самого начала не было почти никаких ограничений, тоже справляется с такой обработкой изображений, хотя и заметно хуже. Стиль студии Ghibli угадывается, а вот переделать Трампа и Зеленского в героев «Южного Парка» искусственному интеллекту уже не под силу.

Чат-бот Grok справился с запросом «Медузы» стилизовать фото с переговоров Трампа и Зеленского под мультфильм Миядзаки. Но сделал это хуже GPT-4o

А вот просьбу «Медузы» обработать то же фото и превратить политиков в героев «Южного Парка» Grok выполнить не смог

Новые возможности искусственного интеллекта вновь подняли дискуссию о том, на каких материалах обучают современные модели и есть ли хоть какой-то способ защитить свое творчество от ИИ. Юрист по вопросам интеллектуальной собственности фирмы Neal & McDevitt Эван Браун напомнил о существовании правовой «серой зоны», в которой на данный момент находятся компании, занимающиеся подобными разработками. По его словам, формально OpenAI не нарушает закон, так как понятие «стиля» не защищено авторским правом.

В этом есть определенная логика, ведь другие аниматоры, работающие в стиле, схожем с мультфильмами Ghibli, тоже не нарушают закон. Яркий пример — японский режиссер Хиромаса Ёнэбаяси, наиболее известный по анимационному фильму «Воспоминания о Марни», номинированному на «Оскар» в 2016 году. Он проработал в Ghibli около 18 лет и принимал участие в создании многих известных анимационных проектов. После того как Ёнэбаяси уволился, он продолжил снимать фильмы в составе новой студии в привычном для себя стиле. Визуально они очень похожи на работы Ghibli.

Однако, отмечает Эван Браун, остается открытым вопрос, как именно OpenAI добилась такого сходства генерируемых изображений с мультфильмами Хаяо Миядзаки. Если Ёнэбаяси вырабатывал этот стиль годами непосредственно в студии, то искусственный интеллект, вероятнее всего, просто тренировали на чужих работах. Учитывая качество генерируемых картинок, в процессе обучения вероятнее всего использовали датасет с миллионами кадров непосредственно из фильмов Ghibli (судя по стилю — более поздних).

Так выглядели бы Юра Борисов и Марк Эйдельштейн, если бы были героями мультфильма Ghibli. Само фото тоже породило множество мемов

Сами разработчики OpenAI не раскрывают, на каких данных тренировали новый генератор картинок. В анонсе лишь отмечается, что обучение проходило на изображениях, «отражающих огромное разнообразие стилей». В комментарии для TechCrunch представитель OpenAI добавил, что, хотя ChatGPT не копирует «стиль отдельных ныне живущих художников», чат-боту все же позволено воспроизводить «более широкие студийные стили».

Существование правовой «серой зоны» признавало и издание 404 Media в расследовании о компании Nvidia, которая, вероятно, нелегально использовала видео с YouTube, Netflix и других платформ для обучения своего ИИ. Журналисты отмечали, что сейчас нет юридического прецедента или закона, который определил бы требования к использованию данных для машинного обучения. Однако на рассмотрении уже находится несколько исков к крупным компаниям, которые занимаются разработкой ИИ (в том числе OpenAI, Midjourney и другим). Но решений по ним еще не вынесено.

Мэттью Макконахи в образе Раста Коула из первого сезона сериала «Настоящий детектив»

Один из символов окончания Второй мировой войны — фото «Поцелуй на Таймс-сквер», сделанное 14 августа 1945 года в Нью-Йорке, после обработки GPT-4o

Редактор «Медузы» и автор телеграм-канала «Плот» Антон Хитров обращает внимание и на проблематику художественной ценности подобных работ:

Изображения, сгенерированные ИИ, очевидно, требуют серьезного искусствоведческого анализа. Точнее, даже не сами изображения по отдельности, а феномен в целом. Почему многие люди чувствуют фрустрацию, глядя на ИИ-картинки? Мы могли убедиться в этом, например, когда российское издание последней книги о Ведьмаке вышло со сгенерированной обложкой. Дело не только в опасностях, которые ИИ создает для профессиональных художников. В искусстве мы воспринимаем не только то, что непосредственно доступно нашим чувствам, но и контекст.

Это особенно актуально для современного искусства, но и для более традиционных вещей тоже справедливо — хотя принято думать, что они-то, в отличие от условного Марселя Дюшана, «говорят сами за себя». Нет, не говорят. К примеру, если мы видим детализированный рисунок, нам на самом деле важно знать, что его создал человек, такой же, как мы, что он приложил усилия и принял множество маленьких творческих решений.

Сами по себе детали рисунка — ничто, если они не дают нам этого заочного контакта с автором. Возможно, глядя на ИИ-картинки, которые имитируют мультфильмы Миядзаки, мы научимся сильнее ценить самого Миядзаки — даже если копия по виду будет неотличима от оригинала.

С другой стороны, говоря об ИИ и искусстве, стоит помнить: не было такой технологии, с которой художники не научились бы в конце концов работать осмысленно. Возможно, к ИИ такой подход пока не найден. Опыты профессиональных художников в этой области сегодня в основном скорее проходят по разряду декоративного, развлекательного искусства. Но и кино, и фотография не сразу стали искусством в полном смысле этого слова.

В студии Ghibli пока не отреагировали на новую разработку OpenAI. Однако журналисты напоминают, что Хаяо Миядзаки негативно относится к работам, созданным с использованием искусственного интеллекта. В документальном фильме 2016 года есть эпизод, когда режиссеру показали технологию анимации зомби с помощью ИИ. Миядзаки отреагировал с отвращением и сказал, что никогда бы не использовал ее в своей работе. Правда, не до конца понятно, что больше возмутило режиссера — сам факт использования ИИ или же то, что разработчики выбрали именно зомби для демонстрации.

Подробнее о скандале с обучением ИИ Nvidia

Nvidia решила скачать весь ютьюб для обучения ИИ. Каждый день компания выгружала с платформы ролики общей продолжительностью 80 лет Разрешения на это никто не давал

8 месяцев назад

Подробнее о скандале с обучением ИИ Nvidia

Nvidia решила скачать весь ютьюб для обучения ИИ. Каждый день компания выгружала с платформы ролики общей продолжительностью 80 лет Разрешения на это никто не давал

8 месяцев назад

Михаил Герасимов, Антон Хитров