новости

OpenAI представила новую нейросеть Sora. Она генерирует видео по текстовому запросу Выглядит очень даже реалистично! Разве что кроме пингвинов на велосипедах

Источник: OpenAI

Компания OpenAI представила нейросеть Sora, которая может по текстовому запросу создавать «реалистичные» и «креативные» ролики. 

«Sora способна создавать сложные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона. Модель [искусственного интеллекта] понимает не только то, что пользователь указал в запросе, но и то, как эти вещи существуют в физическом мире», — говорится в пресс-релизе компании. 

Запрос: «Красивый, заснеженный Токио. Камера движется по оживленной городской улице, следя за несколькими людьми, наслаждающимися прекрасной снежной погодой. Лепестки сакуры летят по ветру вместе со снежинками».

В OpenAI уточнили, что сейчас нейросеть может создавать ролики продолжительностью до минуты. Помимо этого, она может генерировать видео из статичных изображений, а также заполнять недостающие кадры в существующих роликах или расширять их.

Запрос: «Несколько гигантских мамонтов приближаются, шагая по снегу. Их длинная шерсть слегка качается, когда они идут. Заснеженные деревья и горы вдалеке, полуденный свет с небольшими облаками и солнцем создают теплое свечение».

При этом в компании отметили, что у нынешней версии Sora есть «слабые места». В частности, в некоторых случаях нейросеть может не прослеживать причинно-следственную связь. Например, в сгенерированном ролике человека, который ест печенье, на самом печенье не останется следов от укусов. 

Пока Sora недоступна для широкого круга пользователей, но разработчики предоставили доступ к нейросети некоторым специалистам из разных областей, в том числе экспертам по вопросам дезинформации и кибербезопасности. Также в компании уточнили, что занимаются разработкой инструментов, которые будут ограничивать пользователей в создании контента, нарушающего политику компании, и позволят определять, что ролик был сгенерирован нейросетью. 

Запрос: «Стильная женщина идет по улице Токио, наполненной теплым светом неоновых и анимированных вывесок. Она одета в черную кожаную куртку, длинное красное платье, черные ботинки. На ней солнцезащитные очки и красная помада. Она идет уверенно и непринужденно. Улица влажная и отражает свет. Много пешеходов вокруг».

К тестированию своей нейросети OpenAI также привлекла художников, дизайнеров и режиссеров, чтобы с помощью их отзывов усовершенствовать модель для ее использования в профессиональных целях. 

Помимо этого, компания планирует привлечь к развитию Sora политиков, преподавателей и художников по всему миру, чтобы узнать их мнение о новой технологии и определить варианты ее использования.

«Несмотря на обширные исследования и испытания, мы не можем предсказать все полезные способы использования нашей технологии, а также все способы, которыми люди будут ей злоупотреблять. Вот почему мы считаем, что обучение на примере реального использования является важнейшим компонентом создания и выпуска все более безопасных систем искусственного интеллекта», —добавили в OpenAI.

Запрос: «В анимационной сцене крупным планом показан невысокий пушистый монстр возле тающей красной свечи. Художественный стиль трехмерный и реалистичный с упором на освещение и текстуру. Настроение картины — удивление и любопытство. Использование теплых цветов еще больше усиливает уютную атмосферу изображения».

Когда Sora появится в общем доступе, неизвестно. Но пользователи Х уже выкладывают ролики, сгенерированные нейросетью — OpenAI опубликовала их в своем техническом отчете. Помимо очень реалистичных видео с людьми, домашними питомцами и пейзажами, пользователи обратили внимание, например, на ролики с пингвинами на велосипедах и хомяком на утке-драконе.

Их публикует глава OpenAI Сэм Альтман по запросам пользователей.

Также пользователи Х шутят, что Sora пока не удаются стулья из-за видео, сгенерированного по запросу: «археологи обнаруживают в пустыне обычный пластиковый стул, раскапывают и отчищают его с большой осторожностью». В ролике нейросеть не сразу смоделировала стул, как твердый объект, что привело к ошибкам.

Magic link? Это волшебная ссылка: она открывает лайт-версию материала. Ее можно отправить тому, у кого «Медуза» заблокирована, — и все откроется! Будьте осторожны: «Медуза» в РФ — «нежелательная» организация. Не посылайте наши статьи людям, которым вы не доверяете.