Компания OpenAI представила нейросеть Sora, которая может по текстовому запросу создавать «реалистичные» и «креативные» ролики.
«Sora способна создавать сложные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона. Модель [искусственного интеллекта] понимает не только то, что пользователь указал в запросе, но и то, как эти вещи существуют в физическом мире», — говорится в пресс-релизе компании.
Запрос: «Красивый, заснеженный Токио. Камера движется по оживленной городской улице, следя за несколькими людьми, наслаждающимися прекрасной снежной погодой. Лепестки сакуры летят по ветру вместе со снежинками».
В OpenAI уточнили, что сейчас нейросеть может создавать ролики продолжительностью до минуты. Помимо этого, она может генерировать видео из статичных изображений, а также заполнять недостающие кадры в существующих роликах или расширять их.
Запрос: «Несколько гигантских мамонтов приближаются, шагая по снегу. Их длинная шерсть слегка качается, когда они идут. Заснеженные деревья и горы вдалеке, полуденный свет с небольшими облаками и солнцем создают теплое свечение».
При этом в компании отметили, что у нынешней версии Sora есть «слабые места». В частности, в некоторых случаях нейросеть может не прослеживать причинно-следственную связь. Например, в сгенерированном ролике человека, который ест печенье, на самом печенье не останется следов от укусов.
Пока Sora недоступна для широкого круга пользователей, но разработчики предоставили доступ к нейросети некоторым специалистам из разных областей, в том числе экспертам по вопросам дезинформации и кибербезопасности. Также в компании уточнили, что занимаются разработкой инструментов, которые будут ограничивать пользователей в создании контента, нарушающего политику компании, и позволят определять, что ролик был сгенерирован нейросетью.
Запрос: «Стильная женщина идет по улице Токио, наполненной теплым светом неоновых и анимированных вывесок. Она одета в черную кожаную куртку, длинное красное платье, черные ботинки. На ней солнцезащитные очки и красная помада. Она идет уверенно и непринужденно. Улица влажная и отражает свет. Много пешеходов вокруг».
К тестированию своей нейросети OpenAI также привлекла художников, дизайнеров и режиссеров, чтобы с помощью их отзывов усовершенствовать модель для ее использования в профессиональных целях.
Помимо этого, компания планирует привлечь к развитию Sora политиков, преподавателей и художников по всему миру, чтобы узнать их мнение о новой технологии и определить варианты ее использования.
«Несмотря на обширные исследования и испытания, мы не можем предсказать все полезные способы использования нашей технологии, а также все способы, которыми люди будут ей злоупотреблять. Вот почему мы считаем, что обучение на примере реального использования является важнейшим компонентом создания и выпуска все более безопасных систем искусственного интеллекта», —добавили в OpenAI.
Запрос: «В анимационной сцене крупным планом показан невысокий пушистый монстр возле тающей красной свечи. Художественный стиль трехмерный и реалистичный с упором на освещение и текстуру. Настроение картины — удивление и любопытство. Использование теплых цветов еще больше усиливает уютную атмосферу изображения».
Когда Sora появится в общем доступе, неизвестно. Но пользователи Х уже выкладывают ролики, сгенерированные нейросетью — OpenAI опубликовала их в своем техническом отчете. Помимо очень реалистичных видео с людьми, домашними питомцами и пейзажами, пользователи обратили внимание, например, на ролики с пингвинами на велосипедах и хомяком на утке-драконе.
Их публикует глава OpenAI Сэм Альтман по запросам пользователей.
Также пользователи Х шутят, что Sora пока не удаются стулья из-за видео, сгенерированного по запросу: «археологи обнаруживают в пустыне обычный пластиковый стул, раскапывают и отчищают его с большой осторожностью». В ролике нейросеть не сразу смоделировала стул, как твердый объект, что привело к ошибкам.
OpenAI
Один из мировых лидеров в области разработки технологий искусственного интеллекта, разработчик ChatGPT. Главный инвестор и эксклюзивный партнер OpenAI — корпорация Microsoft.