OpenAI представила новую нейросеть Sora. Она генерирует видео по текстовому запросу Выглядит очень даже реалистично! Разве что кроме пингвинов на велосипедах
Компания OpenAI представила нейросеть Sora, которая может по текстовому запросу создавать «реалистичные» и «креативные» ролики.
«Sora способна создавать сложные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона. Модель [искусственного интеллекта] понимает не только то, что пользователь указал в запросе, но и то, как эти вещи существуют в физическом мире», — говорится в пресс-релизе компании.
В OpenAI уточнили, что сейчас нейросеть может создавать ролики продолжительностью до минуты. Помимо этого, она может генерировать видео из статичных изображений, а также заполнять недостающие кадры в существующих роликах или расширять их.
При этом в компании отметили, что у нынешней версии Sora есть «слабые места». В частности, в некоторых случаях нейросеть может не прослеживать причинно-следственную связь. Например, в сгенерированном ролике человека, который ест печенье, на самом печенье не останется следов от укусов.
Пока Sora недоступна для широкого круга пользователей, но разработчики предоставили доступ к нейросети некоторым специалистам из разных областей, в том числе экспертам по вопросам дезинформации и кибербезопасности. Также в компании уточнили, что занимаются разработкой инструментов, которые будут ограничивать пользователей в создании контента, нарушающего политику компании, и позволят определять, что ролик был сгенерирован нейросетью.
К тестированию своей нейросети OpenAI также привлекла художников, дизайнеров и режиссеров, чтобы с помощью их отзывов усовершенствовать модель для ее использования в профессиональных целях.
Помимо этого, компания планирует привлечь к развитию Sora политиков, преподавателей и художников по всему миру, чтобы узнать их мнение о новой технологии и определить варианты ее использования.
«Несмотря на обширные исследования и испытания, мы не можем предсказать все полезные способы использования нашей технологии, а также все способы, которыми люди будут ей злоупотреблять. Вот почему мы считаем, что обучение на примере реального использования является важнейшим компонентом создания и выпуска все более безопасных систем искусственного интеллекта», —добавили в OpenAI.
Когда Sora появится в общем доступе, неизвестно. Но пользователи Х уже выкладывают ролики, сгенерированные нейросетью — OpenAI опубликовала их в своем техническом отчете. Помимо очень реалистичных видео с людьми, домашними питомцами и пейзажами, пользователи обратили внимание, например, на ролики с пингвинами на велосипедах и хомяком на утке-драконе.
Их публикует глава OpenAI Сэм Альтман по запросам пользователей.
Также пользователи Х шутят, что Sora пока не удаются стулья из-за видео, сгенерированного по запросу: «археологи обнаруживают в пустыне обычный пластиковый стул, раскапывают и отчищают его с большой осторожностью». В ролике нейросеть не сразу смоделировала стул, как твердый объект, что привело к ошибкам.