истории

OpenAI выпустила новую модель o1. Она медленная, дорогая и не всегда лучше предшественников Зато впервые ИИ начал «думать» перед тем, как ответить

Источник: Meduza

Компания OpenAI выпустила новую модель искусственного интеллекта под названием OpenAI o1, созданную для решения сложных задач. Она работает медленнее, чем другие модели компании, зато способна строить логические цепочки и «думать» почти как человек. Главный недостаток o1 — ее мыслительный процесс обходится слишком дорого. «Медуза» рассказывает, как устроена новая ИИ-система и в чем она может помочь пользователям.


Разработчики OpenAI запустили новую серию ИИ-моделей, которые, по их словам, способны решать сложные задачи в области математики, программирования и естественных наук. «Мы обучили эти модели тратить больше времени на обдумывание проблем, прежде чем они ответят, — подобно тому, как это делает человек. В ходе тренировок они учатся совершенствовать свой мыслительный процесс, пробовать разные стратегии и распознавать свои ошибки», — говорится в официальном анонсе.

Глава исследовательского направления OpenAI Джерри Творек в комментарии изданию The Verge утверждает, что для обучения модели o1 использовали «совершенно новый алгоритм оптимизации и новый набор обучающих данных, созданный специально для него». Предыдущие ИИ-модели используют в ответах готовые шаблоны, полученные из массивов данных, на которых их обучали. В случае с o1 используется способ «обучения с подкреплением», в рамках которого систему поощряют или наказывают в ходе взаимодействия с внешней средой.

Как OpenAI o1 решает логические задачи

OpenAI

Благодаря этому методу у модели формируется цепочка решений или даже «мыслей», которая используется при обработке запросов. Этот процесс похож на то, как решает проблемы обычный человек. Модель способна не только давать ответы, но и объяснять свои решения. Творек также заметил, что o1 галлюцинирует меньше других продуктов компании, хотя разработчикам пока не удалось полностью избавиться от этой проблемы.

По словам главного научного сотрудника OpenAI Боба Макгрю, модель справляется с AP-тестом по математике лучше, чем он сам. Система также решила 83% задач квалификационного экзамена Международной математической олимпиады. Наиболее совершенная на данный момент модель GPT-4o, обученная по другому алгоритму, справилась только с 13% задач.

Модель OpenAI o1 пока доступна в превью-версии для пользователей с платной подпиской ChatGPT Plus. Кроме того, разработчики создали более быструю и дешевую версию OpenAI o1-mini, которая лучше всего подходит для задач, связанных с написанием кода. Разработчики отмечают, что она тоже способна строить логические цепочки, но не обладает обширными знаниями о мире, как основная модель.

Слухи о «мыслящей» ИИ-модели появились почти год назад. Из-за нее, вероятно, возник конфликт в руководстве OpenAI

По словам журналистов, o1 представляет собой модель, ранее известную под кодовым названием Strawberry. Она выросла из секретного проекта Q* (Кью-стар), который, по слухам, стал одной из причин временного увольнения Сэма Альтмана с поста главы OpenAI в ноябре 2023 года. Некоторые исследователи компании считали Q* прорывом в процессе создания AGI — общего искусственного интеллекта.

Прошлой осенью ученые написали письмо совету директоров OpenAI, в котором рассказали о своем открытии и предупредили, что оно может стать угрозой для человечества. По мнению исследователей, Альтман недостаточно серьезно отнесся к их предостережениям, что и привело к его отставке. Позже он вернулся на пост главы компании.

Его коллега, один из сооснователей и глава научного направления OpenAI Илья Суцкевер, в мае 2024-го решил уволиться. Сообщалось, что именно он возглавлял команду разработки Q*. Позже он создал собственный ИИ-стартап Safe Superintelligence (SSI), который сфокусируется на разработке безопасного и мощного искусственного интеллекта, независимого от коммерческого давления. 

Выпуск новой линейки продуктов прошел на фоне подготовки OpenAI к очередному инвестиционному раунду, в ходе которого компания надеется привлечь 6,5 миллиарда долларов и получить общую оценку в 150 миллиардов. Ожидается, что в нем примут участие такие технологические гиганты, как Apple, Nvidia и Microsoft. Последняя уже является ключевым инвестором и партнером OpenAI. 

Однако для привлечения дополнительных инвестиций компании придется выполнить два важных условия: изменить структуру управления и снять ограничения на прибыльность инвестиций, отмечает Reuters. Сейчас OpenAI существует в формате партнерства между некоммерческой организацией и отдельным подразделением с «ограниченной коммерческой прибылью». Текущие инвесторы ограничены стократным возвратом вложений. Вся дополнительная прибыль достается некоммерческой структуре.

Модель o1 медленно отвечает на вопросы и ограничена по сравнению с GPT-4o. А еще она способна разорить пользователей

На текущий момент «мыслящая» модель o1 существенно уступает GPT-4o по многим параметрам. В частности, у нее нет памяти и она не является мультимодальной, что ограничивает список ее возможностей. Кроме того, система работает ощутимо медленнее — иногда она тратит больше минуты на ответ.

«Посмотрите, как OpenAI o1-preview „думает“ в течение 92 секунд»

Профессор Нью-Йоркского университета Равид Шварц Зив, изучающий ИИ-модели, считает, что прогресс, который демонстрирует o1 по сравнению с другими моделями, не такой уж значительный. «Она [модель] лучше справляется с определенными проблемами, но вы не видите всеобъемлющего улучшения», — отметил он в комментарии для TechCrunch.

Даже сами разработчики признают, что для решения большинства повседневных задач GPT-4o подойдет лучше. Журналист TechCrunch Максвелл Зефф отмечает, что многие пользователи пока просто не задействуют генеративный ИИ для решения больших задач. В том числе потому, что он с ними плохо справляется. Однако, по его мнению, o1 — первый шаг к тому, чтобы изменить эту ситуацию.

Он также добавил, что новая модель очень дорогая. В большинстве случаев при использовании API генеративного искусственного интеллекта разработчики платят за длину запроса и ответа (измеряется в токенах) — чем больше текста нужно обработать модели, тем дороже обойдется запрос. Но o1 разбивает большие запросы на несколько мелких задач и идет по логической цепочке, и счет за эти этапы тоже предъявляют конечному пользователю. Предугадать, как много будет «размышлять» модель, сложно, поэтому даже простой вопрос может обойтись очень дорого.

Зато, в отличие от других моделей, OpenAI o1 не нуждается в подробных запросах, где пользователь детально объясняет задачу, условия и даже ролевую модель, которой должен следовать ИИ. Напротив, разработчики рекомендуют составлять максимально простые промпты и использовать только важные уточняющие детали, чтобы не усложнять ответ. Также пользователям не нужно просить продумать решение по шагам — еще один ход, часто используемый с другими моделями OpenAI, — так как этот процесс заложен в систему изначально.

В своем нынешнем виде модель o1 хорошо подходит для составления планов и технической документации, оценки рисков, а также для быстрого создания приложений и игр. В одном из примеров глава отдела дизайна ElevenLabs Аммаар Реши показал, что с помощью новой модели можно создать анимированное приложение для iOS, показывающее прогноз погоды, всего за 10 минут. 

Михаил Герасимов

Magic link? Это волшебная ссылка: она открывает лайт-версию материала. Ее можно отправить тому, у кого «Медуза» заблокирована, — и все откроется! Будьте осторожны: «Медуза» в РФ — «нежелательная» организация. Не посылайте наши статьи людям, которым вы не доверяете.