Гендиректор OpenAI Сэм Альтман на презентации DevDay

истории

OpenAI запустит «магазин приложений» для искусственного интеллекта Пользователи смогут создавать собственные версии ChatGPT и зарабатывать на них

16:48, 7 ноября 2023

Источник: Meduza

Компания OpenAI, главный игрок на рынке генеративных языковых моделей, а возможно и искусственного интеллекта в целом, провела 6 ноября презентацию новых продуктов и улучшений существующих. Она проходила в рамках DevDay — первого в истории компании мероприятия для разработчиков. Однако некоторые из анонсов будут интересны и простым пользователям. «Медуза» рассказывает о центральной новости презентации: запуске специализированных моделей GPT и «магазина приложений» для них.

ChatGPT, GPT-4, GPT — что все это значит?

OpenAI использует аббревиатуру GPT в различных вариантах — как в названиях технологий, так и продуктов, которые на них основаны. GPT (генеративный предобученный трансформер, generative pre-trained transformer) — это тип языковых моделей, которые учатся генерировать текст, похожий на человеческий, обучаясь на огромных массивах данных.

Пожалуй, чаще всего люди слышат про ChatGPT — это онлайн-сервис, который выглядит как чат-бот и работает на языковых моделях, разработанных OpenAI. Сервис запустился в ноябре 2022 года и за год приобрел невероятную популярность: каждую неделю им пользуется 100 миллионов человек.

Сами модели, лежащие в основе ChatGPT и других продуктов, OpenAI называет порядковыми числительными: GPT-1 и GPT-2 обучались на относительно небольшом объеме текста и не получили широкого распространения. Взрывной рост популярности ChatGPT обеспечила модель GPT-3.5, выпущенная в марте 2022 года. В марте 2023 года появилась еще более совершенная модель, GPT-4, которая постепенно научилась работать не только с текстом, но также «понимать» изображения. Сейчас она доступна только тем, у кого оформлена платная подписка на ChatGPT.

OpenAI представила еще один GPT — теперь это ваш собственный «агент»

На презентации 6 ноября глава OpenAI Сэм Альтман рассказал о запуске еще одного продукта с той же аббревиатурой в названии. GPT — это специализированные версии ChatGPT, настроенные для выполнения конкретного круга задач (их еще называют «агентами»).

В блоге компании объясняется, что предвестником GPT были Custom instructions — специальные инструкции, которые пользователь может вписать в настройках своего ChatGPT, чтобы не повторять каждый раз одно и то же. Простым вариантом Custom instructions можно считать строчку «Действуй как моя любимая учительница истории, которая каждую тему объясняла увлекательно и емко, без нудного списка дат и имен», которую модель будет иметь в виду при ответе на все ваши вопросы (желательно, связанные с историческими событиями).

Но при желании в поля для специальных инструкций можно было упаковать целую систему, по которой должен работать ChatGPT: один из наиболее популярных вариантов, AutoExpert, по сути заставляет модель саму определить, роль какого эксперта она должна принять, вычленить ключевые слова из запроса и переписать вопрос в более понятную для себя форму — и уже затем начать отвечать.

Новые GPT будут представлять собой упакованные заранее версии таких «экспертов». Для примера OpenAI разработала несколько «агентов» с разными возможностями, например, такими:

объяснять правила настольных и карточных игр для людей разных возрастов;
прочитать ваш текст и дать советы, как сделать его лучше;
нарисовать раскраску на базе вашей идеи;
написать рецепт для блюда на основе ингредиентов, которые у вас есть;
объяснить последние мемы и молодежный сленг.

На презентации показали несколько примеров с интеграцией в сторонние сервисы. Один «агент» подключился к календарю и рабочему мессенджеру пользователя, чтобы найти конфликтующие планы и написать начальнику «Мне пора бежать». Другой в связке с платформой для дизайнеров Canva позволил превратить короткий запрос «нарисуй мне постер для DevDay, который пройдет 6 ноября в Музее де Янга» в пару вариантов плакатов — причем у пользователя была возможность быстро перейти в Canva и доработать понравившийся дизайн.

Мы в беде?

«Если люди начнут использовать ChatGPT для поиска истины, мы окажемся в беде» Философ Гаспар Кениг много лет исследовал искусственный интеллект, а теперь разочаровался в технологиях — и изучает дождевых червей. «Медуза» с ним поговорила

год назад

Мы в беде?

«Если люди начнут использовать ChatGPT для поиска истины, мы окажемся в беде» Философ Гаспар Кениг много лет исследовал искусственный интеллект, а теперь разочаровался в технологиях — и изучает дождевых червей. «Медуза» с ним поговорила

год назад

У GPT будет свой App Store

Как объявили на презентации, через несколько недель у пользователей с платной подпиской ChatGPT Plus появится возможность создавать собственные GPT. Причем знать программирование для этого необязательно: «агент» будет настраиваться в диалоге, как при обычной работе с чат-ботом. Модель даже сама предложит для себя название и логотип.

Создатель «агента» сможет загрузить в модель дополнительные знания по теме — например, серию лекций — а также указать, может ли она использовать расширенные возможности ChatGPT (поиск по интернету, анализ данных и генерация изображений).

Получившиеся GPT можно будет использовать в личных целях, поделиться ими с коллегами или выложить в открытый доступ. Скоро OpenAI планирует запустить «магазин приложений» для «агентов», а чуть позже — включить монетизацию, чтобы разработчики GPT могли зарабатывать.

Компания прямо указывает, что запуск GPT — это еще один шаг на пути к созданию сильного искусственного интеллекта (AGI), то есть искусственного интеллекта без конкретной специализации, способного решать любые задачи. OpenAI декларирует своей миссией создание AGI и использование его на благо человечества. Участие сообщества разработчиков в настройке моделей и поисках новых сфер применения, считают в компании, позволит сделать искусственный интеллект безопаснее, а также лучше понять, что ждет нас в будущем.

А что если нет?

ChatGPT стал немного удобнее

Для тех, кому пока достаточно «классического» ChatGPT без «агентов», тоже есть хорошие новости: OpenAI улучшила возможности платной версии, основанной на GPT-4. Во-первых, теперь база знаний модели обрывается не сентябрем 2021 года, как раньше, а апрелем 2023-го. Во-вторых, разные возможности модели объединили в один интерфейс. Раньше пользователь должен был вручную переключаться между обычным ChatGPT, версией с поиском по интернету или версией, генерирующей изображения с помощью модели DALL-E 3. Теперь такого выбора нет: модель сама решит, какую из возможностей нужно применить при каждом конкретном запросе.

Эти и другие нововведения — возможность для OpenAI (снова) обойти конкурентов

Несмотря на то, что GPT-4 остается самым популярным продуктом в области генеративных нейросетей, конкуренты предлагали решения, которые более эффективно решали отдельные задачи. Но анонсы на DevDay, вероятно, позволят компании Сэма Альтмана нивелировать и эти преимущества.

Так, в июле 2023 года корпорация Meta выпустила большую языковую модель Llama 2 — причем как проект с открытым исходным кодом. Это позволяет разработчикам настраивать модель под их конкретные задачи (например, дообучить ее на дополнительном массиве данных), тогда как в случае с GPT-4 приходилось полагаться только на тонкую настройку запросов к модели. 6 ноября OpenAI анонсировала GPT-4 Turbo, которую, кроме прочего, можно дообучать на собственных данных — раньше такая возможность была только для менее продвинутой модели, GPT-3.5. Да и узкоспециализированные «агенты» GPT, которых должно быть гораздо проще создавать, чем донастраивать модели с открытым исходным кодом, должны внести свою лепту.

Еще одна особенность GPT-4 Turbo — у разработчиков (но не пользователей ChatGPT) появляется доступ к огромному контекстному окну в 128 тысяч токенов. Говоря иначе, модель будет способна обработать гораздо больший объем текста в запросе, чем существующие GPT-3.5 и GPT-4 (там чаще всего речь идет о четырех-восьми тысячах токенов; упрощенно можно считать, что один токен равен пяти буквам текста на английском языке и двум буквам на русском). До этого анонса главным конкурентом с соизмеримо большим контекстным окном, 100 тысяч токенов, была модель Claude 2 от компании Anthropic, в которую вложили несколько миллиардов долларов Google и Amazon.

«Медуза»