Перейти к материалам
Купите мерч «Медузы». Это еще один способ 
(красиво) нам помочь
Гендиректор OpenAI Сэм Альтман на презентации DevDay
истории

OpenAI запустит «магазин приложений» для искусственного интеллекта Пользователи смогут создавать собственные версии ChatGPT и зарабатывать на них

Источник: Meduza
Гендиректор OpenAI Сэм Альтман на презентации DevDay
Гендиректор OpenAI Сэм Альтман на презентации DevDay
Justin Sullivan / Getty Images / AFP / Scanpix / LETA

Компания OpenAI, главный игрок на рынке генеративных языковых моделей, а возможно и искусственного интеллекта в целом, провела 6 ноября презентацию новых продуктов и улучшений существующих. Она проходила в рамках DevDay — первого в истории компании мероприятия для разработчиков. Однако некоторые из анонсов будут интересны и простым пользователям. «Медуза» рассказывает о центральной новости презентации: запуске специализированных моделей GPT и «магазина приложений» для них.

ChatGPT, GPT-4, GPT — что все это значит?

OpenAI использует аббревиатуру GPT в различных вариантах — как в названиях технологий, так и продуктов, которые на них основаны. GPT (генеративный предобученный трансформер, generative pre-trained transformer) — это тип языковых моделей, которые учатся генерировать текст, похожий на человеческий, обучаясь на огромных массивах данных.

Пожалуй, чаще всего люди слышат про ChatGPT — это онлайн-сервис, который выглядит как чат-бот и работает на языковых моделях, разработанных OpenAI. Сервис запустился в ноябре 2022 года и за год приобрел невероятную популярность: каждую неделю им пользуется 100 миллионов человек.

Сами модели, лежащие в основе ChatGPT и других продуктов, OpenAI называет порядковыми числительными: GPT-1 и GPT-2 обучались на относительно небольшом объеме текста и не получили широкого распространения. Взрывной рост популярности ChatGPT обеспечила модель GPT-3.5, выпущенная в марте 2022 года. В марте 2023 года появилась еще более совершенная модель, GPT-4, которая постепенно научилась работать не только с текстом, но также «понимать» изображения. Сейчас она доступна только тем, у кого оформлена платная подписка на ChatGPT.

OpenAI представила еще один GPT — теперь это ваш собственный «агент»

На презентации 6 ноября глава OpenAI Сэм Альтман рассказал о запуске еще одного продукта с той же аббревиатурой в названии. GPT — это специализированные версии ChatGPT, настроенные для выполнения конкретного круга задач (их еще называют «агентами»).

В блоге компании объясняется, что предвестником GPT были Custom instructions — специальные инструкции, которые пользователь может вписать в настройках своего ChatGPT, чтобы не повторять каждый раз одно и то же. Простым вариантом Custom instructions можно считать строчку «Действуй как моя любимая учительница истории, которая каждую тему объясняла увлекательно и емко, без нудного списка дат и имен», которую модель будет иметь в виду при ответе на все ваши вопросы (желательно, связанные с историческими событиями).

Но при желании в поля для специальных инструкций можно было упаковать целую систему, по которой должен работать ChatGPT: один из наиболее популярных вариантов, AutoExpert, по сути заставляет модель саму определить, роль какого эксперта она должна принять, вычленить ключевые слова из запроса и переписать вопрос в более понятную для себя форму — и уже затем начать отвечать.

Новые GPT будут представлять собой упакованные заранее версии таких «экспертов». Для примера OpenAI разработала несколько «агентов» с разными возможностями, например, такими:

  • объяснять правила настольных и карточных игр для людей разных возрастов;
  • прочитать ваш текст и дать советы, как сделать его лучше;
  • нарисовать раскраску на базе вашей идеи;
  • написать рецепт для блюда на основе ингредиентов, которые у вас есть;
  • объяснить последние мемы и молодежный сленг.

На презентации показали несколько примеров с интеграцией в сторонние сервисы. Один «агент» подключился к календарю и рабочему мессенджеру пользователя, чтобы найти конфликтующие планы и написать начальнику «Мне пора бежать». Другой в связке с платформой для дизайнеров Canva позволил превратить короткий запрос «нарисуй мне постер для DevDay, который пройдет 6 ноября в Музее де Янга» в пару вариантов плакатов — причем у пользователя была возможность быстро перейти в Canva и доработать понравившийся дизайн.

Мы в беде?

«Если люди начнут использовать ChatGPT для поиска истины, мы окажемся в беде» Философ Гаспар Кениг много лет исследовал искусственный интеллект, а теперь разочаровался в технологиях — и изучает дождевых червей. «Медуза» с ним поговорила

Мы в беде?

«Если люди начнут использовать ChatGPT для поиска истины, мы окажемся в беде» Философ Гаспар Кениг много лет исследовал искусственный интеллект, а теперь разочаровался в технологиях — и изучает дождевых червей. «Медуза» с ним поговорила

У GPT будет свой App Store

Как объявили на презентации, через несколько недель у пользователей с платной подпиской ChatGPT Plus появится возможность создавать собственные GPT. Причем знать программирование для этого необязательно: «агент» будет настраиваться в диалоге, как при обычной работе с чат-ботом. Модель даже сама предложит для себя название и логотип.

Создатель «агента» сможет загрузить в модель дополнительные знания по теме — например, серию лекций — а также указать, может ли она использовать расширенные возможности ChatGPT (поиск по интернету, анализ данных и генерация изображений).

Получившиеся GPT можно будет использовать в личных целях, поделиться ими с коллегами или выложить в открытый доступ. Скоро OpenAI планирует запустить «магазин приложений» для «агентов», а чуть позже — включить монетизацию, чтобы разработчики GPT могли зарабатывать.

Компания прямо указывает, что запуск GPT — это еще один шаг на пути к созданию сильного искусственного интеллекта (AGI), то есть искусственного интеллекта без конкретной специализации, способного решать любые задачи. OpenAI декларирует своей миссией создание AGI и использование его на благо человечества. Участие сообщества разработчиков в настройке моделей и поисках новых сфер применения, считают в компании, позволит сделать искусственный интеллект безопаснее, а также лучше понять, что ждет нас в будущем.

ChatGPT стал немного удобнее

Для тех, кому пока достаточно «классического» ChatGPT без «агентов», тоже есть хорошие новости: OpenAI улучшила возможности платной версии, основанной на GPT-4. Во-первых, теперь база знаний модели обрывается не сентябрем 2021 года, как раньше, а апрелем 2023-го. Во-вторых, разные возможности модели объединили в один интерфейс. Раньше пользователь должен был вручную переключаться между обычным ChatGPT, версией с поиском по интернету или версией, генерирующей изображения с помощью модели DALL-E 3. Теперь такого выбора нет: модель сама решит, какую из возможностей нужно применить при каждом конкретном запросе.

Эти и другие нововведения — возможность для OpenAI (снова) обойти конкурентов

Несмотря на то, что GPT-4 остается самым популярным продуктом в области генеративных нейросетей, конкуренты предлагали решения, которые более эффективно решали отдельные задачи. Но анонсы на DevDay, вероятно, позволят компании Сэма Альтмана нивелировать и эти преимущества.

Так, в июле 2023 года корпорация Meta выпустила большую языковую модель Llama 2 — причем как проект с открытым исходным кодом. Это позволяет разработчикам настраивать модель под их конкретные задачи (например, дообучить ее на дополнительном массиве данных), тогда как в случае с GPT-4 приходилось полагаться только на тонкую настройку запросов к модели. 6 ноября OpenAI анонсировала GPT-4 Turbo, которую, кроме прочего, можно дообучать на собственных данных — раньше такая возможность была только для менее продвинутой модели, GPT-3.5. Да и узкоспециализированные «агенты» GPT, которых должно быть гораздо проще создавать, чем донастраивать модели с открытым исходным кодом, должны внести свою лепту.

Еще одна особенность GPT-4 Turbo — у разработчиков (но не пользователей ChatGPT) появляется доступ к огромному контекстному окну в 128 тысяч токенов. Говоря иначе, модель будет способна обработать гораздо больший объем текста в запросе, чем существующие GPT-3.5 и GPT-4 (там чаще всего речь идет о четырех-восьми тысячах токенов; упрощенно можно считать, что один токен равен пяти буквам текста на английском языке и двум буквам на русском). До этого анонса главным конкурентом с соизмеримо большим контекстным окном, 100 тысяч токенов, была модель Claude 2 от компании Anthropic, в которую вложили несколько миллиардов долларов Google и Amazon.

«Медуза»

Мы используем куки! Что это значит?