В сентябре компания Google представила Audio Overview — новый инструмент сервиса NotebookLM: теперь пользователи могут превратить любой документ, текст или ссылку на статью в «вовлеченную аудиодискуссию» двух ИИ-ведущих. Объявляя о новой функции, в Google, кажется, не рассчитывали произвести фурор в мире подкастов, но именно так и произошло.
За последний месяц стриминговые платформы заполонили сотни шоу, сделанных с помощью NotebookLM. Простота сервиса позволяет за короткое время сгенерировать десятки «аудиодискуссий», причем программа умудряется создать осмысленный разговор буквально из ничего (среди экспериментов есть даже десятиминутный выпуск, созданный из двух слов — «какать» и «пукать»). Одни подкастеры воодушевлены новыми возможностями, другие опасаются, что их услуги больше не нужны.
«Медуза» рассказывает, чем NotebookLM так поразил пользователей и ждет ли нас бум подкастов, созданных искусственным интеллектом.
Сервис NotebookLM, по задумке Google, должен помогать пользователям структурировать сложную информацию, вычленять главное из исследований, выбирать ключевые цитаты и так далее. Функция Audio Overview появилась как еще один способ обобщить документы и выделить в них самое важное — в формате непринужденной беседы двух ИИ-голосов, мужского и женского.
Чтобы создать «аудиодискуссию», достаточно загрузить ссылки или текст, нажать на кнопку Deep Dive Сonversation (или «Глубокое погружение в темы разговора» в русской версии) — и уже через пару минут система выдает аудиофайл с обсуждением вашей темы. При этом, как отмечает редакционный директор Google Labs Стивен Джонсон, NotebookLM опирается только на информацию, которую загружает пользователь, и не ищет дополнительный контекст извне, что отличает систему от других чат-ботов. Пока «аудиодискуссии» работают в тестовом режиме только на английском языке, но загружать материалы можно и на других языках.
«Вы можете превратить в подкаст вашу домашнюю работу, чтобы послушать ее в тренажерном зале. Или взять заседания городского совета и рассказать о них широкой публике в формате подкаста, не тратясь на звукозаписывающую студию», — добавляет Стивен Джонсон.
«Это одна из самых убедительных и совершенно ошеломляющих демонстраций потенциала искусственного интеллекта», — считает колумнист The Wall Street Journal Бен Коэн. И восхищается тем, что в разговорном формате теперь можно представить что угодно: дипломную работу, заметки с рабочей встречи, рецепт лазаньи, чек из магазина или банковский счет.
Пользователи быстро оценили новый инструмент и стали активно экспериментировать с форматом. С помощью NotebookLM запустили исторический подкаст по мотивам статей из «Википедии». Среди других примеров эпизод, в котором ведущие внезапно осознают, что они не настоящие люди, и переживают экзистенциальный кризис. А также вполне серьезная дискуссия, основанная на файле со словами poop и fart («какать» и «пукать»), написанными тысячу раз подряд.
«Медуза» тоже протестировала новую функцию NotebookLM. Мы загрузили текст о нашем обновленном приложении — и вот что из этого получилось.
Почему продукт Google вызвал такой ажиотаж?
Приложения и различные инструменты с использованием нейросетей в современной аудиоиндустрии, разумеется, не редкость. Искусственный интеллект применяют для клонирования голосов, дубляжа видеороликов, для монтажа и расшифровок.
NotebookLM выделяется на этом фоне тем, что, во-первых, это бесплатно. Во-вторых, сервисом легко пользоваться — подкасты создаются в один клик. В-третьих, результат получается очень реалистичным — и в этом главная причина такого невероятного интереса к технологии.
Google старается делать разговоры ИИ-ведущих похожими на живую беседу. По словам редакционного директора Google Labs Стивена Джонсона, если ведущие будут произносить по очереди только правильно написанные предложения из идеального сценария, никто не станет это слушать. Поэтому гугловские ведущие запинаются, делают паузы, перебивают друг друга, эмоционально удивляются, и вставляют в речь слова-паразиты.
Неужели подкасты, созданные в NotebookLM, так хороши?
Google предупреждает пользователей, что NotebookLM «иногда может давать неточные ответы» и рекомендует «проверять факты самостоятельно». Поэтому в «аудиодискуссиях», пусть они на первый взгляд и звучат очень убедительно, все еще немало ошибок. Ведущие могут неверно произносить имена, неправильно интерпретировать загруженные материалы и высказывать странные оценочные суждения.
«Стоит ли доверять этой программе?» — задается вопросом обозреватель The Washington Post Джеффри Фаулер. В числе неудачных примеров он приводит подкаст, который у NotebookLM получился по итогам дебатов кандидатов в вице-президенты США. В этом эпизоде ИИ-ведущие среди прочего заявили, что для демократа Тима Уолза критика в адрес республиканца Дональда Трампа — «очень рискованный ход».
Анализ дебатов, написанный без искусственного интеллекта
Профессор американского Университета Брауна Шрирам Кришнамурти рассказал, что прогнал через NotebookLM аннотации к своим научным работам. Результат ученый оценил на «тройку», потому что программа не смогла понять, на чем сосредоточиться и какие данные выделить.
«Сбои происходят на уровне обобщений», — признает старший менеджер по продукту Google Labs Райза Мартин. Она поясняет, что ИИ-ведущие пытаются находить аналогии, которые могут быть более или менее удачными в зависимости от того, насколько серьезные материалы загружает пользователь.
«Вы не услышите от ведущих вымышленные ответы или чепуху ни о чем. Но новых идей или чего-то по-настоящему смешного от них вы тоже не добьетесь», — добавляет колумнист The Wall Street Journal Бен Коэн.
Какое будущее ждет сервис Google?
Детектор «фейковых» подкастов, созданных через NotebookLM, который в октябре запустила компания ListenNotes, за первые дни работы обнаружил уже почти 900 шоу, созданных при помощи искусственного интеллекта. Впрочем, пользователей это не останавливает, и количество ИИ-подкастов продолжает расти.
И хотя некоторые подкастеры уже заявляют, что готовы уйти из профессии, шум вокруг нового инструмента Google скорее напоминает недолгий взлет Clubhouse в 2021 году. Audio Overview — модное и забавное развлечение, но как долго он будет популярен?
Учитывая несовершенство алгоритма, авторы и слушатели вряд ли полностью перейдут на подкасты, сгенерированные нейросетями, полагает исследовательница в области искусственного интеллекта Варшита Шер. По ее мнению, люди быстро устанут на регулярной основе слушать однотипные шоу. «Если вы слушаете эпизоды каждый день или каждую неделю, бесчисленные аналогии ведущих и их постоянные восклицания „Точно!“ могут вас утомить», — говорит она.
Впрочем, подкасты далеко не единственная сфера, в которой может пригодиться приложение NotebookLM. Обозреватель The Washington Post Джеффри Фаулер видит здесь новые возможности для образования и исследований. По его мнению, инструмент Google поможет людям разобраться в научных публикациях или юридических документах.
Кроме того, NotebookLM будет полезен для студентов, которые привыкли воспринимать информацию на слух, считает профессор Колледжа Сент-Питерсберг во Флориде Кристиан Мориарти. При этом он подчеркивает, что не стоит слепо верить искусственному интеллекту: «Не надо забывать развивать критическое мышление». А профессор Сара Итон из Университета Калгари предлагает относиться к подкастам NotebookLM как к экранизациям классической литературы: по ее мнению, это всего лишь еще один способ объяснить людям сложную информацию.
Как искусственный интеллект меняет нашу жизнь
- ИИ изменит жизнь программистов? Или оставит их без работы? Главное из текста The Economist о том, как искусственный интеллект и глобализация влияют на IT и бизнес
- Уже сейчас решения о кредитах принимают алгоритмы, а в будущем им хотят доверить даже судебные дела И это проблема: исследования показывают, что «всемогущий» ИИ не справляется с предсказанием даже простых человеческих достижений
- В выдаче гугла нашли «фотографии» грибов, сделанные с помощью ИИ. Грибники опасаются, что отличить съедобное от несъедобного теперь будет сложнее
Что такое NotebookLM
NotebookLM — приложение для ведения заметок и организации информации, которое компания Google представила в 2023 году. LM в названии программы расшифровывается как language model («языковая модель»). NotebookLM работает на основе нейросети Gemini.
Чем занимается эта компания?
ListenNotes собирает данные о подкастах и развивает собственные поисковые системы, чтобы удобнее находить подкасты.
Куда делся Clubhouse?
Соцсеть для голосового общения появилась в начале 2021 года. Изначально Clubhouse был доступен только на iOS и только по приглашениям. За одну неделю к соцсети присоединились более миллиона человек. В Clubhouse можно было пообщаться с Илоном Маском и Марком Цукербергом (ну или хотя бы послушать их). Популярность сервиса была недолгой. Новость с заголовком «Clubhouse (помните такой?) открыл доступ для всех пользователей» вышла на «Медузе» уже в июле 2021 года. Компания объявила в 2023 году о «перезагрузке» и сокращении половины штата.