Google запустила впечатляющее и одновременно тревожное дополнение к функции AI Overview – Audio Overview, которая генерирует подкасты результатов поиска, озвученные двумя реалистичными, но не совсем человеческими голосами.
Audio Overview доступна в качестве экспериментальной функции в Search Labs, что означает необходимость активации через специальный переключатель. На данный момент функция работает только в США и генерирует "сводки" исключительно на английском языке.
После активации опции некоторые поисковые запросы Google будут включать блок Audio Overview, обычно расположенный под стандартным AI Overview и разделом "People also ask". Пользователю достаточно нажать кнопку для генерации и дождаться завершения обработки.

Аудио создается в момент запроса, поэтому при обновлении страницы и повторной генерации результат может отличаться. Сгенерированные подкасты длятся от 3 до 5 минут. Все они озвучены одной и той же парой ИИ-голосов, которые обсуждают запрашиваемую тему в формате обычного подкаста.
Голоса звучат значительно более естественно, чем ожидаемый роботизированный голос Siri. Присутствуют изменения тона, разговорные обороты и ощущение естественной речи. Однако звучание не совсем реалистично – два голоса напоминают ведущих подкаста без межличностной "химии", которые просто читают текст с телесуфлера.
Google показывает, какие результаты поиска использовались для создания аудиосводки, так что пользователи могут проверить информацию, предоставленную ИИ-ведущими. Однако голоса звучат настолько реалистично, что некоторые могут принять их за настоящих людей и воспринимать сказанное как факт. Впрочем, эта проблема касается и текстовых ИИ-ответов.
В аудиосводках встречаются неточности, выдающие искусственное происхождение голосов. Например, ИИ-голос может задать вопрос и сразу же ответить на него, что звучит довольно неестественно. Голоса периодически используют эмоциональные выражения, восклицая "Wow!" при упоминании интересных фактов, но это звучит искусственно. Также ИИ-голоса иногда неправильно произносят слова.
Несмотря на жуткое впечатление от функции, она может быть полезна некоторым пользователям, особенно людям с нарушениями зрения или тем, кто полагается на программы чтения с экрана. ИИ-голоса звучат достаточно хорошо для искусственного происхождения.
Однако внедрение подобной технологии вызывает опасения, связанные с распространением дезинформации через ИИ и угрозой, которую ИИ-голоса могут представлять для профессий вроде актеров озвучки.