Google представила Gemini 2.0 — самую мощную версию своей ИИ-модели на сегодняшний день. Новая версия получила улучшенные возможности генерации изображений, живого общения и поддержку ИИ-агентов. Модель Flash, входящая в состав Gemini 2.0, уже доступна пользователям веб-версии Gemini и Gemini Advanced, а в начале следующего года появится на мобильных девайсах.
По словам Google, модель Flash теперь поддерживает не только мультимодальный ввод (изображения, видео и аудио), но и мультимодальный вывод, включая генерацию изображений с текстом и настраиваемый многоязычный синтез речи.
Компания также анонсировала два экспериментальных проекта на базе Gemini 2.0 — Project Astra и Project Mariner, которые сейчас тестируются разработчиками и доверенными пользователями.
Project Astra представляет собой универсального ИИ-ассистента нового поколения. В демонстрационном видео показаны его возможности: сканирование бирок на одежде для получения инструкций по стирке, распознавание достопримечательностей и предоставление рекомендаций на основе данных, полученных через голос, текст, демонстрацию экрана или фото. Ассистент поддерживает несколько языков и лучше понимает акценты и редкие слова. Astra интегрирована с сервисами Google Search, Lens и Maps для расширения функциональности.
Project Mariner работает как экспериментальное расширение Chrome, позволяющее ИИ выполнять действия в браузере. В демонстрации показано, как Mariner самостоятельно исследует компании и заполняет их контактные данные в таблице Google Sheets. Пользователь может контролировать работу агента и останавливать его в любой момент, а интерфейс подробно объясняет каждое действие. Google работает над повышением скорости и плавности работы Mariner.
Компания подчеркивает, что уделяет особое внимание безопасности при развертывании новых ИИ-технологий, проводя тщательную оценку рисков и тестирование всех инициатив, связанных с Gemini.