Meta представила новую серию ИИ-моделей Llama 4

Корпорация Meta выпустила новую линейку открытых ИИ-моделей Llama 4. Они обходят конкурентов по ряду бенчмарков, свидетельствуют данные внутренних тестов.

ЭТО ИНТЕРЕСНО

Психоделики и ИИ: популярность и опасность

04.07.2025

Мнение: Европе нужен прикладной ИИ, а не чипы

04.07.2025

В основе серии лежит Llama 4 Behemoth — большая языковая модель (LLM) с 2 трлн параметров. Она находится в стадии обучения и пока не выпущена. Две ее мультимодальные дистилляции — Maverick и Scout — доступны для разработчиков и пользователей.

ИИ-помощник Meta AI, доступный в различных продуктах компании вроде WhatsApp, Messenger и Instagram, уже обновлен для использования Llama 4 в 40 странах. Мультимодальные функции пока доступны только в США.

Утверждается, что Behemoth, или LLM-учитель двух других моделей, превосходит GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro в ориентированных на STEM бенчмарках, вроде MATH-500 и GPQA Diamond.

«Это только начало для коллекции Llama 4. Мы считаем, что самые интеллектуальные системы должны быть способны выполнять обобщенные действия, естественно общаться с людьми и решать сложные задачи, с которыми они раньше не сталкивались. Наделение Llama сверхспособностями в этих областях приведет к созданию лучших продуктов для людей на наших платформах и расширит возможности разработчиков по внедрению инноваций в следующие крупные потребительские и бизнес-сферы», — говорится в анонсе компании.

Новая архитектура

Llama 4 — первая серия моделей, которые используют архитектуру Mixture of Experts (MoE). Так, у Maverick 128 «экспертов» и 400 млрд общих параметров, но только 17 млрд активных. У Scout показатели 16, 109 млрд и 17 млрд соответственно.

Характеристики нейросетей из линейки Llama 4. Данные: Meta.

Согласно внутренним тестам компании, Maverick превосходит модели вроде GPT-4o и Gemini 2.0 в некоторых тестах программирования, рассуждений, поддержки языков, длинных контекстов и изображений. Но нейросеть не дотягивает до более мощных и современных Gemini 2.5 Pro от Google, Claude 3.7 Sonnet от Anthropic и GPT-4.5 от OpenAI.

Maverick лучше подходит для применения в качестве общего помощника и чата. Сильные стороны Scout — обобщение документов и рассуждения над большими базами. Последняя способна работать на одном графическом процессоре Nvidia H100, в то время как для Maverick требуется система Nvidia H100 DGX или эквивалентная ей.

Скандал вокруг Llama 4

Maverick заняла второе место в LLM Arena — тесте, в котором люди сравнивают работу различных моделей и формируют «пользовательский» рейтинг.

Рейтинг ИИ-моделей согласно данным LLM Arena. Данные: LLM Arena.

Несколько исследователей обратили внимание, что в тестах принимала участие специально оптимизированная версия Maverick, недоступная разработчикам. Версия для LLM Arena использует больше эмодзи и дает необычайно длинные ответы.

Okay Llama 4 is def a littled cooked lol, what is this yap city pic.twitter.com/y3GvhbVz65

— Nathan Lambert (@natolambert) April 6, 2025

Из-за этого пользователям сложно предсказать реальную производительность нейросети в «бытовых» условиях.

Опровержение

Вице-президент по генеративному искусственному интеллект в Meta Ахмад Аль-Дахле опроверг информацию о настройке модели для конкретных тестов.

We're glad to start getting Llama 4 in all your hands. We're already hearing lots of great results people are getting with these models.
That said, we're also hearing some reports of mixed quality across different services. Since we dropped the models as soon as they were…

— Ahmad Al-Dahle (@Ahmad_Al_Dahle) April 7, 2025

«Это просто неправда, и мы никогда бы так не поступили», — подчеркнул он.

По словам руководителя, «переменное качество, которое наблюдают люди, связано с необходимостью стабилизировать реализацию».

«Поскольку мы выпустили модели сразу же, как только они были готовы, мы ожидаем, что потребуется несколько дней, чтобы все публичные внедрения были настроены», — добавил он.

Напомним, в ноябре 2024 года Meta открыла свои ИИ-технологии для правительственных учреждений и оборонных подрядчиков США и союзников.

Ранее она представила Movie Gen — ИИ-генератор для создания новых видео, редактирования существующих и добавления звука к ним.

Meta представила новую серию ИИ-моделей Llama 4

Психоделики и ИИ: популярность и опасность

Мнение: Европе нужен прикладной ИИ, а не чипы

Читайте так-же

Психоделики и ИИ: популярность и опасность

Мнение: Европе нужен прикладной ИИ, а не чипы

Чат-боты украли трафик новостных ресурсов

ИИ восстановил 3000-летнюю вавилонскую поэму

США отменили ограничения на экспорт ПО для чипов в Китай

ТОП НОВОСТИ

Игрок Stronghold нашел свои карты спустя 20 лет и превратил их в масштабные скриншоты

ИИ ChatGPT сел за штурвал космического корабля — что из этого вышло?

Морское расширение Mount & Blade 2 предложит комплексную систему навигации с учетом ветра, течений и осадки судов

Qualcomm представила две новые версии Snapdragon 8 Gen 3

Доступная карта для 1080p с DLSS 4 и отличным охлаждением: обзор Gigabyte RTX 5050 Gaming OC

ПОПУЛЯРНОЕ

Summer Game Fest 2025 стал самым просматриваемым шоу в истории мероприятия

В ролевой котоэкшен Cat Quest 3 добавили бесплатный контент с новыми боссами и попугаями

Бывший руководитель отмененной Hytale почти готов выкупить игру у Riot Games за 25 миллионов долларов и довести ее до релиза

Патч для MindsEye, который делает врагов умнее, вышел на консолях, но не на ПК

Новый патч для ПК-версии Stellar Blade добавил карточки и фоны в Steam и разблокировал сложный режим