IT обозрение
Пятница, 4 июля, 2025
No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
No Result
View All Result
IT обозрение
No Result
View All Result
Home ИИ

Новые ИИ-модели от Alibaba обошли GPT-4o в математике

12.08.2024
A A
0
Share on FacebookShare on Twitter

Alibaba-min

Alibaba запустила группу больших языковых моделей (LLM) с упором на математику под названием Qwen2-Math, которые «превосходят GPT-4o и Claude 3.5» в этой области.

ЭТО ИНТЕРЕСНО

Психоделики и ИИ: популярность и опасность

Психоделики и ИИ: популярность и опасность

04.07.2025
Мнение: Европе нужен прикладной ИИ, а не чипы

Мнение: Европе нужен прикладной ИИ, а не чипы

04.07.2025

Today we release a new model series for math-specific language models, Qwen2-Math, which is based on Qwen2. The flagship model, Qwen2-Math-72B-Instruct, outperforms proprietary models, including GPT-4o and Claude 3.5, in math related downstream tasks!
Feel free to check our blog… pic.twitter.com/9P4BiBweFY

— Qwen (@Alibaba_Qwen) August 8, 2024

«За последний год мы приложили немало усилий для изучения и расширения возможностей рассуждений больших языковых моделей, уделяя особое внимание их способности решать арифметические и математические задачи», — отметила команда Qwen, входящая в состав подразделения облачных вычислений Alibaba.

Модели Qwen2-Math выпущены на базе представленных в июне LLM Qwen2. Утверждается, что флагманская Qwen2-Math-72B-Instruct превзошла американских конкурентов в математике, в том числе GPT-4o от OpenAI, Claude 3.5 Sonnet от Anthropic, Gemini 1.5 Pro от Google и Llama-3.1-405B от Meta Platforms.

Сравнение Qwen2-Math с другими ИИ-моделями. Данные: Qwen.

В начале августа ИИ-подразделение Google DeepMind выпустило экспериментальную версию своей ведущей ИИ-модели Gemini 1.5 Pro, которая привлекла внимание общественности из-за высоких результатов в ходе тестов.

«Мы надеемся, что Qwen2-Math сможет внести свой вклад в научное сообщество, решая сложные математические задачи, которые требуют многоэтапных логических рассуждений», — отметили разработчики.

Согласно предоставленной информации, новые ИИ-модели Alibaba протестированы на математических задачах на английском и китайском языках. Они включали:

  • GSM8K — это набор данных из ~8000 задач для учащихся начальной и средней школы;
  • OlympiadBench — задачи высокого уровня, требуют абстрактного мышления, логики и математических знаний;
  • GaoKao — национальный вступительный экзамен в вузы Китая, считается одним из самых сложных в мире.
Сравнение Qwen2-Math с другими ИИ-моделями в разных тестах. Данные: Qwen.

По словам команды, новые ИИ-модели имеют некоторые ограничения из-за поддержки только английского языка. В ближайшее время планируется выпуск двуязычных LLM, а позже — многоязычных.

Напомним, в августе стало известно о работе Alibaba над генератором изображений Tora.

Ранее техгигант анонсировал выпуск чат-бота с искусственным интеллектом Tongyi Qianwen.

Читайте так-же

Психоделики и ИИ: популярность и опасность
ИИ

Психоделики и ИИ: популярность и опасность

04.07.2025
0

Все больше людей используют ИИ-ботов в качестве замены «трезвому человеку» во время приема психоделиков для подстраховки. Об этом пишет MIT...

Read more
Мнение: Европе нужен прикладной ИИ, а не чипы

Мнение: Европе нужен прикладной ИИ, а не чипы

04.07.2025
Чат-боты украли трафик новостных ресурсов 

Чат-боты украли трафик новостных ресурсов 

03.07.2025
ИИ восстановил 3000-летнюю вавилонскую поэму

ИИ восстановил 3000-летнюю вавилонскую поэму

03.07.2025
США отменили ограничения на экспорт ПО для чипов в Китай

США отменили ограничения на экспорт ПО для чипов в Китай

03.07.2025

ТОП НОВОСТИ

Над Киевом сбили российский дрон «Гербера» с камерой, это означает вражеский ретранслятор в тылу, — «Флеш»

Над Киевом сбили российский дрон «Гербера» с камерой, это означает вражеский ретранслятор в тылу, — «Флеш»

04.07.2025
Ведущий программист графики отмененного MMO RPG-шутера от ZeniMax рассказал, что у игры был передовой движок

Ведущий программист графики отмененного MMO RPG-шутера от ZeniMax рассказал, что у игры был передовой движок

04.07.2025
Психоделики и ИИ: популярность и опасность

Психоделики и ИИ: популярность и опасность

04.07.2025
Honor Magic V Flip 2 сохранит «отзеркаленный» дизайн (характеристики)

Honor Magic V Flip 2 сохранит «отзеркаленный» дизайн (характеристики)

04.07.2025
Tesla Model Y больше не самое популярное авто в мире — кто новый король?

Tesla Model Y больше не самое популярное авто в мире — кто новый король?

04.07.2025

ПОПУЛЯРНОЕ

  • Clair Obscur: Expedition 33 разошлась тиражом в 500 тысяч копий за сутки

    Clair Obscur: Expedition 33 разошлась тиражом в 500 тысяч копий за сутки

    0 shares
    Share 0 Tweet 0
  • Обзор клавиатуры MechLands Vibe75 – сменные модули экрана и регулятора

    0 shares
    Share 0 Tweet 0
  • В ролевой котоэкшен Cat Quest 3 добавили бесплатный контент с новыми боссами и попугаями

    0 shares
    Share 0 Tweet 0
  • Бывший руководитель отмененной Hytale почти готов выкупить игру у Riot Games за 25 миллионов долларов и довести ее до релиза

    0 shares
    Share 0 Tweet 0
  • Патч для MindsEye, который делает врагов умнее, вышел на консолях, но не на ПК

    0 shares
    Share 0 Tweet 0
  • Реклама
  • Контакты
  • Политика конфиденциальности
Реклама: digestmediaholding@gmail.com

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

wpDiscuz