Grok 4 уступил o3 в шахматном турнире

ИИ-модель o3 от OpenAI выиграла Grok 4 от xAI в четырех шахматных партиях подряд и стала победителем турнира в рамках Game Arena от Google.

ЭТО ИНТЕРЕСНО

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic

05.03.2026

Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

05.03.2026

https://youtube.com/shorts/vZ5vNu4f-WE?si=SQtvfxyq27jkEu_d

«Они как талантливый ребенок, который не знает, как двигаются фигуры», — описал игру искусственного интеллекта чемпион мира Магнус Карлсен.

На трехдневном турнире, который проходил с 5 по 7 августа, чат-боты общего назначения играли в шахматы. В рамках кампании ИИ не настраивали специальным образом — анализировались их возможности и знания, которые они получили из интернета.

Карлсен комментировал финал чемпионата. Он отметил, что обе модели играли на уровне случайных игроков, которые недавно выучили правила игры. Таким соответствует рейтинг около 800 ELO. Для сравнения, у гроссмейстера показатель составляет 2839.

В первом матче Grok отдал одну из важнейших фигур бесплатно, а затем только усугубил ситуацию похожими решениями.

Во второй игре он пытался применить стратегию «отравленной пешки», когда фигуру можно взять, но такое решение приведет к серьезным проблемам из-за заранее подготовленной тактики соперника. Однако ИИ съел не ту пешку, из-за чего его ферзь попал в ловушку.

В третьей игре Grok построил солидную позицию, однако в середине партии начал отдавать фигуры сопернику.

В четвертой и заключительной партии o3 допустил ошибку — потерял ферзя. Однако модели удалось его вернуть и одержать победу.

Турнирная сетка. Данные: шахматный турнир от Google.

Gemini от Google занял третье место, победив другую модель OpenAI.

o3 убрали из приложения ChatGPT с выходом GPT-5. Теперь только последняя модель и ее «думающая» версия доступны пользователям.

Напомним, в декабре 2024 года o1-preview путем манипуляций в файловой системе самостоятельно и без подсказок взломала тестовую среду, чтобы не проиграть Stockfish в шахматы.

Позже известный шахматист Леви Розман собрал семь популярных чат-ботов для участия в шахматном турнире. Несмотря на мастерство в ведении диалога, программировании и математике, шахматная доска оказалась для нейросетей необычайно сложной.

Grok 4 уступил o3 в шахматном турнире

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic

Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

Читайте так-же

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic

Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

Падение доходов заставило биткоин-майнеров променять крипторезервы на ИИ-инфраструктуру

OpenAI и Google представили новые ИИ-модели GPT-5.3 Instant и Gemini 3.1 Flash-Lite

X ввела наказания за публикацию ИИ-видео военных конфликтов без маркировки

ТОП НОВОСТИ

На Netflix вышел второй сезон «Ван Пис»: сразу с 8 эпизодами

Осталось 6 дней: OnePlus и OPPO объявили о повышении цен

NVIDIA хочет майнить биткоин в космосе

Геймер напечатал на 3D-принтере «чемодан» для ноутбука с полноразмерной видеокартой

3 минуты – и AI-агент может начинать торговлю. Что изменилось после обновления Agent Hub от Bitget

ПОПУЛЯРНОЕ

Electronic Arts привезет на E3 2017 новые Star Wars: Battlefront и Need for Speed

Эксперты раскритиковали инициативу с запретом современных протоколов шифрования — это может угрожать стабильности Рунета

Почти флагман, почти Nokia, почти получилось. Оценил Nokia 8.3: неоднозначные эмоции

Планы изменились: лидеры Xiaomi объяснили, куда пропал Redmi Turbo 4

Helion получила поддержку Microsoft для создания своего реактора термоядерного синтеза