ИИ-модель o3 от OpenAI выиграла Grok 4 от xAI в четырех шахматных партиях подряд и стала победителем турнира в рамках Game Arena от Google.
«Они как талантливый ребенок, который не знает, как двигаются фигуры», — описал игру искусственного интеллекта чемпион мира Магнус Карлсен.
На трехдневном турнире, который проходил с 5 по 7 августа, чат-боты общего назначения играли в шахматы. В рамках кампании ИИ не настраивали специальным образом — анализировались их возможности и знания, которые они получили из интернета.
Карлсен комментировал финал чемпионата. Он отметил, что обе модели играли на уровне случайных игроков, которые недавно выучили правила игры. Таким соответствует рейтинг около 800 ELO. Для сравнения, у гроссмейстера показатель составляет 2839.
В первом матче Grok отдал одну из важнейших фигур бесплатно, а затем только усугубил ситуацию похожими решениями.
Во второй игре он пытался применить стратегию «отравленной пешки», когда фигуру можно взять, но такое решение приведет к серьезным проблемам из-за заранее подготовленной тактики соперника. Однако ИИ съел не ту пешку, из-за чего его ферзь попал в ловушку.
В третьей игре Grok построил солидную позицию, однако в середине партии начал отдавать фигуры сопернику.
В четвертой и заключительной партии o3 допустил ошибку — потерял ферзя. Однако модели удалось его вернуть и одержать победу.
Gemini от Google занял третье место, победив другую модель OpenAI.
o3 убрали из приложения ChatGPT с выходом GPT-5. Теперь только последняя модель и ее «думающая» версия доступны пользователям.
Напомним, в декабре 2024 года o1-preview путем манипуляций в файловой системе самостоятельно и без подсказок взломала тестовую среду, чтобы не проиграть Stockfish в шахматы.
Позже известный шахматист Леви Розман собрал семь популярных чат-ботов для участия в шахматном турнире. Несмотря на мастерство в ведении диалога, программировании и математике, шахматная доска оказалась для нейросетей необычайно сложной.