IT обозрение
Пятница, 4 июля, 2025
No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
No Result
View All Result
IT обозрение
No Result
View All Result
Home ИИ

«Иллюзия мышления»: исследование Apple показало, почему ИИ не решает сложные задачи

11.06.2025
A A
0
Share on FacebookShare on Twitter

network abstraction (single interface for all blockchains) cryptocurrency network абстракция сети (единый интерфейс для всех блокчейнов) криптовалюты сеть

Исследователи из Apple выяснили, что даже самые продвинутые языковые модели с функцией «размышления» (LRM) не способны к обобщенному решению задач. Их способность к логике оказалась ограниченной, а в некоторых случаях — иллюзорной.

ЭТО ИНТЕРЕСНО

Психоделики и ИИ: популярность и опасность

Психоделики и ИИ: популярность и опасность

04.07.2025
Мнение: Европе нужен прикладной ИИ, а не чипы

Мнение: Европе нужен прикладной ИИ, а не чипы

04.07.2025

Команда провела эксперимент, чтобы понять реальные возможности и ограничения моделей вроде OpenAI o1/o3, Claude 3.7 Sonnet Thinking и DeepSeek-R1. Эти системы генерируют подробные цепочки рассуждений перед тем, как дать ответ, что должно улучшать их производительность.

Вместо стандартных математических тестов, которые могут быть «загрязнены» данными из интернета, команда использовала контролируемые головоломки. Среди них были Ханойская башня, Переправа через реку и Мир блоков. Такой подход позволил точно измерять сложность задачи, меняя количество элементов, и анализировать не только конечный ответ, но и весь процесс «мышления» модели.

Snimok-ekrana-2025-06-11-145517
Иллюстрация головоломок: Ханойская башня, Прыжок в шашках, Переправа через реку и Мир блоков. Данные: Apple.

Коллапс при высокой сложности

Главный вывод исследования — производительность всех современных LRM-моделей падает до нуля, как только сложность головоломки превышает определенный порог.

Усилия на «размышления», измеряемые в количестве использованных токенов, растут вместе со сложностью задачи, но только до определенного момента. Перед полным провалом модель парадоксально начинает «думать» меньше, хотя у нее достаточно вычислительных ресурсов для генерации длинного ответа. Это указывает на фундаментальный предел масштабирования их логических способностей.

Три режима производительности

Сравнив «думающие» модели с их стандартными версиями (LLM), исследователи выделили три режима работы в зависимости от сложности задачи:

  • низкая сложность — LLM без функции размышлений справляются лучше и эффективнее;
  • средняя — LRM продемонстрировали преимущество благодаря цепочкам рассуждений;
  • высокая сложность — оба типа моделей полностью провалили задания.

Неспособность следовать алгоритму

Исследователи предоставили модели точный алгоритм для решения Ханойской башни, который требовал лишь последовательного выполнения шагов. Однако она все равно потерпела крах на том же уровне сложности, что и при самостоятельном поиске решения. Это ставит под сомнение их способность к выполнению точных вычислений и логике.

Авторы пришли к выводу, что нынешние LRM, несмотря на сложные механизмы саморефлексии, не обладают обобщаемыми навыками решения проблем. Их успехи могут быть связаны, скорее, с продвинутым сопоставлением с образцом, а не с реальным процессом рассуждения, что делает термин «иллюзия мышления» из заголовка исследования весьма точным.

Напомним, в мае биржа OKX выпустила отчет, в котором говорится, что искусственный интеллект и блокчейн открывают новые подходы к получению дохода в различных отраслях.

https://forklog.com/news/ai/gallyutsinatsii-ostalis-osnovnoj-problemoj-ii

Читайте так-же

Психоделики и ИИ: популярность и опасность
ИИ

Психоделики и ИИ: популярность и опасность

04.07.2025
0

Все больше людей используют ИИ-ботов в качестве замены «трезвому человеку» во время приема психоделиков для подстраховки. Об этом пишет MIT...

Read more
Мнение: Европе нужен прикладной ИИ, а не чипы

Мнение: Европе нужен прикладной ИИ, а не чипы

04.07.2025
Чат-боты украли трафик новостных ресурсов 

Чат-боты украли трафик новостных ресурсов 

03.07.2025
ИИ восстановил 3000-летнюю вавилонскую поэму

ИИ восстановил 3000-летнюю вавилонскую поэму

03.07.2025
США отменили ограничения на экспорт ПО для чипов в Китай

США отменили ограничения на экспорт ПО для чипов в Китай

03.07.2025

ТОП НОВОСТИ

Над Киевом сбили российский дрон «Гербера» с камерой, это означает вражеский ретранслятор в тылу, — «Флеш»

Над Киевом сбили российский дрон «Гербера» с камерой, это означает вражеский ретранслятор в тылу, — «Флеш»

04.07.2025
Ведущий программист графики отмененного MMO RPG-шутера от ZeniMax рассказал, что у игры был передовой движок

Ведущий программист графики отмененного MMO RPG-шутера от ZeniMax рассказал, что у игры был передовой движок

04.07.2025
Психоделики и ИИ: популярность и опасность

Психоделики и ИИ: популярность и опасность

04.07.2025
Honor Magic V Flip 2 сохранит «отзеркаленный» дизайн (характеристики)

Honor Magic V Flip 2 сохранит «отзеркаленный» дизайн (характеристики)

04.07.2025
Tesla Model Y больше не самое популярное авто в мире — кто новый король?

Tesla Model Y больше не самое популярное авто в мире — кто новый король?

04.07.2025

ПОПУЛЯРНОЕ

  • Clair Obscur: Expedition 33 разошлась тиражом в 500 тысяч копий за сутки

    Clair Obscur: Expedition 33 разошлась тиражом в 500 тысяч копий за сутки

    0 shares
    Share 0 Tweet 0
  • Обзор клавиатуры MechLands Vibe75 – сменные модули экрана и регулятора

    0 shares
    Share 0 Tweet 0
  • В ролевой котоэкшен Cat Quest 3 добавили бесплатный контент с новыми боссами и попугаями

    0 shares
    Share 0 Tweet 0
  • Бывший руководитель отмененной Hytale почти готов выкупить игру у Riot Games за 25 миллионов долларов и довести ее до релиза

    0 shares
    Share 0 Tweet 0
  • Патч для MindsEye, который делает врагов умнее, вышел на консолях, но не на ПК

    0 shares
    Share 0 Tweet 0
  • Реклама
  • Контакты
  • Политика конфиденциальности
Реклама: digestmediaholding@gmail.com

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

wpDiscuz