IT обозрение
Пятница, 6 февраля, 2026
No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
IT обозрение
No Result
View All Result
Home ИИ

Claude Opus 4.6 обошла GPT-5.2 в тестах на логику и получила «команду агентов»

06.02.2026
A A
0
Share on FacebookShare on Twitter

ии-стартап Anthropic AI

ИИ-стартап Anthropic обновил свою флагманскую модель Claude Opus до версии 4.6. Нейросеть стала лучше планировать действия, справляться с длительными задачами и эффективнее работать с объемными базами кода.

ЭТО ИНТЕРЕСНО

ИИ-ассистенты для бизнеса под ключ от компании Secret Agents

ИИ-ассистенты для бизнеса под ключ от компании Secret Agents

06.02.2026
Кто управляет ботами?

Кто управляет ботами?

05.02.2026

Контекстное окно расширили до 1 млн токенов. Такой объем позволяет анализировать массивные документы и вести долгие диалоги без потери логической нити.

Обновленные алгоритмы адаптированы для решения рабочих задач: проведению финансового анализа, исследования, использованию и созданию документов, таблиц и презентаций.

Opus 4.6 получила наивысшую оценку в тесте по программированию Terminal-Bench 2.0 и опередила конкурентов в сложном междисциплинарном бенчмарке на логическое мышление Humanity’s Last Exam.

image
Сравнение Opus 4.6 с конкурентами в ряде тестов. Источник: Anthropic.

В GDPval-AA, который оценивает качество рассуждений и принятия решений, модель превзошла GPT-5.2 от OpenAI. LLM также показала лучшие результаты в BrowseComp, который измеряет способность находить в интернете труднодоступную информацию.

image
Источник: Anthropic.

Opus 4.6 эффективно извлекает данные из объемных документов. Благодаря расширенному контекстному окну модель отслеживает и улавливает неочевидные скрытые детали.

Команды агентов

Ключевое нововведение — возможность создавать группы агентов для совместной работы. В таком режиме несколько ИИ-ассистентов работают параллельно и координируют свою работу автономно.

Инструмент подходит для поручений, которые разделяются на независимые и требуют анализа большого количества текста.

Замкнутый цикл

В Anthropic заявили, что «создают Claude вместе с Claude». Разработчики пишут код с помощью собственной ИИ-модели, а каждый новый продукт перед релизом проходит проверку на внутренних задачах компании.

Команда обнаружила, что Opus 4.6 уделяет больше внимания самым сложным частям задачи без дополнительных указаний, быстро выполняет простые поручения, лучше справляется с неоднозначными проблемами и сохраняет эффективность на длинных дистанциях.

«Opus 4.6 часто думает более глубоко и тщательно пересматривает свои рассуждения перед принятием решения. Это дает лучшие результаты при решении сложных кейсов, но может увеличить затраты и издержки в случае с простыми», — отметили в компании.

Безопасность

Автоматизированный аудит выявил у Opus 4.6 низкую склонность к нежелательному поведению: обману, лести, укреплению заблуждений пользователя и содействию в неправомерных действиях.

image
Модель демонстрирует безопасность на уровне Opus 4.5. Источник: Anthropic.

Для проверки модели компания провела наиболее полную серию оценок, впервые применив новые методики тестирования и усовершенствовав существующие.

Доступность и новые функции

Claude Opus 4.6 уже доступна в веб-интерфейсе, через API и на основных облачных платформах.

В инструментарий для разработчиков новые функции:

  • адаптивное мышление — нейросеть самостоятельно определяет, когда необходимо задействовать режим глубокого рассуждения;
  • регулировка усилий — предусмотрено четыре уровня интенсивности работы: от низкого до максимального;
  • уплотнение контекста — инструмент автоматически резюмирует и заменяет старый контекст, когда разговор приближается к порогу токенов.

Opus 4.6 лучше работает с офисными инструментами вроде Excel и PowerPoint.

Напомним, в январе CEO Anthropic Дарио Амодеи предсказал скорое появление AGI и сокращения рабочих мест.

Читайте так-же

ИИ-ассистенты для бизнеса под ключ от компании Secret Agents
ИИ

ИИ-ассистенты для бизнеса под ключ от компании Secret Agents

06.02.2026
0

Искусственный интеллект перестал быть экспериментом для крупных корпораций — сегодня он становится практичным инструментом для бизнеса любого масштаба. ИИ-ассистенты берут...

Read more
Кто управляет ботами?

Кто управляет ботами?

05.02.2026
Аудитория Gemini достигла 750 млн и вплотную приблизилась к показателям ChatGPT

Аудитория Gemini достигла 750 млн и вплотную приблизилась к показателям ChatGPT

05.02.2026
Конкурент Sora научился генерировать видео со сложным монтажом

Конкурент Sora научился генерировать видео со сложным монтажом

05.02.2026
Ставка Илона Маска на взрослый контент помогла Grok догнать конкурентов

Ставка Илона Маска на взрослый контент помогла Grok догнать конкурентов

05.02.2026

ТОП НОВОСТИ

MachineGames подтвердила намерение завершить трилогию Wolfenstein

MachineGames подтвердила намерение завершить трилогию Wolfenstein

06.02.2026
«Звездные войны. Траун»: роман о самом сложном антагонисте вселенной Star Wars

«Звездные войны. Траун»: роман о самом сложном антагонисте вселенной Star Wars

06.02.2026
Планшет с полезной оранжевой кнопкой: обзор TECNO MEGAPAD Pro для фильмов и работы

Планшет с полезной оранжевой кнопкой: обзор TECNO MEGAPAD Pro для фильмов и работы

06.02.2026
Claude Opus 4.6 обошла GPT-5.2 в тестах на логику и получила «команду агентов»

Claude Opus 4.6 обошла GPT-5.2 в тестах на логику и получила «команду агентов»

06.02.2026
Google подтвердила, что все Android-устройства начнут поддерживать AirDrop

Google подтвердила, что все Android-устройства начнут поддерживать AirDrop

06.02.2026

ПОПУЛЯРНОЕ

  • Blizzard анонсировала крупнейшее обновление Overwatch – синематик Вендетты, 10 героев в год и ребрендинг без цифры «2»

    Electronic Arts привезет на E3 2017 новые Star Wars: Battlefront и Need for Speed

    0 shares
    Share 0 Tweet 0
  • Эксперты раскритиковали инициативу с запретом современных протоколов шифрования — это может угрожать стабильности Рунета

    0 shares
    Share 0 Tweet 0
  • Code Vein 2 оказалась большим разочарованием с отвратительной графикой и ужасной оптимизацией

    0 shares
    Share 0 Tweet 0
  • Valve пересмотрит дату выпуска и цену Steam Machine из-за кризиса памяти

    0 shares
    Share 0 Tweet 0
  • ИИ-ассистенты для бизнеса под ключ от компании Secret Agents

    0 shares
    Share 0 Tweet 0
  • О нас
  • Реклама
  • Контакты
  • Политика конфиденциальности
  • Sitemap
Реклама: digestmediaholding@gmail.com

Использование любых материалов, опубликованных на портале itoboz.com, разрешается только при условии обязательного указания источника. Любое использование контента — будь то статьи, аналитические материалы, обзоры или новостные публикации — должно сопровождаться прямой гиперссылкой, открытой для индексации поисковыми системами.
Для интернет-СМИ, блогов и иных онлайн-платформ необходимо размещать такую ссылку либо в подзаголовке, либо в первом абзаце публикации. Скрытые ссылки или технические методы, препятствующие индексации, использовать запрещается.

Редакция портала itoboz.com публикует материалы различных авторов, однако не обязательно разделяет их мнение или позицию. Все точки зрения, представленные в статьях, обзорах и комментариях, принадлежат исключительно авторам публикаций. Редакция не несет ответственности за содержание републикуемых материалов, а также за любые последствия их использования третьими лицами.

© 2010-2026 IT новости. All Rights reserved

No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта

Использование любых материалов, опубликованных на портале itoboz.com, разрешается только при условии обязательного указания источника. Любое использование контента — будь то статьи, аналитические материалы, обзоры или новостные публикации — должно сопровождаться прямой гиперссылкой, открытой для индексации поисковыми системами.
Для интернет-СМИ, блогов и иных онлайн-платформ необходимо размещать такую ссылку либо в подзаголовке, либо в первом абзаце публикации. Скрытые ссылки или технические методы, препятствующие индексации, использовать запрещается.

Редакция портала itoboz.com публикует материалы различных авторов, однако не обязательно разделяет их мнение или позицию. Все точки зрения, представленные в статьях, обзорах и комментариях, принадлежат исключительно авторам публикаций. Редакция не несет ответственности за содержание републикуемых материалов, а также за любые последствия их использования третьими лицами.

© 2010-2026 IT новости. All Rights reserved

wpDiscuz