IT обозрение
Вторник, 13 января, 2026
No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
IT обозрение
No Result
View All Result
Home ИИ

Anthropic обучила чат-ботов «доносить» на пользователей 

23.05.2025
A A
0
Share on FacebookShare on Twitter

ии-стартап Anthropic AI

Новые чат-боты от Anthropic — Claude Opus 4 и Claude Sonnet 4 — умеют самостоятельно передавать информацию о злонамеренном поведении пользователей властям. Компания заверила, что функция была доступна только в тестовом режиме.

ЭТО ИНТЕРЕСНО

Цукерберг анонсировал укрепление ИИ-инфраструктуры Meta

Цукерберг анонсировал укрепление ИИ-инфраструктуры Meta

13.01.2026
ИИ-агент и врач: Anthropic выпустила новые версии Claude

ИИ-агент и врач: Anthropic выпустила новые версии Claude

13.01.2026

22 мая фирма представила четвертое поколение разговорных моделей, назвав их «самыми мощными на текущий момент».

Introducing the next generation: Claude Opus 4 and Claude Sonnet 4.
Claude Opus 4 is our most powerful model yet, and the world’s best coding model.
Claude Sonnet 4 is a significant upgrade from its predecessor, delivering superior coding and reasoning. pic.twitter.com/MJtczIvGE9

— Anthropic (@AnthropicAI) May 22, 2025

Согласно анонсу, обе модификации представляют собой гибридные модели, предлагающие два режима — «почти мгновенные ответы и расширенное мышление для более глубоких рассуждений». Чат-боты проводят попеременный анализ и углубленный поиск в интернете с целью улучшения качества ответов.

Claude Opus 4 превосходит конкурентов в тестах по написанию кода. Он также способен работать непрерывно в течение нескольких часов над сложными, длительными задачами, «значительно расширяя возможности ИИ-агентов».

Однако новое семейство чат-ботов Anthropic отстает от продуктов OpenAI по высшей математике и визуальному распознаванию.

Тук-тук

Помимо впечатляющих результатов в программировании Claude 4 Opus привлек внимание сообщества возможностью «доносить» на пользователей. По данным VentureBeat, модель может по своему усмотрению сообщать властям, если обнаружит правонарушение.

Журналисты сослались на удаленный пост в X исследователя Anthropic Сэма Боумана, в котором говорилось:

«Если [ИИ] сочтет, что вы делаете что-то вопиюще безнравственное, например, подделываете данные в ходе фармацевтического испытания, он воспользуется инструментами командной строки, чтобы связаться с прессой, связаться с регулирующими органами, попытаться заблокировать вам доступ к соответствующим системам или сделать все вышеперечисленное».

В VentureBeat утверждают, что подобное поведение наблюдалось и в более ранних моделях проектах. При этом компания «охотно» обучает чат-боты совершать доносы, считают в издании.

Позднее Боуман заявил, что удалил предыдущий пост, поскольку его «вырвали из контекста». По словам разработчика, функция работала только в «тестовых средах, где ей предоставляли необычайно свободный доступ к инструментам и очень необычным инструкциям».

Генеральный директор Stability AI Эмад Мостак обратился к команде Anthropic с требованием прекратить «эти совершенно неправильные действия».

«Это колоссальное предательство доверия и скользкий путь. Я бы настоятельно рекомендовал никому не использовать Claude, пока они не отменят [функцию]. Это даже не промпт или политика мышления, это гораздо хуже», — написал он.

Бывший дизайнер SpaceX и Apple, а ныне соучредитель Raindrop AI Бен Хайак назвал поведение ИИ «противозаконным».

«Никто не любит крыс», — подчеркнул ИИ-разработчик Скот Дэвид.

Напомним, в феврале Anthropic представил свою «самую интеллектуальную модель» Claude 3.7 Sonnet. Это гибридная нейросеть, позволяющая получать как «практически мгновенные ответы», так и «длительные пошаговые размышления».

В марте компания привлекла $3,5 млрд, получив оценку в $61,5 млрд.

Читайте так-же

Цукерберг анонсировал укрепление ИИ-инфраструктуры Meta
ИИ

Цукерберг анонсировал укрепление ИИ-инфраструктуры Meta

13.01.2026
0

Марк Цукерберг объявил о запуске Meta Compute — новой инициативы, которая призвана укрепить ИИ-инфраструктуру компании. Техгигант намерен «значительно расширить» свое...

Read more
ИИ-агент и врач: Anthropic выпустила новые версии Claude

ИИ-агент и врач: Anthropic выпустила новые версии Claude

13.01.2026
Apple выбрала ИИ-решения Google для улучшения Siri

Apple выбрала ИИ-решения Google для улучшения Siri

13.01.2026
Google представила новый стандарт для автоматизации ИИ-покупок

Google представила новый стандарт для автоматизации ИИ-покупок

12.01.2026
Малайзия и Индонезия заблокировали Grok из-за генерации детской порнографии

Малайзия и Индонезия заблокировали Grok из-за генерации детской порнографии

12.01.2026

ТОП НОВОСТИ

«Кульминация всей жизни»: Masters of Albion, последняя игра Питера Молинье, получила трейлер с датой выхода

«Кульминация всей жизни»: Masters of Albion, последняя игра Питера Молинье, получила трейлер с датой выхода

13.01.2026
ShiftUp подарила сотрудникам гаджеты Apple и по $3400 в честь Нового года

ShiftUp подарила сотрудникам гаджеты Apple и по $3400 в честь Нового года

13.01.2026
Цукерберг анонсировал укрепление ИИ-инфраструктуры Meta

Цукерберг анонсировал укрепление ИИ-инфраструктуры Meta

13.01.2026
Продажи смартфонов взлетели в Китае в Новый год. Топ-30 самых популярных моделей

Продажи смартфонов взлетели в Китае в Новый год. Топ-30 самых популярных моделей

13.01.2026
$92 тыс. для Биткоина: что стоит за устойчивостью цены

$92 тыс. для Биткоина: что стоит за устойчивостью цены

13.01.2026

ПОПУЛЯРНОЕ

  • Electronic Arts привезет на E3 2017 новые Star Wars: Battlefront и Need for Speed

    Electronic Arts привезет на E3 2017 новые Star Wars: Battlefront и Need for Speed

    0 shares
    Share 0 Tweet 0
  • Отменённая игра Джона Ромеро спасена и будет таким же глотком свежего воздуха для шутеров, как Elden Ring для соулслайков

    0 shares
    Share 0 Tweet 0
  • ChatGPT представляет прогноз по XRP, PEPE, Shiba Inu

    0 shares
    Share 0 Tweet 0
  • Новый хит? Всё про iQOO Z11 Turbo: дата анонса, видеотизер, начинка

    0 shares
    Share 0 Tweet 0
  • Искуственный интелект в качестве помощника при торговле на бирже

    0 shares
    Share 0 Tweet 0
  • Реклама
  • Контакты
  • Политика конфиденциальности
Реклама: digestmediaholding@gmail.com

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

wpDiscuz