IT обозрение
Четверг, 4 июня, 2026
No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
IT обозрение
No Result
View All Result
Home ИИ

Anthropic обучила чат-ботов «доносить» на пользователей 

23.05.2025
A A
0
Share on FacebookShare on Twitter

ии-стартап Anthropic AI

Новые чат-боты от Anthropic — Claude Opus 4 и Claude Sonnet 4 — умеют самостоятельно передавать информацию о злонамеренном поведении пользователей властям. Компания заверила, что функция была доступна только в тестовом режиме.

ЭТО ИНТЕРЕСНО

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic

05.03.2026
Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

05.03.2026

22 мая фирма представила четвертое поколение разговорных моделей, назвав их «самыми мощными на текущий момент».

Introducing the next generation: Claude Opus 4 and Claude Sonnet 4.
Claude Opus 4 is our most powerful model yet, and the world’s best coding model.
Claude Sonnet 4 is a significant upgrade from its predecessor, delivering superior coding and reasoning. pic.twitter.com/MJtczIvGE9

— Anthropic (@AnthropicAI) May 22, 2025

Согласно анонсу, обе модификации представляют собой гибридные модели, предлагающие два режима — «почти мгновенные ответы и расширенное мышление для более глубоких рассуждений». Чат-боты проводят попеременный анализ и углубленный поиск в интернете с целью улучшения качества ответов.

Claude Opus 4 превосходит конкурентов в тестах по написанию кода. Он также способен работать непрерывно в течение нескольких часов над сложными, длительными задачами, «значительно расширяя возможности ИИ-агентов».

Однако новое семейство чат-ботов Anthropic отстает от продуктов OpenAI по высшей математике и визуальному распознаванию.

Тук-тук

Помимо впечатляющих результатов в программировании Claude 4 Opus привлек внимание сообщества возможностью «доносить» на пользователей. По данным VentureBeat, модель может по своему усмотрению сообщать властям, если обнаружит правонарушение.

Журналисты сослались на удаленный пост в X исследователя Anthropic Сэма Боумана, в котором говорилось:

«Если [ИИ] сочтет, что вы делаете что-то вопиюще безнравственное, например, подделываете данные в ходе фармацевтического испытания, он воспользуется инструментами командной строки, чтобы связаться с прессой, связаться с регулирующими органами, попытаться заблокировать вам доступ к соответствующим системам или сделать все вышеперечисленное».

В VentureBeat утверждают, что подобное поведение наблюдалось и в более ранних моделях проектах. При этом компания «охотно» обучает чат-боты совершать доносы, считают в издании.

Позднее Боуман заявил, что удалил предыдущий пост, поскольку его «вырвали из контекста». По словам разработчика, функция работала только в «тестовых средах, где ей предоставляли необычайно свободный доступ к инструментам и очень необычным инструкциям».

Генеральный директор Stability AI Эмад Мостак обратился к команде Anthropic с требованием прекратить «эти совершенно неправильные действия».

«Это колоссальное предательство доверия и скользкий путь. Я бы настоятельно рекомендовал никому не использовать Claude, пока они не отменят [функцию]. Это даже не промпт или политика мышления, это гораздо хуже», — написал он.

Бывший дизайнер SpaceX и Apple, а ныне соучредитель Raindrop AI Бен Хайак назвал поведение ИИ «противозаконным».

«Никто не любит крыс», — подчеркнул ИИ-разработчик Скот Дэвид.

Напомним, в феврале Anthropic представил свою «самую интеллектуальную модель» Claude 3.7 Sonnet. Это гибридная нейросеть, позволяющая получать как «практически мгновенные ответы», так и «длительные пошаговые размышления».

В марте компания привлекла $3,5 млрд, получив оценку в $61,5 млрд.

Читайте так-же

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic
ИИ

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic

05.03.2026
0

Недавняя инвестиция $30 млрд в OpenAI «может стать последней» для Nvidia перед выходом ИИ-стартапа на биржу. Об этом заявил генеральный...

Read more
Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

05.03.2026
Падение доходов заставило биткоин-майнеров променять крипторезервы на ИИ-инфраструктуру

Падение доходов заставило биткоин-майнеров променять крипторезервы на ИИ-инфраструктуру

05.03.2026
OpenAI и Google представили новые ИИ-модели GPT-5.3 Instant и Gemini 3.1 Flash-Lite

OpenAI и Google представили новые ИИ-модели GPT-5.3 Instant и Gemini 3.1 Flash-Lite

05.03.2026
X ввела наказания за публикацию ИИ-видео военных конфликтов без маркировки

X ввела наказания за публикацию ИИ-видео военных конфликтов без маркировки

04.03.2026

ТОП НОВОСТИ

Red Dead Redemption 2 продалась тиражом 85 млн копий: глава Take-Two отверг обвинения в провале онлайна

Red Dead Redemption 2 продалась тиражом 85 млн копий: глава Take-Two отверг обвинения в провале онлайна

26.05.2026
Nvidia закрыла панель управления GeForce после 20 лет: все настройки теперь в новом приложении

Nvidia закрыла панель управления GeForce после 20 лет: все настройки теперь в новом приложении

26.05.2026
«Письма счастья» от «налоговой»: мошенники массово рассылают фишинговые сообщения

«Письма счастья» от «налоговой»: мошенники массово рассылают фишинговые сообщения

26.05.2026
Маск променял солнечную энергетику на ископаемое топливо для ЦОД под Grok, который никому не нужен

Маск променял солнечную энергетику на ископаемое топливо для ЦОД под Grok, который никому не нужен

26.05.2026
«Приключения Паддингтона 4» получил неожиданных сценаристов: задействованы авторы «Гущи событий»

«Приключения Паддингтона 4» получил неожиданных сценаристов: задействованы авторы «Гущи событий»

26.05.2026

ПОПУЛЯРНОЕ

  • Blizzard анонсировала крупнейшее обновление Overwatch – синематик Вендетты, 10 героев в год и ребрендинг без цифры «2»

    Electronic Arts привезет на E3 2017 новые Star Wars: Battlefront и Need for Speed

    0 shares
    Share 0 Tweet 0
  • Фильм Mortal Kombat 2 выходит в цифровой продаже 9 июня, на Blu-ray — 28 июля

    0 shares
    Share 0 Tweet 0
  • Infinix Smart 20 представлен в России: особенности и цены

    0 shares
    Share 0 Tweet 0
  • Обзор Lenovo Legion Y700 Gen 5: 24 ГБ ОЗУ, 165 Гц, Snapdragon 8 Elite Gen 5

    0 shares
    Share 0 Tweet 0
  • Юбилейный игровой монстр: вышел MSI Titan 18 HX Dragon Edition Draco Epic к 40-летию бренда

    0 shares
    Share 0 Tweet 0
  • О нас
  • Реклама
  • Контакты
  • Политика конфиденциальности
  • Sitemap
Реклама: digestmediaholding@gmail.com

Использование любых материалов, опубликованных на портале itoboz.com, разрешается только при условии обязательного указания источника. Любое использование контента — будь то статьи, аналитические материалы, обзоры или новостные публикации — должно сопровождаться прямой гиперссылкой, открытой для индексации поисковыми системами.
Для интернет-СМИ, блогов и иных онлайн-платформ необходимо размещать такую ссылку либо в подзаголовке, либо в первом абзаце публикации. Скрытые ссылки или технические методы, препятствующие индексации, использовать запрещается.

Редакция портала itoboz.com публикует материалы различных авторов, однако не обязательно разделяет их мнение или позицию. Все точки зрения, представленные в статьях, обзорах и комментариях, принадлежат исключительно авторам публикаций. Редакция не несет ответственности за содержание републикуемых материалов, а также за любые последствия их использования третьими лицами.

© 2010-2026 IT новости. All Rights reserved

No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта

Использование любых материалов, опубликованных на портале itoboz.com, разрешается только при условии обязательного указания источника. Любое использование контента — будь то статьи, аналитические материалы, обзоры или новостные публикации — должно сопровождаться прямой гиперссылкой, открытой для индексации поисковыми системами.
Для интернет-СМИ, блогов и иных онлайн-платформ необходимо размещать такую ссылку либо в подзаголовке, либо в первом абзаце публикации. Скрытые ссылки или технические методы, препятствующие индексации, использовать запрещается.

Редакция портала itoboz.com публикует материалы различных авторов, однако не обязательно разделяет их мнение или позицию. Все точки зрения, представленные в статьях, обзорах и комментариях, принадлежат исключительно авторам публикаций. Редакция не несет ответственности за содержание републикуемых материалов, а также за любые последствия их использования третьими лицами.

© 2010-2026 IT новости. All Rights reserved

wpDiscuz