IT обозрение
Суббота, 21 июня, 2025
No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
No Result
View All Result
IT обозрение
No Result
View All Result
Home ИИ

Anthropic обучила чат-ботов «доносить» на пользователей 

23.05.2025
A A
0
Share on FacebookShare on Twitter

ии-стартап Anthropic AI

Новые чат-боты от Anthropic — Claude Opus 4 и Claude Sonnet 4 — умеют самостоятельно передавать информацию о злонамеренном поведении пользователей властям. Компания заверила, что функция была доступна только в тестовом режиме.

ЭТО ИНТЕРЕСНО

СМИ: OpenAI отказалась от услуг Scale AI после сделки с Meta

СМИ: OpenAI отказалась от услуг Scale AI после сделки с Meta

20.06.2025
Midjourney выпустил генеративный ИИ для создания видео 

Midjourney выпустил генеративный ИИ для создания видео 

19.06.2025

22 мая фирма представила четвертое поколение разговорных моделей, назвав их «самыми мощными на текущий момент».

Introducing the next generation: Claude Opus 4 and Claude Sonnet 4.
Claude Opus 4 is our most powerful model yet, and the world’s best coding model.
Claude Sonnet 4 is a significant upgrade from its predecessor, delivering superior coding and reasoning. pic.twitter.com/MJtczIvGE9

— Anthropic (@AnthropicAI) May 22, 2025

Согласно анонсу, обе модификации представляют собой гибридные модели, предлагающие два режима — «почти мгновенные ответы и расширенное мышление для более глубоких рассуждений». Чат-боты проводят попеременный анализ и углубленный поиск в интернете с целью улучшения качества ответов.

Claude Opus 4 превосходит конкурентов в тестах по написанию кода. Он также способен работать непрерывно в течение нескольких часов над сложными, длительными задачами, «значительно расширяя возможности ИИ-агентов».

Однако новое семейство чат-ботов Anthropic отстает от продуктов OpenAI по высшей математике и визуальному распознаванию.

Тук-тук

Помимо впечатляющих результатов в программировании Claude 4 Opus привлек внимание сообщества возможностью «доносить» на пользователей. По данным VentureBeat, модель может по своему усмотрению сообщать властям, если обнаружит правонарушение.

Журналисты сослались на удаленный пост в X исследователя Anthropic Сэма Боумана, в котором говорилось:

«Если [ИИ] сочтет, что вы делаете что-то вопиюще безнравственное, например, подделываете данные в ходе фармацевтического испытания, он воспользуется инструментами командной строки, чтобы связаться с прессой, связаться с регулирующими органами, попытаться заблокировать вам доступ к соответствующим системам или сделать все вышеперечисленное».

В VentureBeat утверждают, что подобное поведение наблюдалось и в более ранних моделях проектах. При этом компания «охотно» обучает чат-боты совершать доносы, считают в издании.

Позднее Боуман заявил, что удалил предыдущий пост, поскольку его «вырвали из контекста». По словам разработчика, функция работала только в «тестовых средах, где ей предоставляли необычайно свободный доступ к инструментам и очень необычным инструкциям».

Генеральный директор Stability AI Эмад Мостак обратился к команде Anthropic с требованием прекратить «эти совершенно неправильные действия».

«Это колоссальное предательство доверия и скользкий путь. Я бы настоятельно рекомендовал никому не использовать Claude, пока они не отменят [функцию]. Это даже не промпт или политика мышления, это гораздо хуже», — написал он.

Бывший дизайнер SpaceX и Apple, а ныне соучредитель Raindrop AI Бен Хайак назвал поведение ИИ «противозаконным».

«Никто не любит крыс», — подчеркнул ИИ-разработчик Скот Дэвид.

Напомним, в феврале Anthropic представил свою «самую интеллектуальную модель» Claude 3.7 Sonnet. Это гибридная нейросеть, позволяющая получать как «практически мгновенные ответы», так и «длительные пошаговые размышления».

В марте компания привлекла $3,5 млрд, получив оценку в $61,5 млрд.

Читайте так-же

СМИ: OpenAI отказалась от услуг Scale AI после сделки с Meta
ИИ

СМИ: OpenAI отказалась от услуг Scale AI после сделки с Meta

20.06.2025
0

Компания OpenAI прекращает сотрудничество со Scale AI, пишет Bloomberg. Решение приняли после того, как корпорация Meta объявила о покупке 49%...

Read more
Midjourney выпустил генеративный ИИ для создания видео 

Midjourney выпустил генеративный ИИ для создания видео 

19.06.2025
Игра Иннокентия

Игра Иннокентия

19.06.2025
Сингулярность близко: что такое AISM и как он помогает подготовиться к превосходству ИИ

Сингулярность близко: что такое AISM и как он помогает подготовиться к превосходству ИИ

18.06.2025
OpenAI получила от Пентагона контракт на $200 млн

OpenAI получила от Пентагона контракт на $200 млн

18.06.2025

ТОП НОВОСТИ

Разработчики Unknown Worlds показали уникальную технологию создания мира Subnautica 2

Разработчики Unknown Worlds показали уникальную технологию создания мира Subnautica 2

21.06.2025
Анонс MediaTek Dimensity 8450: вообще ничего нового

Анонс MediaTek Dimensity 8450: вообще ничего нового

21.06.2025
Как будут работать компьютерные сети на космических расстояниях, — ответы ученого

Как будут работать компьютерные сети на космических расстояниях, — ответы ученого

21.06.2025
Сообщения о краже 16 миллиардов паролей оказались очередной дезинформацией

Сообщения о краже 16 миллиардов паролей оказались очередной дезинформацией

21.06.2025
Nothing Headphone (1) уже засветились на первых шпионских фото

Nothing Headphone (1) уже засветились на первых шпионских фото

21.06.2025

ПОПУЛЯРНОЕ

  • Фото дня: автофокусный парфокальный объектив Samyang 24-70mm f/2.8 FE

    Фото дня: автофокусный парфокальный объектив Samyang 24-70mm f/2.8 FE

    0 shares
    Share 0 Tweet 0
  • Для Path of Exile вышло крупное обновление «Секреты Атласа»

    0 shares
    Share 0 Tweet 0
  • Elex 3 была полностью играбельна перед закрытием Piranha Bytes

    0 shares
    Share 0 Tweet 0
  • Цена Samsung Galaxy S25, S25+ и S25 Ultra в Европе

    0 shares
    Share 0 Tweet 0
  • Фермерский симулятор Len’s Island вышел из раннего доступа и получил кооператив на 8 человек — в игре стартовали бесплатные выходные

    0 shares
    Share 0 Tweet 0
  • Реклама
  • Контакты
  • Политика конфиденциальности
Реклама: digestmediaholding@gmail.com

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

wpDiscuz