IT обозрение
Вторник, 18 ноября, 2025
No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
IT обозрение
No Result
View All Result
Home ИИ

Исследователи Anthropic допустили саботаж ИИ против человечества

19.10.2024
A A
0
Share on FacebookShare on Twitter

ИИ угрожает человечеству AI

Искусственный интеллект может однажды саботировать человечество, но пока все в порядке. Об этом сообщили эксперты ИИ-стартапа Anthropic в новом исследовании.

ЭТО ИНТЕРЕСНО

Character.AI запретит подросткам общаться с ИИ-персонажами

Character.AI запретит подросткам общаться с ИИ-персонажами

30.10.2025
СМИ: OpenAI выйдет на биржу с оценкой в $1 трлн

СМИ: OpenAI выйдет на биржу с оценкой в $1 трлн

30.10.2025

New Anthropic research: Sabotage evaluations for frontier models
How well could AI models mislead us, or secretly sabotage tasks, if they were trying to?
Read our paper and blog post here: https://t.co/nQrvnhrBEv pic.twitter.com/GWrIr3wQVH

— Anthropic (@AnthropicAI) October 18, 2024

Специалисты исследовали четыре различных вектора угроз со стороны искусственного интеллекта и определили, что «минимальные меры смягчения последствий» были достаточными для текущих моделей.

«Достаточно способные модели могут подорвать человеческий надзор и принятие решений в важных контекстах. Например, в контексте разработки ИИ модели могут тайно саботировать усилия по оценке собственных опасных возможностей, мониторингу их поведения или принятию решений об их развертывании», — говорится в документе.

Однако хорошая новость в том, что исследователи Anthropic видят возможности смягчения таких рисков, по крайней мере на текущий момент.

«Хотя наши демонстрации показали, что в современных моделях, возможно, есть низкоуровневые признаки способности к саботажу, мы считаем, что минимальные меры по смягчению последствий достаточны для устранения рисков. Тем не менее по мере улучшения возможностей ИИ, вероятно, будут необходимы более реалистичные и жесткие меры по снижению рисков», — говорится в отчете.

Ранее эксперты взломали ИИ-роботов и заставили их выполнять запрещенные протоколами безопасности и этическими нормами действия. Например, детонировать бомбы.

Читайте так-же

Character.AI запретит подросткам общаться с ИИ-персонажами
ИИ

Character.AI запретит подросткам общаться с ИИ-персонажами

30.10.2025
0

Платформа для общения с ИИ-персонажами Character.AI ограничит доступ для пользователей младше 18 лет. Причиной стала серия судебных исков. «Нам нелегко...

Read more
СМИ: OpenAI выйдет на биржу с оценкой в $1 трлн

СМИ: OpenAI выйдет на биржу с оценкой в $1 трлн

30.10.2025
Nvidia представила технологию подключения квантовых компьютеров к ИИ-чипам

Nvidia представила технологию подключения квантовых компьютеров к ИИ-чипам

29.10.2025
В BNB Chain появятся x402-транзакции

В BNB Chain появятся x402-транзакции

29.10.2025
Майнер TeraWulf привлечет $500 млн на строительство дата-центра в Техасе 

Майнер TeraWulf привлечет $500 млн на строительство дата-центра в Техасе 

29.10.2025

ТОП НОВОСТИ

Продюсер Resident Evil Requiem назвал фейком популярное изображение Леона с повязкой на глазу

Продюсер Resident Evil Requiem назвал фейком популярное изображение Леона с повязкой на глазу

18.11.2025
Обновление Xiaomi SU7: странное авто замечено на тестировании, компания распродает предыдущие модели

Обновление Xiaomi SU7: странное авто замечено на тестировании, компания распродает предыдущие модели

18.11.2025
Обзор HUAWEI nova 14i: ёмкая батарея, приятный корпус и достойная камера

Обзор HUAWEI nova 14i: ёмкая батарея, приятный корпус и достойная камера

18.11.2025
Assassin’s Creed Mirage получила бесплатное дополнение Valley of Memory с новой локацией, сюжетом и улучшениями базовой игры

Assassin’s Creed Mirage получила бесплатное дополнение Valley of Memory с новой локацией, сюжетом и улучшениями базовой игры

18.11.2025
XAI тихо запустила Grok 4.1: новая модель стала точнее и «эмоциональнее»

XAI тихо запустила Grok 4.1: новая модель стала точнее и «эмоциональнее»

18.11.2025

ПОПУЛЯРНОЕ

  • Таблица сроков программной поддержки всех Android-брендов

    Таблица сроков программной поддержки всех Android-брендов

    0 shares
    Share 0 Tweet 0
  • Обзор iPhone 17 Pro Max — флагман для тех, кто «всё и сразу»

    0 shares
    Share 0 Tweet 0
  • Как создать Биткоин-кошелёк — простой путеводитель для начинающих

    0 shares
    Share 0 Tweet 0
  • Вышел майнинговый рогалик Wall World 2 с робопауком и процедурной генерацией

    0 shares
    Share 0 Tweet 0
  • Финальное дополнение для Atomic Heart выйдет в следующем месяце

    0 shares
    Share 0 Tweet 0
  • Реклама
  • Контакты
  • Политика конфиденциальности
Реклама: digestmediaholding@gmail.com

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

wpDiscuz