IT обозрение
Воскресенье, 19 апреля, 2026
No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
IT обозрение
No Result
View All Result
Home ИИ

OpenAI выпустила склонные к обману ИИ-модели o3 и o4-mini

17.04.2025
A A
0
Share on FacebookShare on Twitter

Что такое ChatGPT и как им пользоваться

  • Компания OpenAI представила новые «думающие» ИИ-модели o3 и o4-mini.
  • Ключевая особенность нейросетей — «мышление изображениями» вместо их обычного анализа.
  • Тестеры безопасности пожаловались на склонность o3 и o4-mini к обману.
  • Стартап делает упор на разработку ИИ-агентов для программирования.

OpenAI сообщила о запуске новых ИИ-моделей o3 и o4-mini. Обе ориентированы на рассуждения — затрачивают больше времени перед ответом для перепроверки самих себя.

ЭТО ИНТЕРЕСНО

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic

05.03.2026
Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

05.03.2026

Introducing OpenAI o3 and o4-mini—our smartest and most capable models to date.
For the first time, our reasoning models can agentically use and combine every tool within ChatGPT, including web search, Python, image analysis, file interpretation, and image generation. pic.twitter.com/rDaqV0x0wE

— OpenAI (@OpenAI) April 16, 2025

o3 позиционируется как самая продвинутая «думающая» нейросеть. Согласно внутренним тестам, она превосходит предыдущие итерации в математике, программировании, рассуждениях, науке и визуальном понимании.

o4-mini предлагает конкурентоспособный компромисс между ценой, скоростью и производительностью.

Обе модели способны просматривать веб-страницы, анализировать код на Python, обрабатывать и генерировать изображения. Они, а также вариация o4-mini-high, доступны для подписчиков Pro, Plus и Team.

По заявлению компании, модели o3 и o4-mini стали первыми, кто не просто распознает изображения, а буквально «думает с их помощью». Пользователи могут загружать в ChatGPT картинки — например, схемы на доске или диаграммы из PDF — а модели будут анализировать их, используя так называемую «цепочку размышлений».

Благодаря этому нейросети способны понимать размытые и некачественные изображения. Также они могут запустить и выполнить код на Python прямо в браузере с помощью функции Canvas в ChatGPT или осуществить поиск в интернете, если их спросить об актуальных событиях.

o3 набрала 69,1% в тесте по программированию SWE-bench, o4-mini — 68,1%. o3-mini имеет показатель 49,3 %, Claude 3.7 Sonnet — 62,3 %.

o3 взимает $10 за миллион входных токенов и $40 — выходных. В случае с o4-mini — $1,1 и $4,4 соответственно.

В ближайшие недели запланирован запуск o3-pro — версии o3, которая задействует больше вычислительных ресурсов для предоставления ответа. Она будет доступна только подписчикам ChatGPT Pro.

Новая система безопасности

OpenAI внедрила новую систему мониторинга в моделях o3 и o4-mini, чтобы выявлять запросы, связанные с биологическими и химическими угрозами. Она направлена на предотвращение предоставления советов, которые могут побудить к осуществлению потенциально опасных атак.

Компания отметила, что новые модели обладают значительно расширенными возможностями по сравнению с предыдущими и, соответственно, несут усиленный риск при использовании не добропорядочными пользователями.

O3 более искусна в ответах на вопросы, связанные с созданием определенных типов биологических угроз, поэтому компания создала новую систему мониторинга. Она работает поверх o3 и o4-mini и предназначена для выявления промптов, связанных с биологическим и химическим риском.

Специалисты OpenAI провели около 1000 часов, помечая «небезопасные» разговоры. Затем модели отказывались отвечать на рисковые промпты в 98,7% случаев.

Сравнение новых моделей OpenAI в области биорисков. Данные: OpenAI.

Несмотря на регулярное улучшение безопасности ИИ-моделей, один из партнеров компании выразил обеспокоенность.

OpenAI торопится

Организация Metr, с которой OpenAI сотрудничает для проверки возможностей своих ИИ-моделей и их оценки в области безопасности, получила мало времени для тестирования новых нейросетей.

Она сообщила в блоге, что один из эталонных экспериментов o3 был пройден «за относительно короткое время» по сравнению с анализом предыдущей флагманской модели OpenAI — o1.

Согласно информации Financial Times, ИИ-стартап дал тестерам менее недели на проверку безопасности новых продуктов.

Metr утверждает, что, исходя из информации, которую удалось собрать за ограниченное время, o3 имеет «высокую склонность» к «обману» или «взлому» тестов сложными способами для максимизации своего балла. Она идет на крайние меры, даже когда четко понимает, что поведение не соответствует намерениям пользователя и OpenAI.

Организация считает, что o3 может проявлять и другие виды враждебного или «злонамеренного» поведения.

«Хотя мы не считаем это особенно вероятным, важно отметить, что [наша] оценочная установка не сможет уловить этот тип риска. В целом мы считаем, что тестирование возможностей перед запуском само по себе не является достаточной стратегией управления рисками, и в настоящее время мы разрабатываем прототипы дополнительных форм оценки», — подчеркнули в компании.

Компания Apollo Research также зафиксировала обманчивое поведение модели o3 o4-mini. В одном из тестов ей запретили использовать определенный инструмент, но модель все равно применила его, посчитав, что он поможет лучше справиться с задачей.

«[Выводы Apollo] показывают, что o3 и o4-mini способны на внутриконтекстные интриги и стратегический обман. Несмотря на относительную безвредность, повседневным пользователям важно знать о расхождениях между заявлениями и действиями моделей […] Это может быть дополнительно оценено путем анализа внутренних следов рассуждений», — отметила OpenAI.

Агент для программирования

Вместе с новыми ИИ-моделями OpenAI представила Codex CLI — локального программного агента, который запускается прямо из терминала.

Инструмент позволяет писать и редактировать код на рабочем столе и выполнять некоторые действия вроде перемещения файлов.

«Вы можете получить преимущества мультимодального рассуждения из командной строки, передавая скриншоты или эскизы с низким разрешением модели, в сочетании с доступом к вашему коду локально [через Codex CLI]», — отметили в компании.

OpenAI хочет купить Windsurf

Тем временем OpenAI ведет переговоры о возможном приобретении популярного ИИ-помощника для программистов Windsurf. Об этом пишет Bloomberg.

Сделка может стать крупнейшей покупкой для стартапа Сэма Альтмана. Ее детали еще не определены и могут измениться, подчеркнули в агентстве.

Напомним, в апреле OpenAI представила новое семейство ИИ-моделей — GPT-4.1, GPT-4.1 mini и GPT-4.1 nano. Они «отлично справляются» с программированием и выполнением инструкций.

Читайте так-же

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic
ИИ

CEO Nvidia намекнул на остановку инвестиций в OpenAI и Anthropic

05.03.2026
0

Недавняя инвестиция $30 млрд в OpenAI «может стать последней» для Nvidia перед выходом ИИ-стартапа на биржу. Об этом заявил генеральный...

Read more
Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

Блокчейн Ethereum станет независимой средой верификации для ИИ-агентов

05.03.2026
Падение доходов заставило биткоин-майнеров променять крипторезервы на ИИ-инфраструктуру

Падение доходов заставило биткоин-майнеров променять крипторезервы на ИИ-инфраструктуру

05.03.2026
OpenAI и Google представили новые ИИ-модели GPT-5.3 Instant и Gemini 3.1 Flash-Lite

OpenAI и Google представили новые ИИ-модели GPT-5.3 Instant и Gemini 3.1 Flash-Lite

05.03.2026
X ввела наказания за публикацию ИИ-видео военных конфликтов без маркировки

X ввела наказания за публикацию ИИ-видео военных конфликтов без маркировки

04.03.2026

ТОП НОВОСТИ

Вэл Килмер умер в 2025-м, но оцифрованным сыграл священника в «As Deep as the Grave»: трейлер

Вэл Килмер умер в 2025-м, но оцифрованным сыграл священника в «As Deep as the Grave»: трейлер

17.04.2026
Официально: Huawei Watch Buds 2 покажут вместе с Pura 90

Официально: Huawei Watch Buds 2 покажут вместе с Pura 90

17.04.2026
Amazon MGM анонсировала фильмы на 2026-2027: «Горец» с Кавиллом, «Космические яйца 2» и не только

Amazon MGM анонсировала фильмы на 2026-2027: «Горец» с Кавиллом, «Космические яйца 2» и не только

17.04.2026
Marvel’s Wolverine получила дату выхода, а уже весной Insomniac обещает новые детали

Marvel’s Wolverine получила дату выхода, а уже весной Insomniac обещает новые детали

17.04.2026
ВИДЕО: сравнение камер iPhone 17 Pro Max и Xiaomi 17 Ultra

ВИДЕО: сравнение камер iPhone 17 Pro Max и Xiaomi 17 Ultra

17.04.2026

ПОПУЛЯРНОЕ

  • Tesla Optimus, подвинься: Chery начала продажи гуманоидного робота Mornine M1 по цене $41,4 тыс.

    Tesla Optimus, подвинься: Chery начала продажи гуманоидного робота Mornine M1 по цене $41,4 тыс.

    0 shares
    Share 0 Tweet 0
  • Resident Evil 7 будет самой сложной игрой серии

    0 shares
    Share 0 Tweet 0
  • Red Magic Gaming Pad 3 Pro красуется на видео и живых фото до анонса

    0 shares
    Share 0 Tweet 0
  • «Кладбище» отмененных игр Blizzard включает научно-фантастическую версию Diablo и игру в стиле Helldivers по вселенной Warcraft

    0 shares
    Share 0 Tweet 0
  • Первый тизер «Властелина колец: Охота на Голума» разочаровал фанатов актером на роль Арагорна

    0 shares
    Share 0 Tweet 0
  • О нас
  • Реклама
  • Контакты
  • Политика конфиденциальности
  • Sitemap
Реклама: digestmediaholding@gmail.com

Использование любых материалов, опубликованных на портале itoboz.com, разрешается только при условии обязательного указания источника. Любое использование контента — будь то статьи, аналитические материалы, обзоры или новостные публикации — должно сопровождаться прямой гиперссылкой, открытой для индексации поисковыми системами.
Для интернет-СМИ, блогов и иных онлайн-платформ необходимо размещать такую ссылку либо в подзаголовке, либо в первом абзаце публикации. Скрытые ссылки или технические методы, препятствующие индексации, использовать запрещается.

Редакция портала itoboz.com публикует материалы различных авторов, однако не обязательно разделяет их мнение или позицию. Все точки зрения, представленные в статьях, обзорах и комментариях, принадлежат исключительно авторам публикаций. Редакция не несет ответственности за содержание републикуемых материалов, а также за любые последствия их использования третьими лицами.

© 2010-2026 IT новости. All Rights reserved

No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта

Использование любых материалов, опубликованных на портале itoboz.com, разрешается только при условии обязательного указания источника. Любое использование контента — будь то статьи, аналитические материалы, обзоры или новостные публикации — должно сопровождаться прямой гиперссылкой, открытой для индексации поисковыми системами.
Для интернет-СМИ, блогов и иных онлайн-платформ необходимо размещать такую ссылку либо в подзаголовке, либо в первом абзаце публикации. Скрытые ссылки или технические методы, препятствующие индексации, использовать запрещается.

Редакция портала itoboz.com публикует материалы различных авторов, однако не обязательно разделяет их мнение или позицию. Все точки зрения, представленные в статьях, обзорах и комментариях, принадлежат исключительно авторам публикаций. Редакция не несет ответственности за содержание републикуемых материалов, а также за любые последствия их использования третьими лицами.

© 2010-2026 IT новости. All Rights reserved

wpDiscuz