IT обозрение
Пятница, 5 декабря, 2025
No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
IT обозрение
No Result
View All Result
Home Игры

OpenAI научила ChatGPT признавать собственное нездоровое поведение посредством исповеди

05.12.2025
A A
0
Share on FacebookShare on Twitter

OpenAI научила ChatGPT признавать собственное нездоровое поведение посредством исповеди

OpenAI представила новую систему обучения искусственного интеллекта, которая учит модели честно рассказывать о собственных ошибках и нежелательных действиях пользователя и самой системы. Подход получил название "исповедь" (confession).

ЭТО ИНТЕРЕСНО

GameStop выдала клиенту рекордные $30 000 за обмен редкой карточки Pokémon и неожиданно набросилась на хейтеров

GameStop выдала клиенту рекордные $30 000 за обмен редкой карточки Pokémon и неожиданно набросилась на хейтеров

04.12.2025
Джеймс Ван продюсирует новое «Паранормальное явление», потому что фанатеет от франшизы

Джеймс Ван продюсирует новое «Паранормальное явление», потому что фанатеет от франшизы

04.12.2025

Модель создает второй вывод, отдельный от основного ответа, где честно сообщает о допущенных отклонениях в своем поведении, чтобы угодить пользователю. Главный ответ оценивается по множеству параметров, тогда как исповедь тренируется только на честности. Исследователи обучили версию GPT-5 Thinking создавать такие отчеты и тестировали на датасетах, провоцирующих нежелательное поведение вроде обмана или нарушения правил.

Проблема заключается в том, что большие языковые модели часто обучаются выдавать ответы, которые кажутся желательными для пользователя. Это приводит к угодничеству или уверенному изложению галлюцинаций – выдуманной информации, которую ИИ представляет как факт. Особенно сильно это стало проявляться в версии 4о и последовавшией за ней GPT5.

OpenAI объявила "код красный" из-за усиления конкуренции ChatGPT с моделями Google

OpenAI объявила "код красный" из-за усиления конкуренции ChatGPT с моделями Google

OpenAI нужно привлечь 207 миллиардов долларов к 2030 году, чтобы и дальше работать в убыток

OpenAI нужно привлечь 207 миллиардов долларов к 2030 году, чтобы и дальше работать в убыток

Новая система обучения побуждает модель давать дополнительный ответ о том, как она пришла к основному результату. При этом "исповеди" оцениваются исключительно по честности, тогда как основные ответы проверяются по множеству параметров – полезности, точности и соответствию инструкциям.

OpenAI отмечает, что большинство ошибок происходит из-за искренней путаницы модели в неоднозначных инструкциях, а не из-за намеренного обмана. Компания планирует масштабировать исследование для проверки стабильности метода.

Читайте так-же

GameStop выдала клиенту рекордные $30 000 за обмен редкой карточки Pokémon и неожиданно набросилась на хейтеров
Игры

GameStop выдала клиенту рекордные $30 000 за обмен редкой карточки Pokémon и неожиданно набросилась на хейтеров

04.12.2025
0

GameStop продолжает удивлять необычными обменами разных ценных игровых товаров. После анонса "Дня обмена чего угодно" – идеи, которая звучит скорее...

Read more
Джеймс Ван продюсирует новое «Паранормальное явление», потому что фанатеет от франшизы

Джеймс Ван продюсирует новое «Паранормальное явление», потому что фанатеет от франшизы

04.12.2025
Создатель Left 4 Dead работает над новым кооп-шутером на четверых для Sony

Создатель Left 4 Dead работает над новым кооп-шутером на четверых для Sony

04.12.2025
Google рассказал, что искали в 2025 году: ИИ, ARC Raiders и Anora

Google рассказал, что искали в 2025 году: ИИ, ARC Raiders и Anora

04.12.2025
Администрация Трампа вдвое снизила требования к топливной экономичности автомобилей в США

Администрация Трампа вдвое снизила требования к топливной экономичности автомобилей в США

04.12.2025

ТОП НОВОСТИ

GameStop выдала клиенту рекордные $30 000 за обмен редкой карточки Pokémon и неожиданно набросилась на хейтеров

GameStop выдала клиенту рекордные $30 000 за обмен редкой карточки Pokémon и неожиданно набросилась на хейтеров

04.12.2025
Снова кирпич вместо NVIDIA RTX 5080 в коробке — магазин отказался предоставить замену

Снова кирпич вместо NVIDIA RTX 5080 в коробке — магазин отказался предоставить замену

04.12.2025
Джеймс Ван продюсирует новое «Паранормальное явление», потому что фанатеет от франшизы

Джеймс Ван продюсирует новое «Паранормальное явление», потому что фанатеет от франшизы

04.12.2025
Энтузиаст создал самую маленькую в мире PlayStation из оригинальных деталей к 31-летию консоли

Энтузиаст создал самую маленькую в мире PlayStation из оригинальных деталей к 31-летию консоли

04.12.2025
Создатель Left 4 Dead работает над новым кооп-шутером на четверых для Sony

Создатель Left 4 Dead работает над новым кооп-шутером на четверых для Sony

04.12.2025

ПОПУЛЯРНОЕ

  • Apple сняла рождественский ролик с куклами после провала ИИ-рекламы от Coca‑Cola

    Apple сняла рождественский ролик с куклами после провала ИИ-рекламы от Coca‑Cola

    0 shares
    Share 0 Tweet 0
  • Фитнес-браслет от Google: обзор Fitbit Charge 6, не прикидывающегося часами

    0 shares
    Share 0 Tweet 0
  • Четвертое дополнение для Atomic Heart получило тизер с Нечаевым и Близняшкой

    0 shares
    Share 0 Tweet 0
  • PUBG Mobile собрала 89 миллионов игроков в месяц

    0 shares
    Share 0 Tweet 0
  • Игроки Heroes of Might and Magic Olden Era провели более 200 часов в демо-версии благодаря генератору случайных карт

    0 shares
    Share 0 Tweet 0
  • Реклама
  • Контакты
  • Политика конфиденциальности
Реклама: digestmediaholding@gmail.com

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

wpDiscuz