IT обозрение
Понедельник, 7 июля, 2025
No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
No Result
View All Result
IT обозрение
No Result
View All Result
Home ИИ

DeepMind создала ИИ-модель для фактчекинга

01.04.2024
A A
0
Share on FacebookShare on Twitter

Чат-боты с искусственным интеллектом

DeepMind представила ИИ-модель SAFE, проверяющую факты в ответах LLM лучше людей.

ЭТО ИНТЕРЕСНО

Психоделики и ИИ: популярность и опасность

Психоделики и ИИ: популярность и опасность

04.07.2025
Мнение: Европе нужен прикладной ИИ, а не чипы

Мнение: Европе нужен прикладной ИИ, а не чипы

04.07.2025

У всех больших языковых моделей есть одна общая проблема — достоверность сгенерированной информации. Чат-боты подвержены галлюцинациям, которые мешают им верно отвечать на вопросы. Из-за этого каждый результат необходимо проверять вручную, что значительно увеличивает время решения задачи.

Исследователи из DeepMind создали ИИ-модель, автоматически указывающую на неточности. Система получила название Search-Augmented Factuality Evaluator (SAFE) — «Оценщик фактов с расширенным поиском».

Разработчики создали LLM, которая сперва разделяет утверждения или факты в ответе чат-ботов. Затем она используют Google Search для поиска сайтов, верифицирующих утверждения, и производит сравнение.

По словам исследователей, использование ИИ-модели обойдется в 20 раз дешевле, чем проверка фактов людьми. Поскольку объем генерируемой чат-ботами информации стремительно растет, наличие дешевого способа верификации будет востребовано.

Для обучения команда использовала нейросеть для проверки 16 000 фактов, содержащихся в ответах 13 основных языковых моделей из четырех семейств (Gemini, GPT, Claude и PaLM-2). Они сравнили результаты с заключениями живых фактчекеров и обнаружили, что SAFE совпадает с ними в 72% случаев.

При проверке разногласий между ИИ-моделью и людьми SAFE оказался прав в 76% случаев.

On a quick read I can’t figure out much about the human subjects, but it looks like superhuman means better than an underpaid crowd worker, rather a true human fact checker? That makes the characterization misleading. (Like saying that 1985 chess software was superhuman).…

— Gary Marcus (@GaryMarcus) March 28, 2024

По словам профессора Гэри Маркуса, не совсем корректно утверждать, что ИИ-модель справляется с задачей на «сверхчеловеческом уровне», поскольку неизвестен уровень квалификации людей, которые принимали участие в эксперименте.

Команда DeepMind разместила код SAFE на GitHub.

Напомним, в сентябре 2023 года соучредитель компании Мустафа Сулейман назвал интерактивных ботов, которые могут выполнять задачи за человека, следующим этапом развития ИИ.

Читайте так-же

Психоделики и ИИ: популярность и опасность
ИИ

Психоделики и ИИ: популярность и опасность

04.07.2025
0

Все больше людей используют ИИ-ботов в качестве замены «трезвому человеку» во время приема психоделиков для подстраховки. Об этом пишет MIT...

Read more
Мнение: Европе нужен прикладной ИИ, а не чипы

Мнение: Европе нужен прикладной ИИ, а не чипы

04.07.2025
Чат-боты украли трафик новостных ресурсов 

Чат-боты украли трафик новостных ресурсов 

03.07.2025
ИИ восстановил 3000-летнюю вавилонскую поэму

ИИ восстановил 3000-летнюю вавилонскую поэму

03.07.2025
США отменили ограничения на экспорт ПО для чипов в Китай

США отменили ограничения на экспорт ПО для чипов в Китай

03.07.2025

ТОП НОВОСТИ

Главное атмосфера, а не сюжет: Квентин Тарантино назвал два лучших «фильма для тусовок» всех времен

Главное атмосфера, а не сюжет: Квентин Тарантино назвал два лучших «фильма для тусовок» всех времен

07.07.2025
Новый геймплей Mafia: The Old Country – больше деталей через неделю

Новый геймплей Mafia: The Old Country – больше деталей через неделю

07.07.2025
Обзор Realme 14 5G: новое поколение

Обзор Realme 14 5G: новое поколение

07.07.2025
Прогноз цены Ethereum: ETH консолидируется в узком диапазоне на фоне растущего спроса на ETF

Прогноз цены Ethereum: ETH консолидируется в узком диапазоне на фоне растущего спроса на ETF

07.07.2025
Удобен ли для ремонта модульный Fairphone 6? iFixit проверила

Удобен ли для ремонта модульный Fairphone 6? iFixit проверила

07.07.2025

ПОПУЛЯРНОЕ

  • Как установить Linux-приложение на Chrome OS

    Как установить Linux-приложение на Chrome OS

    0 shares
    Share 0 Tweet 0
  • Патч для MindsEye, который делает врагов умнее, вышел на консолях, но не на ПК

    0 shares
    Share 0 Tweet 0
  • Новый патч для ПК-версии Stellar Blade добавил карточки и фоны в Steam и разблокировал сложный режим

    0 shares
    Share 0 Tweet 0
  • Ryzen 5 1500X, GTX 970 и 2 ГБ свободного места — объявлены системные требования ремейка Postal 2

    0 shares
    Share 0 Tweet 0
  • Ryzen 7 7700X, RTX 3060 и всего 20 ГБ свободного места — опубликованы системные требования Killing Floor 3

    0 shares
    Share 0 Tweet 0
  • Реклама
  • Контакты
  • Политика конфиденциальности
Реклама: digestmediaholding@gmail.com

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

wpDiscuz