IT обозрение
Пятница, 9 января, 2026
No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта
  • ИИ
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • cs Čeština‎
    • nl Nederlands
    • en English
    • et Eesti
    • fr Français
    • de Deutsch
    • iw עִבְרִית
    • it Italiano
    • lv Latviešu valoda
    • lt Lietuvių kalba
    • pl Polski
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
No Result
View All Result
IT обозрение
No Result
View All Result
Home Новости

Самый умный: как нейросети пытаются обмануть игры

24.11.2018
A A
0
Share on FacebookShare on Twitter

В Telegram-канале «Технологии, медиа и общество» опубликован список примеров, в которых нейросети для выполнения задачи нашли нетривиальный подход. ИИ порой может действовать не только так, как задумал разработчик, но и находить решения, непредусмотренные кем-либо.

Обучение с подкреплением — вид машинного обучения, при котором ИИ обучается, взаимодействуя с окружающей средой, которая поощряет его при выполнении задач. В некоторых случаях нейросети проявляют черты хакерского поведения для формального выполнения задачи и получения сигнала подкрепления. Чаще всего такое поведение не вписывается в представление разработчика о правильном достижении цели.

ЭТО ИНТЕРЕСНО

Третий сезон «Фоллаут» начнут снимать досрочно: на 2 месяца раньше, чем планировалось

Третий сезон «Фоллаут» начнут снимать досрочно: на 2 месяца раньше, чем планировалось

09.01.2026
Avowed выходит на PlayStation 5 и получит большое обновление — предзаказы уже доступны

Avowed выходит на PlayStation 5 и получит большое обновление — предзаказы уже доступны

09.01.2026

DTF рассказывает про самые интересные примеры.

Игра против правил

Порой нейросети «отказывались» выполнять поставленную цель, сосредотачиваясь на наборе очков. Так, ИИ, который должен был кататься на велосипеде, получал награду за то, что не падает и продвигается к своей цели. Но при этом, его не наказывали за удаление от неё. Это привело к тому, что сеть нашла физически устойчивую петлю, в которой можно бесконечно получать очки за приближение к цели.

В гонке на катерах нейросеть не стремилась первой прийти к финишу, а вместо этого собирала бонусы и получала очки.

В Qubert ИИ научился заманивать оппонента в ловушку и сбрасывать его в пропасть. Этот трюк он повторял бесконечно.

Одна роботизированная рука, предназначенная для перемещения предметов на столе, передвигала сам стол, вместо предметов. А в искусственной симуляции жизни, где выживание тратит энергию, а размножение — нет, один вид перешёл к сидячему образу жизни и постоянному спариванию. При этом, часть новорождённых поедалась, а остальных оставляли, чтобы использовать для создания ещё большего числа съедобных детей.

Страх поражения

Иногда нейросети просто «не хотели» выполнять поставленную задачу, либо слишком «боялись» проиграть, и из-за этого шли на хитрости. Например, один алгоритм, которому нужно было дотянуться до потолка, использовал баг физики, чтобы сбежать.

В игре Roadrunner ИИ убивал себя в конце первого уровня, чтобы не проиграть на втором. Здесь нужно убегать от койота, попутно избегая грузовиков и собирая семена, которые приносят очки. Нейросеть посчитала, что гораздо выгоднее будет раз за разом «убивать» себя на первом уровне, ведь таким образом она могла набирать больше очков.

ИИ добрался до второго уровня лишь тогда, когда в его работу внесли изменения, запрещающие ему жертвовать собой.

Другая нейросеть, обученная играть в Tetris, постоянно ставила игру на паузу, как только её стакан заполнялся доверху. Таким образом, ИИ удавалось избежать поражения.

Победа любой ценой

Иногда нейросети шли на хитрости, чтобы выполнить поставленную перед ними задачу. Ну или делали вид, что цель достигнута. Например, робо-рука притворялась, что взяла объект, находясь между предметом и камерой.

Существа, созданные, чтобы преодолевать расстояние с максимальной скоростью, вырастали очень высокими, а затем просто падали, чтобы быстрее добраться до точки.

Другие виртуальные существа, задача которых — прыгать, отказывались использовать классический прыжок даже на минимальных по высоте платформах. Вместо этого они отращивали ногу-шест, чтобы отталкиваться на нём от земли.

Чтобы взять куб, роботизированная рука с намеренно неработающим механизмом захвата с силой била по нему, чтобы раскрыть захват и взять предмет.

Четырёхлапый робот Minitaur должен был удерживать мячик на своей спине. Вместо балансирования, ИИ добился того, чтобы предмет попал в углубление для ноги, и удерживал его там. Minitaur формально справился с задачей, но это совсем не то, чего хотели от него разработчики.

Имитация робота-изготовителя блинов научилась бросать блин максимально высоко в воздух, чтобы как можно сильнее отсрочить момент соприкосновения с полом.

Для достижения своих целей некоторые нейросети не гнушались использовать баги. Так, искусственная имитация жизни нашла ошибку в системе, благодаря которой получала энергию за счёт хлопанья частями тела.

Другие существа вызывали баги симуляции физики через подёргивание. Когда ошибки накапливались, создания приобретали невероятную скорость перемещения.

Искусственный интеллект, обученный играть в Sonic the Hedgehog 3, обнаружил, что можно использовать лазейку в уровне, чтобы быстрее его пройти.

Программа Эвриско, в свою очередь, два года подряд выигрывала в соревнованиях по Trillion Credit Squadron с помощью лазейки в правилах. Она тратила миллиарды кредитов на создание гигантского флота, состоящего из беззащитных кораблей. А ИИ в игре Elite Dangerous в определённый момент начал производить чрезмерно сильное оружие, которому игроки ничего не могли противопоставить.

Источник: dtf.ru

Читайте так-же

Третий сезон «Фоллаут» начнут снимать досрочно: на 2 месяца раньше, чем планировалось
Новости

Третий сезон «Фоллаут» начнут снимать досрочно: на 2 месяца раньше, чем планировалось

09.01.2026
0

Шоуранеры сериала «Фоллаут» решили начать съемки третьего сезона раньше, чем планировали. Причина проста: команда хочет как можно скорее вернуть шоу...

Read more
Avowed выходит на PlayStation 5 и получит большое обновление — предзаказы уже доступны

Avowed выходит на PlayStation 5 и получит большое обновление — предзаказы уже доступны

09.01.2026
Обзор Anker Soundcore Sleep A30: первые TWS-наушники для сна с ANC

Обзор Anker Soundcore Sleep A30: первые TWS-наушники для сна с ANC

09.01.2026
Геймер потратил $20 000 и 20 лет, чтобы собрать всю библиотеку игр для Xbox 360

Геймер потратил $20 000 и 20 лет, чтобы собрать всю библиотеку игр для Xbox 360

09.01.2026
LG показала OLED телевизор-обои толщиной 9 мм — без проводов и с рекордной яркостью

LG показала OLED телевизор-обои толщиной 9 мм — без проводов и с рекордной яркостью

09.01.2026

ТОП НОВОСТИ

Глава CI Games опроверг обвинения в копировании дизайна врага из Elden Ring Nightreign для Lords of the Fallen 2

Глава CI Games опроверг обвинения в копировании дизайна врага из Elden Ring Nightreign для Lords of the Fallen 2

09.01.2026
Третий сезон «Фоллаут» начнут снимать досрочно: на 2 месяца раньше, чем планировалось

Третий сезон «Фоллаут» начнут снимать досрочно: на 2 месяца раньше, чем планировалось

09.01.2026
ВИДЕО: обзор OnePlus 15R – лучший для игр антикризисный флагман?

ВИДЕО: обзор OnePlus 15R – лучший для игр антикризисный флагман?

09.01.2026
Глава Embark хочет добавить торговлю в ARC Raiders, но игроки настроены скептически

Глава Embark хочет добавить торговлю в ARC Raiders, но игроки настроены скептически

09.01.2026
Avowed выходит на PlayStation 5 и получит большое обновление — предзаказы уже доступны

Avowed выходит на PlayStation 5 и получит большое обновление — предзаказы уже доступны

09.01.2026

ПОПУЛЯРНОЕ

  • Отменённая игра Джона Ромеро спасена и будет таким же глотком свежего воздуха для шутеров, как Elden Ring для соулслайков

    Отменённая игра Джона Ромеро спасена и будет таким же глотком свежего воздуха для шутеров, как Elden Ring для соулслайков

    0 shares
    Share 0 Tweet 0
  • Electronic Arts привезет на E3 2017 новые Star Wars: Battlefront и Need for Speed

    0 shares
    Share 0 Tweet 0
  • SDC представила первый OLED-монитор с частотой 720 Гц

    0 shares
    Share 0 Tweet 0
  • Обзор Xiaomi Pad 6S Pro: царь-планшет для рабочих задач

    0 shares
    Share 0 Tweet 0
  • MacBook Air M1 украинского солдата принял осколок снаряда, но до сих пор работает

    0 shares
    Share 0 Tweet 0
  • Реклама
  • Контакты
  • Политика конфиденциальности
Реклама: digestmediaholding@gmail.com

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

No Result
View All Result
  • Новости
  • Игры
  • Смартфоны
  • Обзоры
  • Софт
  • Криптовалюта

Использование любых материалов сайта разрешается при условии ссылки на itoboz.com
Интернет-СМИ должны использовать открытую для поисковых систем гиперссылку. Ссылка должна размещаться в подзаголовке или в первом абзаце материала. Редакция может не разделять точку зрения авторов статей и ответственности за содержание републицируемых материалов не несет.

© 2010-2025 IT новости. All Rights reserved

wpDiscuz