Мы уже писали о победе ИИ в игре го. Теперь же новый алгоритм смог победить людей в области, которая традиционно считалась непреодолимой для машины. А именно – в покере, то есть в игре с неполной информацией.
В 2015 году алгоритм Claudico по итогам покерного турнира с четырьмя живыми игроками занял третье место. Соревнования длились две недели — за это время было сыграно 80 тысяч раздач. Новый же алгоритм Libratus сыграл 120 тысяч раздач в безлимитный техасский холдем. Состязание длилось 20 дней. Против новой версии программы выступили Джимми Чу, Даниэль МакОлэй, Джейсон Лес и Донг Ким, однако компьютер смог обыграть их, заработав более $1,7 млн. При этом призовой фонд в размере $200 тысяч разделят между игроками-людьми.
Разработчики обещают открыть подробности работы механизма Libratus в ближайшее время. Отметим, что такие системы смогут помочь в вопросах информационной безопасности, при проведении аукционов, на переговорах и так далее.
Разработчики заявили, что алгоритм состоит из трех частей: «ядра», на тренировку которого ушло 15 миллионов ядро-часов; модуля мониторинга ошибок соперников; и модуля мониторинга собственных ошибок. Такая система позволила программе как блефовать, так и распознавать блеф.










