Компьютер победил профессиональных игроков в покер
Существующие алгоритмы машинного обучения позволяют компьютерам обыгрывать человека в различные игры, например в го. Однако до сих пор в играх с неполной информацией машины уступали людям. В 2015 году алгоритм Claudico по итогам покерного турнира с четырьмя живыми игроками занял третье место. Соревнования длились две недели - за это время было сыграно 80 тысяч раздач.
Новый турнир продолжался 20 дней и включал в себя 120 тысяч раздач в безлимитный техасский холдем. Против новой версии программы выступили Джимми Чу, Даниэль МакОлэй, Джейсон Лес и Донг Ким. Компьютер занял первое место, заработав свыше 1,7 миллиона долларов. Тем не менее, призовой фонд в размере 200 тысяч долларов будет поделен между живыми игроками.
Точный механизм работы Libratus неизвестен. По словам авторов, алгоритм состоит из трех частей: «ядра», на тренировку которого ушло 15 миллионов ядро-часов; модуля мониторинга ошибок соперников; и модуля мониторинга собственных ошибок. Такая система позволила программе как блефовать, так и распознавать блеф. Подробности механизма будут опубликованы в ближайшее время.
Разработчики отмечают, что у алгоритмов, подобных Libratus, большое будущее в различных сферах, в том числе там, где предусмотрена работа с неполной информацией. Например, такие системы могут использоваться в информационной безопасности, при проведении аукционов, на переговорах. Кроме того, они могут помогать в распределении жизненно важной продукции, в частности медикаментов.