ИИ AlphaStar стал гроссмейстером StarCraft II: он играет лучше, чем 99,8 % пользователей
Компания DeepMind сообщила о новых успехах AlphaStar, в январе победившего в StarCraft II двух киберспортсменов из Team Liquid. Недавно ИИ достиг наивысшего ранга гроссмейстера (Grandmaster), играя за все три расы (терраны, протоссы и зерги), и оказался в "Элитной лиге", в которую входят всего 200 лучших игроков из всех регионов. Это означает, что он обошел 99,8 % активных пользователей Battle.net. По словам исследователей, прежде AlphaStar играл на не слишком честных условиях, но теперь делает это наравне с человеком. Информация опубликована в блоге DeepMind. Статья доступна на Nature.
Актуальная версия AlphaStar в чем-то слабее первоначальной, однако она полагается на стратегию и тактику, а не на технические преимущества. Разработчики намеренно сократили количество действий, которые способен выполнять ИИ, до 22 неповторяющихся за пять секунд (что соответствует человеческим возможностям), и уменьшили обзор карты. Хотя система лишилась некоторых особенностей, она смогла улучшить показатели за счет самообучения. AlphaStar тренировался, просматривая записи матчей лучших киберспортсменов, играя против самого себя за каждую расу и сравнивая эффективность разных подходов. В каждом случае его оппонентом выступала другая версия AlphaStar, созданная с учетом особенностей данной расы. Все эти варианты были объединены в лигу, в рамках которой появились 900 разных ИИ-игроков. Также он сражался против людей, не знавших, что их противником выступает компьютер. На достижение гроссмейстерского уровня ушло 44 дня.
Многие пользователи все еще сомневаются в честности игры AlphaStar, указывая на слишком высокую скорость реакции и якобы имеющийся у него расширенный доступ к игровым данным. Однако профессиональный игрок Дарио Вюнш (Dario TLO Wünsch), выступивший одним из соперников ИИ в январе и сейчас работающий над проектом, считает систему "невероятно впечатляющей", но не "сверхчеловеческой". "Нельзя сказать, что AlphaStar играет на уровне, недостижимом для человека даже теоретически, - отметил он. - В целом он действует предельно честно, будто действительно играет в StarCraft II так, как это делают люди".
Два года назад ИИ проявил себя в Quake III: Arena, в которой обыграл людей в 79 % матчей. AlphaGo, созданная DeepMind в 2014 году, стала первой ИИ-системой, сумевшей победить чемпиона Европы по игре в го. Однако главный научный сотрудник DeepMind Дэвид Сильвер (David Silver) подчеркивает, что StarCraft II намного превосходит в сложности шахматы и го: в стратегии игроки управляют сотнями юнитов, а количество возможных действий в каждый ход равно 10 26.
Исследователи отмечают, что приемы машинного обучения, использованные в разработке AlphaStar, в будущем помогут сделать более безопасными и надежными ИИ-системы, применяемые в других областях (например, для беспилотных автомобилей).