AlphaZero — программа для нейронных сетей, разработанная компанией DeepMind, которая использует обобщенный подход AlphaGo Zero. 5 декабря 2017 года коллектив DeepMind выпустил препринт AlphaZero, которая в течение 24 часов достигла сверхчеловеческого уровня игры в шахматы, сёги, и го, победив чемпионов мира среди программ, Stockfish, Elmo и трехдневный вариант AlphaGo Zero в каждом случае[1].
AlphaZero (AZ) — это более обобщенный вариант алгоритма AlphaGo Zero (AGZ), который кроме го, умеет также играть в сёги и шахматы. Различия между AZ и AGZ заключаются в том, что:
Рассматривая поиск с помощью дерева поиска Монте-Карло, AlphaZero анализирует лишь 80,000 позиций на секунду в шахматах и 40 000 в сёги, по сравнению с 70 миллионов для Stockfish и 35 миллионов для Elmo. AlphaZero компенсирует низкое количество оценок использованием своих глубоких нейронных сетей, сосредотачиваясь гораздо более избирательно на наиболее перспективных вариантах.
В шахматных партиях AlphaZero против Stockfish каждая программа имела по одной минуте времени на ход. AlphaZero имела лучшее компьютерное оборудование относительно Stockfish. Из 100 игр с нормального начального положения AlphaZero выиграл 25 партий белыми, 3 чёрными и свёл вничью оставшиеся 72.[2]
Некоторые гроссмейстеры, такие как Хикару Накамура и создатель Комодо Ларри Кауфман, подчеркнули, что силу AlphaZero не надо преувеличивать, утверждая, что результаты матча был бы другими, если бы программа имела доступ к дебютным базам (поскольку Stockfish был оптимизирован под этот сценарий)[3]. AlphaZero победила Stockfish, лишив последнего доступа к дебютным базам и эндшпильным таблицам, играя с намного лучшим компьютерным оборудованием, чем у противника.[4][5] Stockfish также была ограничена по времени принятия хода: нетипичный контроль времени, 1 минута на ход, не позволял глубоко задумываться в критических позициях. Кроме того использовалась версия Stockfish 8, вышедшая год назад. Все четыре обстоятельства: нехватка мощности, ограничение по времени, отключение дебютной книги и использование устарелой версии внесли свой вклад в поражение Stockfish.
В ста играх в сёги против Elmo, AlphaZero выиграл девяносто раз, восемь раз проиграл и две партии завершились вничью.
Сообщество программистов компьютерной игры в сёги не полностью удовлетворена условиями матча AlphaZero — Elmo.[6][7]
После 8-и часов самостоятельного обучения игры в го, в матчах против предыдущей версии AlphaZero, AlphaZero выиграл шестьдесят игр и проиграл сорок.
Газеты вышли с заголовками, что обучение шахматам заняло только четыре часа: «это было сделано за время чуть большее, чем промежуток между завтраком и обедом»[8]. Wired раскрутили AlphaZero как «первый искусственный интеллект, который является чемпионом многих настольных игр»[9].
«Мне всегда было интересно, как это будет, когда высшие существа приземлятся на землю и покажут нам, как они играют в шахматы», заявил датский гроссмейстер Питер Хайне Нильсен в интервью Би-би-си, «теперь я знаю». Норвежский гроссмейстер Йон Людвиг Хаммер охарактеризовал AlphaZero как «сумасшедшие атакующие шахматы» с глубокой позиционной игрой. Бывший чемпион мира Гарри Каспаров сказал: «это замечательное достижение, даже несмотря на то, что мы уже ожидали нечто подобное после успехов AlphaGo»[10].