ИИ AlphaZero понадобилось четыре часа, чтобы научиться играть в шахматы и обыграть программу-чемпиона

archive view archive save

ИИ AlphaZero понадобилось четыре часа, чтобы научиться играть в шахматы и обыграть программу-чемпиона Программа AlphaZero за четыре часа обучилась игре в шахматы, после чего победила Stockfish 8 – искусственный интеллект, который считался лучшим виртуальным шахматным игроком.

Об этом говорится в научной работе, препринт которой опубликован на сайте Arxiv.

Как сообщается, в AlphaZero внедрили только правила шахмат, но не стратегии и алгоритмы игры. Всему этому программа обучалась самостоятельно.

Если раньше все шахматные программы запоминали ходы, сделанные людьми, и руководствовались традиционными знаниями об игре, накопленными человечеством за многовековые эксперименты, то новое поколение интеллекта получает все навыки, играя само с собой.

Затем исследователи организовали битву между Stockfish 8 и AlphaZero. Перед началом каждого хода программам давали минуту на размышления. Всего провели 100 игр. AlphaZero победила 25 раз белыми и еще 3 раза черными. Остальные игры сыграли вничью. То есть, AlphaZero не допустил ни единого проигрыша. Навыки программы разработчики назвали «сверхчеловеческими».

По их словам, нейронная сеть может предсказывать ходы далеко вперед, стремится жертвовать фигурами для позиционных завоеваний и не имеет предрассудков и логических предустановок. Искусственный интеллект порой выбирает ходы, которые человек почти наверняка бы отбросил, выстраивая с их помощью выигрышные комбинации.

Напоследок отметим, что, помимо шахмат, Alpha Zero также научили правилам сеги – японской настольной игры шахматного типа. Как и в первом случае, в программу включили только основные правила, но не загружали возможные сценарии.

После двух часов обучения программа обыграла алгоритм Elmo со счетом в 90:8, еще две игры закончились вничью.


Комментарии в блоге
Новое на форуме