ИИ AlphaZero понадобилось четыре часа, чтобы научиться играть в шахматы и обыграть программу-чемпиона

Программа AlphaZero за четыре часа обучилась игре в шахматы, после чего победила Stockfish 8 – искусственный интеллект, который считался лучшим виртуальным шахматным игроком.

Об этом говорится в научной работе, препринт которой опубликован на сайте Arxiv.

Как сообщается, в AlphaZero внедрили только правила шахмат, но не стратегии и алгоритмы игры. Всему этому программа обучалась самостоятельно.

Если раньше все шахматные программы запоминали ходы, сделанные людьми, и руководствовались традиционными знаниями об игре, накопленными человечеством за многовековые эксперименты, то новое поколение интеллекта получает все навыки, играя само с собой.

Затем исследователи организовали битву между Stockfish 8 и AlphaZero. Перед началом каждого хода программам давали минуту на размышления. Всего провели 100 игр. AlphaZero победила 25 раз белыми и еще 3 раза черными. Остальные игры сыграли вничью. То есть, AlphaZero не допустил ни единого проигрыша. Навыки программы разработчики назвали «сверхчеловеческими».

По их словам, нейронная сеть может предсказывать ходы далеко вперед, стремится жертвовать фигурами для позиционных завоеваний и не имеет предрассудков и логических предустановок. Искусственный интеллект порой выбирает ходы, которые человек почти наверняка бы отбросил, выстраивая с их помощью выигрышные комбинации.

Напоследок отметим, что, помимо шахмат, Alpha Zero также научили правилам сеги – японской настольной игры шахматного типа. Как и в первом случае, в программу включили только основные правила, но не загружали возможные сценарии.

После двух часов обучения программа обыграла алгоритм Elmo со счетом в 90:8, еще две игры закончились вничью.

Об авторе

Автор: Арсений Яковлевич

Ещё статьи автора

АХТУНГ! Все комменты гостей модерасятся модерастом.

Мессаги исключительно рекламного содержания, либо содержащие только одни оценочные суждения типа "круто" ("отлично", "спасибо", "автор дебил" и т.п.) не публикуются;
Злостным спамерам, пранкерам и прочей сетевой нечисти рекомендуем напрасно не тратить своего времени и удовлетворять свои больные фантазии на специализированных Интернет ресурсах!;
Разумная обоснованная критика, замечания, дополнения приветствуются. Поля помеченные символом * обязательны к заполнению.