Chess.com, FortuneやITmediaが報じたように、AlphaZeroがコンピュータチェスチャンピオンのStockfishに1,000ゲームのマッチで圧倒的にかつ華麗に勝ちました。
昨年末のマッチでも勝ちましたが、そのときは短いタイムコントロールで、Stockfishに不利と噂がありました。今回は持ち時間それぞれ3時間という長いタイムコントロールです!しかも、AlphaZeroにその10分の1の時間だけ与えても、勝っていました。
DeepMindによると、AlphaZeroの最初の自己対局ゲームセットの作成には5,000 TPUs、その後の深層強化学習には 16 TPUs が使われました。約4時間の学習でStockfishを超えるようになり、9時間経過で完全に圧倒しました。
特に、今回のゲームマッチでは、AlphaZeroがポーン(歩)を単独に敵陣深く侵入させることがよくあり、この棋風はオープンソースの Lc0も同様に自己学習で生み出しました。人間のチェスプロはあまり指さない棋風です。また、一見して大胆なサクリファイス(捨て駒)をして、後々有利な形成を作っていく華麗なゲームが多く見られ、元世界王者のカスパロフも大絶賛しています。
Garry Kasparov@kasparov63I couldn't help but be pleased that AlphaZero plays in open, dynamic style. It's not just my style, but it's not the incomprehensible maneuvering we feared computer chess would become. My @sciencemagazine article: science.sciencemag.org/content/362/64… twitter.com/DanielKingChes…20:20 PM - 06 Dec 2018Daniel King @DanielKingChess@DeepMindAI Newly released games from AlphaZero! Beautiful attacking play: https://t.co/qzdtiv6lAH 'AlphaZero plays like a human on fire'
Top comments (0)