DEV Community

Cong
Cong

Posted on

2

AlphaZeroの美しい勝利

Chess.com, FortuneITmediaが報じたように、AlphaZeroがコンピュータチェスチャンピオンのStockfishに1,000ゲームのマッチで圧倒的にかつ華麗に勝ちました。

昨年末のマッチでも勝ちましたが、そのときは短いタイムコントロールで、Stockfishに不利と噂がありました。今回は持ち時間それぞれ3時間という長いタイムコントロールです!しかも、AlphaZeroにその10分の1の時間だけ与えても、勝っていました。

DeepMindによると、AlphaZeroの最初の自己対局ゲームセットの作成には5,000 TPUs、その後の深層強化学習には 16 TPUs が使われました。約4時間の学習でStockfishを超えるようになり、9時間経過で完全に圧倒しました。

特に、今回のゲームマッチでは、AlphaZeroがポーン(歩)を単独に敵陣深く侵入させることがよくあり、この棋風はオープンソースの Lc0も同様に自己学習で生み出しました。人間のチェスプロはあまり指さない棋風です。また、一見して大胆なサクリファイス(捨て駒)をして、後々有利な形成を作っていく華麗なゲームが多く見られ、元世界王者のカスパロフも大絶賛しています。

API Trace View

Struggling with slow API calls? 👀

Dan Mindru walks through how he used Sentry's new Trace View feature to shave off 22.3 seconds from an API call.

Get a practical walkthrough of how to identify bottlenecks, split tasks into multiple parallel tasks, identify slow AI model calls, and more.

Read more →

Top comments (0)

A Workflow Copilot. Tailored to You.

Pieces.app image

Our desktop app, with its intelligent copilot, streamlines coding by generating snippets, extracting code from screenshots, and accelerating problem-solving.

Read the docs

👋 Kindness is contagious

Please leave a ❤️ or a friendly comment on this post if you found it helpful!

Okay