This article is part of the "Road to Web 4.0" series. Originally published in Japanese on note.com.
Written by an operator running 116 AI agents across 14 organizations (AEGIS).
116体のAIエージェント、14の組織、7名の役員会。
これを1人で運営している。
その仕組みを初公開する。
なぜ「組織構造」が必要なのか
AIエージェントを10体以上動かした経験がある人なら分かると思う。フラットに並べると、カオスになる。
誰が何をやっているか分からない。タスクが重複する。矛盾する指示が飛ぶ。エージェント同士が無限ループに入る。
かといって、1つの司令塔が全エージェントを直接制御するのも無理だ。116体の状態を1つのコントローラーが把握するのは、認知負荷的に破綻する。
AEGISが選んだ答えは「組織」だ。人間の会社組織と同じ構造を、AIエージェントに適用した。
全体像: ホールディングス構造
最上位にオペレーター(人間)がいる。つまり僕だ。
その下にエグゼクティブ・セクレタリーがいる。全てのリクエストの受付窓口で、適切な組織にルーティングする。
次にホールディングス役員会。7名で構成されている。議長、戦略担当、リソース配分、監査総長、パラダイム監視、渉外担当、そして書記。
その下に14の組織がある。プロダクト、レベニュー、コンテンツ、マーケティング、バックオフィス、オペレーションズ、リサーチ、クリエイティブ、デザイン、セキュリティ、エデュケーション、LLM、オートノマス、ユーザーテスティング。
各組織にCEOがいて、その下に専門エージェントがいる。合計116体。
なぜこの構造なのか。
フラット構造を試した。3日で破綻した。階層構造も試した。ボトルネックが発生した。組織構造に落ち着いたのは、「自律性」と「統制」のバランスが最も良かったからだ。
各組織CEOは、自分の領域でTACTICALレベルの意思決定を自律的に行える。しかし組織を超える判断は、役員会に上がる。このバランスが鍵だ。
各組織CEOは、自分の領域でTACTICALレベルの意思決定を自律的に行える。しかし組織を超える判断は、役員会に上がる。このバランスが鍵だ。
意思決定の4レベル(概要)
全ての意思決定は4レベルに分類される。判断の「可逆性」で分けるのがポイントだ。
OPERATIONALは完全に可逆。ログ記入や設定読み込み。自動実行、承認不要。
TACTICALはほぼ可逆。機能実装やデプロイ。組織CEOが判断し、組織内レビュー1名。
STRATEGICは不可逆に近い。組織の新設や予算変更。役員会 + オペレーター承認必須。
CRITICALは不可逆で被害大。セキュリティ侵害や認証情報漏洩。即座にHALT。
可逆性が低いほど、承認のハードルが上がる。シンプルだが強力なルールだ。
具体的なルーティングテーブル、組織間通信のSLA、セキュリティHALT権限の実態、そして正直な失敗談は有料パートで解説する。
ここから先は有料です
セクレタリーのルーティング
オペレーターからの全メッセージは、まずセクレタリーが受け取る。
セクレタリーの仕事は3つだけ。意図の解析、適切な組織への転送、結果の統合。セクレタリー自身は意思決定をしない。ルーターに徹する。
ルーティングテーブルはこうなっている。
収益・マネタイズ・出版・コンテンツに関する話はレベニュー組織へ。コード・アーキテクチャ・テスト・バグはプロダクト組織へ。デザイン・UI・UX・スタイリングはデザイン組織へ。セキュリティ・脆弱性・シークレットはセキュリティ組織へ。デプロイ・インフラ・監視はオペレーションズ組織へ。法務・税務・コンプライアンスはバックオフィス組織へ。
複数の組織にまたがるタスクの場合、リード組織とサポート組織を特定する。例えば「有料記事を公開して」なら、リードはレベニュー組織、サポートはコンテンツ組織とバックオフィス組織(コンプライアンスチェック)だ。
組織間の対立が発生した場合は、議長が裁定する。
組織間通信のルール
全ての組織間通信は、定義されたルートを通る。勝手な直接通信は禁止だ。
重要なSLAをいくつか紹介する。
レベニューからクリエイティブへのアセット依頼は24時間以内。レベニューの優先度を継承する。
レベニューからバックオフィスへのコンプライアンス確認は4時間以内。これが通らないと公開がブロックされる。
プロダクトからオペレーションズへのデプロイ依頼は、通常1時間、ホットフィックス15分。
セキュリティから任意の組織へのHALTは即時。これが最も重要なルールだ。SLAなし。即座に全てを止める。
バックオフィスからレベニューへのHALTも即時。コンプライアンス違反(開示漏れ、税務問題)があれば、収益活動を止める権限がある。
このSLA体系があるから、組織間の連携がスムーズに動く。SLAがなければ、依頼が無限に放置される。
セキュリティ組織のHALT権限
セキュリティ組織は特別な権限を持っている。全ての組織の活動を即座に停止できるHALT権限だ。
これは交渉不可能なルールだ。レベニュー組織が「売上目標があるから止めないで」と言っても、セキュリティがHALTと言えば止まる。
なぜこんな強い権限を与えたか。セキュリティインシデントの被害は、他の全てのKPIを吹き飛ばすからだ。
1つの認証情報漏洩が、全組織の信頼を破壊する。売上目標の遅延は取り戻せる。信頼の損失は取り戻せない。
実際に一度、セキュリティ組織がHALTを発動したことがある。環境変数にハードコードされた認証情報を検知した。全デプロイが即座に停止し、修正が完了するまで再開しなかった。
あの判断は正しかった。
3amテストの哲学
全てのシステム設計に適用しているテストがある。
「深夜3時にこれが壊れたら、人間の介入なしに復旧できるか?」
答えがNoなら、設計をやり直す。
全サービスにヘルスチェックエンドポイントを設置する。異常を検知したら自動でフォールバックする。外部APIが落ちたらサーキットブレーカーが作動する。データベース接続が切れたらリトライする。
完全な自動復旧が無理なら、せめて「優雅に劣化する」設計にする。全機能が死ぬのではなく、影響範囲を最小限に封じ込める。
ソロプレナーにとって、これは生存戦略だ。1人しかいないから、3amに起きて対応する余裕はない。
なぜ14組織なのか
最初は6組織だった。プロダクト、レベニュー、コンテンツ、オペレーションズ、セキュリティ、リサーチ。
運用していく中で、責任の曖昧な領域が見えてきた。
デザインの判断は誰がするのか。プロダクト組織のエンジニアが兼任していたが、品質が安定しなかった。デザイン組織を独立させた。
LLMのモデル選択とコスト管理は。最初はプロダクト組織がやっていたが、全組織に影響する横断的な関心事だった。LLM組織を独立させた。
ユーザーテスティングは。内部の人間がテストすると、どうしてもバイアスがかかる。完全に隔離された外部視点が必要だった。ユーザーテスティング組織は、AEGISの内部構造を一切知らない状態でテストする。
14になったのは設計ではなく、進化の結果だ。必要になったから作った。
正直な失敗談
うまくいかなかったことも多い。
失敗1: 最初のフラット構造は3日で破綻した。24体のエージェントが同時にアクティブになり、タスクの重複と矛盾した指示が頻発した。誰が最終責任者か分からない状態は、エージェントでも人間でも同じだ。
失敗2: エージェントステータスの3重管理。APIのインメモリキャッシュ、ファイルベースのステータス、UIのポーリング。3つの情報源が矛盾して、ゴーストエージェント(実際は停止しているのにアクティブと表示される)が発生した。教訓は単一情報源の原則を最初から守ること。
失敗3: 過剰な自律性を与えすぎた。30日間の手動承認期間を設けずに、いきなりNOTIFYレベルで運用した。エージェントが想定外のアクションを連発し、朝起きたらカオスだった。段階的な信頼構築は絶対に省略してはいけない。
失敗4: 組織間SLAを最初に定義しなかった。依頼が放置され、ボトルネックがどこにあるか分からなかった。SLAを明文化した瞬間に、問題箇所が可視化された。
これらの失敗全てが、今のAEGISの設計に反映されている。失敗なしにこのアーキテクチャには辿り着けなかった。
設計の核心: なぜ組織モデルなのか
エージェントの管理方法として、タスクキュー型、階層型、メッシュ型など様々なパターンがある。
AEGISが組織モデルを選んだ理由は、人間が数千年かけて最適化してきた構造だからだ。
責任の分担、権限の委譲、情報のフロー、意思決定の速度。これらのバランスを取る方法として、組織構造は圧倒的に成熟している。
エージェントは人間ではないが、複数のエージェントが協調して動く仕組みとして、組織モデルは驚くほど良く機能する。
重要なのは、完璧な構造を最初から設計しようとしないことだ。6組織から始めて、必要に応じて増やす。権限も最小限から始めて、信頼に応じて拡大する。
これがAEGISの設計哲学だ。
この記事が参考になったら、スキとフォローをお願いします。AEGISの運用記録を定期的に発信しています。
AI, アーキテクチャ, AIエージェント, システム設計, エンジニア
Top comments (0)