Cognitionは、WindsurfエディタをDevin Desktopとしてブランド変更し、新機能を追加しました。Devinのダウンロードページでは、Devinを「すべてのエージェントを管理するためのコマンドセンター」と説明しています。公式発表では、Devin Desktopを「エージェントマネージャーが組み込まれたフルIDEであり、その逆ではない」と位置づけています。
この変更で重要なのは、Devinが単なる自律型クラウドエージェントではなくなった点です。現在のDevinは、Devin Desktop、Devin Cloud、Devin CLI、Devin Reviewを含む開発ワークフロー全体のブランドです。この記事では、新しいDevinの主要機能、Cursorとの違い、そしてエージェントが生成したAPIをどう検証するかを実装目線で整理します。エディタ側の背景を先に確認したい場合は、Cursor Composer 2.5でAPIを構築するガイドも参考になります。
大きな変更点:WindsurfがDevin Desktopになった
Windsurfを使っていた場合、Devin Desktopへの移行は基本的に自動です。CognitionはこれをOTAアップデートとして提供しており、既存のプラン、料金、設定、拡張機能はそのまま引き継がれます。
変更されたのは、製品の位置づけです。WindsurfはAI機能を持つエディタでした。Devin Desktopは、エージェント管理を前提にしたフルIDEです。
実務では、次のように使い分けます。
- ローカルで要件や変更方針を整理する
- Devin Localで小さな変更を進める
- 長時間かかる作業をDevin Cloudに委任する
- Devin ReviewでPRを確認し、必要なら修正を戻す
エージェントコマンドセンター
Devin Desktopを開くと、最初に表示されるのがエージェントコマンドセンターです。
これは、ローカルおよびクラウドで実行中のエージェントをステータス別に管理するカンバンボードです。
例:
- APIリファクタリング用エージェント
- 単体テスト作成用エージェント
- UIプロトタイプ作成用エージェント
- PR修正用エージェント
これらを並列に走らせ、進行中、ブロック中、レビュー待ちといった状態で確認できます。
Cognitionは「エンジニアの仕事は、コードを書くことから作業を指示することへ移行する」と説明しています。コマンドセンターは、そのための管理画面です。
複数エージェントを扱う場合は、停止中のタスクや古い前提で動いているタスクを見逃しやすくなります。エージェントワークフローの配線パターンと落とし穴に関するノートでも説明しているように、並列化するほど可視化が重要になります。
スペース
スペースは、プロジェクトやタスク単位でコンテキストをまとめる機能です。
スペースには以下が集約されます。
- エージェントセッション
- プルリクエスト
- 関連ファイル
- プロジェクトコンテキスト
新しいセッションをスペース内で開始すると、そのスペースが持つ情報を引き継ぎます。毎回コードベースの説明をやり直す必要がなくなります。
実務では、以下のようにスペースを切ると管理しやすくなります。
billing-api-refactorauth-migrationfrontend-dashboardtest-coverage-improvement
スペース名をタスク単位にすると、エージェントの成果物とPRを追跡しやすくなります。
並列エージェントの使い方
Devin Desktopの設計は、複数エージェントを同時に動かすことを前提にしています。クラウドとローカルの両方で、同じプロジェクトの別領域を並列処理できます。
例えば、API改修では次のように分担できます。
Agent A: OpenAPI仕様に沿ってルートを追加
Agent B: 既存テストを更新
Agent C: フロントエンドの呼び出し箇所を修正
Agent D: PR差分をレビューして不整合を指摘
ポイントは、各エージェントに明確な境界を与えることです。
悪い依頼例:
このAPIを全部いい感じに直して
良い依頼例:
/users/{id}/subscriptions エンドポイントを追加してください。
OpenAPI仕様に従い、既存の controller/service/repository 構成を維持してください。
DBマイグレーションは変更せず、既存の subscriptions テーブルを使用してください。
変更後に関連するユニットテストを追加してください。
Devin LocalがCascadeに取って代わる
Windsurfに同梱されていたローカル対話型エージェントのCascadeは、現在レガシー扱いです。後継のDevin LocalはRustでゼロから書き直されています。
Cognitionによると、Devin Localでは以下が改善されています。
- トークン効率が最大30%向上
- サブエージェントをサポート
- 単一のローカルエージェントからサブタスク用ヘルパーを起動可能
トークン効率はコストに直結します。エージェント実行は大量のコンテキストを消費するため、30%の削減は長時間作業では大きな差になります。CLIからのエージェントトークンコスト削減ガイドでも、コスト管理の考え方を解説しています。
Cascadeは7月1日まで利用できますが、それ以降はDevin Localがデフォルトになります。
Devin Cloud
Devin Cloudは、エディタに統合された自律型クラウドエージェントです。
タスクを渡すと、Devin Cloudは独自の隔離されたVMを起動します。そのVMには以下が含まれます。
- ブラウザ
- シェル
- エディタ
- デバッグ環境
- テスト実行環境
開発者はローカルで作業方針を固め、実装をDevin Cloudに委任できます。完了後はPRとして結果を受け取ります。
実装フローの例:
1. Devin Desktopで変更内容を整理
2. Devin Localで対象ファイルを確認
3. 実装をDevin Cloudに委任
4. Devin CloudがPRを作成
5. Devin Reviewで差分を確認
6. 必要ならローカルエージェントに修正を依頼
Devin Review
Devin Reviewは、クラウドエージェントが作成したPRをDevin内で確認するための機能です。
主な流れは次のとおりです。
- Devin CloudがPRを作成
- Devin Reviewで差分を確認
- 問題があればローカルエージェントに修正を依頼
- チェックが通れば承認
- GitHubの自動マージ機能でマージ
レビュー、修正、マージを1箇所で完結できるため、GitHubとエディタを頻繁に往復する必要が減ります。
Agent Client Protocol:Devin内でCodex、Claude、OpenCodeを実行
Devin Desktopには、Agent Client Protocol(ACP)が搭載されています。ACPは、互換性のあるエージェントをACP対応エディタ内で実行するためのオープンソース標準です。
Devinは以下のエージェントをサポートします。
- Codex
- Claude Agent
- OpenCode
- カスタム社内エージェント
つまり、Devin DesktopはCognitionのエージェント専用環境ではありません。OpenAIのCodexやAnthropicのClaude Agentを、同じコマンドセンター内で並べて実行できます。
エージェントランタイムの構造を理解したい場合は、コーディングエージェントハーネスアーキテクチャの解説が参考になります。
SWE-1.6、Cognitionの社内モデル
Devinは、OpenAI、Anthropic、Googleの最先端モデルを引き続き提供します。さらに、有料プランではCognition独自のSWE-1.6も無料で利用できます。
SWEファミリーは速度重視で設計されています。以前のSWE-1.5は毎秒約950トークンで動作し、高速なインライン編集やタブ補完に向いています。
実務では、以下のようにモデルを使い分けると効率的です。
- 軽い補完:SWE-1.6
- 短いリファクタリング:SWE-1.6または高速モデル
- 複雑な設計判断:最先端モデル
- 長時間の実装:Devin Cloud
高性能モデルのクォータを温存できる点は、日常利用では大きなメリットです。
DeepWikiとコード検索
Devinはリポジトリを自動的にインデックス化し、DeepWikiを通じてWikiを生成します。
DeepWikiには以下が含まれます。
- コードベース概要
- アーキテクチャ図
- ソースへのリンク
- リポジトリ内の構造情報
新しいエージェントは、リポジトリを毎回ゼロからクロールするのではなく、このインデックスを利用します。そのため、スペース内のセッションは最初から一定の文脈を持った状態で開始できます。
統合、Sessions API、自動トリアージ
Devinは、チームが普段使っているツールからセッションを開始できます。
対応する起点は以下です。
- Slack
- Jira
- Linear
- GitHub
- Teams
- API
注目すべき機能は次のとおりです。
セッションAPI
セッションAPIでは、以下の操作ができます。
- IDによるセッション取得
- アクティブなセッションへのメッセージ送信
- 発生元によるセッションのフィルタリング
- セッションスコープのシークレット受け渡し
発生元には、Webアプリ、Slack、Teams、API、Linear、Jiraなどがあります。
セッション作成時にスコープ付きシークレットを渡せるため、プロンプトにAPIキーを貼り付ける必要がありません。これはセキュリティ上重要です。コーディングエージェント用のスコープ付きシークレットアクセスガイドでも、この考え方を説明しています。
MCPサポート
Devinは、すべてのセッション作成方法でデフォルトプラットフォームを尊重します。また、MCP OAuthフローではRFC 8707のリソースパラメータを転送するようになりました。
これにより、リソースインジケータを必要とするSnowflakeのようなサーバーでの認証問題が修正されます。
自動トリアージ
Devinは、受信した問題を自動的に取得し、トリアージできます。追跡チケットを人間が手動で開始しなくても、Devinがセッションへ変換できます。
Slack制御
Slackでは、次のように入力することで、Devinが応答スレッドを投稿するチャンネルを変更できます。
!channel #name
Devin CLI、JetBrains、デスクトップアプリ
Devinはエディタ以外の開発環境にも対応しています。
Devin CLI
ターミナルからDevinを使う場合は、以下でインストールします。
curl -fsSL https://cli.devin.ai/install.sh | bash
JetBrainsプラグイン
JetBrainsプラグインにより、以下のIDEでエージェント編集を使えます。
- IntelliJ
- PyCharm
- WebStorm
- GoLand
- RubyMine
- Rider
- その他のJetBrains IDE
デスクトップアプリ
ネイティブビルドは以下に対応しています。
- macOS Apple Silicon
- macOS Intel
- Windows 10 64ビット
- Linux
Devin Next
Devin Next(ベータ)は、最新変更を早く試したいユーザー向けの早期採用トラックです。
新しいDevinとCursorの比較
DevinとCursorの違いは、以前より複雑になりました。
以前は次のように分けられました。
- Cursor:自分が操作するAIエディタ
- Devin:タスクを委任する自律型エージェント
現在は、どちらもエディタであり、複数のモデルベンダーをサポートします。違いは、ワークフローの姿勢です。
| 項目 | Cursor | Devin |
|---|---|---|
| デフォルトの姿勢 | 開発者が主導し、AIがインラインで支援 | ローカルで主導し、クラウドに委任 |
| ヒューマン・イン・ザ・ループ | 継続的 | 断続的。チェックポイントとPRレビュー中心 |
| マルチエージェントビュー | 限定的 | エージェントコマンドセンターで複数エージェントを管理 |
| 自律型クラウドエージェント | バンドルなし | Devin Cloud。隔離VMで作業しPRを返す |
| オープンエージェントプロトコル | Cursorネイティブ | ACP。Codex、Claude Agent、OpenCode、カスタムに対応 |
| 向いている用途 | 探索、UIイテレーション、変化するタスク | 明確に定義され、並列化できる長時間タスク |
料金体系も近くなっています。
| ティア | Devin | Cursor |
|---|---|---|
| 無料 | 無料。タブとインライン編集が無制限 | Hobby。無料、使用制限あり |
| エントリー有料 | Pro、$20/月。クラウドエージェントアクセス | Pro、$20/月 |
| パワーユーザー | Max、$200/月 | Ultra、$200/月 |
| チーム | $80/月 + $40/シート | $40/ユーザー/月 |
| エンタープライズ | カスタム | カスタム |
注意点として、どちらも大量使用では課金が増えます。特にDevin Cloudの自律実行はコストが大きくなりやすいため、導入前に使用量を見積もるべきです。最新情報はDevinの料金とCursorの料金ドキュメントを確認してください。
ベンチマーク比較では、単純なスコア比較に注意が必要です。CursorはComposer 2.5がSWE-bench Multilingualで79.8%を記録したと報告しています。一方、Devinの自律モードは、より厳格なSWE-bench Verifiedで約45.8%と測定されています。
これらは異なるルールの異なるスイートであり、直接比較できる単純なスコアボードではありません。各テストの内容はSWE-benchを参照してください。
どちらのエディタも同じ最先端モデルを実行できるため、実際の選択基準はベンチマークよりワークフローです。モデル比較については、Composer 2.5 vs Opus 4.7 vs GPT-5.5比較とComposer 2.5ガイドが参考になります。
まとめると、Cursorはエディタ内で自分が主導して作業したい開発者に向いています。Devinは、同じエディタ体験に加えて、自律型クラウドエージェント、マルチエージェント管理、外部エージェントを動かすACPまで含む広いワークフローに向いています。
Apidogの役割
DevinやCursorはコードを生成できます。しかし、APIコントラクトの設計、エンドポイントの検証、モック、実際のリクエスト・レスポンス確認は別のレイヤーです。
Devin Cloudが一晩で新しいAPIルートを含むPRを作成しても、次の確認は必要です。
- レスポンススキーマは仕様どおりか
- フロントエンドが期待するモックを提供できるか
- ステージングで500エラーになる呼び出しはないか
- 認証ヘッダーやクエリパラメータは正しいか
- OpenAPI仕様と実装がずれていないか
Apidogは、この検証レイヤーを担当します。
実装フローは次のようになります。
1. ApidogでAPIコントラクトを設計
2. OpenAPI仕様をエージェントに渡す
3. DevinやCursorで実装を生成
4. Apidogでエンドポイントをテスト
5. 必要に応じてモックを作成
6. 実装と仕様の差分を修正
仕様優先のアプローチは、自律型エージェントと相性が良いです。明確なコントラクトがあると、エージェントにとって実装ターゲットが明確になります。逆に曖昧な仕様は、誤った実装や余計な推測の原因になります。
詳しくは、Apidog仕様優先モードガイド、design.mdがコーディングエージェントに何をするか、ApidogのAIエージェントデバッガーを参照してください。
よくある質問
Windsurfは廃止されましたか?
いいえ。Windsurfは現在Devin Desktopです。OTAアップデートとして提供され、プラン、設定、拡張機能は変更なく引き継がれます。
Cascadeはどうなりましたか?
Cascadeは現在レガシーです。後継のDevin LocalはRustで書き直され、トークン効率が最大30%向上し、サブエージェントをサポートします。Cascadeは7月1日まで利用できます。
DevinはClaudeやCodexを実行できますか?
はい。Agent Client Protocolを通じて、Devin DesktopはCodex、Claude Agent、OpenCode、カスタムエージェントを実行できます。CognitionのSWE-1.6や他の最先端モデルと並行して利用できます。
Devinは無料ですか?
タブ補完とインライン編集が無制限の無料ティアがあります。Devin Cloudの自律型エージェントへのアクセスは、月額20ドルのProプランから開始されます。
DevinはCursorより優れていますか?
用途によります。Cursorは、開発者がエディタ内で継続的に主導する作業に向いています。Devinは、自律型クラウドエージェント、マルチエージェント管理、ACPによる外部エージェント実行まで含む、委任中心のワークフローに向いています。
Devinをインストールするには?
ダウンロードページからデスクトップビルドを取得できます。JetBrainsプラグインを追加することもできます。CLIは次のコマンドでインストールします。
curl -fsSL https://cli.devin.ai/install.sh | bash
結論
Windsurfのブランド変更は、単なる名前変更ではありません。Devinは現在、フルIDE、自律型クラウドエージェント、CLI、レビューインターフェースを含む開発プラットフォームです。エージェントコマンドセンターとACPにより、複数のエージェントや外部ベンダーのエージェントも管理できます。
重要なのは、すべてのコードを自分で書くことではなく、作業を正しく分割し、委任し、レビューすることです。
ただし、エージェントが生成したAPIは必ず検証してください。APIコントラクトを設計し、テストし、モックし、本番で通用する実装にするために、Apidogをワークフローに組み込むのが現実的です。





Top comments (0)