Cognition vừa đổi tên trình soạn thảo Windsurf thành Devin Desktop và phát hành kèm nhiều tính năng mới. Trang tải xuống của Devin gọi Devin là “trung tâm chỉ huy để quản lý tất cả các agent của bạn”, còn thông báo chính thức mô tả Devin Desktop là “một IDE hoàn chỉnh với trình quản lý agent được tích hợp sẵn, chứ không phải ngược lại.”
Điểm quan trọng: Devin không còn chỉ là agent đám mây tự trị. Hệ sinh thái hiện gồm Devin Desktop, Devin Cloud, Devin CLI và Devin Review. Bài viết này đi qua từng phần theo hướng triển khai: bạn dùng tính năng nào, dùng khi nào, và nên kiểm thử API do agent tạo ra như thế nào. Nếu bạn đang so sánh với Cursor, hãy đọc thêm hướng dẫn xây dựng API với Cursor Composer 2.5.
Thay đổi lớn: Windsurf giờ đây là Devin Desktop
Nếu bạn đang dùng Windsurf, bạn đã có Devin Desktop thông qua bản cập nhật tiêu chuẩn. Theo Cognition, các gói, giá, cài đặt và tiện ích mở rộng được giữ nguyên. Không cần migrate project hay cấu hình lại editor.
Cách hiểu thực tế:
- Windsurf cũ: editor có AI tích hợp.
- Devin Desktop mới: IDE có lớp quản lý agent làm trung tâm.
- Luồng làm việc mới: chia việc cho nhiều agent, theo dõi trạng thái, review kết quả và merge PR.
Trung tâm Chỉ huy Agent
Khi mở Devin Desktop, bạn sẽ thấy Trung tâm Chỉ huy Agent. Đây là bảng Kanban hiển thị các agent đang chạy cục bộ và trên đám mây, được nhóm theo trạng thái như đang thực hiện, bị chặn hoặc sẵn sàng để đánh giá.
Cách dùng hiệu quả:
- Tách một dự án lớn thành các tác vụ nhỏ.
- Giao từng tác vụ cho agent riêng.
- Theo dõi agent nào đang bị chặn.
- Review kết quả theo PR hoặc diff.
- Chỉ merge khi test và kiểm tra API đã qua.
Ví dụ phân rã tác vụ:
Agent 1: Refactor route /users
Agent 2: Viết unit test cho service user
Agent 3: Tạo mock response cho frontend
Agent 4: Kiểm tra lỗi auth trong staging
Nếu bạn đang thiết kế workflow agent, bài viết về các mẫu kết nối và cạm bẫy của quy trình làm việc theo agent sẽ giúp bạn tránh các lỗi phổ biến như agent chạy lệch ngữ cảnh hoặc bị kẹt mà không ai phát hiện.
Không gian làm việc: Spaces
Spaces giúp gom mọi thứ liên quan đến một tác vụ hoặc dự án vào cùng một chế độ xem: phiên agent, pull request, file và ngữ cảnh.
Cách áp dụng:
- Tạo một Space cho từng dự án hoặc epic.
- Đưa các phiên agent liên quan vào cùng Space.
- Bắt đầu phiên mới từ Space đó để agent kế thừa ngữ cảnh.
- Quay lại Space khi cần review hoặc tiếp tục công việc.
Ví dụ cấu trúc Space:
Space: billing-api-refactor
- Agent session: refactor invoice routes
- Agent session: add payment validation tests
- PR: refactor billing controller
- Files: openapi.yaml, billing.service.ts, invoice.controller.ts
Lợi ích chính là giảm việc phải giải thích lại codebase cho từng agent.
Chạy nhiều agent song song
Trung tâm Chỉ huy Agent và Spaces được thiết kế cho mô hình nhiều agent chạy cùng lúc. Thay vì dùng một agent để làm toàn bộ việc, bạn nên chia theo ranh giới rõ ràng:
Tốt:
- Agent A: sửa endpoint GET /users/:id
- Agent B: viết test cho user service
- Agent C: cập nhật tài liệu OpenAPI
Không tốt:
- Agent A: "cải thiện toàn bộ backend"
Nguyên tắc triển khai:
- Mỗi agent nên có đầu ra cụ thể.
- Mỗi tác vụ nên có tiêu chí hoàn thành.
- Mỗi thay đổi API nên có spec hoặc test đi kèm.
- Không để nhiều agent sửa cùng một file lớn nếu không cần thiết.
Devin Local thay thế Cascade
Cascade, agent tương tác cục bộ của Windsurf, giờ là sản phẩm cũ. Người kế nhiệm là Devin Local, được viết lại bằng Rust. Cognition cho biết Devin Local hiệu quả hơn tới 30% về token và hỗ trợ subagent.
Điều này quan trọng vì chi phí agent thường phụ thuộc vào token. Nếu agent phải đọc nhiều file, sửa code và chạy nhiều vòng lặp, mức giảm token có thể tạo khác biệt rõ rệt. Xem thêm hướng dẫn giảm chi phí token agent từ CLI.
Bạn vẫn có thể dùng Cascade cũ cho đến ngày 1 tháng 7. Sau đó, Devin Local sẽ là mặc định.
Devin Cloud
Devin Cloud là agent tự trị chạy trên môi trường đám mây. Khi nhận tác vụ, nó tạo một máy ảo riêng với trình duyệt, shell và editor, sau đó xử lý công việc từ đầu đến cuối, bao gồm debug, triển khai và kiểm thử. Khi hoàn thành, nó trả về pull request.
Cách dùng phù hợp:
Dùng Devin Local khi:
- Cần chỉnh sửa nhanh trong editor
- Cần tương tác liên tục
- Cần kiểm soát từng bước
Dùng Devin Cloud khi:
- Tác vụ đã được mô tả rõ
- Có thể chạy độc lập
- Có thể review kết quả qua PR
- Tác vụ mất nhiều thời gian
Ví dụ prompt nên rõ ràng:
Refactor endpoint POST /orders để validate input theo schema hiện tại.
Không đổi response contract.
Thêm unit test cho các case:
- missing customerId
- empty items
- invalid quantity
Tạo PR riêng và mô tả các file đã thay đổi.
Devin Review
Devin Review giúp bạn review pull request do agent tạo ra ngay trong Devin. Bạn có thể chuyển lại cho agent cục bộ để sửa, phê duyệt và dùng GitHub auto-merge khi các kiểm tra đã qua.
Checklist review nên dùng:
[ ] Diff có đúng phạm vi tác vụ không?
[ ] API contract có bị thay đổi ngoài ý muốn không?
[ ] Test mới có bao phủ case chính không?
[ ] Response status code còn đúng không?
[ ] Không có secret hoặc token trong code?
[ ] PR description giải thích rõ thay đổi?
Giao thức Agent Client: ACP
Một điểm quan trọng là Giao thức Agent Client (ACP). Đây là tiêu chuẩn mã nguồn mở cho phép agent tương thích chạy trong editor tương thích ACP.
Devin Desktop ra mắt với hỗ trợ cho:
- Codex
- Claude Agent
- OpenCode
- Agent nội bộ tùy chỉnh
Điều này giảm rủi ro bị khóa vào một nhà cung cấp. Bạn có thể chạy nhiều agent trong cùng Devin Desktop và quản lý chúng từ Trung tâm Chỉ huy Agent.
Nếu bạn muốn hiểu cách các runtime agent được xây dựng, xem thêm phân tích kiến trúc harness của agent mã hóa.
SWE-1.6, mô hình nội bộ của Cognition
Devin vẫn hỗ trợ các mô hình từ OpenAI, Anthropic và Google, đồng thời có SWE-1.6 của Cognition. Theo Cognition, mô hình này miễn phí sử dụng trên các gói trả phí.
Dòng SWE được tối ưu cho tốc độ. SWE-1.5 trước đó được nêu là chạy khoảng 950 token mỗi giây, phù hợp cho chỉnh sửa nội tuyến và tự động hoàn thành bằng phím Tab.
Cách dùng thực tế:
Dùng model nhanh:
- autocomplete
- chỉnh sửa nhỏ
- giải thích đoạn code
- tạo boilerplate
Dùng model mạnh hơn:
- refactor phức tạp
- phân tích bug khó
- thiết kế kiến trúc
- viết migration lớn
DeepWiki và tìm kiếm mã
Devin tự động lập chỉ mục repository và tạo wiki thông qua DeepWiki. Wiki này có thể gồm sơ đồ kiến trúc, tóm tắt codebase và liên kết về source code.
Tác dụng chính với agent:
- Agent mới không cần quét repo từ đầu.
- Phiên trong Space có ngữ cảnh tốt hơn.
- Dễ xác định file liên quan trước khi sửa.
- Giảm khả năng agent đoán sai cấu trúc dự án.
Cách tận dụng:
Trước khi giao task:
1. Kiểm tra DeepWiki đã hiểu đúng module chưa.
2. Chỉ rõ file hoặc package liên quan.
3. Gắn task vào Space đúng dự án.
4. Yêu cầu agent không sửa ngoài phạm vi.
Tích hợp, Sessions API và Tự động phân loại
Devin có thể bắt đầu công việc từ Slack, Jira, Linear, GitHub và Teams. Nó cũng theo dõi phiên được tạo từ nguồn nào.
Các điểm cần biết:
- Sessions API: truy xuất phiên bằng ID, gửi tin nhắn đến phiên đang hoạt động và lọc phiên theo nguồn như webapp, Slack, Teams, API, Linear hoặc Jira. Bạn cũng có thể truyền secret theo phạm vi phiên khi tạo phiên. Xem thêm truy cập bí mật theo phạm vi cho các agent mã hóa.
- Hỗ trợ MCP: Devin tôn trọng nền tảng mặc định trên các phương thức tạo phiên. Luồng OAuth MCP hiện chuyển tiếp tham số tài nguyên RFC 8707, hữu ích với server như Snowflake cần chỉ báo tài nguyên.
- Auto-Triage: Devin có thể nhận issue mới và tự động phân loại thành phiên đã bắt đầu.
-
Điều khiển Slack: dùng
!channel #nameđể đổi nơi Devin đăng luồng phản hồi cho một phiên.
Ví dụ quy trình từ ticket đến PR:
Jira issue created
→ Auto-Triage phân loại
→ Devin tạo session
→ Agent xử lý task
→ Devin tạo PR
→ Devin Review
→ Merge khi test pass
Devin CLI, JetBrains và ứng dụng desktop
Devin cũng có các điểm truy cập ngoài editor chính:
- Devin CLI: dùng trong terminal.
- Plugin JetBrains: hỗ trợ IntelliJ, PyCharm, WebStorm, GoLand, RubyMine, Rider và các IDE JetBrains khác.
- Ứng dụng desktop: có bản dựng cho macOS Apple Silicon, macOS Intel, Windows 10 64-bit và Linux.
- Devin Next Beta: kênh nhận thay đổi mới sớm hơn.
Cài Devin CLI:
curl -fsSL https://cli.devin.ai/install.sh | bash
Cách Devin mới so sánh với Cursor
Việc đổi thương hiệu làm so sánh Devin với Cursor thay đổi đáng kể. Trước đây, Cursor là editor bạn điều khiển, còn Devin là agent bạn ủy quyền. Giờ cả hai đều là editor và đều chạy nhiều nhà cung cấp mô hình. Khác biệt chính nằm ở cách làm việc.
| Cursor | Devin | |
|---|---|---|
| Thái độ mặc định | Bạn điều khiển; AI hỗ trợ nội tuyến | Bạn điều khiển cục bộ, sau đó ủy quyền cho đám mây |
| Con người trong vòng lặp | Liên tục | Không liên tục; các điểm kiểm tra và đánh giá PR |
| Chế độ xem đa agent | Hạn chế | Trung tâm chỉ huy Agent, hàng chục agent song song |
| Agent đám mây tự trị | Không đi kèm | Devin Cloud, máy ảo cách ly, trả về PRs |
| Giao thức agent mở | Gốc Cursor | ACP; Codex, Claude Agent, OpenCode, tùy chỉnh |
| Tốt nhất cho | Khám phá, lặp lại UI, các tác vụ phát triển | Công việc được xác định rõ ràng, có thể song song hóa, chạy dài |
Các bậc giá hiện khá gần nhau:
| Bậc | Devin | Cursor |
|---|---|---|
| Miễn phí | Miễn phí; không giới hạn tự động hoàn thành Tab và chỉnh sửa nội tuyến | Hobby; miễn phí, sử dụng hạn chế |
| Trả phí cơ bản | Pro, $20/tháng; truy cập agent đám mây | Pro, $20/tháng |
| Người dùng chuyên sâu | Max, $200/tháng | Ultra, $200/tháng |
| Nhóm | $80/tháng + $40/chỗ ngồi | $40/người dùng/tháng |
| Doanh nghiệp | Tùy chỉnh | Tùy chỉnh |
Lưu ý: cả hai đều có chi phí theo mức sử dụng lớn. Với Devin, các lượt chạy tự động của Devin Cloud là phần cần theo dõi kỹ. Kiểm tra giá của Devin và tài liệu giá của Cursor trước khi chọn gói.
Về benchmark, không nên so sánh trực tiếp nếu bộ kiểm thử khác nhau. Cursor báo cáo Composer 2.5 đạt 79.8% trên SWE-bench Multilingual, trong khi chế độ tự động của Devin được đo khoảng 45.8% trên SWE-bench Verified nghiêm ngặt hơn. Đây là các bộ khác nhau, nên không phải bảng điểm một-một. Xem SWE-bench để hiểu từng bài kiểm thử. Để đọc thêm về model và editor, xem so sánh Composer 2.5 vs Opus 4.7 vs GPT-5.5 và hướng dẫn Composer 2.5.
Tóm tắt:
Chọn Cursor nếu:
- Bạn muốn điều khiển liên tục trong editor
- Bạn làm nhiều UI iteration
- Bạn thích workflow tập trung vào một developer
Chọn Devin nếu:
- Bạn muốn ủy quyền task dài
- Bạn cần nhiều agent chạy song song
- Bạn muốn review kết quả qua PR
- Bạn cần agent cloud và ACP
Vị trí của Apidog
Các agent có thể tạo route, service và test, nhưng chúng không tự đảm bảo hợp đồng API của bạn đúng. Một PR do agent tạo có thể thêm endpoint mới, đổi response hoặc làm frontend nhận sai dữ liệu nếu không có spec rõ ràng.
Apidog xử lý lớp API đó:
- Thiết kế contract API trước.
- Xuất hoặc cung cấp OpenAPI spec rõ ràng cho agent.
- Để agent triển khai theo spec.
- Kiểm thử endpoint sau khi agent tạo code.
- Mock API cho frontend khi backend chưa hoàn chỉnh.
- Debug request/response khi staging trả lỗi.
Quy trình spec-first phù hợp với agent tự trị vì agent cần mục tiêu rõ ràng. Spec mơ hồ thường dẫn đến implementation mơ hồ.
Ví dụ bàn giao cho agent:
Dựa trên OpenAPI spec trong /docs/openapi.yaml.
Triển khai endpoint POST /orders.
Không đổi schema response.
Nếu thiếu thông tin, dừng lại và hỏi.
Sau khi triển khai, thêm test cho status 201, 400 và 401.
Đọc thêm:
- Hướng dẫn chế độ spec-first của Apidog
- Tác dụng của design.md đối với các agent mã hóa
- Trình gỡ lỗi agent AI của Apidog
Câu hỏi thường gặp
Windsurf có bị ngừng phát triển không?
Không. Windsurf giờ là Devin Desktop. Bạn nhận được bản cập nhật qua mạng, còn gói, cài đặt và tiện ích mở rộng được giữ nguyên.
Chuyện gì đã xảy ra với Cascade?
Cascade là sản phẩm cũ. Devin Local thay thế Cascade, được viết lại bằng Rust, hiệu quả hơn tới 30% về token và hỗ trợ subagent. Bạn có thể tiếp tục dùng Cascade cho đến ngày 1 tháng 7.
Devin có thể chạy Claude hoặc Codex không?
Có. Thông qua Giao thức Agent Client, Devin Desktop có thể chạy Codex, Claude Agent, OpenCode và agent tùy chỉnh, cùng với SWE-1.6 của Cognition và các mô hình tiên tiến khác.
Devin có miễn phí không?
Có gói miễn phí với tự động hoàn thành Tab và chỉnh sửa nội tuyến không giới hạn. Truy cập agent tự trị Devin Cloud bắt đầu từ gói Pro $20.
Devin có tốt hơn Cursor không?
Không nên xem là tốt hơn tuyệt đối. Cursor phù hợp hơn nếu bạn muốn làm việc trực tiếp trong editor. Devin phù hợp hơn nếu bạn muốn ủy quyền nhiều task, chạy agent song song và review kết quả qua PR.
Làm cách nào để cài đặt Devin?
Tải bản desktop từ trang tải xuống, cài plugin JetBrains, hoặc cài CLI:
curl -fsSL https://cli.devin.ai/install.sh | bash
Kết luận
Việc đổi tên Windsurf thành Devin Desktop không chỉ là thay đổi thương hiệu. Devin hiện là IDE, agent đám mây tự trị, CLI và nền tảng review, được kết nối bằng Trung tâm Chỉ huy Agent và giao thức ACP.
Cách dùng hiệu quả là chia nhỏ công việc, giao task rõ ràng, review PR nghiêm túc và luôn kiểm thử API do agent tạo ra. Dù bạn dùng Devin hay Cursor, hãy thiết kế, kiểm thử và mock API trong Apidog để contract API không bị lệch khi agent tạo code.





Top comments (0)