DEV Community

Cover image for Claude Managed Agents vs Agent SDK (2026): Nên Chọn Cái Nào?
Sebastian Petrus
Sebastian Petrus

Posted on • Originally published at apidog.com

Claude Managed Agents vs Agent SDK (2026): Nên Chọn Cái Nào?

Bạn đã quyết định triển khai một tác nhân AI sản xuất trên Claude. Ngã rẽ đầu tiên không nằm ở prompt, mà ở runtime: để Anthropic chạy vòng lặp tác nhân và sandbox bằng Claude Managed Agents, hay tự giữ vòng lặp trong dịch vụ của bạn bằng Claude Agent SDK. Hai lựa chọn này có thể giống nhau trong demo, nhưng sẽ kéo theo kiến trúc, chi phí, vận hành và kiểm soát dữ liệu rất khác nhau.

Dùng thử Apidog ngay hôm nay

TL;DR

Chọn Claude Managed Agents nếu bạn muốn Anthropic lưu trữ vòng lặp tác nhân, sandbox và trạng thái phiên cho các tác vụ dài hoặc không đồng bộ.

Chọn Claude Agent SDK nếu bạn cần vòng lặp chạy trong hạ tầng của mình, kiểm soát công cụ, dữ liệu, quyền hạn và chi phí vận hành.

Cả hai đều hỗ trợ MCP và các mô hình Claude.

Bối cảnh: bạn đang chọn runtime, không chỉ chọn SDK

Vào năm 2026, “xây dựng tác nhân AI” không còn đơn giản là bọc một vòng while quanh API chat completion. Với Claude, bạn có hai cách chính để chạy tác nhân trong production:

  • Claude Managed Agents: Anthropic chạy vòng lặp tác nhân, sandbox và trạng thái phiên. Ứng dụng của bạn gửi sự kiện và nhận stream kết quả.
  • Claude Agent SDK: bạn cài thư viện Python hoặc TypeScript, rồi chạy vòng lặp tác nhân trong chính process và hạ tầng của bạn.

Cùng một lớp mô hình bên dưới, nhưng hợp đồng vận hành khác nhau:

  • Dữ liệu nằm ở đâu?
  • Ai vận hành sandbox?
  • Ai xử lý khi tool call bị treo lúc 2 giờ sáng?
  • Chi phí được tính theo runtime được quản lý hay compute tự vận hành?

Hầu hết tác nhân production đều làm việc bằng cách gọi API: hoàn tiền, tạo ticket, tra cứu inventory, đọc log, gọi endpoint nội bộ. Vì vậy, độ tin cậy của tác nhân phụ thuộc rất nhiều vào API và tool mà nó gọi.

Trước khi chọn runtime, bạn nên thiết kế, mock và kiểm thử các endpoint đó. Một nền tảng như Apidog phù hợp cho phần này: mock dependency, chạy contract test, kiểm thử MCP server và quan sát request/response mà tác nhân tạo ra. Nếu muốn đào sâu riêng về hướng được lưu trữ, xem thêm hướng dẫn Claude Managed Agents.

Claude Managed Agents là gì?

Claude Managed Agents là runtime tác nhân được Anthropic quản lý. Thay vì tự viết vòng lặp tác nhân, sandbox và lớp thực thi tool, bạn định nghĩa agent rồi để Anthropic chạy nó.

Managed Agents được ra mắt dưới dạng public beta vào tháng 4 năm 2026 và yêu cầu beta header:

anthropic-beta: managed-agents-2026-04-01
Enter fullscreen mode Exit fullscreen mode

SDK có thể thiết lập header này cho bạn.

Managed Agents xoay quanh bốn khái niệm:

  • Agent: model, system prompt, tool, MCP server và skill. Bạn tạo một lần, sau đó tham chiếu bằng ID.
  • Environment: template container với package cài sẵn như Python, Node.js, Go và rule truy cập mạng.
  • Session: một agent đang chạy trong một environment. Session có filesystem và lịch sử hội thoại liên tục.
  • Events: thông điệp giữa ứng dụng và agent, ví dụ user turn, tool result, status update. Events được stream qua SSE và được lưu phía server.

Luồng triển khai điển hình:

  1. Tạo agent.
  2. Cấu hình environment.
  3. Bắt đầu session.
  4. Gửi user message dưới dạng event.
  5. Nhận stream phản hồi.
  6. Gửi thêm event hoặc interrupt nếu cần đổi hướng.

Managed Agents cung cấp sẵn một số tool:

  • Bash
  • Đọc/ghi/chỉnh sửa file
  • Glob, grep
  • Web search và web retrieval
  • Kết nối MCP server

Theo Anthropic, lựa chọn này phù hợp với các tác vụ:

  • Chạy vài phút đến vài giờ
  • Có nhiều tool call
  • Cần sandbox cloud an toàn
  • Cần trạng thái phiên tồn tại qua nhiều interaction
  • Muốn giảm phần hạ tầng tự vận hành

Managed Agents cũng có trên Claude Platform on AWS, nhưng cần kiểm tra khác biệt về tính năng và session behavior nếu bạn bị ràng buộc bởi một cloud cụ thể.

Hai điểm cần nhớ:

  1. Custom tool vẫn do ứng dụng của bạn thực thi. Claude quyết định gọi tool, nhưng app của bạn chạy tool và trả kết quả qua event stream.
  2. Một số tính năng như result và multi-agent có thể nằm sau research preview riêng. Đừng giả định mọi tính năng đều bật mặc định.

Để hiểu mẫu kiến trúc tổng quát hơn, xem bài kiến trúc AI tác nhân.

Claude Agent SDK là gì?

Claude Agent SDK là thư viện Python/TypeScript cho phép bạn chạy vòng lặp tác nhân trong process của mình. Trước đây nó được gọi là Claude Code SDK; việc đổi tên phản ánh phạm vi rộng hơn ngoài coding task.

Cài đặt:

pip install claude-agent-sdk
Enter fullscreen mode Exit fullscreen mode

hoặc:

npm install @anthropic-ai/claude-agent-sdk
Enter fullscreen mode Exit fullscreen mode

Một agent tối thiểu trong Python có dạng:

from claude_agent_sdk import query, ClaudeAgentOptions

options = ClaudeAgentOptions(
    allowed_tools=["Read", "Write", "Edit", "Bash", "Grep"]
)

async for message in query(
    prompt="Đọc project này và đề xuất các bước refactor an toàn.",
    options=options,
):
    print(message)
Enter fullscreen mode Exit fullscreen mode

Khác với Client SDK thông thường, bạn không cần tự viết vòng lặp kiểu:

while response.stop_reason == "tool_use":
    run_tool()
    send_tool_result()
Enter fullscreen mode Exit fullscreen mode

Agent SDK đã đóng gói vòng lặp, quản lý context và tool execution.

Các thành phần quan trọng:

  • Built-in tools: Read, Write, Edit, Bash, Glob, Grep, WebSearch, WebFetch, Monitor, AskUserQuestion.
  • Hooks: callback tại các điểm như PreToolUse, PostToolUse, Stop, SessionStart, SessionEnd, UserPromptSubmit. Dùng để audit, validate, log hoặc chặn hành vi.
  • Subagents: tạo agent chuyên biệt cho task phụ. Message có parent_tool_use_id để trace.
  • MCP: kết nối database, browser và API qua Model Context Protocol.
  • Permissions: phê duyệt trước tool an toàn, chặn tool nguy hiểm hoặc yêu cầu approval cho hành động nhạy cảm.
  • Sessions: lưu session ID, resume sau này hoặc branch để thử hướng khác. Trạng thái là JSONL trên filesystem của bạn.

Vì vòng lặp chạy trong hạ tầng của bạn, SDK có thể đọc cấu hình Claude Code như:

  • .claude/skills/
  • slash command
  • CLAUDE.md
  • plugin

SDK hỗ trợ xác thực qua Anthropic API, Amazon Bedrock, Claude Platform on AWS, Google Vertex AI và Azure AI Foundry. Điều này hữu ích nếu bạn muốn inference đi qua hợp đồng cloud hiện có.

Nếu muốn bắt đầu bằng ví dụ thực hành, xem hướng dẫn thiết lập Claude Agent SDK với một gói Claude và bài xây dựng Claude Code của riêng bạn.

Lưu ý về billing: từ ngày 15 tháng 6 năm 2026, việc sử dụng Agent SDK và claude -p trên các gói đăng ký sẽ lấy từ một khoản tín dụng Agent SDK hàng tháng riêng, khác với giới hạn dùng Claude tương tác. Hãy kiểm tra điều khoản hiện tại trực tiếp từ Anthropic trước khi dự báo chi phí.

So sánh nhanh: Managed Agents vs Agent SDK

Xem hàng chi phí như định hướng. Luôn xác nhận với trang giá của Anthropictài liệu Managed Agents.

Tiêu chí Claude Managed Agents Claude Agent SDK
Nơi vòng lặp chạy Hạ tầng do Anthropic quản lý Process và hạ tầng của bạn
Giao diện REST API + SSE event stream Thư viện Python hoặc TypeScript
Kiểm soát vòng lặp Cấu hình, điều khiển qua event Kiểm soát bằng code, hook, permission
Chi phí Token Claude + phí runtime theo giờ session hoạt động Token Claude + compute bạn tự vận hành
Ops burden Thấp hơn: không vận hành sandbox/session store/scaling Cao hơn: bạn vận hành service, sandbox, monitoring
Observability Event log được lưu và có thể lấy lại Bạn tự instrument bằng hook/log/tracing
Latency profile Phù hợp tác vụ async dài Kiểm soát gần dữ liệu và service nội bộ
Data residency Sandbox và session state ở Anthropic hoặc AWS option File, state và tool execution ở hạ tầng của bạn
Custom tool Claude yêu cầu, app của bạn thực thi qua event Function Python/TypeScript trong process
Phù hợp nhất Agent async dài, muốn giảm hạ tầng Agent cần kiểm soát dữ liệu, quyền hạn, VPC

Chi phí

Managed Agents tính token Claude tiêu chuẩn cộng phí runtime cho thời gian session hoạt động. Nếu agent “suy nghĩ” trong một giờ, bạn có thể trả phí runtime cho khoảng thời gian đó.

Agent SDK không có phí runtime Anthropic theo giờ, nhưng bạn trả tiền cho:

  • server
  • autoscaling
  • sandbox
  • queue/worker
  • monitoring
  • on-call

Rẻ hơn trên bảng giá không nhất thiết rẻ hơn khi tính cả vận hành.

Gánh nặng vận hành

Managed Agents loại bỏ nhiều phần khỏi trách nhiệm của bạn:

  • sandbox
  • session store
  • scaling
  • event history

SDK trao lại cho bạn toàn quyền kiểm soát, phù hợp khi agent phải chạy trong VPC cạnh database riêng tư hoặc service nội bộ.

Nơi lưu trú dữ liệu

Với SDK, tool execution và session state nằm trong hạ tầng của bạn; chỉ inference request đi đến Claude.

Với Managed Agents, sandbox và event log nằm trong môi trường của Anthropic hoặc AWS option. Với dữ liệu regulated, đây thường là tiêu chí quyết định.

Observability

Managed Agents cho bạn event log được lưu sẵn.

SDK cho bạn hook để tự đưa event vào stack hiện có:

async def pre_tool_use_hook(context):
    tool = context.tool_name
    args = context.tool_input

    audit_log.write({
        "event": "pre_tool_use",
        "tool": tool,
        "args": args,
        "session_id": context.session_id,
    })

    if tool == "refund_payment" and args["amount"] > 500:
        raise PermissionError("Refund vượt ngưỡng cần human approval")
Enter fullscreen mode Exit fullscreen mode

Cách kiểm thử API mà agent gọi

Dù chọn Managed Agents hay Agent SDK, agent chỉ đáng tin cậy bằng các API và MCP server mà nó gọi.

Một agent hoàn tiền có reasoning tốt nhưng gọi endpoint thanh toán không ổn định thì vẫn là agent không ổn định.

Bạn nên kiểm thử ba lớp sau trước khi production.

1. Contract API

Mọi tool mà agent gọi đều là API có schema. Hãy mock endpoint và xác nhận request/response shape.

Ví dụ, agent hoàn tiền có thể kỳ vọng endpoint:

POST /refunds
Content-Type: application/json
Enter fullscreen mode Exit fullscreen mode

Request:

{
  "transaction_id": "txn_123",
  "amount": 49.99,
  "reason": "duplicate_charge"
}
Enter fullscreen mode Exit fullscreen mode

Response:

{
  "refund_id": "ref_456",
  "status": "pending"
}
Enter fullscreen mode Exit fullscreen mode

Nếu backend đổi refund_id thành id, agent có thể hỏng trong production. Contract test nên bắt lỗi này trước.

Với Apidog, bạn có thể mock service thanh toán hoặc ticketing, định nghĩa schema và chạy contract test theo lịch. Xem thêm hướng dẫn cách kiểm thử các tác nhân AI gọi API.

2. MCP server

Cả Managed Agents và Agent SDK đều có thể dùng MCP để kết nối tool bên ngoài. MCP server cũng là một service cần test:

  • Tool có được liệt kê đúng không?
  • Input schema có ổn định không?
  • Output có cấu trúc không?
  • Timeout được xử lý thế nào?
  • Error path có trả JSON thay vì plain text không?

Hãy kiểm thử MCP server trực tiếp trước khi gắn vào agent. Xem hướng dẫn kiểm thử máy chủ MCP với Apidog. Apidog cũng có AI agent và A2A debugger để quan sát request/response do agent tạo ra.

3. Hành vi request của agent

Agent gọi API khác người dùng:

  • retry liên tục
  • gọi cùng endpoint nhiều lần trong một vòng reasoning
  • đọc partial data rồi gọi lại
  • tạo request gần đúng nhưng sai schema
  • gây “retry storm” khi timeout

Hãy replay traffic agent tạo ra đối với mock trước khi gọi service thật. Đây là nơi debugger request trực tiếp có giá trị: bạn phát hiện storm trong staging thay vì trong incident call.

Bạn có thể Tải xuống Apidog để mock dependency, chạy contract test và debug luồng request của agent.

Khung ra quyết định

Trả lời các câu hỏi sau theo thứ tự. Câu “có” mạnh đầu tiên thường chỉ ra lựa chọn phù hợp.

Chọn Claude Managed Agents nếu

  • Agent chạy dài hoặc async, từ vài phút đến vài giờ.
  • Bạn không muốn vận hành task runner, sandbox và session store.
  • Nhóm nhỏ, nhân sự vận hành là giới hạn chính.
  • Bạn muốn event log được lưu sẵn.
  • Data posture cho phép sandbox và session state nằm trong môi trường Anthropic hoặc AWS.
  • Bạn chấp nhận trạng thái beta và một số tính năng cần research preview.

Chọn Claude Agent SDK nếu

  • Agent phải chạy trong VPC của bạn.
  • Agent cần truy cập database hoặc service nội bộ không public.
  • Session state không được rời khỏi hạ tầng công ty.
  • Bạn cần hook để audit, policy, approval hoặc chặn tool.
  • Bạn cần custom permission chi tiết.
  • Bạn muốn inference đi qua Bedrock, Vertex hoặc Azure contract hiện có.
  • Bạn đang prototype local và muốn agent thao tác trực tiếp trên filesystem.

Lộ trình phổ biến

Một cách làm thực tế:

  1. Prototype local bằng Agent SDK.
  2. Xác định tool, permission và API contract.
  3. Mock dependency và chạy test.
  4. Nếu workload async dài và yêu cầu data cho phép, chuyển sang Managed Agents cho production.
  5. Nếu cần VPC/data residency, giữ Agent SDK và đầu tư vào vận hành.

Việc chuyển từ SDK sang Managed Agents không phải chỉ là đổi config. Bạn sẽ thay đổi interface, cách custom tool được thực thi và nơi lưu session state. Hãy coi đó là một migration project.

Nếu bạn cũng so sánh mô hình hoặc coding agent, xem bài so sánh Claude vs Codex năm 2026.

Trường hợp sử dụng thực tế

1. Agent hoàn tiền thanh toán

Một nhóm fintech muốn agent xử lý yêu cầu hoàn tiền:

  1. Đọc ticket.
  2. Tra cứu giao dịch.
  3. Kiểm tra policy hoàn tiền.
  4. Gọi payment API.
  5. Ghi tóm tắt vào ticket.

Vì liên quan đến tiền, mọi API call cần contract test và audit log.

Lựa chọn phù hợp: Claude Agent SDK.

Lý do:

  • Agent nên chạy trong VPC cạnh service thanh toán.
  • Session state không nên rời khỏi hạ tầng công ty.
  • Hook PreToolUse có thể enforce approval cho refund vượt ngưỡng.

Ví dụ policy hook:

async def pre_tool_use(context):
    if context.tool_name == "create_refund":
        amount = context.tool_input["amount"]

        if amount > 500:
            return {
                "action": "require_approval",
                "reason": "Refund vượt ngưỡng 500"
            }

    return {"action": "allow"}
Enter fullscreen mode Exit fullscreen mode

Trước khi launch, nhóm nên:

  • mock payment API trong Apidog
  • viết contract test cho refund và lookup
  • replay ticket lịch sử
  • kiểm tra agent có retry sai sau lỗi 504 hay không

Một lỗi phổ biến: refund thực tế đã thành công, nhưng agent retry vì nhận timeout. Đây là kiểu lỗi phải bắt bằng test trước production.

2. Agent phân loại ticket hỗ trợ async

Một công ty SaaS nhận hàng ngàn ticket mỗi ngày và muốn agent:

  1. Phân loại ticket.
  2. Kéo log liên quan.
  3. Soạn phản hồi.
  4. Resolve hoặc escalate.

Mỗi ticket mất vài phút, chạy liên tục cả ngày, dữ liệu có độ nhạy thấp.

Lựa chọn phù hợp: Claude Managed Agents.

Lý do:

  • Workload async dài.
  • Nhóm không muốn tự chạy worker autoscaling.
  • Event log được lưu sẵn giúp trace theo từng ticket.
  • Hạ tầng quản lý session và sandbox được giảm đáng kể.

Tuy nhiên, API correctness vẫn là trách nhiệm của bạn. Nên mock logging API và MCP server ticketing trong Apidog để schema change không âm thầm làm giảm chất lượng phân loại.

3. Agent vận hành dữ liệu nội bộ sau firewall

Một platform team muốn agent xử lý yêu cầu nội bộ như:

“Khôi phục các phân vùng ETL bị lỗi ngày hôm qua.”

Agent cần:

  1. Query job API nội bộ.
  2. Chạy script khắc phục.
  3. Báo cáo trạng thái.
  4. Ghi audit log.

Các API không public internet và dữ liệu nhạy cảm.

Lựa chọn phù hợp: Claude Agent SDK.

Lý do:

  • Agent phải chạy nơi có thể truy cập service riêng tư.
  • Session state không được nằm trong sandbox bên thứ ba.
  • Hook SDK có thể ghi mọi lệnh vào audit pipeline hiện có.
  • MCP server nội bộ có thể được kiểm thử riêng trước khi kết nối agent.

Đây là trường hợp “chạy trong process của bạn” không còn là sở thích, mà là yêu cầu. Xem thêm bài các tác nhân AI là người tiêu dùng API mới.

Checklist triển khai

Dùng checklist này trước khi chọn runtime:

  • [ ] Agent có cần chạy trong VPC không?
  • [ ] Session state có được phép nằm ngoài hạ tầng của bạn không?
  • [ ] Tác vụ chạy vài giây, vài phút hay vài giờ?
  • [ ] Bạn có đội vận hành sandbox/worker không?
  • [ ] Bạn cần hook approval trước tool call không?
  • [ ] Bạn cần audit log theo từng tool call không?
  • [ ] Các API mà agent gọi đã có schema rõ ràng chưa?
  • [ ] MCP server đã được test riêng chưa?
  • [ ] Bạn đã mô phỏng timeout, retry và partial failure chưa?
  • [ ] Bạn đã xác nhận pricing và trạng thái beta từ nguồn chính thức chưa?

Kết luận

Quyết định giữa Managed Agents và Agent SDK thực chất là quyết định về vận hành và quản trị dữ liệu.

Ghi nhớ các điểm chính:

  • Managed Agents lưu trữ vòng lặp và sandbox; SDK chạy chúng trong process của bạn.
  • Chi phí là mô hình vận hành, không chỉ là giá token.
  • Data residency thường quyết định lựa chọn.
  • Nhóm nhỏ thường hưởng lợi nhiều từ runtime được quản lý.
  • Agent production cần test API và MCP dependency nghiêm túc.
  • Prototype bằng SDK rồi chuyển sang Managed Agents là hợp lý, nhưng migration không miễn phí.
  • Luôn kiểm tra pricing và beta status tại nguồn chính thức.

Bước tiếp theo: trước khi kết nối agent với bất kỳ hệ thống customer-facing nào, hãy đưa API và MCP dependency vào kiểm thử. Tải xuống Apidog để mock endpoint, chạy contract test và debug request thực tế của agent.

Câu hỏi thường gặp

Sự khác biệt cốt lõi giữa Claude Managed Agents và Claude Agent SDK là gì?

Managed Agents là REST API được lưu trữ, nơi Anthropic chạy vòng lặp tác nhân và sandbox theo session. Bạn gửi event và nhận stream kết quả. Agent SDK là thư viện Python/TypeScript chạy vòng lặp trong process và hạ tầng của bạn.

Claude Agent SDK có giống Claude Code SDK cũ không?

Có. Claude Code SDK đã được đổi tên thành Claude Agent SDK để phản ánh phạm vi rộng hơn ngoài coding task. Vòng lặp tác nhân, built-in tool và quản lý context là cùng cơ chế cung cấp sức mạnh cho Claude Code.

Tùy chọn nào rẻ hơn?

Phụ thuộc workload. Managed Agents tính token Claude cộng phí runtime cho thời gian session hoạt động. SDK không có phí runtime Anthropic theo giờ, nhưng bạn trả compute và vận hành. Luôn xác nhận trên trang giá của Anthropic.

Tôi có thể dùng MCP server với cả hai không?

Có. Cả hai đều hỗ trợ Model Context Protocol. Vì vậy, bạn nên test MCP server trước khi kết nối với agent. Xem hướng dẫn kiểm thử máy chủ MCP với Apidog.

Làm thế nào để giữ dữ liệu khách hàng không nằm trong hạ tầng Anthropic?

Dùng Agent SDK và chạy vòng lặp trong môi trường của bạn. Với SDK, tool execution và session state nằm trên hạ tầng của bạn; chỉ inference request đi đến Claude. Với Managed Agents, sandbox và event log nằm trong môi trường Anthropic hoặc AWS option.

Claude Managed Agents đã sẵn sàng cho production chưa?

Managed Agents được ra mắt dưới dạng public beta vào tháng 4 năm 2026 và yêu cầu header managed-agents-2026-04-01. Một số tính năng có thể cần research preview riêng. Hãy kiểm tra tài liệu hiện tại trước khi triển khai production.

Làm thế nào để kiểm thử agent trước khi nó gọi API thật?

Mock mọi API và MCP server mà agent gọi, viết contract test cho request/response schema, rồi replay traffic thực tế của agent đối với mock. Apidog hỗ trợ mock, contract test, AI agent và A2A debugger. Xem hướng dẫn cách kiểm thử các tác nhân AI gọi API.

Tôi có thể bắt đầu với một lựa chọn rồi chuyển sang lựa chọn khác không?

Có. Một lộ trình phổ biến là prototype bằng Agent SDK local rồi chuyển sang Managed Agents nếu workload production phù hợp. Nhưng đây không phải đổi config đơn giản: interface khác nhau, custom tool execution khác nhau và session state nằm ở nơi khác. Hãy lập kế hoạch như một migration project.

Top comments (0)