Walse

Posted on May 19 • Originally published at apidog.com

Claude Managed Agents vs Agent SDK (2026): Mana yang Terbaik?

Anda sudah siap mengirim agen AI produksi di Claude. Keputusan pertama yang menentukan arsitektur adalah: jalankan loop agen dan sandbox di Anthropic dengan Claude Managed Agents, atau jalankan loop di proses Anda sendiri dengan Claude Agent SDK. Keduanya terlihat mirip di demo, tetapi berbeda besar dalam kontrol data, biaya operasional, observability, dan tanggung jawab on-call. Panduan ini membandingkan keduanya dengan contoh agen refund pembayaran dan agen triage tiket dukungan.

Coba Apidog hari ini

TL;DR

Pilih Claude Managed Agents jika Anda ingin Anthropic meng-host loop agen, sandbox, dan status sesi untuk pekerjaan panjang atau asinkron. Pilih Claude Agent SDK jika Anda membutuhkan loop di dalam proses sendiri, kontrol penuh atas tool, residensi data, dan biaya infrastruktur. Keduanya menggunakan model Claude dan mendukung MCP.

Pendahuluan

Pada 2026, membangun agen AI produksi bukan lagi sekadar menaruh while loop di sekitar chat completion. Anthropic menyediakan dua pola eksekusi:

Claude Managed Agents: REST API terkelola. Anthropic menjalankan loop, sandbox per sesi, dan penyimpanan event.
Claude Agent SDK: library Python/TypeScript. Anda menjalankan loop agen, tool, dan state di infrastruktur sendiri.

Perbedaannya bukan hanya cara memanggil API. Pilihan ini menentukan:

di mana data pelanggan berada,
siapa yang mengoperasikan sandbox,
bagaimana Anda mengaudit tindakan agen,
bagaimana biaya dihitung,
dan siapa yang bangun jam 2 pagi saat tool call macet.

Sebagian besar agen produksi bekerja dengan memanggil API: refund pembayaran, membuat tiket Zendesk, membaca inventory, atau memanggil endpoint internal. Karena itu, reliabilitas agen sangat bergantung pada reliabilitas API yang dipanggilnya.

Sebelum memilih model hosting, siapkan cara untuk mendesain, mock, dan menguji endpoint tersebut. Platform seperti Apidog membantu Anda membuat mock API, menjalankan contract test, dan menguji server MCP seperti agen akan menggunakannya. Jika Anda ingin fokus pada sisi hosted, baca juga panduan Claude Managed Agents.

Apa Itu Claude Managed Agents

Claude Managed Agents adalah runtime agen terkelola dari Anthropic. Anda tidak menulis loop agen, sandbox, atau lapisan eksekusi tool sendiri. Anda mendefinisikan agen, lalu Anthropic menjalankannya.

Produk ini diluncurkan dalam beta publik pada April 2026 dan memerlukan header beta berikut di setiap request:

anthropic-beta: managed-agents-2026-04-01

SDK biasanya mengatur header ini untuk Anda.

Managed Agents dibangun dari empat konsep utama:

Konsep	Fungsi
Agent	Model, system prompt, tool, server MCP, dan skill. Dibuat sekali, digunakan di banyak sesi.
Environment	Template container dengan paket bawaan seperti Python, Node.js, Go, dan aturan akses jaringan.
Session	Instance agen yang menjalankan satu tugas. Memiliki filesystem persisten dan riwayat percakapan.
Event	Pesan antara aplikasi dan agen: user turn, hasil tool, status update, dan output streaming.

Alur dasarnya:

Buat agent.
Konfigurasi environment.
Mulai session.
Kirim user message sebagai event.
Stream respons agen.
Ambil event history untuk audit atau debugging.

Managed Agents cocok untuk workload yang:

berjalan beberapa menit sampai jam,
membutuhkan banyak tool call,
membutuhkan sandbox cloud,
membutuhkan state sesi yang bertahan,
dan ingin mengurangi beban operasional di sisi aplikasi.

Tool bawaan yang tersedia mencakup Bash, operasi file, pencarian web, pengambilan web, dan koneksi MCP. Untuk tool custom, Claude memutuskan kapan tool dipanggil, tetapi aplikasi Anda tetap mengeksekusi tool tersebut dan mengirim hasilnya kembali melalui event stream.

Catatan penting:

Loop dan sandbox di-host oleh Anthropic.
Eksekusi tool custom masih terjadi di aplikasi Anda.
Beberapa fitur seperti result dan multi-agent berada di balik akses preview riset.
Jika Anda menjalankan di Claude Platform on AWS, cek perbedaan fitur dan perilaku sesi.

Untuk konteks arsitektur yang lebih luas, lihat arsitektur AI agentik.

Apa Itu Claude Agent SDK

Claude Agent SDK adalah library untuk menjalankan loop agen di proses Anda sendiri. Library ini tersedia untuk Python dan TypeScript.

Instalasi:

pip install claude-agent-sdk

atau:

npm install @anthropic-ai/claude-agent-sdk

Dengan SDK, Anda memanggil query() dengan prompt dan opsi tool, lalu membaca pesan streaming. Agen dapat membaca file, menjalankan command, mengedit kode, dan memanggil tool tanpa Anda menulis loop tool_use manual.

Perbedaannya dengan Client SDK biasa:

while response.stop_reason == "tool_use":
    # Anda harus mengeksekusi tool sendiri
    # lalu mengirim hasilnya kembali ke model

Dengan Agent SDK, loop tersebut sudah disediakan.

Fitur utama Agent SDK:

Fitur	Fungsi
Built-in tools	Read, Write, Edit, Bash, Glob, Grep, WebSearch, WebFetch, Monitor, AskUserQuestion.
Hooks	Callback seperti `PreToolUse`, `PostToolUse`, `Stop`, `SessionStart`, `SessionEnd`, dan `UserPromptSubmit`.
Subagents	Agen khusus untuk subtugas, dengan `parent_tool_use_id` untuk tracing.
MCP	Menghubungkan database, browser, dan API melalui Model Context Protocol.
Permissions	Mengizinkan, memblokir, atau meminta approval untuk tool tertentu.
Sessions	Menangkap session ID, melanjutkan sesi, atau melakukan fork konteks. State disimpan sebagai JSONL di filesystem Anda.

Karena loop berjalan di proses Anda, SDK juga dapat membaca konfigurasi Claude Code seperti:

.claude/skills/
slash commands
CLAUDE.md
plugin

Autentikasi mendukung Anthropic API langsung, Amazon Bedrock, Claude Platform on AWS, Google Vertex AI, dan Azure AI Foundry. Jika Anda ingin mulai dari contoh praktis, baca panduan setup Claude Agent SDK dengan paket Claude dan membangun Claude Code sendiri.

Catatan billing: mulai 15 Juni 2026, penggunaan Agent SDK dan claude -p pada paket langganan menggunakan kredit Agent SDK bulanan terpisah dari batas penggunaan interaktif. Jangan mengandalkan angka di blog untuk perencanaan biaya; cek syarat Anthropic terbaru secara langsung.

Perbandingan Langsung: Managed Agents vs Agent SDK

Gunakan tabel ini sebagai checklist awal saat review arsitektur. Untuk biaya, konfirmasi langsung di halaman harga Anthropic dan dokumen Managed Agents.

Dimensi	Claude Managed Agents	Claude Agent SDK
Di mana loop berjalan	Infrastruktur yang dikelola Anthropic	Proses dan infrastruktur Anda
Antarmuka	REST API + SSE event stream	Library Python atau TypeScript
Kontrol loop	Dikonfigurasi melalui event	Dikontrol penuh melalui hook, permission, dan kode aplikasi
Model biaya	Token Claude + biaya runtime sesi aktif	Token Claude + compute yang Anda jalankan
Beban operasional	Lebih rendah: sandbox, scaling, dan session storage dikelola	Lebih tinggi: Anda mengoperasikan runtime dan sandbox
Observability	Event log ter-host dan dapat diambil ulang	Bergantung pada instrumentasi Anda: hook, log, tracing
Latency	Ada hop jaringan ke runtime hosted	Loop dekat dengan data dan tool internal Anda
Residensi data	Sandbox dan session state berada di lingkungan Anthropic atau opsi AWS	File, state, dan eksekusi tool berada di infrastruktur Anda
Eksekusi tool custom	Claude meminta tool call; aplikasi Anda mengeksekusi dan mengirim hasil via event	Fungsi Python/TypeScript berjalan dalam proses Anda
Paling cocok	Agen asinkron, panjang, dan minim beban infrastruktur	Agen dekat dengan filesystem, VPC, layanan internal, dan data sensitif

Biaya

Managed Agents menambahkan biaya runtime untuk waktu sesi aktif selain tarif token Claude. Jika agen berjalan satu jam, waktu tersebut dapat masuk ke biaya runtime walaupun sebagian waktunya menunggu tool.

Agent SDK tidak memiliki biaya runtime Anthropic per jam, tetapi Anda membayar:

server,
worker,
sandbox,
autoscaling,
logging,
monitoring,
dan tim yang mengoperasikannya.

Jadi “lebih murah” harus dihitung berdasarkan total cost of ownership, bukan hanya harga API.

Operasional

Managed Agents menghapus kebutuhan untuk menjalankan sandbox, menyimpan state sesi, dan mengelola worker jangka panjang. Ini berguna untuk tim kecil atau workload asinkron.

Agent SDK memberi kontrol penuh, tetapi berarti Anda harus menyediakan:

isolasi proses,
limit resource,
retry policy,
observability,
secret management,
dan audit trail.

Residensi Data

Dengan Agent SDK, eksekusi tool dan session state tetap di infrastruktur Anda. Hanya inferensi model yang dikirim ke Claude.

Dengan Managed Agents, sandbox dan event log berada di lingkungan Anthropic atau opsi AWS. Untuk data yang diatur ketat, ini sering menjadi faktor penentu.

Observability

Managed Agents menyediakan event log yang di-host.

Agent SDK menyediakan hooks. Contoh hook yang umum:

def pre_tool_use_hook(tool_name, tool_input):
    log_event({
        "phase": "pre_tool_use",
        "tool": tool_name,
        "input": tool_input,
    })

    if tool_name == "refund_payment" and tool_input["amount"] > 500:
        raise PermissionError("Refund besar membutuhkan approval manusia")

Dengan SDK, kualitas observability bergantung pada seberapa baik Anda menghubungkan hook ke logging, tracing, dan audit pipeline.

Menguji dan Mendebug API yang Dipanggil Agen

Apa pun model hosting-nya, agen hanya seandal API dan tool yang dipanggil. Agen refund yang berpikir benar tetapi memanggil endpoint pembayaran yang tidak stabil tetap akan gagal.

Uji tiga lapisan berikut sebelum production.

1. Kontrak API

Setiap tool call adalah API call dengan skema request dan response. Mock endpoint tersebut dan jalankan contract test.

Contoh endpoint refund:

POST /payments/{payment_id}/refund
Content-Type: application/json

Payload yang diharapkan:

{
  "amount": 12500,
  "currency": "IDR",
  "reason": "duplicate_charge",
  "requested_by": "agent"
}

Response sukses:

{
  "refund_id": "rf_123",
  "status": "submitted",
  "payment_id": "pay_456"
}

Dengan Apidog, Anda dapat:

mendefinisikan skema endpoint,
membuat mock response,
menjalankan contract test,
dan mendeteksi perubahan backend sebelum agen production rusak.

Untuk pola pengujian yang lebih detail, baca cara menguji agen AI yang memanggil API.

2. Server MCP

Managed Agents dan Agent SDK sama-sama dapat memakai MCP. Server MCP harus diuji seperti service biasa karena sering menjadi titik gagal:

output tool berubah bentuk,
timeout tidak ditangani,
error dikembalikan sebagai teks bebas,
field wajib hilang,
atau tool list berubah tanpa versi.

Checklist pengujian MCP:

Enumerasi semua tool yang diekspos server.
Uji input valid untuk setiap tool.
Uji input invalid.
Uji timeout.
Uji response error.
Pastikan response tetap terstruktur.

Panduan pengujian server MCP dengan Apidog menjelaskan cara melatih setiap tool MCP secara langsung. Apidog juga menyediakan AI agent dan A2A debugger untuk melihat request dan response aktual yang dihasilkan agen.

3. Pola Request Agen

Agen tidak selalu memanggil API seperti manusia atau backend biasa. Polanya bisa berupa:

retry burst,
pembacaan sebagian,
memanggil endpoint yang sama berulang kali,
mengirim payload yang valid secara JSON tetapi salah secara bisnis,
atau mengulangi aksi setelah timeout.

Contoh bug yang harus dicari:

1. Agen memanggil POST /refund
2. API mengembalikan 504
3. Refund sebenarnya berhasil di backend
4. Agen retry POST /refund
5. Customer menerima refund ganda

Mitigasi:

gunakan idempotency key,
mock skenario timeout,
replay traffic historis,
dan validasi payload sebelum tool dieksekusi.

Contoh header idempotency:

Idempotency-Key: refund-ticket-9381-payment-456

Download Apidog untuk membuat mock endpoint, menjalankan contract test, dan mendebug traffic agen sebelum menyentuh pelanggan nyata.

Kerangka Keputusan

Gunakan urutan pertanyaan berikut.

Pilih Claude Managed Agents jika:

Agen berjalan lama atau asinkron.
Setiap task membutuhkan banyak tool call.
Tim Anda tidak ingin mengoperasikan job runner, sandbox, dan session storage.
Anda ingin event log ter-host.
Data dan aturan compliance mengizinkan sandbox serta session state berada di lingkungan Anthropic atau AWS.
Anda siap bekerja dengan status beta dan fitur preview tertentu.

Contoh workload:

triage tiket dukungan,
research agent,
batch enrichment,
long-running report generation,
workflow asinkron dengan data sensitivitas rendah.

Pilih Claude Agent SDK jika:

Agen harus berjalan di VPC Anda.
Agen perlu mengakses database atau API internal.
Session state tidak boleh disimpan pihak ketiga.
Anda perlu hook detail untuk audit, policy, dan approval.
Anda ingin kontrol penuh atas tool execution.
Anda perlu menggunakan kontrak Bedrock, Vertex, atau Azure.
Anda sedang prototyping lokal di filesystem sendiri.

Contoh workload:

refund pembayaran,
data ops internal,
agent yang memodifikasi repo,
workflow dengan data sensitif,
agent yang memerlukan approval manusia di tengah proses.

Jalur umum

Banyak tim memulai dengan Agent SDK karena mudah untuk prototyping lokal. Setelah pola kerja stabil, sebagian workload bisa dipindahkan ke Managed Agents jika penghematan operasional lebih besar daripada kehilangan kontrol.

Namun, migrasi ini bukan sekadar mengganti konfigurasi. Anda perlu menyesuaikan:

antarmuka library menjadi REST + event,
cara tool custom dieksekusi,
session storage,
observability,
dan audit trail.

Jika Anda juga membandingkan model atau agen coding, baca perbandingan Claude vs Codex 2026.

Kasus Penggunaan Dunia Nyata

1. Agen Refund Pembayaran

Sebuah tim dukungan fintech ingin agen yang memproses refund end-to-end:

membaca tiket,
mencari transaksi,
memeriksa kebijakan refund,
memanggil API pembayaran,
menulis ringkasan ke tiket.

Karena agen menyentuh uang, persyaratan utamanya adalah:

audit trail lengkap,
approval untuk refund besar,
idempotency,
contract test API pembayaran,
dan session state tetap di infrastruktur perusahaan.

Pilihan yang lebih tepat: Claude Agent SDK.

Implementasi kontrol dengan hook:

REFUND_APPROVAL_THRESHOLD = 500_000

def pre_tool_use(tool_name, tool_input):
    if tool_name != "refund_payment":
        return

    amount = tool_input["amount"]

    audit_log.write({
        "event": "refund_attempt",
        "payment_id": tool_input["payment_id"],
        "amount": amount,
        "reason": tool_input["reason"],
    })

    if amount > REFUND_APPROVAL_THRESHOLD:
        raise PermissionError("Refund di atas threshold membutuhkan approval manusia")

Sebelum launch, tim sebaiknya:

mock endpoint pembayaran di Apidog,
tulis contract test untuk lookup dan refund,
replay tiket historis,
simulasi timeout dan retry,
pastikan refund memakai idempotency key.

2. Agen Triage Tiket Dukungan Asinkron

Sebuah perusahaan SaaS menerima ribuan tiket per hari. Mereka ingin agen untuk:

mengklasifikasikan tiket,
menarik log terkait,
membuat draft respons,
menyelesaikan atau mengeskalasi tiket.

Karakter workload:

berjalan asinkron,
setiap tiket membutuhkan beberapa menit tool call,
data relatif rendah sensitivitas,
tim kecil,
tidak ingin mengoperasikan worker autoscaling.

Pilihan yang lebih tepat: Claude Managed Agents.

Managed Agents memberi:

runtime hosted,
session state,
event log per tiket,
dan sandbox tanpa tim harus menjalankannya sendiri.

Namun dependensi tetap harus diuji. API logging dan server MCP ticketing perlu di-mock dan diuji kontraknya di Apidog agar perubahan skema tidak diam-diam menurunkan kualitas triage.

3. Agen Data Ops Internal di Balik Firewall

Tim platform ingin agen yang merespons permintaan seperti:

“Back-fill partisi ETL yang gagal kemarin.”

Agen perlu:

memanggil API job internal,
menjalankan script remediasi,
membaca status pipeline,
melaporkan hasil.

Karena API internal tidak tersedia di internet publik dan data sensitif, pilihan praktisnya adalah Claude Agent SDK.

Alasannya:

agen harus berjalan di jaringan internal,
session state tidak boleh keluar,
command execution harus diaudit,
dan tool MCP internal harus diuji sebelum digunakan.

Contoh audit command:

def post_tool_use(tool_name, tool_input, tool_output):
    if tool_name == "bash":
        audit_log.write({
            "event": "agent_command_executed",
            "command": tool_input["command"],
            "output_preview": tool_output[:500],
        })

Untuk latar belakang mengapa agen menjadi konsumen API utama, baca agen AI sebagai konsumen API baru.

Kesimpulan

Keputusan antara Claude Managed Agents dan Claude Agent SDK adalah keputusan operasional dan tata kelola data, bukan sekadar pilihan API.

Ringkasnya:

Managed Agents meng-host loop, sandbox, session state, dan event log.
Agent SDK menjalankan loop di proses dan infrastruktur Anda.
Managed Agents mengurangi beban operasional, tetapi memindahkan state ke lingkungan hosted.
Agent SDK memberi kontrol penuh, tetapi Anda mengoperasikan runtime sendiri.
Residensi data sering menjadi faktor penentu.
Biaya harus dihitung sebagai total cost: token, runtime, compute, dan on-call.
API dan MCP tetap harus diuji, apa pun model hosting-nya.

Langkah berikutnya: sebelum agen menyentuh pelanggan atau sistem produksi, mock semua dependensi API dan MCP. Download Apidog untuk membuat mock endpoint, menjalankan contract test, dan mendebug request agen yang sebenarnya.

FAQ

Apa perbedaan inti antara Claude Managed Agents dan Claude Agent SDK?

Managed Agents adalah REST API terkelola. Anthropic menjalankan loop agen dan sandbox per sesi. Anda mengirim event dan menerima hasil streaming.

Agent SDK adalah library Python atau TypeScript. Loop agen berjalan di proses dan infrastruktur Anda sendiri.

Model Claude yang digunakan bisa sama, tetapi kepemilikan operasionalnya berbeda.

Apakah Claude Agent SDK sama dengan Claude Code SDK lama?

Ya. Claude Code SDK diganti nama menjadi Claude Agent SDK untuk mencerminkan cakupan yang lebih luas daripada tugas coding. Loop agen, built-in tools, dan manajemen konteksnya adalah mekanisme yang sama yang mendukung Claude Code.

Opsi mana yang lebih murah?

Tergantung workload.

Managed Agents mengenakan tarif token Claude plus biaya runtime sesi aktif. Agent SDK tidak memiliki biaya runtime Anthropic per jam, tetapi Anda membayar compute dan operasi sendiri.

Cek harga terbaru langsung di halaman harga Anthropic sebelum membuat anggaran.

Bisakah saya memakai server MCP dengan keduanya?

Ya. Keduanya mendukung Model Context Protocol. Karena itu, server MCP harus diuji seperti service produksi. Panduan pengujian server MCP dengan Apidog menjelaskan cara menguji setiap tool yang diekspos server.

Bagaimana cara menjaga data pelanggan keluar dari infrastruktur Anthropic?

Gunakan Claude Agent SDK dan jalankan loop di lingkungan Anda sendiri. Dengan SDK, eksekusi tool dan session state tetap berada di infrastruktur Anda. Hanya inferensi model yang masuk ke Claude.

Dengan Managed Agents, sandbox dan event log berada di lingkungan Anthropic atau opsi AWS, yang mungkin tidak cocok untuk aturan residensi data ketat.

Apakah Claude Managed Agents siap produksi?

Managed Agents diluncurkan dalam beta publik pada April 2026 dan memerlukan header beta:

anthropic-beta: managed-agents-2026-04-01

Fungsionalitas sesi inti tersedia untuk akun API, tetapi beberapa fitur seperti result dan multi-agent berada di balik akses preview riset. Perlakukan sebagai beta dan cek dokumentasi terbaru sebelum production.

Bagaimana cara menguji agen sebelum menyentuh API nyata?

Lakukan ini:

Mock setiap API dan server MCP.
Tulis contract test untuk request dan response.
Replay traffic realistis.
Simulasi timeout, retry, dan error.
Validasi idempotency untuk aksi berisiko seperti refund.

Apidog mendukung mock API, contract test, AI agent, dan A2A debugger. Panduan cara menguji agen AI yang memanggil API membahas mode kegagalan yang umum.

Bisakah saya mulai dengan satu opsi lalu pindah ke opsi lain?

Bisa. Jalur umum adalah prototyping dengan Agent SDK, lalu memindahkan workload tertentu ke Managed Agents.

Namun, ini bukan perubahan konfigurasi sederhana. Anda harus mengubah:

antarmuka library menjadi REST + event,
cara tool custom dieksekusi,
penyimpanan session state,
observability,
dan audit pipeline.

Rencanakan sebagai proyek migrasi.

DEV Community