DEV Community

superXdev
superXdev Subscriber

Posted on

4 Tools/MCP yang Wajib Kamu Coba Biar AI Coding Agent Kamu Nggak "Bego" Lagi

Kalau kamu udah lumayan sering pakai Claude Code, Cursor, atau OpenCode buat kerja sehari-hari, kamu pasti pernah ngerasain hal-hal ini:

  • Agent-nya harus grep dan baca ulang puluhan file cuma buat ngerti satu fungsi dipanggil dari mana.
  • Dia ngasih kode pakai API atau library versi lama karena training data-nya emang udah nggak update.
  • Context window cepet penuh gara-gara output command (test, git log, build) yang panjangnya kebangetan.
  • Dia nggak tau info terbaru di luar karena emang nggak bisa browsing sendiri.

Semua itu bukan salah modelnya doang, itu masalah infrastruktur di sekitar agent-nya. Dan ini yang jarang dibahas: performa AI coding agent itu nggak cuma soal model mana yang paling pintar, tapi juga soal apa aja yang kamu kasih ke dia lewat MCP (Model Context Protocol) dan tools pendukung.

Di artikel ini gue mau share 4 tools/MCP yang menurut gue paling berdampak buat naikin kualitas kerja AI coding agent kamu, entah itu Claude Code, Cursor, Windsurf, atau OpenCode. Urutannya sengaja gue susun dari yang paling "kasih akses ke luar", sampai yang paling "ngirit resource di dalam".


1. Firecrawl (CLI + Skill) — Biar Agent Kamu Bisa Akses Web Secara Real-Time Tanpa Bikin Context Penuh

Firecrawl repository

Masalah yang dipecahkan

AI coding agent by default cuma punya knowledge sampai tanggal training cutoff-nya. Begitu kamu nanya soal library versi terbaru, error message yang baru muncul minggu ini, atau perlu riset kompetitor, dia bakal ngarang atau bilang "saya tidak punya informasi terkini".

Kenapa pakai versi CLI + Skill, bukan MCP

Firecrawl sebenarnya punya dua cara integrasi: MCP server, atau CLI + Agent Skill. Gue sengaja rekomendasiin yang versi CLI + Skill karena caranya jauh lebih ringan buat context window:

  • MCP itu sifatnya nge-load semua definisi tool-nya di awal sesi, jadi walaupun kamu belum pernah pakai satu fungsi pun, token-nya udah kepotong duluan. Kalau kamu pasang beberapa MCP server sekaligus, ini bisa numpuk jadi puluhan ribu token cuma buat "daftar menu" doang.
  • Skill kerja pakai progressive disclosure: yang ke-load di awal cuma nama dan deskripsi skill-nya (kira-kira 100 token), dan instruksi lengkapnya baru dibaca pas skill itu bener-bener kepake. Jadi context kamu tetap bersih sampai agent beneran butuh Firecrawl.
  • Hasil scrape/crawl/search-nya ditulis ke filesystem (folder .firecrawl/), bukan didorong langsung ke context. Agent baru baca file itu kalau memang perlu, jadi kamu yang kontrol berapa banyak yang masuk ke context.
  • Skill ini format-nya open standard, jadi satu file SKILL.md yang sama bisa jalan di Claude Code, Cursor, OpenAI Codex, Gemini CLI, dan agent lain yang support Agent Skills, nggak perlu setup ulang per tool.

Apa itu Firecrawl

Firecrawl adalah context API buat search, scrape, dan berinteraksi dengan web dalam skala besar. Lewat CLI-nya, agent kamu punya command-command siap pakai:

  • firecrawl scrape <url> — ambil satu halaman jadi markdown bersih, termasuk halaman yang render-nya butuh JavaScript.
  • firecrawl search "<query>" --scrape — search sekaligus langsung scrape hasil teratasnya dalam satu langkah.
  • firecrawl crawl <url> — nyusurin banyak halaman dalam satu domain/section (misalnya seluruh dokumentasi API).
  • firecrawl map <url> — nemuin semua URL di satu domain tanpa nge-scrape isinya, cocok buat riset awal.
  • firecrawl browser — buka sesi cloud browser buat interaksi kayak klik, isi form, sampai halaman yang butuh login.

Skill-nya sendiri yang ngajarin agent kapan harus pakai command yang mana, jadi kamu tinggal minta dalam bahasa natural ("cari dan rangkum dokumentasi terbaru library X"), agent yang milih command CLI yang paling pas.

Kapan dipakai

  • Riset library/framework yang dokumentasinya belum ke-index di tempat lain.
  • Ambil data kompetitor atau riset market.
  • Debugging error yang solusinya cuma ada di forum/GitHub issue terbaru.

Cara pasang singkat

npx -y firecrawl-cli@latest init --all --browser
Enter fullscreen mode Exit fullscreen mode

Command ini otomatis install CLI secara global, minta kamu login/masukin API key (FIRECRAWL_API_KEY), lalu pasang skill-nya ke semua coding agent yang kedeteksi di komputer kamu (Claude Code, Cursor, Windsurf, dst) sekaligus. Kalau cuma mau pasang ke satu agent tertentu, tinggal tambahin --agent <nama_agent>. Restart agent-nya, dan Firecrawl langsung siap dipanggil lewat skill.


2. codebase-memory-mcp — Biar Agent Ngerti Struktur Codebase Kamu, Bukan Cuma Nebak dari Grep

Codebase UI graph

Masalah yang dipecahkan

Ini yang paling sering bikin boros token dan waktu: agent harus Grep/Read file satu-satu berkali-kali cuma buat nyari siapa yang manggil fungsi X, atau gimana arsitektur project kamu secara keseluruhan.

Apa itu codebase-memory-mcp

Ini adalah MCP server code intelligence yang meng-index seluruh codebase kamu jadi knowledge graph yang persisten — mencatat function, class, call chain, route HTTP, sampai koneksi antar service. Dia jalan sebagai single binary (nggak butuh Docker atau dependency tambahan), dan mendukung 158 bahasa pemrograman termasuk TypeScript, Python, Go, PHP, dan lain-lain yang biasa dipakai di stack Hono.js/PostgreSQL/Python kamu.

Fitur-fitur yang paling kepake:

  • Query struktural instan — tanya "siapa yang manggil ProcessOrder?" langsung dijawab lewat graph traversal, bukan grep manual ke seluruh repo.
  • Architecture overview dalam satu kali panggilan: bahasa yang dipakai, package, entry point, route, sampai "hotspot" kode yang paling sering diubah.
  • Deteksi dead code dan impact analysis dari git diff, jadi sebelum merge kamu udah tau perubahan itu nyenggol fungsi apa aja.
  • Query ala Cypher (graph query language) buat kebutuhan yang lebih spesifik.
  • Diklaim bisa menghemat token secara signifikan dibanding eksplorasi file manual satu-satu, karena satu query graph bisa gantiin puluhan siklus grep/read.
  • Mendukung banyak agent sekaligus (Claude Code, Cursor, OpenCode, Gemini CLI, dan lainnya) lewat satu perintah install yang otomatis konfigurasi semuanya.

Kapan dipakai

  • Onboarding agent ke codebase lama/besar yang belum pernah dia sentuh.
  • Refactoring lintas file/service, terutama kalau kamu punya beberapa microservice yang saling terhubung.
  • Butuh dokumentasi arsitektur otomatis tanpa harus nulis manual.

Cara pasang singkat

curl -fsSL https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.sh | bash
Enter fullscreen mode Exit fullscreen mode

Restart agent, terus tinggal bilang "index project ini" dan beres.


3. Context7 — Stop Agent Kamu Ngarang API yang Nggak Ada

Context7 Home page

Masalah yang dipecahkan

Ini yang bikin sakit hati: kamu minta bikin middleware pakai versi terbaru Next.js atau Hono.js, terus agent kasih syntax dari versi lama karena training data-nya emang nggak sampai situ, atau lebih parah, dia manggil function yang sebenarnya udah nggak ada alias hallucination API.

Apa itu Context7

Context7 (dibuat oleh Upstash) adalah MCP server yang narik dokumentasi dan contoh kode yang paling update dan spesifik-versi langsung dari sumbernya, lalu disuntikkan ke context LLM kamu. Cara kerjanya dua tahap:

  1. resolve-library-id — nemuin ID library yang tepat dari nama yang kamu sebut (misalnya "Hono.js" atau "Pydantic v2").
  2. get-library-docs — narik dokumentasi dan snippet kode terbaru dari library dengan ID tersebut.

Cukup tambahin kalimat "use context7" di prompt kamu, dan agent bakal otomatis narik dokumentasi live sebelum ngasih jawaban — bukan modal ingatan lama.

Yang bikin ini worth it:

  • Gratis dipakai dengan rate limit dasar; API key gratis dari dashboard-nya kalau butuh limit lebih tinggi.
  • Kompatibel dengan banyak client sekaligus: Claude Code, Cursor, Codex, OpenCode, VS Code, dan lainnya.
  • Bisa spesifik ke versi tertentu, misalnya nanya soal "Next.js 14 middleware" dan Context7 otomatis matching dokumentasi versi itu.
  • Kalau kamu udah tau library ID-nya, kamu bisa langsung skip proses pencarian dan minta dokumentasi spesifik, misalnya /hono/hono.

Kapan dipakai

  • Kerja dengan library/framework yang update-nya cepat (Next.js, Hono.js, Prisma, library AI seperti Cerebras SDK yang lagi kamu eksplorasi).
  • Menghindari kode "generate lalu error karena API udah deprecated".
  • Setup project baru yang butuh contoh kode akurat dari awal.

Cara pasang singkat

{
  "mcpServers": {
    "context7": {
      "url": "https://mcp.context7.com/mcp",
      "headers": { "CONTEXT7_API_KEY": "API_KEY_KAMU" }
    }
  }
}
Enter fullscreen mode Exit fullscreen mode

Atau versi lokal lewat npx -y @upstash/context7-mcp.


4. RTK (Rust Token Killer) — Ngirit Token dari Command Sehari-hari

RTK CLI gain output

Masalah yang dipecahkan

Tiga tools di atas nambah kemampuan agent, tapi ada satu sumber pemborosan token yang sering luput: output command CLI yang mentah. git log, hasil test runner, ls -la, output docker ps, semuanya numpuk dan bikin context window kepenuhan sama noise yang sebenarnya nggak penting-penting amat buat agent.

Apa itu RTK

RTK adalah CLI proxy (single binary Rust, zero dependency) yang memfilter dan mengompres output command sebelum sampai ke context LLM. Dia nggak ganti fungsi command-nya, cuma motong noise-nya — komentar, whitespace, baris log yang berulang, hasil test yang sukses (tinggal nunjukin yang gagal), dan seterusnya.

Beberapa contoh penghematannya:

  • git status, git log, git diff bisa dipotong sampai 75-80% dari ukuran token aslinya.
  • Hasil test runner (cargo test, pytest, npm test) dipangkas sampai 90% karena yang ditampilkan cuma test yang gagal, bukan seluruh baris "ok".
  • git add/commit/push yang tadinya berbaris-baris log jadi cuma satu baris ringkas kayak ok main.

RTK kerja lewat hook yang otomatis nyegat command Bash sebelum dieksekusi dan mengubahnya ke versi RTK — jadi begitu udah di-setup, kamu (atau agent kamu) nggak perlu ngetik rtk secara manual tiap kali. Dia mendukung 14 AI coding tools termasuk Claude Code, Cursor, Gemini CLI, Windsurf, dan OpenCode.

Catatan penting: hook RTK cuma nyegat pemanggilan lewat Bash tool. Tools bawaan seperti Read, Grep, Glob di Claude Code nggak lewat situ, jadi kalau mau hasil yang sama-sama ringkas, pakai command shell biasa (cat, rg, find) atau panggil rtk read / rtk grep secara eksplisit.

Kapan dipakai

  • Sesi coding panjang di Claude Code/Cursor yang sering jalanin test, git command, atau lint berkali-kali.
  • Project dengan CI/CD lokal yang outputnya berat (relevan buat workflow PM2/GitHub Actions kamu).
  • Kamu mau tau seberapa banyak token yang udah kehemat, RTK ada command rtk gain buat lihat statistiknya.

Cara pasang singkat

curl -fsSL https://raw.githubusercontent.com/rtk-ai/rtk/refs/heads/master/install.sh | sh
rtk init -g
Enter fullscreen mode Exit fullscreen mode

Restart Claude Code/Cursor kamu, dan command sehari-hari bakal otomatis lewat RTK.


Bonus: Lunos — Kalau Produk AI Kamu Sendiri Juga Manggil Banyak Model

Lunos Dashboard

4 tools di atas fokus ningkatin performa agent yang bantu kamu ngoding. Tapi kalau produk yang lagi kamu bangun juga manggil banyak model AI di belakang layar, misalnya arsitektur dual-model kayak Claude + GPT yang dipakai di GoalCast AI, kamu bakal ketemu masalah yang beda: tiap provider punya SDK, format request/response, dan API key sendiri-sendiri, belum lagi kalau satu provider tiba-tiba down.

Di bagian ini gue mau selipin Lunos — disclosure di depan: ini platform yang gue bangun sendiri di bawah PT Maximus Solusi Digital, jadi anggap aja bonus/plug, bukan review pihak ketiga.

Apa itu Lunos

Lunos adalah unified AI API gateway — satu endpoint yang OpenAI-compatible buat akses 100+ model dari OpenAI, Anthropic, Google, Meta, Mistral, DeepSeek, xAI, dan provider lainnya. Yang relevan buat kamu yang lagi develop produk AI (bukan cuma pakai coding agent):

  • Format request/response seragam — pindah dari gpt-4o ke Claude atau Gemini tinggal ganti satu parameter model, nggak perlu install SDK atau nulis wrapper baru per provider.
  • Automatic failover — kalau satu provider lagi down, otomatis dialihkan ke model setara, jadi produk kamu nggak ikut down.
  • Smart routing buat cost optimization, milih rasio harga-performa terbaik sesuai task.
  • Pay-as-you-go tanpa subscription, bayar sesuai token yang beneran kepake lintas semua model.
  • Satu dashboard buat manage API key dan lihat analytics usage token lintas provider, jadi nggak perlu buka-buka dashboard beda-beda tiap provider.

Kapan dipakai

  • Produk AI kamu manggil lebih dari satu provider LLM (kayak arsitektur dual-model) dan capek ngurus banyak integrasi.
  • Butuh failover otomatis biar produksi tetap jalan walau satu provider bermasalah.
  • Mau eksperimen ganti-ganti model buat cari rasio biaya/performa yang paling pas, tanpa nulis ulang kode tiap kali ganti.

Ini bukan pengganti 4 tools sebelumnya, main-nya di layer yang beda. RTK ngirit token di sisi CLI/coding agent, sementara Lunos ngirit effort integrasi dan biaya di sisi produk AI kamu sendiri yang manggil model secara programatik.


Kombinasi 4 Tools Ini Kalau Dipakai Bareng

Kalau digabung, alurnya kira-kira jadi kayak gini pas kamu kerja di Claude Code atau Cursor:

  1. codebase-memory-mcp kasih agent "peta" struktur project kamu dari awal, jadi dia nggak buta arah.
  2. Context7 mastiin kode yang di-generate pakai API/library versi yang bener, bukan versi lama.
  3. Firecrawl (lewat skill-nya) dipanggil pas butuh informasi dari luar codebase, dokumentasi yang belum ke-index, atau data kompetitor tanpa nambah beban token di awal sesi kayak MCP.
  4. RTK jalan di background, motongin semua noise dari command CLI biar context window nggak kepenuhan sama hal-hal yang nggak penting.

Hasil akhirnya: agent kamu lebih ngerti konteks (baik internal maupun eksternal), lebih akurat karena nggak modal ingatan lama, dan lebih hemat token/biaya per sesi, yang ujung-ujungnya bikin sesi kerja kamu bisa lebih panjang dan lebih produktif sebelum context window kepotong.


Penutup

Nggak ada satu pun dari 4 tools ini yang saling menggantikan, masing-masing nutupin celah yang beda. Kalau kamu baru mau coba, urutan yang paling masuk akal buat mulai adalah codebase-memory-mcp dulu (biar agent langsung "kenal" project kamu), baru nambah Context7 dan RTK, terus Firecrawl kalau workflow kamu emang sering butuh riset atau data dari luar.

Coba pasang satu-satu, ukur sendiri bedanya dari sisi kecepatan kerja dan biaya token, biasanya kerasa banget begitu udah dipakai di project yang lumayan besar.

Top comments (0)