Cursor merilis Composer 2.5 pada 18 Mei 2026. Poin utamanya: model pengkodean agensial yang mendekati Opus 4.7 dan GPT-5.5 pada tolok ukur perangkat lunak nyata, dengan biaya di bawah satu dolar per tugas. Untuk developer, rasio harga-kualitas ini memengaruhi cara membagi pekerjaan antara coding manual, agen, dan verifikasi.
Panduan ini fokus pada implementasi: apa itu Composer 2.5, cara mengaksesnya di Cursor, cara memilih variannya, dan cara memakainya untuk pekerjaan produksi—terutama ketika tugas Anda menyentuh API dan perlu diverifikasi dengan Apidog.
Apa itu Cursor Composer 2.5?
Composer 2.5 adalah model pengkodean agensial milik Cursor. Model ini dirancang untuk:
- membaca konteks proyek,
- merencanakan perubahan,
- mengedit banyak file,
- menjalankan perintah terminal,
- memeriksa hasilnya sendiri,
- dan mengulang sampai kondisi selesai terpenuhi.
Ini adalah penerus Composer 2. Perbedaannya bukan hanya lebih cepat, tetapi lebih stabil untuk tugas panjang yang membutuhkan beberapa langkah.
Fakta teknis yang relevan:
- Dibangun di atas checkpoint sumber terbuka Moonshot Kimi K2.5, dengan basis sekitar satu triliun parameter.
- Cursor menempatkan sekitar 85% anggaran komputasi pelatihan ke post-training dan reinforcement learning.
- Dilatih pada 25 kali lebih banyak tugas sintetik dibanding Composer 2, termasuk skenario saat fitur dihapus dan model harus membangunnya ulang sampai pengujian lulus.
Dampaknya dalam penggunaan harian: Composer 2.5 lebih cocok untuk tugas multi-file seperti refactor, penambahan fitur, migrasi API client, atau memperbaiki bug yang membutuhkan pemahaman lintas modul.
Jika Anda ingin konteks tentang generasi sebelumnya, baca panduan Composer 2.
Apa yang berubah di bawah kap mesin?
Ada tiga perubahan pelatihan yang menjelaskan peningkatan Composer 2.5.
RL terarah dengan umpan balik tekstual
Alih-alih hanya memberi reward di akhir tugas, Cursor memberi instruksi korektif singkat ke konteks lokal model. Ini membantu model belajar kapan harus berhenti, kapan harus memperbaiki, dan kapan tidak perlu memanggil alat yang tidak tersedia.Data sintetik dalam skala besar
Tugas sintetik meningkat 25 kali lipat. Banyak tugas divalidasi lewat pengujian, bukan sekadar evaluasi subjektif.Pengoptimal Muon yang di-shard dengan HSDP *dual-mesh*
Ini detail infrastruktur pelatihan, tetapi penting karena memungkinkan iterasi pelatihan lebih cepat pada model besar. Lebih banyak iterasi berarti kualitas agen bisa ditingkatkan lebih agresif.
Anda tidak perlu mengingat detail ini saat memakai Cursor. Yang penting: Composer 2.5 lebih kuat untuk tugas panjang yang punya kondisi selesai jelas.
Tolok ukur Composer 2.5
Cursor membandingkan Composer 2.5 dengan Opus 4.7 dan GPT-5.5 pada tiga tolok ukur.
| Tolok Ukur | Composer 2.5 | Opus 4.7 | GPT-5.5 |
|---|---|---|---|
| SWE-bench Multilingual | 79.8% | 80.5% | 77.8% |
| Terminal-Bench 2.0 | 69.3% | 69.4% | 82.7% |
| CursorBench v3.1 | 63.2% | 64.8% (maks) / 61.6% (default) | 59.2% (default) |
Cara membacanya:
- Pada SWE-bench Multilingual, Composer 2.5 mencapai 79.8%, dekat dengan Opus 4.7 dan di atas GPT-5.5.
- Pada CursorBench v3.1, Composer 2.5 mengungguli pengaturan default Opus 4.7.
- Pada Terminal-Bench 2.0, GPT-5.5 unggul jauh dengan 82.7%.
Artinya, Composer 2.5 sangat menarik untuk tugas coding umum di editor. Namun jika pekerjaan Anda dominan berupa rangkaian terminal panjang dan kompleks, hasil Terminal-Bench perlu dipertimbangkan.
Angka paling praktis adalah biaya per tugas. Cursor melaporkan performa sekitar 63% pada CursorBench dengan biaya rata-rata di bawah $1 per tugas. Liputan dari The Decoder juga menyimpulkan bahwa Composer 2.5 mendekati kualitas model teratas dengan biaya jauh lebih rendah.
Berapa biaya Composer 2.5?
Cursor menyediakan dua varian.
| Varian | Input | Output | Kapan digunakan |
|---|---|---|---|
| Standar | $0.50 / Juta token | $2.50 / Juta token | Tugas agen reguler, pekerjaan batch, dan penggunaan yang sensitif biaya |
| Cepat | $3.00 / Juta token | $15.00 / Juta token | Iterasi langsung ketika latensi lebih penting daripada biaya |
Varian cepat memiliki kualitas model yang sama, tetapi latensinya lebih rendah. Dalam produk, varian cepat biasanya menjadi default.
Model penagihan tergantung paket:
- Paket individu seperti Pro menyertakan kumpulan penggunaan Composer.
- Paket tim dan perusahaan dikenakan biaya langsung berdasarkan tarif API.
- Promo peluncuran: Cursor menggandakan penggunaan Composer 2.5 selama minggu pertama setelah rilis.
Untuk rincian harga, lihat panduan harga Cursor Composer. Jika ingin mencoba tanpa langsung membayar banyak, baca juga panduan Composer gratis.
Cara mengakses Cursor Composer 2.5
Ikuti langkah berikut.
-
Perbarui Cursor
Buka Cursor, cek pembaruan, lalu restart jika pembaruan terinstal.- macOS: menu Cursor
- Windows/Linux: menu Help
Masuk dengan akun yang memiliki akses Composer
Paket Pro dan Business menyertakan penggunaan Composer. Akun gratis dapat mencoba lewat kuota yang tersedia, tetapi penggunaan berat membutuhkan paket berbayar.Buka pemilih model
Mulai sesi chat atau agent, lalu buka dropdown model.Pilih
composer-2.5
Biasanya varian cepat akan aktif sebagai default.Gunakan mode Agent
Composer 2.5 paling berguna dalam mode Agent karena dapat mengedit file, menjalankan terminal, dan memakai tool yang tersedia.
Contoh tugas yang cocok:
Tambahkan pagination ke endpoint daftar pesanan.
Kondisi selesai:
- API menerima query param page dan limit.
- Default page = 1 dan limit = 20.
- Response menyertakan data, page, limit, total.
- Semua test existing tetap lulus.
- Tambahkan test untuk input limit tidak valid.
Dokumentasi resmi tersedia di dokumen model Composer 2.5. Jika Anda belum terbiasa dengan permukaan agent di Cursor, baca gambaran umum Cursor 2.0.
Cara menggunakan Composer 2.5 secara efektif
Composer 2.5 bekerja lebih baik jika Anda memberi konteks dan kriteria selesai yang eksplisit.
1. Beri tugas nyata, bukan instruksi mikro
Kurang efektif:
Buka file orderController lalu tambahkan parameter page.
Lebih efektif:
Implementasikan pagination untuk daftar order.
Ubah controller, service, DTO, dan test yang diperlukan.
Jalankan test terkait setelah selesai.
Jangan ubah kontrak response selain menambahkan metadata pagination.
Model agensial lebih berguna saat diberi ruang untuk merencanakan dan mengedit beberapa file.
2. Tulis kondisi keberhasilan
Tambahkan definisi selesai ke prompt.
Kondisi selesai:
- npm test lulus.
- Endpoint GET /orders mendukung page dan limit.
- limit maksimal 100.
- Input page < 1 mengembalikan 422.
- Dokumentasi API diperbarui.
Composer 2.5 dilatih untuk bekerja dengan verifikasi. Jika targetnya eksplisit, peluang koreksi mandiri lebih baik.
3. Pilih varian sesuai jenis pekerjaan
Gunakan aturan sederhana:
- Standar: refactor besar, batch task, migrasi file, pekerjaan yang tidak perlu respons instan.
- Cepat: debugging interaktif, pair programming, review perubahan kecil, atau saat Anda menunggu langsung di editor.
Kualitasnya sama. Perbedaannya ada pada latensi dan biaya.
4. Jangan biarkan model menebak kontrak API
Untuk tugas API, risiko terbesar bukan sintaks. Risiko terbesar adalah model membuat asumsi tentang:
- nama endpoint,
- field request,
- bentuk response,
- status code,
- autentikasi,
- header,
- dan error schema.
Karena itu, berikan spesifikasi API yang nyata.
Workflow Composer 2.5 + Apidog untuk tugas API
Sebagian besar pekerjaan aplikasi menyentuh API. Workflow yang lebih aman adalah:
- Ambil spesifikasi API aktual.
- Berikan spesifikasi itu ke Composer 2.5.
- Minta model membuat kode berdasarkan kontrak tersebut.
- Jalankan request nyata di Apidog.
- Simpan request yang valid sebagai test atau mock.
- Baru merge setelah test dan verifikasi lulus.
Langkah 1: Hubungkan spesifikasi API ke Cursor
Gunakan Server Apidog MCP untuk menghubungkan spesifikasi API Apidog langsung ke Cursor.
Dengan cara ini, Composer 2.5 tidak perlu menebak skema. Ia bisa menghasilkan:
- API client,
- tipe request/response,
- test,
- dan contoh pemanggilan berdasarkan kontrak aktual.
Jika Anda memakai beberapa agent atau tool lain, lihat juga daftar server MCP terbaik untuk Cursor.
Langkah 2: Pakai prompt yang membatasi asumsi
Contoh prompt:
Gunakan spesifikasi API yang tersedia melalui MCP.
Buat client TypeScript untuk endpoint pembayaran.
Jangan membuat endpoint atau field yang tidak ada di spesifikasi.
Jika ada field yang ambigu, tanyakan dulu sebelum implementasi.
Kondisi selesai:
- Tipe request dan response sesuai schema.
- Error response ditangani.
- Tambahkan unit test untuk success dan validation error.
Langkah 3: Verifikasi di Apidog
Setelah Composer 2.5 membuat kode:
- Buka endpoint terkait di Apidog.
- Kirim request nyata.
- Periksa status code.
- Validasi bentuk response.
- Simpan request yang benar sebagai test otomatis atau mock server.
- Perbarui kode jika hasil runtime berbeda dari asumsi model.
Prinsipnya sederhana: Composer 2.5 membuat draf cepat, Apidog memverifikasi perilaku nyata.
Composer 2.5 vs kompetitor
Ringkasan praktis:
vs Opus 4.7
Composer 2.5 hampir setara pada SWE-bench Multilingual dan CursorBench, tetapi jauh lebih murah per tugas. Opus masih unggul pada pengaturan maksimum CursorBench.vs GPT-5.5
Composer 2.5 unggul pada SWE-bench Multilingual dan CursorBench. GPT-5.5 unggul jelas pada Terminal-Bench 2.0.vs Claude Code
Bentuk tool berbeda. Composer 2.5 berjalan di editor Cursor, sedangkan Claude Code adalah agent terminal. Lihat perbandingan Claude Code vs Cursor.vs GitHub Copilot
Copilot kuat untuk pelengkapan inline. Composer 2.5 lebih cocok untuk tugas agen multi-file. Lihat panduan Cursor vs GitHub Copilot.
Cursor juga menyatakan sedang melatih model yang jauh lebih besar dengan xAI menggunakan sekitar sepuluh kali komputasi. Jadi Composer 2.5 kemungkinan adalah titik tengah pada kurva peningkatan, bukan batas akhir.
FAQ
Apakah Composer 2.5 gratis?
Tidak ada tingkatan yang sepenuhnya gratis. Namun paket individu menyertakan kumpulan penggunaan Composer, dan Cursor menggandakan penggunaan selama minggu peluncuran. Baca panduan Composer gratis untuk detail kuota.
Apakah Composer 2.5 lebih baik daripada Composer 2?
Ya. SWE-bench Multilingual naik dari 73.7% menjadi 79.8%. Composer 2.5 juga lebih stabil untuk tugas panjang. Panduan Composer 2 menjelaskan dasar yang ditingkatkan oleh versi 2.5.
Model apa yang menjadi dasar Composer 2.5?
Composer 2.5 dibangun di atas checkpoint Kimi K2.5 sumber terbuka dari Moonshot, lalu dilatih lanjut oleh Cursor dengan reinforcement learning dan tugas sintetik.
Varian mana yang harus dipilih: standar atau cepat?
Gunakan standar untuk pekerjaan batch yang sensitif biaya. Gunakan cepat untuk iterasi langsung saat latensi penting. Kecerdasannya sama; harga dan waktu tunggunya berbeda.
Apakah Composer 2.5 bisa bekerja dengan spesifikasi API dan MCP?
Ya. Composer 2.5 mendukung tool agent Cursor, termasuk MCP. Anda dapat menghubungkan spesifikasi API melalui server Apidog MCP agar kode yang dihasilkan mengikuti skema API aktual.
Intinya
Composer 2.5 membuat pekerjaan agen di Cursor lebih ekonomis untuk penggunaan harian. Anda mendapatkan performa mendekati model teratas pada tugas perangkat lunak nyata, dengan biaya rata-rata di bawah satu dolar per tugas.
Untuk mulai:
- Perbarui Cursor.
- Pilih
composer-2.5di pemilih model. - Gunakan mode Agent.
- Beri tugas multi-langkah dengan kondisi selesai.
- Jalankan test.
- Untuk pekerjaan API, verifikasi kontrak dan request dengan Apidog.
Jika workflow Anda banyak menyentuh API, hasil terbaik datang dari kombinasi: hasilkan kode berdasarkan spesifikasi nyata, lalu Unduh Apidog untuk mengirim request langsung, mengonfirmasi response, dan menyimpan panggilan yang valid sebagai test otomatis atau mock.


Top comments (0)