DEV Community

Cover image for /goal Command: Cara Menjalankan Kode Codex dan Claude Sebagai Agen Otonom 24/7
Walse
Walse

Posted on • Originally published at apidog.com

/goal Command: Cara Menjalankan Kode Codex dan Claude Sebagai Agen Otonom 24/7

Setiap laboratorium AI besar merilis primitif yang sama dalam enam minggu terakhir. Anthropic menambahkan /goal ke Claude Code. OpenAI merilisnya di Codex CLI dan aplikasi desktop Codex. Nous Research mengintegrasikannya ke Hermes. Penamaannya konsisten karena industri sedang menyepakati antarmuka bersama untuk satu hal: agen yang berjalan dalam loop tertutup sampai kondisi akhir yang terukur tercapai, tanpa meminta izin Anda di setiap langkah.

Coba Apidog hari ini

Jika Anda selama ini melakukan pola manual “setujui, kirim prompt, minta agen lanjut, ulangi”, /goal adalah perintah slash yang menghilangkan proses itu. Anda memberi target, agen bekerja sampai target tercapai, lalu kembali dengan hasil.

Panduan ini ditujukan untuk developer dan pembuat API. Kita akan membahas:

  • Apa yang sebenarnya dilakukan /goal
  • Cara mengaturnya di Codex dan Claude Code
  • Struktur prompt yang menghindari loop tanpa akhir
  • Cara memasangkannya dengan workflow API menggunakan Apidog

Jika ingin mengikuti contoh API di bagian akhir, Anda bisa mengunduh Apidog secara gratis.

Apa sebenarnya yang dilakukan /goal

Singkatnya: /goal membuat agen AI mengulang sebuah tugas sampai kondisi berhenti terpenuhi, tanpa Anda harus menyetujui setiap langkah.

Mekanismenya biasanya seperti ini:

  1. Model utama menjalankan langkah berikutnya.
  2. Model validator yang lebih kecil dan cepat mengecek hasilnya.
  3. Validator menjawab: “Apakah tujuan sudah tercapai?”
  4. Jika belum, agen lanjut.
  5. Jika sudah, loop berhenti dan agen melaporkan hasil.

Pola ini mirip dengan “Ralph loop” yang populer di awal 2026, tetapi sekarang tersedia sebagai perintah kelas satu di alat resmi.

Perbedaannya dengan penggunaan agen biasa:

  • Tanpa /goal: Anda menjadi loop-nya. Anda membaca output, memutuskan apakah benar, memberi instruksi lanjutan, menyetujui tool call, dan mengulang proses.
  • Dengan /goal: agen memiliki loop sendiri. Ia merencanakan, mengeksekusi, memvalidasi, lalu berhenti ketika selesai, mencapai batas, atau kehabisan anggaran.

Contoh:

/goal buat halaman landing
Enter fullscreen mode Exit fullscreen mode

Agen dapat melakukan riset, membuat struktur, menulis kode, memperbaiki styling, debugging, dan menampilkan pratinjau akhir dalam satu proses berkelanjutan.

Mengapa /goal tiba-tiba ada di mana-mana

Tugas agen dengan horizon panjang sering gagal karena dua hal:

  1. Drift

    Tanpa validator yang terus mengecek target awal, model dapat menyimpang dan tetap menghasilkan output yang terlihat meyakinkan.

  2. Terlalu banyak pengawasan manual

    Walaupun model mampu mengerjakan tugasnya, pengguna tetap harus mengawasi setiap iterasi. Ini mengurangi nilai utama dari agen.

Model validator kedua membantu mengatasi keduanya. Ia murah, fokus pada prompt yang sempit, dan memberi kondisi berhenti yang jelas untuk loop.

Itulah inti /goal: bukan sekadar prompt panjang, tetapi prompt dengan validasi berulang.

Mengatur /goal di Codex

Codex CLI memberi kontrol paling besar. Setup minimalnya:

  1. Aktifkan goals di aplikasi desktop Codex

Buka:

   Settings → Configuration
Enter fullscreen mode Exit fullscreen mode

Lalu atur:

   goals = true
Enter fullscreen mode Exit fullscreen mode

CLI akan mewarisi konfigurasi ini.

  1. Jalankan CLI dalam mode full-auto

Ini mengurangi prompt persetujuan manual:

   codex --approval-mode full-auto
Enter fullscreen mode Exit fullscreen mode
  1. Tetapkan tujuan
   /goal [tujuan Anda di sini]
Enter fullscreen mode Exit fullscreen mode

Codex akan mengonfirmasi bahwa tujuan sudah terdaftar, lalu mulai menjalankan loop.

Codex goal setup

Jika Anda non-teknis atau baru mulai, gunakan aplikasi desktop Codex terlebih dahulu. Fungsinya sama, tetapi Anda mendapatkan UI untuk menjeda, menghapus goal, dan memantau penggunaan token.

Mengatur /goal di Claude Code

Claude Code CLI bekerja hampir sama.

Jalankan CLI, lalu ketik:

/goal [deskripsi tugas Anda]
Enter fullscreen mode Exit fullscreen mode

Dokumen resminya tersedia di situs dokumentasi Claude Code.

Claude Code goal

Jika Anda mengalami error setup atau konfigurasi saat meluncurkan Claude Code, lihat panduan perbaikan konfigurasi enterprise custom3p yang tidak valid. Untuk workflow multi-agen bersama /goal, lihat ulasan tentang Ruflo, lapisan multi-agen di atas Claude Code.

Tip penting: di Claude Code, /goal menampilkan jumlah token langsung dan progress bar untuk tugas yang berjalan. Perhatikan jumlah token, bukan hanya output.

Jika token terus habis tetapi progres tidak jelas, kemungkinan validator tidak bisa mencapai konvergensi. Gunakan:

/pause
Enter fullscreen mode Exit fullscreen mode

atau:

/goal clear
Enter fullscreen mode Exit fullscreen mode

Struktur prompt /goal yang efektif

Sintaks /goal sederhana. Bagian sulitnya adalah menulis tujuan yang bisa diverifikasi.

Prompt /goal yang baik memiliki tiga komponen:

  1. Pekerjaan

    Apa yang harus diselesaikan.

  2. Kondisi akhir yang terukur

    Definisi “selesai” yang bisa dicek.

  3. Batasan

    Aturan yang harus dipatuhi selama proses.

Template dasar:

/goal [lakukan pekerjaan] sampai [kondisi akhir yang terukur] tanpa [batasan yang harus dipertahankan]
Enter fullscreen mode Exit fullscreen mode

Contoh untuk tugas coding:

/goal perbaiki setiap pengujian yang gagal hingga npm test keluar 0 tanpa mengubah file apa pun di luar direktori /auth
Enter fullscreen mode Exit fullscreen mode

Mengapa ini bekerja:

  • npm test keluar 0 adalah kondisi akhir yang dapat diverifikasi.
  • tanpa mengubah file apa pun di luar direktori /auth adalah batasan yang jelas.
  • Validator bisa menjalankan perintah dan mengecek file yang berubah.

Bandingkan dengan goal yang buruk:

/goal buat UI ini terasa modern
Enter fullscreen mode Exit fullscreen mode

Masalahnya: “modern” tidak mudah divalidasi.

Ubah menjadi lebih terukur:

/goal perbarui UI hingga skor aksesibilitas Lighthouse minimal 90 dan tidak ada layout shift besar
Enter fullscreen mode Exit fullscreen mode

Jika kondisi akhir tidak dapat diukur, gunakan prompt biasa atau pecah tugasnya menjadi goal yang lebih kecil.

Struktur lanjutan untuk tugas panjang

Untuk pekerjaan yang lebih besar, gunakan format empat blok:

/goal
Tujuan: [tujuan satu baris]

Kriteria keberhasilan:
  - [kriteria terukur 1]
  - [kriteria terukur 2]

Batasan:
  - [batas 1]
  - [batas 2]

Konteks:
  - [file, repo, API key, atau informasi yang harus diketahui agen]
Enter fullscreen mode Exit fullscreen mode

Contoh:

/goal
Tujuan: implementasikan endpoint POST /auth/login

Kriteria keberhasilan:
  - semua test auth berjalan sukses
  - endpoint mengembalikan 200 untuk kredensial valid
  - endpoint mengembalikan 401 untuk kredensial invalid
  - response body sesuai skema OpenAPI

Batasan:
  - jangan mengubah endpoint lain
  - jangan mengubah struktur database

Konteks:
  - kontrak API ada di openapi.yaml
  - test ada di tests/auth.test.ts
Enter fullscreen mode Exit fullscreen mode

Format ini memberi validator hal konkret untuk diperiksa di setiap iterasi. Tanpa kriteria keberhasilan, validator akan kembali ke pencocokan semantik yang kabur, dan di situlah drift sering terjadi.

Contoh /goal yang bisa ditiru

Riset

/goal kumpulkan setiap benchmark publik untuk Claude Opus 4.7 yang diterbitkan sejak April 2026, simpan sumber, dan hasilkan tabel markdown yang diurutkan berdasarkan tanggal hingga tabel mencakup setidaknya 10 benchmark berbeda
Enter fullscreen mode Exit fullscreen mode

Pemeliharaan repo

/goal temukan kode mati, dependensi tidak terpakai, dan file usang di repo ini, lalu usulkan deskripsi PR yang mencantumkan penghapusan yang aman hingga setiap item memiliki justifikasi
Enter fullscreen mode Exit fullscreen mode

Dokumentasi

/goal tulis ulang README.md agar kontributor baru dapat menginstal, menjalankan, menguji, dan memahami proyek hingga setiap dari empat langkah tersebut memiliki perintah yang berfungsi dan output yang diharapkan
Enter fullscreen mode Exit fullscreen mode

Fitur frontend

/goal tambahkan tombol tema gelap/terang, pertahankan pilihan di localStorage, perbarui gaya untuk kedua tema, dan verifikasi di browser hingga tombol berfungsi tanpa memuat ulang halaman dan bertahan setelah refresh
Enter fullscreen mode Exit fullscreen mode

Pola utamanya sama: setiap goal memiliki kondisi akhir yang bisa diverifikasi.

Memasangkan /goal dengan workflow pengembangan API

Banyak pembahasan tentang /goal fokus pada coding umum. Untuk backend dan platform engineer, use case yang lebih kuat adalah pengembangan API.

Endpoint API cocok untuk /goal karena definisi “selesai” biasanya jelas:

  • Request mengembalikan status yang benar.
  • Response body sesuai skema.
  • Error case terdokumentasi.
  • Test contract berhasil.

Workflow praktisnya:

  1. Rancang kontrak terlebih dahulu di Apidog

    Definisikan endpoint, request schema, response schema, dan contoh payload di Apidog. Ini menjadi sumber kebenaran.

  2. Ekspor spesifikasi

    Ekspor OpenAPI 3.x dari Apidog, lalu berikan file tersebut ke Codex atau Claude Code sebagai konteks.

  3. Jalankan /goal

    Contoh:

   /goal implementasikan endpoint POST /users hingga setiap kasus pengujian Apidog lolos tanpa mengubah endpoint lain
Enter fullscreen mode Exit fullscreen mode
  1. Biarkan validator menjalankan test runner Di setiap iterasi, validator menjalankan pengujian terhadap service yang sedang berjalan. Agen berhenti hanya ketika semua case hijau.

Ini lebih aman daripada membiarkan agen membuat test-nya sendiri. Kontrak sudah terkunci, sehingga agen tidak bisa “menyelesaikan” tugas dengan membuat test yang terlalu mudah.

Jika Anda belum menggunakan Apidog, platform ini menggabungkan desain, mocking, pengujian, dan dokumentasi API dalam satu alat. Ini penting untuk /goal, karena validator bekerja paling baik ketika cukup menjalankan satu perintah untuk mengetahui status.

Untuk setup contract-first, lihat panduan workflow API berbasis desain. Untuk struktur test case, lihat ikhtisar alat pengujian API untuk engineer QA.

Jika Anda bekerja dengan server MCP, pola yang sama berlaku. Lihat pengujian server MCP dengan Apidog untuk setup yang memungkinkan agen /goal berjalan terhadap server MCP lokal dengan lebih aman.

Tips praktis menjalankan /goal dalam produksi

Beberapa pola yang berguna setelah memakai /goal di pekerjaan nyata:

  • Satu goal pada satu waktu Codex dan Claude Code membatasi satu goal aktif. Gunakan ini sebelum menjalankan goal baru:
  /goal clear
Enter fullscreen mode Exit fullscreen mode
  • Pasangkan dengan /plan Workflow yang lebih stabil:
  /plan
Enter fullscreen mode Exit fullscreen mode

Tinjau rencananya, lalu jalankan /goal dengan rencana tersebut sebagai konteks. Ini mengurangi iterasi karena agen tidak perlu merancang ulang pendekatan di tengah loop.

  • Gunakan file progress Minta agen menjaga file seperti:
  progress.md
Enter fullscreen mode Exit fullscreen mode

Manfaatnya:

  • Anda punya audit trail.
  • Agen punya konteks persisten.
  • Debugging lebih mudah jika loop gagal.

    • Minta model menulis goal-nya sendiri Berikan ide kasar, lalu minta model mengubahnya menjadi prompt /goal dengan kriteria keberhasilan. Biasanya model bisa menulis goal yang lebih mudah divalidasi.
    • Debug validator, bukan hanya model utama Jika loop tidak selesai, masalahnya sering bukan “model kurang pintar”, tetapi kriteria suksesnya tidak terukur.
    • Gunakan /goal untuk pekerjaan berjangka panjang Untuk refactor satu baris atau perubahan kecil, prompt biasa lebih cepat. Loop otonom punya overhead.

Kapan /goal akan mengecewakan Anda

/goal bukan solusi untuk semua tugas. Batasan yang perlu diingat:

  • Biaya token

    Loop yang berjalan satu jam akan menghabiskan lebih banyak token daripada sesi manual. Tetapkan anggaran dan pantau pemakaian.

  • Tugas tanpa sinyal validasi

    Poles UX, selera desain, tone tulisan, atau “buat lebih bagus” sulit divalidasi. Agen bisa berhenti terlalu cepat atau membuat kondisi berhenti palsu.

  • Efek samping eksternal

    Goal yang mengirim email, memproses pembayaran, atau memanggil API produksi perlu batasan ketat. Jangan berharap agen menyimpulkan kehati-hatian sendiri. Jika Anda sedang membangun kontrol akses untuk agen AI yang memanggil API, lihat artikel tentang penggunaan dan API penagihan GitHub Copilot untuk tim.

  • Konteks kedaluwarsa

    Goal yang berjalan lama bisa menyimpang jika codebase berubah di tengah proses. Lebih baik pause dan reset daripada melanjutkan dengan konteks lama.

Dampaknya untuk cara Anda membangun dengan AI

/goal menggeser AI dari “autocomplete yang lebih pintar” menjadi “pekerja yang diberi arahan dan diperiksa hasilnya”.

Perubahan UI-nya kecil: satu slash command. Tetapi implikasinya besar:

  • Anda menulis kriteria keberhasilan.
  • Anda menetapkan batasan.
  • Anda menyediakan test dan kontrak.
  • Agen mengeksekusi sampai kondisi akhir terpenuhi.

Tim yang paling diuntungkan adalah tim yang sudah punya:

  • kontrak API yang jelas,
  • CI yang kuat,
  • test suite yang bisa dijalankan,
  • spesifikasi OpenAPI,
  • dokumentasi yang tidak ambigu.

Jika API Anda punya dokumen OpenAPI dan test yang baik, Anda bisa memberi agen /goal untuk mengimplementasikan endpoint. Jika API hanya ada di kepala seseorang, agen tidak punya sinyal validasi yang cukup.

Di sinilah platform API menjadi infrastruktur penting untuk workflow AI. Apidog dibangun di sekitar pengembangan API design-first. Itu membuatnya cocok untuk workflow /goal, karena agen dapat membaca spesifikasi dan memeriksa implementasinya terhadap test yang sudah Anda definisikan.

Jika ingin menyiapkan workflow contract-first seperti di atas, unduh Apidog.

FAQ

Apakah /goal berfungsi di aplikasi web Codex?

Ya. /goal berfungsi di Codex CLI, desktop Codex, aplikasi Codex, dan Claude Code CLI. Hermes juga mendukung perintah yang sama.

Apa bedanya /goal dengan prompt biasa?

Prompt biasa berjalan satu putaran lalu berhenti. /goal berjalan dalam loop tertutup dengan model validator yang memeriksa kondisi berhenti setelah setiap langkah.

Bisakah agen melanggar batasan yang saya tetapkan?

Validator menegakkan batasan di setiap iterasi, tetapi hasilnya tetap bergantung pada seberapa jelas batasan Anda. Contoh yang bisa ditegakkan:

tanpa memodifikasi file apa pun di luar /auth
Enter fullscreen mode Exit fullscreen mode

Contoh yang terlalu kabur:

tanpa merusak apa pun
Enter fullscreen mode Exit fullscreen mode

Apakah /goal lebih mahal daripada sesi Claude atau Codex biasa?

Ya. Validator biasanya memakai model yang lebih kecil dan murah, tetapi model utama tetap melakukan pekerjaan berulang. Tetapkan anggaran atau gunakan:

/pause
Enter fullscreen mode Exit fullscreen mode

Bagaimana jika saya ingin menguji output agen terhadap API nyata?

Gunakan alat seperti Apidog untuk mengunci kontrak API dan menjalankan test nyata terhadap implementasi. Validator agen dapat memanggil test runner tersebut sebagai kondisi akhir yang terukur. Jika Anda sedang memulai layanan berbasis Claude dengan anggaran terbatas, lihat panduan API Claude gratis.

Top comments (0)