1. Apa Itu Language Agents?
Language Agents adalah bidang riset baru yang ngembangin LLM-based agents, alias model AI yang bisa ngelakuin lebih dari sekadar jawab pertanyaan. Bayangin LLM kayak GPT-4 atau DeepSeek yang dikasih kemampuan buat:
- Bikin rencana dan "berpikir" (
reasoning). - Ambil tindakan berdasarkan rencana dan lingkungan sekitar.
- Pake
tools(alat) buat bantu kerja mereka.
Ini kayak ngubah LLM dari chatbot biasa jadi asisten cerdas yang bisa ngatur strategi dan eksekusi tugas. Area ini masih "budding" (baru berkembang), jadi banyak inovasi seru yang lagi diteliti!
Analogi sederhana:
- Tanpa
Language Agents,LLMcuma bisa jawab berdasarkan pelatihan. - Dengan
Language Agents,LLMjadi agen yang bisa nyari solusi, pake kalkulator, atau ngakses data eksternal.
2. Kemampuan Utama Language Agents
Berdasarkan gambar, ada tiga kemampuan utama Language Agents:
-
Create plans and "reason":- Agen ini bisa bikin rencana dan "berpikir" langkah demi langkah. Misalnya, kalau ditanya "Gimana cara bikin aplikasi AI sederhana?", agen bakal buat outline: 1) Pilih model, 2) Siapin data, 3) Coding, dll.
-
Take actions in response to plans and the environment:- Setelah bikin rencana, agen bisa eksekusi tindakan berdasarkan situasi. Contoh: Kalau rencananya pake
Python, agen bisa nulis kode atau panggil library yang dibutuhin.
- Setelah bikin rencana, agen bisa eksekusi tindakan berdasarkan situasi. Contoh: Kalau rencananya pake
-
Are capable of using tools:- Agen bisa pake
toolseksternal, kayak kalkulator, API, atau database, buat bantu jawab atau selesain tugas. Ini bikin mereka lebih fleksibel daripadaLLMbiasa.
- Agen bisa pake
3. Metode Terkenal di Language Agents
Gambar juga ngasih contoh beberapa karya penting di bidang ini. Aku jelasin satu-satu:
a. ReAct [Yao et al., 2022]
-
Apa itu?:
ReActadalah framework iteratif di manaLLMngeluarinthoughts(pikiran), lalu ambilactions(tindakan), dan ngamatinresults(hasil). -
Cara kerja:
-
LLMmikir: "Aku perlu data buat jawab ini." - Ambil tindakan: Nyari data di
corpusatau panggiltool. - Ngamatin hasil: Periksa apakah data cukup, lalu lanjut.
-
-
Contoh:
- Pertanyaan: "Berapa 5 + 7?"
-
Thought: "Aku perlu kalkulator." -
Action: Panggiltoolkalkulator. -
Result: "12".
-
Kerennya:
ReActbikinLLMlebih interaktif dan adaptif.
b. Toolformer [Schick et al., 2023]
-
Apa itu?: Teknik pre-training di mana
strings(teks biasa) diganti dengancallsketoolsyang ngasih hasil. -
Cara kerja:
- Selama pelatihan,
LLMdilatih buat ngerti kapan harus panggiltool(misalnya, API cuaca) daripada nulis teks manual. - Contoh: "Cuaca hari ini" diganti jadi panggil API cuaca, trus hasilnya (misalnya, "25°C") diproses lagi.
- Selama pelatihan,
-
Contoh:
- Input: "Cuaca di Jakarta?"
-
Toolformer: Panggil API cuaca → "25°C di Jakarta hari ini."
-
Kerennya: Bikin
LLMlebih praktis buat tugas real-time tanpa perlu data pelatihan baru.
c. Bootstrapped reasoning [Zelikman et al., 2022]
-
Apa itu?: Metode yang nyuruh
LLMngeluarinrationalization(penjelasan langkah) dari proses berpikir, lalu pake data itu buatfine-tuning. -
Cara kerja:
- Prompt
LLMbuat jelasin langkah-langkah (misalnya, "Aku tambah 5 + 7 jadi 12"). - Simpen penjelasan ini sebagai data
fine-tuning. - Latih ulang
LLMbiar lebih jago nalar.
- Prompt
-
Contoh:
- Pertanyaan: "Kenapa 5 + 7 = 12?"
-
LLM: "Aku tambah 5 + 7, step by step: 5 + 2 = 7, 7 + 3 = 10, 10 + 2 = 12." - Data ini dipake buat improve
reasoning.
-
Kerennya: Bikin
LLMlebih transparan dan terlatih buat nalar logis.
4. Kaitan dengan DeepSeek 1.5B
DeepSeek 1.5B yang kamu pake di lokal bisa nggak sih jadi Language Agent?
- Bisa, tapi ada batasannya. Karena cuma 1.5B
parameter,DeepSeekudah jago direasoning(matematika,coding), tapi buat jadi agen penuh (bikin rencana, paketools), perlu tambahan:- Integrasi
ReActbuat bikin dia mikir dan ambil tindakan. - Tambahin
toolssederhana (misalnya, kalkulator atau API lokal) pake framework kayakLangChain. - Optimasi hardware biar prosesnya nggak lelet (misalnya, pake GPU kalau ada).
- Integrasi
-
Tips: Coba tes
DeepSeekdengan prompt sederhana kayak "Bikin rencana buat ngerjain soal matematika" dan lihat apakah dia bisa ngeluarin langkah-langkah.
5. Catatan Belajar dan Langkah Selanjutnya
-
Progres gue: Gue sekarang ngerti
Language AgentsadalahLLMyang bisa bikin rencana, ambil tindakan, dan paketools. Metode kayakReAct,Toolformer, samaBootstrapped reasoningnunjukin cara bikinLLMlebih cerdas. -
Rencana berikutnya:
- Coba implementasi
ReActsederhana pakeDeepSeek 1.5Bdi lokal. Misalnya, bikin agen yang mikir dan panggil kalkulator. - Eksplor
LangChainatau library lain buat tambahintoolskeDeepSeek. - Tes
Bootstrapped reasoningdengan prompt langkah-langkah buat latihreasoninglebih baik. - Dalemin detail
ReActatau coba bikin agen yang interaktif pakePython.
- Coba implementasi
Motivasi: Language Agents bikin AI lebih hidup kayak karakter di game! Dengan DeepSeek, gue bisa eksperimen bikin agen sederhana di lokal. Ser
Top comments (0)