DEV Community

# llm

Posts

👋 Sign in for the ability to sort posts by relevant, latest, or top.
Harness Engineering: The Most Important Part of AI Agents

Harness Engineering: The Most Important Part of AI Agents

Comments
3 min read
Cara Menguji Aplikasi LLM: Panduan Lengkap Promptfoo (2026)

Cara Menguji Aplikasi LLM: Panduan Lengkap Promptfoo (2026)

1
Comments
10 min read
วิธีทดสอบแอปพลิเคชัน LLM: คู่มือ Promptfoo ฉบับสมบูรณ์ (2026)

วิธีทดสอบแอปพลิเคชัน LLM: คู่มือ Promptfoo ฉบับสมบูรณ์ (2026)

Comments
5 min read
LLMアプリケーション テスト完全ガイド:Promptfoo徹底解説(2026年)

LLMアプリケーション テスト完全ガイド:Promptfoo徹底解説(2026年)

Comments
4 min read
The 15x Token Tax on Multi-Agent Coordination

The 15x Token Tax on Multi-Agent Coordination

1
Comments
2 min read
How I Built a Magical Comic Book Generator with GenAI — NVIDIA Hackathon Winner 🏆

How I Built a Magical Comic Book Generator with GenAI — NVIDIA Hackathon Winner 🏆

Comments
2 min read
WeightRoom — an LLM resource calculator

WeightRoom — an LLM resource calculator

1
Comments 1
3 min read
Engineering a LangGraph UI Pipeline

Engineering a LangGraph UI Pipeline

Comments
2 min read
Escribí un intérprete de Python en Python. Lo que aprendí no tiene nada que ver con Python

Escribí un intérprete de Python en Python. Lo que aprendí no tiene nada que ver con Python

Comments
8 min read
Agentes IA que pasan tus tests. Ese es el problema.

Agentes IA que pasan tus tests. Ese es el problema.

Comments
9 min read
Defluffer promete -45% en tokens. Yo medí el costo semántico del ahorro y es incómodo

Defluffer promete -45% en tokens. Yo medí el costo semántico del ahorro y es incómodo

Comments
9 min read
The LLM Hype Train: A Pamphlet[?] You Should Read With Your Manager

The LLM Hype Train: A Pamphlet[?] You Should Read With Your Manager

Comments
9 min read
EVAL #006: LLM Evaluation Tools — RAGAS vs DeepEval vs Braintrust vs LangSmith vs Arize Phoenix

EVAL #006: LLM Evaluation Tools — RAGAS vs DeepEval vs Braintrust vs LangSmith vs Arize Phoenix

Comments
10 min read
LLM Cost Management: From Monitoring Dashboards to Real-Time Enforcement

LLM Cost Management: From Monitoring Dashboards to Real-Time Enforcement

Comments
6 min read
Claude system prompt diff: lo que cambió entre Opus 4.6 y 4.7 (y yo lo estaba viendo sin saberlo)

Claude system prompt diff: lo que cambió entre Opus 4.6 y 4.7 (y yo lo estaba viendo sin saberlo)

Comments
8 min read
👋 Sign in for the ability to sort posts by relevant, latest, or top.