AI 에이전트 디버거는 AI 에이전트를 개발하는 개발자를 위한 시각적 디버깅 도구입니다. 모델 입력/출력만 보는 방식이 아니라, 대화 라운드, 모델 호출, 도구 호출, 중간 단계, 최종 출력까지 에이전트 실행 전체를 추적합니다.
AI 에이전트를 만들면서 다음과 같은 문제를 겪었다면, AI 에이전트 디버거가 필요합니다.
- 왜 이 도구를 호출했는가?
- 왜 응답 시간이 오래 걸렸는가?
- 왜 토큰을 이렇게 많이 사용했는가?
- 왜 테스트에서는 성공했는데 프로덕션에서는 실패했는가?
AI 에이전트 디버깅이 어려운 이유
AI 에이전트는 일반적인 애플리케이션 코드보다 실행 흐름을 추적하기 어렵습니다. 주요 원인은 다음과 같습니다.
1. 비결정적 동작
LLM은 동일한 프롬프트에도 매번 다른 출력을 생성할 수 있습니다. 테스트에서는 올바른 도구를 호출했지만, 다른 실행에서는 다른 도구를 선택할 수 있습니다.
디버깅할 때는 단일 실행 결과만 보지 말고 여러 세션을 비교해야 합니다.
2. 긴 추론 체인
최신 에이전트는 단순히 답변만 생성하지 않습니다.
- 계획 수립
- 도구 선택
- 도구 호출
- 결과 해석
- 추가 호출
- 최종 응답 생성
이런 체인 중 3단계에서 발생한 문제가 10단계의 실패로 나타날 수 있습니다. 따라서 전체 실행 추적이 필요합니다.
3. 블랙박스 문제
기존 코드처럼 모델 내부에 중단점을 걸고 상태를 검사할 수 없습니다. 대신 다음 정보를 확인해야 합니다.
- 모델에 전달된 프롬프트
- 모델 응답
- 도구 호출 여부
- 도구 입력/출력
- 오류 메시지
- 토큰 사용량
4. 도구 사용의 복잡성
에이전트는 외부 API, MCP 도구, 파일 시스템, 셸 명령 등 여러 도구와 상호 작용합니다.
문제가 발생했을 때 확인해야 할 질문은 다음과 같습니다.
- 에이전트가 올바른 도구를 선택했는가?
- 매개변수 형식이 올바른가?
- 도구 자체가 실패했는가?
- 인증이 실패했는가?
- MCP 서버 연결이 끊겼는가?
5. 오류 원인 분석
에이전트 실패 원인은 하나가 아닐 수 있습니다.
- 프롬프트 문제
- 모델 선택 문제
- 도구 스키마 문제
- MCP 서버 문제
- 인증 문제
- 오케스트레이션 로직 문제
AI 에이전트 디버거의 핵심 역할은 이 실행 과정을 눈으로 확인할 수 있게 만드는 것입니다.
AI 에이전트 디버거가 보여주는 것
AI 에이전트 디버거는 에이전트 실행을 구조화된 추적으로 보여줍니다.
완전한 실행 추적
일반적으로 다음 항목을 확인할 수 있습니다.
- 사용자 프롬프트 및 시스템 프롬프트: 모델로 전송된 실제 컨텍스트
- 모델 호출: LLM 요청 및 응답
- 사고 과정: 모델이 확장된 사고를 지원하는 경우 추론 체인
- 도구 호출: MCP 도구 또는 내장 함수 호출
- 도구 입력 및 출력: 전달된 매개변수와 반환 결과
- 오류 및 예외: 실패 위치와 원인
- 최종 출력: 에이전트가 사용자에게 반환한 결과
세션 메트릭
디버깅할 때는 결과뿐 아니라 비용과 성능도 봐야 합니다.
- 응답 시간: 각 단계에 걸린 시간
- 토큰 소비: 입력 토큰, 출력 토큰, 캐시된 토큰
- 예상 비용: 세션별 비용
- 대화 라운드: 주고받은 대화 수
- 실행 단계: 수행된 작업 수
모델 비교
동일한 작업을 여러 모델로 실행하고 비교할 수 있습니다.
확인할 항목은 다음과 같습니다.
- 어떤 모델이 더 적은 단계로 작업을 완료했는가?
- 어떤 모델이 도구를 더 정확하게 선택했는가?
- 어떤 모델의 지연 시간이 더 낮은가?
- 어떤 모델의 토큰 사용량과 비용이 더 낮은가?
AI 에이전트 디버거의 주요 사용 사례
1. 도구 호출 체인 디버깅
에이전트가 예상과 다르게 도구를 호출할 때는 다음 순서로 확인합니다.
- 어떤 도구가 호출되었는지 확인
- 호출 순서 확인
- 각 도구에 전달된 매개변수 확인
- 각 도구의 반환값 확인
- 체인이 중단된 위치 확인
이는 MCP (Model Context Protocol) 서버를 사용하는 에이전트에서 특히 중요합니다.
2. 모델 성능 비교
모든 모델이 모든 작업에 적합하지는 않습니다. 다음 방식으로 비교합니다.
- 동일한 사용자 프롬프트를 준비합니다.
- 동일한 도구 구성을 사용합니다.
- 모델 A로 실행합니다.
- 모델 B로 실행합니다.
- 실행 단계, 토큰, 비용, 응답 품질을 비교합니다.
3. 토큰 소비 최적화
사용량 기반 과금에서는 토큰 가시성이 중요합니다.
디버거에서 확인할 항목은 다음과 같습니다.
- 불필요하게 긴 시스템 프롬프트
- 매번 전송되는 과도한 컨텍스트
- 장황한 모델 출력
- 반복되는 도구 호출
- 동일한 작업에서 모델별 토큰 차이
4. MCP 서버 통합 검증
MCP를 사용하면 에이전트가 외부 도구와 데이터 소스에 연결할 수 있습니다. 디버깅 시 다음을 확인합니다.
- MCP 서버가 연결되었는가?
- 도구가 올바르게 노출되었는가?
- 인증이 성공했는가?
- 도구 응답이 올바르게 파싱되는가?
- 에이전트가 해당 도구를 실제로 호출하는가?
5. 시스템 프롬프트 반복 개선
작은 프롬프트 변경도 에이전트 동작을 크게 바꿀 수 있습니다.
추천 워크플로는 다음과 같습니다.
- 기준 시스템 프롬프트를 작성합니다.
- 동일한 사용자 프롬프트로 실행합니다.
- 도구 호출과 응답을 기록합니다.
- 시스템 프롬프트를 수정합니다.
- 다시 실행하고 이전 세션과 비교합니다.
단계별 가이드: Apidog AI 에이전트 디버거 사용하기
Apidog는 내장 AI 에이전트 디버거를 제공합니다. 아래 순서로 에이전트 실행을 디버깅할 수 있습니다.
1단계: 새 에이전트 디버그 세션 생성
- Apidog 데스크톱 클라이언트를 엽니다.
- 상단 탭 바에서 AI 에이전트 디버거로 이동합니다.
- 상단 영역에서 모델을 구성합니다.
구성 항목은 다음과 같습니다.
- 왼쪽: 모델 제공업체 선택 예: OpenAI, Anthropic
-
중앙: 모델 선택 예:
gpt-4o,claude-sonnet-4-6 - 기본 URL: 선택한 제공업체에 따라 자동 매칭
2단계: 프롬프트 구성
프롬프트 탭에서 에이전트 입력을 설정합니다.
- 전송 후 지우기: 전송 후 입력 상자를 자동으로 비움
- 사용자 프롬프트: 이번 세션에서 테스트할 입력
- 시스템 프롬프트: 에이전트의 역할, 목표, 제약 조건, 도구 사용 규칙
예시 사용자 프롬프트:
Why is my POST /users endpoint returning 500 when I send a valid JSON payload?
예시 시스템 프롬프트:
You are a code assistant that helps developers debug API issues.
Use the available tools to fetch API responses, search documentation,
and provide actionable solutions.
프롬프트를 작성할 때는 도구 사용 조건을 명확히 적는 것이 좋습니다.
예시:
If the issue requires checking an API response, use the available API inspection tool.
If the error is related to documentation, fetch the relevant documentation first.
Do not guess the root cause without checking tool results.
3단계: 사용 가능한 도구 구성
도구 탭에서 에이전트가 사용할 수 있는 도구를 선택합니다.
내장 도구
Apidog는 다음과 같은 내장 도구를 제공합니다.
| 도구 | 기능 |
|---|---|
bash |
지속적인 셸 세션에서 명령 실행 |
web_fetch |
웹 콘텐츠를 가져와 마크다운, 텍스트 또는 HTML로 변환 |
read |
텍스트, 이미지 또는 PDF 파일 읽기 |
edit |
파일에서 정밀한 문자열 바꾸기 수행 |
write |
파일 생성 또는 덮어쓰기 |
grep |
정규 표현식을 사용하여 파일 내용 검색 |
glob |
glob 패턴을 사용하여 파일 찾기 |
kill_shell |
현재 셸 세션 재설정 |
필요한 도구만 활성화합니다. 비활성화된 도구는 실행 중 사용할 수 없습니다.
MCP 도구 연결
MCP (Model Context Protocol)를 통해 외부 도구를 연결하려면 다음 순서로 진행합니다.
- 도구 탭에서 MCP 서버 추가를 클릭합니다.
- 연결 방법을 선택합니다.
- STDIO: 로컬 MCP 서버 프로세스 시작
- HTTP: 스트리밍 가능한 HTTP를 통해 MCP 서버에 연결
- SSE: Server-Sent Events를 통해 연결
- 필요한 경우 인증을 구성합니다.
- 요청 헤더
- OAuth 2.0 인증
- 연결 후 에이전트에 노출할 도구를 선택합니다.
4단계: 스킬 구성
스킬 탭에서 에이전트에 재사용 가능한 스킬을 추가할 수 있습니다.
스킬은 다음 경우에 유용합니다.
- 프로젝트 내 고정 워크플로 제공
- 일반 작업에 대한 작업 사양 재사용
- 시스템 프롬프트의 반복 설명 축소
실행 중 관련 스킬은 작업에 따라 필요할 때 로드됩니다.
5단계: 인증 및 모델 매개변수 구성
인증 탭에서는 모델 서비스 또는 MCP 서비스에 필요한 자격 증명을 추가합니다.
설정 탭에서는 모델 런타임 매개변수를 구성합니다.
-
Temperature: 무작위성 제어
-
0: 더 결정론적 -
1: 더 창의적
-
- Max Tokens: 최대 응답 길이
- Top P: Nucleus 샘플링 매개변수
- 기타 매개변수: 모델 제공업체에 따라 다름
디버깅 목적이라면 먼저 낮은 Temperature로 실행해 재현성을 높이는 것이 좋습니다.
6단계: 실행 및 관찰
오른쪽 상단의 실행을 클릭하여 디버깅을 시작합니다.
실행 후에는 세 가지 영역을 확인합니다.
세션 목록
왼쪽 패널에는 각 실행 세션이 표시됩니다.
예시:
Session 3
1 turn · 1 step · 10s · 3.1k tokens · $0.02
gpt-4o
세션을 클릭하면 이전 실행과 현재 실행을 비교할 수 있습니다.
턴 패널
중앙 패널에서는 다중 라운드 대화를 확인합니다.
에이전트가 여러 번 사용자와 주고받았다면 각 라운드가 여기에 표시됩니다. 특정 턴을 클릭하면 해당 실행 추적을 볼 수 있습니다.
추적 패널
오른쪽 패널에서는 에이전트 실행 흐름을 순서대로 확인합니다.
확인할 항목은 다음과 같습니다.
- 프롬프트: 실제 전송된 사용자/시스템 프롬프트
- 모델 호출: LLM 요청 및 응답
- 사고 과정: 지원되는 경우 모델 추론
- 도구 호출: 실행된 MCP 도구 및 사용자 정의 스킬
- 도구 세부 정보: 입력, 출력, 타이밍, 오류
- 최종 출력: 에이전트 응답
7단계: 실패한 도구 호출 디버깅
도구 호출이 실패하면 추적 패널에서 다음 순서로 확인합니다.
- 실패한 단계를 찾습니다.
- 입력 매개변수를 확인합니다.
- 도구 출력 또는 오류 메시지를 확인합니다.
- MCP 서버 연결 상태를 확인합니다.
- 인증 설정을 확인합니다.
- 필요하면 프롬프트의 도구 사용 규칙을 수정합니다.
일반적인 실패 원인은 다음과 같습니다.
- MCP 서버가 연결되지 않았거나 연결이 끊김
- 매개변수 형식이 도구 스키마와 맞지 않음
- OAuth, API 키, 헤더 등 인증 구성이 잘못됨
- 로컬 STDIO 서비스 시작 명령을 사용할 수 없음
- 에이전트가 도구 사용 조건을 잘못 판단함
8단계: 모델 성능 비교
사용 사례에 가장 적합한 모델을 찾으려면 다음 방식으로 비교합니다.
- 동일한 프롬프트를 사용합니다.
- 동일한 도구 구성을 사용합니다.
- 모델 A 예: GPT-4o로 실행합니다.
- 모델 B 예: Claude Sonnet으로 실행합니다.
- 세션 메트릭을 비교합니다.
비교 기준은 다음과 같습니다.
- 더 적은 단계로 완료했는가?
- 도구 선택이 더 정확했는가?
- 응답 시간이 더 짧았는가?
- 토큰 사용량이 더 적었는가?
- 예상 비용이 더 낮았는가?
- 최종 응답이 더 실행 가능한가?
AI 에이전트 디버거 vs. 기존 디버깅
| 측면 | 기존 디버깅 | AI 에이전트 디버거 |
|---|---|---|
| 초점 | 코드 로직, 변수, 호출 스택 | 모델 호출, 도구 호출, 프롬프트 |
| 가시성 | 코드 한 줄씩 단계별 실행 | 완전한 실행 추적 확인 |
| 비결정성 | 코드는 대체로 재현 가능 | 여러 실행 비교, 패턴 확인 |
| 블랙박스 | 변수 검사 가능 | 모델 입력/출력 확인, 내부 가중치는 불가 |
| 도구 통합 | 각 API를 별도로 디버깅 | 모든 도구 호출을 하나의 추적에서 확인 |
| 비용 가시성 | 해당 없음 | 토큰 소비 및 예상 비용 확인 |
자주 묻는 질문
내 에이전트가 예상한 도구를 호출하지 않는 이유는 무엇인가요?
다음을 확인합니다.
- 도구 탭에서 해당 도구가 활성화되어 있는가?
- 시스템 프롬프트가 도구 사용 조건을 명확히 설명하는가?
- MCP 서버가 연결되어 있는가?
- 도구가 비활성화되지 않았는가?
- 추적에서 사고 과정 또는 도구 호출 기록을 확인할 수 있는가?
- 사용하는 모델이 도구 호출을 지원하는가?
MCP 도구 호출이 계속 실패합니다. 무엇을 확인해야 하나요?
추적 패널에서 실패한 도구 호출을 열고 다음을 확인합니다.
- 입력 매개변수: 도구 스키마와 맞는가?
- 출력 결과: 도구가 어떤 오류를 반환했는가?
- 연결 상태: MCP 서버가 연결되어 있는가?
- 인증: API 키, OAuth 토큰, 헤더가 올바른가?
- STDIO 명령: 로컬 서버 시작 명령이 유효한가?
동일한 작업을 여러 번 실행해야 하는 이유는 무엇인가요?
에이전트는 비결정적입니다. 동일한 프롬프트라도 실행 경로가 달라질 수 있습니다.
여러 번 실행하면 다음을 확인할 수 있습니다.
- 실행 경로의 분산
- 단계 수 차이
- 도구 선택 패턴
- 토큰 사용량 차이
- 프롬프트와 모델 설정의 안정성
시작하기
AI 에이전트 디버거는 Apidog에서 사용할 수 있습니다. 시작 절차는 다음과 같습니다.
- 최신 Apidog 데스크톱 클라이언트 다운로드
- 상단 탭에서 AI 에이전트 디버거로 이동
- 모델, 프롬프트, 도구 구성
- 에이전트 실행
- 추적 패널에서 모든 단계 검사
- 필요하면 프롬프트, 도구, 모델을 수정하고 다시 실행
결론
AI 에이전트 디버거는 에이전트 개발을 추측 중심 작업에서 추적 가능한 디버깅 프로세스로 바꿉니다.
에이전트가 예상치 못한 행동을 했을 때 다음을 직접 확인할 수 있습니다.
- 어떤 프롬프트가 전달되었는지
- 어떤 모델 호출이 발생했는지
- 어떤 도구가 호출되었는지
- 어떤 매개변수가 전달되었는지
- 어디서 오류가 발생했는지
- 얼마나 많은 토큰과 비용이 사용되었는지
AI 에이전트가 더 많은 도구와 외부 시스템에 연결될수록, 이런 실행 가시성은 안정적이고 비용 효율적인 에이전트 시스템을 구축하는 데 필수적입니다.





Top comments (0)