DEV Community

정상록
정상록

Posted on

ByteDance의 DeerFlow 2.0 써봤는데, 에이전트 프레임워크가 이 정도까지 왔네요

TL;DR

ByteDance가 AI 에이전트 프레임워크 DeerFlow 2.0을 MIT 라이선스로 공개했어요. GitHub 스타 25,000개, 트렌딩 1위 달성. 직접 써보니 서브에이전트, 샌드박스, 메모리가 모두 내장되어 있더라고요. 5분이면 Docker로 시작할 수 있어요.


문제: 에이전트 프레임워크가 너무 복잡했어요

요즘 AI 에이전트 관련 도구들이 많잖아요. OpenAI Deep Research는 비싸고 OpenAI에 종속돼 있고, LangGraph는 직접 모든 걸 만들어야 하고, AutoGPT나 CrewAI는 어중간하게 느껴졌어요.

그래서 저는 지금까지 다음처럼 했거든요:

  • 에이전트 오케스트레이션을 직접 짜기 (복잡함)
  • 샌드박스를 직접 구성하기 (시간 낭비)
  • 메모리 시스템을 직접 구현하기 (유지보수 악몽)
  • 컨텍스트를 수동으로 관리하기 (토큰 낭비)

그런데 DeerFlow 2.0 발표를 보니 "어? 이게 다 포함되어 있다고?"라는 생각이 들었어요.


해결: DeerFlow 2.0은 "배터리 포함" 에이전트 런타임

DeerFlow는 원래 딥리서치 프레임워크였대요. 근데 v2.0에서 완전히 갈아엎었고, 이제는 에이전트 런타임이 됐습니다.

# 5분이면 시작
git clone https://github.com/bytedance/deer-flow.git
cd deer-flow
make config        # 설정 파일 생성
# config.yaml에서 모델 설정 (OpenAI, Claude, Gemini 등 뭐든 OK)
# .env에 API 키 설정
make docker-init   # 샌드박스 이미지 풀 (최초 1회)
make docker-start  # 서비스 시작
# http://localhost:2026 접속
Enter fullscreen mode Exit fullscreen mode

이게 좋은 점 세 가지를 말해볼게요:

1. 이미 다 들어있다는 게 신기해요

✓ 서브에이전트 동적 스폰
✓ Docker 샌드박스 (파일 읽기/쓰기, bash 실행)
✓ Long-term 메모리 (세션 간 유지)
✓ 컨텍스트 자동 정리 (완료된 서브태스크는 요약)
✓ 리서치, 리포트, 슬라이드, 이미지/영상 생성 스킬
✓ MCP(Model Context Protocol) 지원
Enter fullscreen mode Exit fullscreen mode

직접 LangGraph로 짜면 이 모든 걸 손으로 구현해야 합니다. 근데 DeerFlow는 기본으로 제공해요.

2. 모델에 종속되지 않아요

# config.yaml
models:
  default: openai-gpt-4o

# 또는 Claude로 바꿀 수도 있고
models:
  default: anthropic-claude-3-opus

# Google Gemini도 가능
models:
  default: google-gemini-2-flash
Enter fullscreen mode Exit fullscreen mode

OpenAI 호환 API를 지원하는 모든 LLM을 연결할 수 있어요. 특정 모델에 갇혀 있지 않다는 게 장점입니다.

3. 파일시스템이 깔끔하게 격리돼 있어요

/mnt/user-data/
├── uploads/          (입력 파일)
├── workspace/        (작업 공간)
└── outputs/          (최종 결과물)
Enter fullscreen mode Exit fullscreen mode

세션끼리 오염이 없어요. 새 세션마다 깔끔한 상태에서 시작할 수 있습니다.


경쟁 프레임워크와 비교하면?

DeerFlow 2.0 OpenAI Deep Research LangGraph
비용 무료 (MIT) 유료 API 무료
모델 선택 OpenAI 호환 모두 가능 OpenAI만 모두 가능
샌드박스 Docker 내장 제한적 직접 구현
메모리 Long-term 내장 API별 다름 직접 구현
난이도 중간 낮음 높음

솔직한 후기:

  • OpenAI Deep Research보다 자유도가 높고 무료예요
  • LangGraph보다 훨씬 빨리 시작할 수 있어요
  • AutoGPT/CrewAI보다 프로덕션에 더 적합해요

아키텍처: ByteDance가 어떻게 만들었나

Sub-Agents: 분할 정복이 가능해요

리드 에이전트가 여러 개의 서브에이전트를 동적으로 만들고, 각자 독립된 컨텍스트에서 일해요. 마치 팀원을 여러 명 고용하는 것처럼요.

리드 에이전트
├─ 리서치 에이전트 (논문 찾기)
├─ 분석 에이전트 (데이터 처리)
└─ 리포트 에이전트 (결과 정리)

→ 모두 병렬로 실행 → 결과 합성
Enter fullscreen mode Exit fullscreen mode

Context Engineering: 토큰을 아껴요

완료된 서브태스크는 자동으로 요약되고, 파일시스템에 오프로드돼요. 그래서 컨텍스트 윈도우를 낭비하지 않고도 큰 작업을 처리할 수 있어요.

Step 1 결과: 50,000 토큰
↓ (자동 요약 및 파일 저장)
Step 2에서 필요한 핵심만: 5,000 토큰
Enter fullscreen mode Exit fullscreen mode

Long-Term Memory: 세션을 기억해요

사용자 프로필, 선호도, 이전 대화 내용을 로컬 파일로 저장해요. 새 세션을 시작해도 이전 맥락을 기억합니다.


써보니까 주의할 점도 있어요

1. ByteDance 제품이라는 우려

보안 전문가들의 리뷰를 보면, 거버넌스와 프라이버시 평가가 아직 부족하다고 하네요. 개인 프로젝트나 학습 목적으로는 좋지만, 조직 도입 전에는 보안 리뷰를 꼭 하세요.

2. v1과 호환되지 않아요

v2.0은 완전히 재작성돼서 v1 코드와 공유하는 게 없어요. 기존 사용자는 새로 설치하고 설정을 다시 구성해야 합니다.

3. 아직 활발히 개발 중

GitHub 스타 25,000개, 트렌딩 1위는 맞는데, 문서가 많지 않아요. 이슈 트래커도 활발하니까 문제가 생기면 빨리 피드백을 올려야 합니다.


FAQ: 자주 묻는 것들

"정말 무료예요?"

네, MIT 라이선스 완전 오픈소스입니다. 상업적 사용도 가능. 다만 API 비용은 별도입니다.

"어떤 LLM을 쓸 수 있어요?"

OpenAI, Claude, Gemini, 로컬 모델 등 OpenAI 호환 API면 뭐든 됩니다. 선택의 자유가 있어요.

"프로덕션에서 써도 돼?"

ByteDance 내부에서 검증됐지만, 조직 도입 전에는 보안 리뷰를 선행하세요. 민감한 데이터라면 더욱 조심스러워야 합니다.


결론: 한번 설치해보세요

일주일 써본 솔직한 후기:

좋은 점:

  • 설정: 5분 (진짜 5분)
  • 모든 에이전트 런타임의 필수 요소가 들어있어요
  • 모델 선택의 자유가 있어요

조심할 점:

  • ByteDance 제품이라는 신뢰 이슈
  • 아직 활발히 개발 중이라 API가 바뀔 수 있어요
  • 문서가 아직 적어요

지금까지 LangGraph로 직접 짜거나, AutoGPT/CrewAI로 어중간하게 때웠다면, DeerFlow 2.0을 한번 시도해보세요. 적어도 에이전트 아키텍처가 어떻게 프로덕션에 맞춰져야 하는지는 배울 수 있을 거예요.

DeerFlow 2.0 GitHub 바로가기


참고 자료

혹시 DeerFlow를 직접 써본 분이 있으면 댓글로 경험담을 나눠주세요. 어떤 프로젝트에 적용했는지, 그리고 어려웠던 점이 뭔지 궁금합니다!

Top comments (0)