DEV Community

Cover image for 구글 에이전트 스미스, 구글 코드 25% 작성: API 팀이 알아야 할 점
Rihpig
Rihpig

Posted on • Originally published at apidog.com

구글 에이전트 스미스, 구글 코드 25% 작성: API 팀이 알아야 할 점

TL;DR

Google의 사내 AI 코딩 에이전트인 Agent Smith가 이제 회사 신규 프로덕션 코드의 25% 이상을 생성하고 있습니다. Copilot과 같은 자동 완성 도구와 달리 Agent Smith는 백그라운드에서 비동기적으로 작동하며, 사람의 개입 없이 코드를 작성하고 테스트하며 반복합니다. API 팀에게는 코드베이스의 1/4이 기계 생성될 때 계약 안정성, 테스트 범위, 문서 불일치, 검토 워크플로에 대한 의문이 제기됩니다.

지금 Apidog을 사용해 보세요

서론

2026년 3월 실적 발표에서 Google CEO 순다르 피차이는 전체 소프트웨어 산업을 멈칫하게 할 만한 수치를 공개했습니다: 이제 Google에서 생산되는 신규 코드의 25% 이상이 AI가 생성한 코드입니다.

이것은 자동 완성도 아닙니다. 개발자들이 수락한 Copilot 제안도 아닙니다. 이것은 AI 생성 후 프로덕션에 배포되는 코드입니다. 이 도구는 내부적으로 Agent Smith(매트릭스의 자가 복제 악당에 대한 오마주)라고 불리며, Google의 180,000명 이상의 직원들 사이에서 너무 인기가 많아 회사는 인프라 부담을 관리하기 위해 접근을 제한해야 했습니다.

Agent Smith는 오늘날 대부분의 개발자가 사용하는 AI 코딩 도구와는 다른 범주에 속합니다. Copilot과 Claude Code가 실시간으로 지원하는 반면, Agent Smith는 백그라운드에서 작동합니다. 엔지니어는 작업을 할당하고 자리를 비웠다가 나중에 돌아와 완료된 작업을 검토합니다.

API 개발 팀에게 “AI 지원”에서 “AI 생성” 코드로의 이러한 전환은 실제적인 질문을 제기합니다. 코드베이스의 25%가 자율 에이전트에 의해 작성될 때, API 계약을 어떻게 안정적으로 유지할 수 있을까요? 기계 생성 엔드포인트를 테스트가 커버하도록 어떻게 보장할 수 있을까요? 문서가 불일치하는 것을 어떻게 방지할 수 있을까요?

💡 Apidog의 통합 API 라이프사이클 플랫폼은 인간이든 AI 에이전트든 변경을 수행하는지에 관계없이 설계, 테스트, 목(mock), 문서를 동기화 상태로 유지합니다. Apidog을 무료로 사용하여 에이전트 방어적인 API 워크플로를 구축해 보세요.

이 글에서는 Agent Smith가 무엇을 하는지, 다른 AI 코딩 도구와 어떻게 다른지, 그리고 API 팀이 무엇을 준비해야 하는지에 대해 실질적인 관점에서 설명합니다.

Agent Smith는 무엇을 하는가

비동기 자율 코딩

Agent Smith는 IDE에서 대기하지 않고, 백그라운드에서 자율적으로 작업을 처리합니다. 실제 워크플로는 다음과 같습니다:

  1. 엔지니어가 자연어로 작업을 설명
  2. Agent Smith가 작업을 하위 작업으로 분할
  3. 여러 파일에 걸쳐 코드 작성
  4. 테스트 실행 및 실패 시 반복
  5. 엔지니어가 결과를 검토

Copilot의 인라인 제안이나 Claude Code의 대화형 세션과는 다릅니다. Agent Smith는 티켓을 받아 몇 시간 뒤 풀 리퀘스트(PR)로 결과를 내놓는 주니어 개발자와 유사합니다.

엔지니어는 Google 내부 채팅 플랫폼을 통해 모바일에서도 작업을 위임하고 상태를 모니터링할 수 있습니다. 이 도구는 직원 프로필과 내부 문서에 자동 접근하여 Google의 지식 기반에서 컨텍스트를 가져옵니다.

Gemini 및 Antigravity 기반

Agent Smith는 Google Gemini 모델 제품군에서 실행되며, 내부 코드베이스 및 문서에 액세스 가능한 검색 시스템을 활용합니다. 기존 에이전트 코딩 플랫폼인 Antigravity를 기반으로 자율 분해 및 실행 기능이 확장되었습니다.

검색 증강 덕분에, Agent Smith는 고립된 상태가 아니라 내부 코드베이스의 패턴, 구현, 규칙을 참고해 25% 규모의 프로덕션 품질 코드를 생성할 수 있습니다.

“신규 코드의 25%”의 의미

  • AI가 직접 생성(자동 완성 아님)
  • 코드 리뷰를 통과(인간 엔지니어가 최종 검토)
  • 프로덕션 시스템에 실제로 배포
  • Google 전체 엔지니어링 결과물에 적용

즉, 전체 코드의 25%가 아니라, 신규로 작성되는 코드의 25%가 Agent Smith에서 나온다는 의미입니다. 이 비율은 계속 증가할 전망입니다.

Agent Smith vs. 다른 AI 코딩 도구

AI 코딩 도구 스펙트럼

도구 모드 상호작용 범위 프로덕션 코드인가요?
GitHub Copilot 실시간 자동 완성 IDE 내 인라인 라인/함수 수준 인간 승인 후
Claude Code 대화형 세션 대화형 다중 파일 변경 인간 검토 후
Cursor Agent 백그라운드 + 대화형 IDE 내장 프로젝트 수준 인간 검토 후
Agent Smith 비동기 자율 작업 위임 전체 기능 구현 인간 검토 후
KAIROS (미출시) 상시 실행 데몬 백그라운드 모니터링 저장소 전반 미정

Agent Smith는 완전 자율형에 가까우며, 인간 리뷰 없이 완전히 자율 배포하는 단계는 아직 없습니다(그리고 그래서는 안 됩니다).

API 팀에게 비동기가 중요한 이유

실시간 도구(Copilot, Claude Code)는 개발자가 AI가 작성한 코드를 직접 보며 컨텍스트와 의도를 파악할 수 있습니다. 반면, 비동기 에이전트는 작업 완료 후 결과만 전달하므로 다음과 같은 리스크가 있습니다:

  • 에이전트가 왜 특정 응답 포맷을 선택했는지 명확하지 않음
  • 계약 변경이 코드 리뷰에서 드러나지 않을 수 있음
  • 테스트, 문서, 목(mock) 등 아티팩트가 미반영될 수 있음
  • 전체 영향 파악이 어렵고, 중요한 변경이 누락될 수 있음

AI가 API 코드를 작성할 때 발생하는 문제

API 계약 불일치

API 계약(엔드포인트, 요청/응답 스키마 등)은 서비스와 소비자 간의 명확한 합의입니다. 자율 에이전트가 코드를 수정할 때, OpenAPI 등 계약 사양이 자동으로 갱신되지 않으면 계약 위반이 발생할 수 있습니다.

예시 시나리오:

  • Agent Smith가 "프로필 엔드포인트에 사용자 기본 설정 추가" 작업을 수행
  • GET /api/users/{id} 응답에 preferences 필드를 추가
  • 기존 테스트는 새 필드의 부재를 검증하지 않아 통과
  • 프런트엔드 타입 또는 모바일 앱에서는 예상치 못한 필드로 인해 오류 발생

테스트는 통과하지만, 실제 계약은 깨질 수 있습니다.

테스트 범위 격차

AI가 생성한 테스트는 자신이 추가한 동작만 검증하는 경향이 있어, 기존 동작의 보존 여부는 놓칠 수 있습니다.

  • 응답 시간 벤치마크 미포함
  • 오류 형식 불일치
  • 속도 제한/인증/페이지네이션 등 비표준 동작 누락

문서 불일치

코드 변경이 OpenAPI, 코드 주석과 동기화되지 않으면 문서 불일치가 발생합니다. 설명, 예시 등 컨텍스트가 부족해 실서비스 사용에 문제가 생길 수 있습니다.

검토 피로

AI 생성 코드가 많아질수록, 검토자는 컨텍스트 및 팀 규칙을 일일이 검증하기 어려워져 형식적인 승인만 하게 될 위험이 있습니다.

에이전트 방어적인 API 워크플로 구축 방법

1. API 계약을 진실의 원천으로 만드세요

디자인 우선(Design-First) API 개발을 도입하면, OpenAPI 사양이 계약의 기준이 되어 모든 코드 변경이 명확하게 검증됩니다.

디자인 우선이 없는 경우

코드 변경 → 테스트 통과 → 배포 → 계약 위반
Enter fullscreen mode Exit fullscreen mode

디자인 우선인 경우

사양이 계약을 정의 → 코드는 사양과 일치해야 함 → 계약 유효성 검사로 불일치 감지
Enter fullscreen mode Exit fullscreen mode

Apidog의 시각적 API 디자이너를 활용하면 실제 코드 이전에 스키마와 응답 형식을 정의할 수 있습니다. Agent Smith가 코드를 생성해도, 불완전한 기존 테스트가 아니라 사양에 따라 유효성을 검증할 수 있습니다.

2. 단위 테스트 대신 계약 테스트를 사용하세요

단위 테스트는 내부 동작 검증에 그치지만, 계약 테스트는 API 전체의 계약을 검증합니다.

계약 테스트 예시 (Jest + supertest):

// This test fails if the response shape changes,
// even if the new shape is "valid"
describe("GET /api/users/:id contract", () => {
  it("returns expected schema", async () => {
    const response = await request(app).get("/api/users/123");

    expect(response.body).toMatchSchema({
      type: "object",
      required: ["id", "name", "email", "created_at"],
      properties: {
        id: { type: "string" },
        name: { type: "string" },
        email: { type: "string", format: "email" },
        created_at: { type: "string", format: "date-time" }
      },
      additionalProperties: false  // This catches unexpected fields
    });
  });
});
Enter fullscreen mode Exit fullscreen mode

additionalProperties: false를 지정하면, 에이전트가 응답에 추가 필드를 삽입해도 테스트에서 잡아냅니다.

Apidog에서는 사양을 한 번 정의하면, 응답이 자동으로 계약 테스트를 통과해야만 통합/배포가 이뤄집니다.

3. 사양 유효성 검사에 따라 배포를 제한하세요

CI/CD 파이프라인에 API 사양 유효성 검증을 추가합니다.

# CI/CD pipeline step
- name: Validate API contract
  run: |
    # Diff the current spec against the running implementation
    apidog run --test-scenario-id CONTRACT_TESTS

    # Fail if any contract violations found
    if [ $? -ne 0 ]; then
      echo "API contract violation detected. Review changes."
      exit 1
    fi
Enter fullscreen mode Exit fullscreen mode

이렇게 하면 Agent Smith가 계약 위반 변경을 만들어도, 프로덕션 반영 전에 걸러낼 수 있습니다.

4. API 변경 시 사양 업데이트를 요구하세요

모든 API 동작 변경 Pull Request(PR)는 반드시 OpenAPI 사양 변경을 포함하도록 개발 규칙을 만드세요. 에이전트 PR에도 동일하게 적용됩니다.

Apidog에서는 사양 변경이 다음 아티팩트에 자동 전파됩니다:

  • API 문서
  • 목 서버 응답
  • 테스트 단언
  • 클라이언트 SDK 타입

이로써 문서, 테스트, 목, 실제 코드가 항상 일치하게 됩니다.

5. 프로덕션에서 API 동작을 모니터링하세요

사전 테스트와 사양 검증이 완료되어도, 프로덕션에서는 실제 트래픽을 기반으로 다음을 모니터링해야 합니다:

  • 응답 스키마 위반: 정의된 스키마와 불일치하는 응답 감지
  • 새 필드 출현: 사양에 없는 필드 등장 시 알림
  • 오류율 변화: AI 생성 엔드포인트의 오류율 모니터링
  • 지연 시간 변화: 성능 특성 변화 감지
  • 트래픽 패턴 변경: 새 엔드포인트로 인한 트래픽 분포 변경 확인

6. API 검토를 코드 검토와 분리하세요

API 변경 검토를 코드 변경 검토와 별도로 진행하세요.

API 리뷰 체크리스트 예시:

  • 기존 소비자 영향 여부 확인
  • OpenAPI 사양 업데이트 여부
  • 하위 호환성/버전 지정 여부
  • 오류 응답 형식 일치 여부
  • 예시와 함께 문서화 여부
  • 다운스트림 팀 통지 여부

궤적: 자율 코딩의 미래

오늘의 Agent Smith vs. 미래의 Agent Smith

Agent Smith가 25%를 달성한 지금이 시작에 불과합니다. 도구가 개선되고, 접근성도 확대되면 이 비율은 지속적으로 증가할 것입니다.

다른 주요 기업들도 유사한 시스템을 출시하고 있습니다:

  • Claude Code의 KAIROS: GitHub 웹훅과 백그라운드 워커 기반 상시 실행 데몬
  • GitHub Copilot 에이전트 모드: 자율 파일 편집 및 다단계 코딩
  • Amazon CodeWhisperer: 자동 완성에서 에이전트 기반 워크플로로 확장

업계 트렌드는 ‘AI 지원’에서 ‘자율 기여자’, ‘백그라운드 인프라’로의 진화입니다. 앞으로의 관건은 "AI가 API 코드를 작성하는가"가 아니라 "얼마나 많이 작성하는가"가 될 것입니다.

API 팀이 지금 준비해야 할 사항

  • 디자인 우선은 필수입니다. 에이전트가 코드를 작성할 때, API 사양이 유일한 기준점입니다. 지금 바로 도입하세요.
  • 계약 테스트 인프라에 투자하세요. 암묵적 규칙은 AI가 지킬 수 없습니다. 계약 테스트로 명시적 룰을 강제하세요.
  • 아티팩트 동기화 도구를 사용하세요. 개별 클라이언트, 테스트, 목, 문서 생성기는 불일치의 원인입니다. Apidog과 같은 통합 플랫폼을 도입하세요.
  • AI 생성 코드에 특화된 리뷰 프로세스를 만드세요. 체크리스트와 자동화된 유효성 검증으로 계약 위반을 사전에 차단하세요.

Apidog을 무료로 사용해, 인간이든 Agent Smith든 모든 코드 변경에 일관성을 유지하는 API 워크플로를 바로 구축해보세요.

FAQ

Google Agent Smith란 무엇인가요?

Agent Smith는 Google의 Gemini 모델 및 Antigravity 플랫폼 기반 내부 AI 코딩 에이전트입니다. 백그라운드에서 비동기적으로 동작하며, 엔지니어가 작업을 할당하면 실시간 상호작용 없이 코드를 작성/테스트/반복합니다. 2026년 3월 기준, Google 신규 프로덕션 코드의 25% 이상을 생성합니다.

Agent Smith는 Google 외부에서 사용할 수 있나요?

아니요. Agent Smith는 Google 내부 직원만 사용 가능합니다. 공개 출시 계획은 없습니다. Copilot Agent Mode, Claude Code와 유사하나, Google 내부 코드베이스 및 문서 시스템과 깊이 통합되어 있습니다.

AI 생성 코드가 API 계약을 위반할 수 있나요?

네. AI 에이전트는 테스트를 통과하는 코드만 보장할 뿐, 테스트가 계약의 모든 측면을 커버하지 않으면 스키마 변경, 필드 추가, 오류 형식 등 다운스트림에 문제를 일으킬 수 있습니다. 계약 테스트와 디자인 우선 개발이 이를 방지합니다.

API 팀은 Agent Smith에 대해 걱정해야 할까요?

Agent Smith 자체는 내부 도구이지만, 이와 유사한 자율 코딩 도구(예: Copilot Agent Mode, KAIROS 등)는 곧 모든 팀에 도달할 것입니다. 디자인 우선 개발, 계약 테스트, 통합 도구로 워크플로를 미리 강화해야 안전하게 도입 가능합니다.

AI 에이전트가 API를 손상시키는 것을 어떻게 방지할 수 있나요?

OpenAPI 사양을 진실의 원천으로 두고, additionalProperties: false가 포함된 계약 테스트를 도입하세요. 사양 유효성 검사 및 자동 동기화 도구(Apidog 등)를 활용해, 예기치 않은 스키마 변경을 실시간 차단할 수 있습니다.

AI 지원 코드와 AI 생성 코드의 차이점은 무엇인가요?

AI 지원 코드는 인간이 직접 제안을 보고 승인하며 실시간으로 작성됩니다. 반면, AI 생성 코드는 비동기적으로 엔지니어의 개입 없이 생성되어 사후에만 검토됩니다. 이로 인해 계약 위반 탐지가 더 어려워집니다.

AI 에이전트가 API 개발자를 대체할까요?

아닙니다. Agent Smith도 작업 정의, 코드 리뷰, 배포 승인 등 인간의 판단과 컨텍스트를 필요로 합니다. MIT 연구에 따르면, AI는 생산성을 끌어올리지만 인간의 아키텍처적 통찰, 시스템 일관성 유지 역량은 대체하지 못합니다.

핵심 요점

  • Google Agent Smith는 비동기 자율 방식으로 신규 프로덕션 코드의 25%를 생성합니다.
  • 이는 AI 지원에서 AI 생성 코드로의 진화이며, API 계약 및 워크플로 검토 방식에 큰 변화를 만듭니다.
  • 자율 에이전트가 엔드포인트/스키마를 수정할 때 API 계약 불일치가 가장 큰 리스크입니다.
  • OpenAPI 기반 디자인 우선 개발이 계약 위반 방지의 핵심입니다.
  • 엄격한 스키마 유효성 검사를 통한 계약 테스트로 변경 사항을 정확히 감지할 수 있습니다.
  • Apidog과 같은 통합 플랫폼은 사양, 테스트, 목, 문서를 항상 동기화하여 불일치를 방지합니다.
  • 자율 코딩 에이전트의 시대가 빠르게 다가오고 있습니다. 지금 바로 API 워크플로를 강화하세요.

Agent Smith의 25%는 시작에 불과합니다. 오늘 에이전트 방어적 API 워크플로를 구축하는 팀이 내일 자율 코딩 도구를 안전하게 활용할 수 있습니다.

Top comments (0)