DEV Community

Cover image for đŸ€– DĂ©ployer son agent sur Google Vertex AI Agent Engine
Benjamin Bourgeois for Zenika

Posted on • Edited on • Originally published at bbourgeois.dev

đŸ€– DĂ©ployer son agent sur Google Vertex AI Agent Engine

Google Cloud a rĂ©cemment introduit Vertex AI Agent Engine, une plateforme intĂ©grĂ©e Ă  l’écosystĂšme Vertex AI conçue pour centraliser et dĂ©ployer des agents Ă  grande Ă©chelle dans unun environnement cloud sĂ©curisĂ© et scalable.

Dans cet article, nous allons voir les avantages de Vertex AI Agent Engine et les différentes façons de déployer un agent dessus : l'approche native avec ADK (Agent Development Kit) et l'approche flexible via le SDK Vertex AI pour les agents conçus avec des frameworks comme LangChain, LangGraph ou CrewAI.

A travers cet article, nous allons comprendre comment passer d’un agent local Ă  un agent opĂ©rationnel dans le cloud, prĂȘt Ă  interagir avec vos donnĂ©es et vos utilisateurs.

❓Comprendre Vertex AI Agent Engine et ses avantages

Vertex AI Agent Engine est un service de Google Cloud conçu pour simplifier le dĂ©ploiement et l’orchestration d’agents IA. L’idĂ©e derriĂšre Agent Engine est simple : proposer une infrastructure centralisĂ©e pour gĂ©rer des agents, qu’ils soient conversationnels, analytiques ou autonomes.

Interaction avec Vertex AI Agent Engine

💡 Les principaux avantages de Vertex AI Agent Engine

âžĄïž Gestion des mĂ©moires et des sessions

Gestion des mémoires et des sessions

Vertex AI Agent Engine intÚgre nativement la gestion des sessions et des mémoires conversationnelles. Cela permet à un agent de :

  • garder le contexte entre plusieurs interactions d’un mĂȘme utilisateur,
  • s’appuyer sur l’historique d’échanges,
  • enrichir sa comprĂ©hension du contexte au fil du temps.

âžĄïž Support multi-frameworks

EcosystĂšme Vertex AI Agent Engine

Vertex AI Agent Engine ne se limite pas Ă  un framework. Il prend en charge plusieurs frameworks d’agents (ADK, LangChain, LlamaIndex, frameworks maison, etc.), ce qui permet de l’adapter Ă  diffĂ©rents contextes.

âžĄïž IntĂ©gration native Ă  Google Cloud

Les agents peuvent facilement se connecter Ă  d’autres services. GrĂące aux Tools comme Google Cloud, MCP (Model Context Protocol), A2A (Agent2Agent) ou encore des “custom tools”, ils peuvent interagir avec des API, des bases de donnĂ©es ou des applications mĂ©tiers.

âžĄïž Auto-scaling

Agent Engine gĂšre automatiquement le scaling et le dĂ©ploiement des agents. Le compute s’ajuste automatiquement selon la demande.

âžĄïž SĂ©curitĂ© et gouvernance

Chaque agent hĂ©rite d’une identitĂ© sĂ©curisĂ©e. Vous pouvez ainsi dĂ©finir des permissions prĂ©cises pour les accĂšs aux donnĂ©es ou aux APIs.

âžĄïž Monitoring

Chaque exĂ©cution d’agent est monitorĂ©e : logs dĂ©taillĂ©s, mĂ©triques, et suivi des appels aux modĂšles. Cela facilite le debug, l’optimisation et l’analyse de performances.

🚀 DĂ©ployer son agent avec le framework ADK (Agent Development Kit)

Le framework ADK (Agent Development Kit) est le framework proposĂ© par Google pour construire des agents et disponible actuellement en Python et en Java. Il offre une structure claire pour le dĂ©veloppement, le test et le dĂ©ploiement d’agents, tout en s’intĂ©grant nativement avec les services Vertex AI.

Le premier dĂ©ploiement peut s’effectuer en quelques minutes.

Pré-requis :

  • La CLI Google Cloud (gcloud)

1. Installation et initialisation du projet

CrĂ©ation d’un environnement virtuel Python (ici Ă  l’aide de uv):

mkdir deploy-with-adk && cd deploy-with-adk
uv venv --python 3.12
source .venv/bin/activate
Enter fullscreen mode Exit fullscreen mode

Initialisation d’un projet d’agent avec ADK :

uv pip install google-adk
adk create personal_assistant
Enter fullscreen mode Exit fullscreen mode

L’arborescence du projet est automatiquement créée :

└── deploy-with-adk
    └── personal_assistant
        ├── __init__.py
        ├── .env
        └── agent.py
Enter fullscreen mode Exit fullscreen mode

2. CrĂ©ation d’un agent

Dans mon fichier agent.py, j’ai créé, pour cet article, un agent tout simple capable de rĂ©pondre Ă  mes questions tout en se basant sur un datastore dans VertexAI Search contenant diffĂ©rents documents personnels.

from google.adk.agents.llm_agent import Agent
from google.adk.tools import VertexAiSearchTool

root_agent = Agent(
    model='gemini-2.5-flash',
    name='root_agent',
    instruction="Answer questions using Vertex AI Search to find information from internal documents. Always cite sources when available.",
    description="Enterprise document search assistant with Vertex AI Search capabilities",
    tools=[VertexAiSearchTool(data_store_id=DATASTORE_ID)]
)
Enter fullscreen mode Exit fullscreen mode

3. Déploiement

adk deploy agent_engine \
    --project=${PROJECT_ID} \
    --region=${PROJECT_REGION} \
    --staging_bucket=gs://${BUCKET_NAME} \
    --display_name="Personal Assistant" \
    personal_assistant
Enter fullscreen mode Exit fullscreen mode

Cette commande :

  • construit une image container de votre agent,
  • la dĂ©ploie sur Vertex AI Agent Engine,
  • et gĂ©nĂšre un endpoint accessible via API ou depuis d’autres agents.

Une fois dĂ©ployĂ©, votre agent peut ĂȘtre intĂ©grĂ© dans des workflows plus complexes.

Dashboard Vertex AI Agent Engine

🚀 DĂ©ployer un agent avec un autre framework grĂące au SDK Vertex AI

Si ADK intĂšgre simplement le dĂ©ploiement, Agent Engine est aussi compatible avec de nombreux autres frameworks d’agents IA comme LangChain, LlamaIndex ou CrewAI via la SDK de Vertex AI.

Cette approche permet d’intĂ©grer un agent existant (dĂ©jĂ  conçu avec LangChain par exemple) dans l’écosystĂšme Vertex AI pour le monitorer, le scaler et le connecter Ă  d’autres services Google Cloud.

1. Installation et initialisation du projet

Commençons par initialiser Vertex AI avec le projet, la rĂ©gion, et un “staging bucket” (nĂ©cessaire pour le packaging de l’agent).

mkdir deploy-with-vertex && cd deploy-with-vertex && touch agent.py

uv venv --python 3.12
source .venv/bin/activate

uv pip install google-cloud-aiplatform[agent_engines,langchain]
Enter fullscreen mode Exit fullscreen mode

2. CrĂ©ation d’un agent

Dans le fichier agent.py, nous allons repartir du mĂȘme cas d’usage que l’agent prĂ©cĂ©dent, mais cette fois en utilisant LangChain.

Cet agent sera capable de répondre à des questions en interrogeant un datastore Vertex AI Search contenant différents documents personnels.

from vertexai import init, agent_engines
from langchain_retrievers.google_vertex_ai_search import VertexAISearchRetriever
from langchain.tools import Tool

# Init Vertex AI
init(
    project=${PROJECT_ID},
    location=${PROJECT_REGION},
    staging_bucket="gs://${STAGING_BUCKET}",
)

# Create retriever
retriever = VertexAISearchRetriever(data_store_id=${DATASTORE_ID})

# Define search tool
search_tool = Tool(
    name="vertex_search",
    func=lambda query: retriever.get_relevant_documents(query),
    description="Searches your private document store via Vertex AI Search."
)

# System prompt
system_prompt = """
You're an intelligent assistant that can answer questions using internal document search. Use the search tool when necessary.
"""

# Create Langchain Agent
agent = agent_engines.LangchainAgent(
    model="gemini-2.5-flash",
    system_instruction=system_prompt,
    tools=[search_tool],
    model_kwargs={
        "temperature": 0.3,
        "top_p": 0.9,
        "max_output_tokens": 1000,
    },
)
Enter fullscreen mode Exit fullscreen mode

3. IntĂ©gration de l’agent dans Vertex AI

La ligne clĂ© suivante permet d’envelopper l’agent LangChain dans une classe compatible avec Vertex AI Agent Engine. C’est cette abstraction qui rend possible son dĂ©ploiement dans l’infrastructure Vertex AI.

agent = agent_engines.LangchainAgent(...)
Enter fullscreen mode Exit fullscreen mode

Vertex AI fournit Ă©galement d’autres classes pour intĂ©grer diffĂ©rents frameworks comme par exemple :

  • agent_engines.LlamaIndexAgent pour LlamaIndex,

  • agent_engines.CrewAIAgent pour CrewAI.

4. Déploiement

J’ajoute ensuite la mĂ©thode ci-dessous pour le dĂ©ploiement. Plusieurs options sont disponibles pour configurer le dĂ©ploiement et notamment le paramĂštre “requirements” pour dĂ©finir les packages nĂ©cessaires Ă  l’agent.

remote_agent = agent_engines.create(
    agent_engine=agent,
    requirements=[
        "google-cloud-aiplatform[agent_engines,langchain]",
        "langchain_community",
    ],
)

print(f"✅ Agent deployed with success.")
Enter fullscreen mode Exit fullscreen mode

Ce code va :

  • “sĂ©rialiser” l’agent
  • envoyer le code vers le staging bucket,
  • dĂ©ployer l’agent sur Vertex AI Agent Engine

Il ne me reste plus qu’à exĂ©cuter mon fichier et l’agent sera dĂ©ployĂ© en quelques minutes

uv run index.py
Enter fullscreen mode Exit fullscreen mode

💬 Interagir avec l’agent dĂ©ployĂ©

Une fois l’agent dĂ©ployĂ© sur Vertex AI Agent Engine, il est possible de l’interroger directement depuis le code Python Ă  l’aide du SDK Vertex AI, quelle que soit la mĂ©thode de dĂ©ploiement (ADK ou via le SDK VertexAI).

Les agents dĂ©ployĂ©s via ADK ou via le SDK Vertex AI sont compatibles avec la mĂȘme API.

Voici un exemple minimaliste d’interaction :

from vertexai import agent_engines

# Get the deployed agent engine
agent_engine = agent_engines.get(${RESOURCE_ID})

# Send a request to the agent
response = agent_engine.query(
    input="Who won the FIFA World Cup in 2018?"
)

# Display the text response
print(response.output_text)
Enter fullscreen mode Exit fullscreen mode

💡 En rĂ©sumĂ©

Dans cet article, nous avons vu deux maniÚres de déployer un agent sur Vertex AI Agent Engine : le framework ADK, idéal pour un déploiement rapide et standardisé, et le SDK Vertex AI, plus flexible pour intégrer des frameworks comme LangChain et des outils personnalisés.

L’exemple prĂ©sentĂ© reste volontairement simple, mais il est possible d’aller beaucoup plus loin:

  • configurer le service account associĂ© Ă  chaque agent,
  • ajuster les paramĂštres d’exĂ©cution, ou activer le monitoring.

💡 Update 10/11/2025 – Vertex AI Agent Engine Express Mode

Quelques jours aprĂšs la sortie de cet article, Google a introduit le mode Express pour Vertex AI Agent Engine.

Ce mode permet d’utiliser Agent Engine sans crĂ©er de projet Google Cloud, simplement avec un compte Gmail et une clĂ© API depuis Vertex AI Studio.

â„č Depuis le 1er novembre 2025, un nouveau free tier est Ă©galement disponible pour permettre aux dĂ©veloppeurs d’expĂ©rimenter Agent Engine gratuitement.

Pour approfondir le sujet :

Top comments (0)