L’automatisation moderne des navigateurs ne se limite plus à des scripts Selenium fragiles. Avec Browser Use, Ollama et DeepSeek, vous pouvez créer un agent IA local capable de piloter un navigateur, interagir avec des formulaires, extraire des données et exécuter des tâches web à partir d’instructions en langage naturel.
Essayez Apidog dès aujourd'hui
Dans ce guide, vous allez configurer une pile Python complète pour automatiser un navigateur avec un LLM local. L’objectif : exécuter un agent IA capable d’ouvrir Google, rechercher la météo de Boston et retourner le résultat.
Pourquoi utiliser Browser Use, Ollama et DeepSeek ?
Cette pile combine trois composants :
- Browser Use : package Python qui orchestre les actions navigateur : navigation, clics, saisie, extraction.
- Ollama : serveur local pour exécuter des modèles LLM sur votre machine.
- DeepSeek : modèle de raisonnement utilisé pour transformer une tâche en langage naturel en étapes exécutables dans le navigateur.
Avec cette architecture, vous pouvez automatiser :
- la navigation web ;
- l’extraction de données ;
- le remplissage de formulaires ;
- des scénarios multi-étapes ;
- des workflows QA ou backend dépendant d’interfaces web.
Prérequis
Avant de commencer, vérifiez votre environnement :
python --version
node --version
git --version
Vous aurez besoin de :
- Python 3.11+
- Ollama : ollama.com
- Node.js, requis par Playwright
- Git
- 16 Go de RAM recommandés
- 12 Go de stockage libre pour certains modèles DeepSeek
- Un GPU est optionnel, mais utile pour les modèles plus lourds
1. Créer le projet
Créez un dossier de travail dédié :
mkdir browser-use-agent
cd browser-use-agent
Clonez ensuite Browser Use :
git clone https://github.com/browser-use/browser-use.git
cd browser-use
2. Créer un environnement virtuel Python
Isolez les dépendances du projet :
python -m venv venv
Activez l’environnement.
Sur macOS ou Linux :
source venv/bin/activate
Sur Windows :
venv\Scripts\activate
Votre terminal doit afficher un préfixe similaire à :
(venv)
3. Ouvrir le projet dans VS Code
Si vous utilisez VS Code :
code .
Sélectionnez ensuite l’interpréteur Python de l’environnement virtuel :
- Ouvrez la palette de commandes.
- Tapez
Select Python Interpreter. - Choisissez l’interpréteur du dossier
venv.
4. Installer Ollama
Téléchargez Ollama depuis ollama.com, puis vérifiez l’installation :
ollama --version
5. Télécharger un modèle DeepSeek
Téléchargez le modèle DeepSeek avec Ollama :
ollama pull deepseek/seed
Le modèle peut être volumineux. Si votre machine manque de ressources, vous pouvez tester un modèle plus léger compatible avec Ollama, par exemple :
ollama pull qwen2.5:14b
Vérifiez les modèles disponibles localement :
ollama list
Vous devez voir le modèle téléchargé dans la liste.
6. Installer Browser Use et les dépendances
Depuis le dossier du dépôt Browser Use, installez le package et ses dépendances de développement :
pip install . ."[dev]"
Installez ensuite LangChain et l’intégration Ollama :
pip install langchain langchain-ollama
Ces packages permettent à l’agent Python d’envoyer ses prompts au modèle local servi par Ollama.
7. Installer Playwright
Browser Use s’appuie sur Playwright pour piloter le navigateur.
Installez les navigateurs nécessaires :
playwright install
Si vous rencontrez des erreurs liées aux dépendances système, exécutez :
playwright install-deps
8. Démarrer le serveur Ollama
Dans un terminal séparé, lancez Ollama :
ollama serve
Le serveur local est disponible par défaut à l’adresse :
http://localhost:11434
Gardez ce terminal ouvert pendant l’exécution de votre agent.
Exemple : créer un agent IA qui recherche la météo de Boston
Créez un fichier test.py à la racine du projet :
import asyncio
from browser_use import Agent
from langchain_ollama import ChatOllama
async def run_search() -> str:
agent = Agent(
task="Use Google to find the weather in Boston, Massachusetts",
llm=ChatOllama(
model="deepseek/seed",
num_ctx=32000,
),
max_actions_per_step=3,
tool_call_in_content=False,
)
result = await agent.run(max_steps=15)
return result
async def main():
result = await run_search()
print("\n\n", result)
if __name__ == "__main__":
asyncio.run(main())
Exécutez le script :
python test.py
L’agent va :
- ouvrir un navigateur ;
- aller sur Google ;
- rechercher la météo à Boston ;
- extraire le résultat ;
- l’afficher dans le terminal.
Si l’exécution échoue, vérifiez d’abord que le serveur Ollama tourne bien :
ollama serve
Puis consultez les logs Ollama :
ls ~/.ollama/logs
Intégrer Apidog pour valider les API utilisées par vos agents
Si votre agent IA interagit avec des API web, vous devez aussi valider les contrats d’API. Par exemple, un agent peut automatiser une interface web qui dépend d’endpoints backend. Si ces endpoints changent ou échouent, votre automatisation navigateur devient instable.
Apidog peut être utilisé dans ce type de workflow pour :
- automatiser les tests d’API ;
- vérifier que les endpoints répondent comme prévu ;
- gérer des cas de test API ;
- valider les contrats entre staging et production.
Vous pouvez ainsi tester les API dont dépend votre agent avant d’exécuter les scénarios navigateur.
Tests de contrat d’API avec Apidog
Conseils pour écrire de meilleurs prompts
La qualité du prompt influence directement la qualité de l’automatisation.
Utilisez des consignes spécifiques
Préférez :
Go to kayak.com, search flights from Zurich to Beijing, 25.12.2025–02.02.2026, sort by price
Au lieu de :
Find flights.
Décomposez les tâches complexes
Exemple :
Visit LinkedIn, search for ML jobs, save links to a file, apply to top 3.
Pour des workflows sensibles, commencez par une tâche simple, puis ajoutez les étapes progressivement.
Itérez sur le prompt
Si l’agent clique au mauvais endroit ou extrait une mauvaise donnée :
- rendez le prompt plus explicite ;
- limitez le nombre d’actions ;
- réduisez la portée de la tâche ;
- testez une seule étape à la fois.
Débogage et dépannage
Ollama ne répond pas
Vérifiez que le serveur est lancé :
ollama serve
Confirmez que le modèle est installé :
ollama list
Le modèle est trop lent
Essayez un modèle plus léger ou réduisez le contexte :
llm=ChatOllama(
model="qwen2.5:14b",
num_ctx=8000,
)
Playwright échoue au lancement
Réinstallez les navigateurs :
playwright install
Sur Linux, ajoutez les dépendances système :
playwright install-deps
L’agent n’exécute pas la bonne tâche
Modifiez la chaîne task dans votre script :
task="Go to GitHub and find the number of stars for browser-use/browser-use"
Vous pouvez ainsi réutiliser la même structure de script pour différents scénarios.
FAQ
Qu’est-ce que Browser Use ?
Browser Use est un package Python pour l’automatisation de navigateur basée sur l’IA. Il utilise Playwright pour contrôler le navigateur.
Lien : GitHub
Ai-je besoin d’un GPU ?
Non, ce n’est pas obligatoire pour les petits modèles. Un GPU peut cependant accélérer les modèles plus grands.
Puis-je utiliser un autre modèle que DeepSeek ?
Oui. Vous pouvez utiliser tout modèle compatible avec Ollama et suffisamment performant pour raisonner sur des actions navigateur.
Lien : GitHub
Mes données restent-elles locales ?
Oui, si vous utilisez Ollama localement et que vous ne configurez pas de service externe. L’inférence s’exécute sur votre machine.
Puis-je automatiser des connexions et des scénarios multi-étapes ?
Oui. Décrivez la tâche de haut niveau dans task, puis laissez l’agent la décomposer en actions navigateur.
Conclusion
Avec Python, Browser Use, Ollama et DeepSeek, vous pouvez construire un agent IA local capable de piloter un navigateur réel à partir d’instructions en langage naturel.
Cette pile est utile pour :
- l’automatisation QA ;
- les tests de workflows web ;
- l’extraction de données ;
- les scénarios backend dépendant d’interfaces web ;
- l’expérimentation avec des agents IA locaux.
Ajoutez des tests API avec Apidog lorsque vos agents dépendent d’endpoints backend, afin de vérifier que les contrats d’API restent cohérents avant d’exécuter vos automatisations navigateur.





Top comments (0)