Antoine Laurent

Posted on Jun 23 • Originally published at apidog.com

Comment créer une automatisation de navigateur intelligente avec Python, Ollama et DeepSeek

L’automatisation moderne des navigateurs ne se limite plus à des scripts Selenium fragiles. Avec Browser Use, Ollama et DeepSeek, vous pouvez créer un agent IA local capable de piloter un navigateur, interagir avec des formulaires, extraire des données et exécuter des tâches web à partir d’instructions en langage naturel.

Essayez Apidog dès aujourd'hui

Dans ce guide, vous allez configurer une pile Python complète pour automatiser un navigateur avec un LLM local. L’objectif : exécuter un agent IA capable d’ouvrir Google, rechercher la météo de Boston et retourner le résultat.

Pourquoi utiliser Browser Use, Ollama et DeepSeek ?

Cette pile combine trois composants :

Browser Use : package Python qui orchestre les actions navigateur : navigation, clics, saisie, extraction.
Ollama : serveur local pour exécuter des modèles LLM sur votre machine.
DeepSeek : modèle de raisonnement utilisé pour transformer une tâche en langage naturel en étapes exécutables dans le navigateur.

Avec cette architecture, vous pouvez automatiser :

la navigation web ;
l’extraction de données ;
le remplissage de formulaires ;
des scénarios multi-étapes ;
des workflows QA ou backend dépendant d’interfaces web.

Prérequis

Avant de commencer, vérifiez votre environnement :

python --version
node --version
git --version

Vous aurez besoin de :

Python 3.11+
Ollama : ollama.com
Node.js, requis par Playwright
Git
16 Go de RAM recommandés
12 Go de stockage libre pour certains modèles DeepSeek
Un GPU est optionnel, mais utile pour les modèles plus lourds

1. Créer le projet

Créez un dossier de travail dédié :

mkdir browser-use-agent
cd browser-use-agent

Clonez ensuite Browser Use :

git clone https://github.com/browser-use/browser-use.git
cd browser-use

2. Créer un environnement virtuel Python

Isolez les dépendances du projet :

python -m venv venv

Activez l’environnement.

Sur macOS ou Linux :

source venv/bin/activate

Sur Windows :

venv\Scripts\activate

Votre terminal doit afficher un préfixe similaire à :

(venv)

3. Ouvrir le projet dans VS Code

Si vous utilisez VS Code :

code .

Sélectionnez ensuite l’interpréteur Python de l’environnement virtuel :

Ouvrez la palette de commandes.
Tapez Select Python Interpreter.
Choisissez l’interpréteur du dossier venv.

4. Installer Ollama

Téléchargez Ollama depuis ollama.com, puis vérifiez l’installation :

ollama --version

5. Télécharger un modèle DeepSeek

Téléchargez le modèle DeepSeek avec Ollama :

ollama pull deepseek/seed

Le modèle peut être volumineux. Si votre machine manque de ressources, vous pouvez tester un modèle plus léger compatible avec Ollama, par exemple :

ollama pull qwen2.5:14b

Vérifiez les modèles disponibles localement :

ollama list

Vous devez voir le modèle téléchargé dans la liste.

6. Installer Browser Use et les dépendances

Depuis le dossier du dépôt Browser Use, installez le package et ses dépendances de développement :

pip install . ."[dev]"

Installez ensuite LangChain et l’intégration Ollama :

pip install langchain langchain-ollama

Ces packages permettent à l’agent Python d’envoyer ses prompts au modèle local servi par Ollama.

7. Installer Playwright

Browser Use s’appuie sur Playwright pour piloter le navigateur.

Installez les navigateurs nécessaires :

playwright install

Si vous rencontrez des erreurs liées aux dépendances système, exécutez :

playwright install-deps

8. Démarrer le serveur Ollama

Dans un terminal séparé, lancez Ollama :

ollama serve

Le serveur local est disponible par défaut à l’adresse :

http://localhost:11434

Gardez ce terminal ouvert pendant l’exécution de votre agent.

Exemple : créer un agent IA qui recherche la météo de Boston

Créez un fichier test.py à la racine du projet :

import asyncio
from browser_use import Agent
from langchain_ollama import ChatOllama


async def run_search() -> str:
    agent = Agent(
        task="Use Google to find the weather in Boston, Massachusetts",
        llm=ChatOllama(
            model="deepseek/seed",
            num_ctx=32000,
        ),
        max_actions_per_step=3,
        tool_call_in_content=False,
    )

    result = await agent.run(max_steps=15)
    return result


async def main():
    result = await run_search()
    print("\n\n", result)


if __name__ == "__main__":
    asyncio.run(main())

Exécutez le script :

python test.py

L’agent va :

ouvrir un navigateur ;
aller sur Google ;
rechercher la météo à Boston ;
extraire le résultat ;
l’afficher dans le terminal.

Si l’exécution échoue, vérifiez d’abord que le serveur Ollama tourne bien :

ollama serve

Puis consultez les logs Ollama :

ls ~/.ollama/logs

Intégrer Apidog pour valider les API utilisées par vos agents

Si votre agent IA interagit avec des API web, vous devez aussi valider les contrats d’API. Par exemple, un agent peut automatiser une interface web qui dépend d’endpoints backend. Si ces endpoints changent ou échouent, votre automatisation navigateur devient instable.

Apidog peut être utilisé dans ce type de workflow pour :

automatiser les tests d’API ;
vérifier que les endpoints répondent comme prévu ;
gérer des cas de test API ;
valider les contrats entre staging et production.

Vous pouvez ainsi tester les API dont dépend votre agent avant d’exécuter les scénarios navigateur.

Tests de contrat d’API avec Apidog

Conseils pour écrire de meilleurs prompts

La qualité du prompt influence directement la qualité de l’automatisation.

Utilisez des consignes spécifiques

Préférez :

Go to kayak.com, search flights from Zurich to Beijing, 25.12.2025–02.02.2026, sort by price

Au lieu de :

Find flights.

Décomposez les tâches complexes

Exemple :

Visit LinkedIn, search for ML jobs, save links to a file, apply to top 3.

Pour des workflows sensibles, commencez par une tâche simple, puis ajoutez les étapes progressivement.

Itérez sur le prompt

Si l’agent clique au mauvais endroit ou extrait une mauvaise donnée :

rendez le prompt plus explicite ;
limitez le nombre d’actions ;
réduisez la portée de la tâche ;
testez une seule étape à la fois.

Débogage et dépannage

Ollama ne répond pas

Vérifiez que le serveur est lancé :

ollama serve

Confirmez que le modèle est installé :

ollama list

Le modèle est trop lent

Essayez un modèle plus léger ou réduisez le contexte :

llm=ChatOllama(
    model="qwen2.5:14b",
    num_ctx=8000,
)

Playwright échoue au lancement

Réinstallez les navigateurs :

playwright install

Sur Linux, ajoutez les dépendances système :

playwright install-deps

L’agent n’exécute pas la bonne tâche

Modifiez la chaîne task dans votre script :

task="Go to GitHub and find the number of stars for browser-use/browser-use"

Vous pouvez ainsi réutiliser la même structure de script pour différents scénarios.

FAQ

Qu’est-ce que Browser Use ?

Browser Use est un package Python pour l’automatisation de navigateur basée sur l’IA. Il utilise Playwright pour contrôler le navigateur.

Lien : GitHub

Ai-je besoin d’un GPU ?

Non, ce n’est pas obligatoire pour les petits modèles. Un GPU peut cependant accélérer les modèles plus grands.

Puis-je utiliser un autre modèle que DeepSeek ?

Oui. Vous pouvez utiliser tout modèle compatible avec Ollama et suffisamment performant pour raisonner sur des actions navigateur.

Lien : GitHub

Mes données restent-elles locales ?

Oui, si vous utilisez Ollama localement et que vous ne configurez pas de service externe. L’inférence s’exécute sur votre machine.

Puis-je automatiser des connexions et des scénarios multi-étapes ?

Oui. Décrivez la tâche de haut niveau dans task, puis laissez l’agent la décomposer en actions navigateur.

Conclusion

Avec Python, Browser Use, Ollama et DeepSeek, vous pouvez construire un agent IA local capable de piloter un navigateur réel à partir d’instructions en langage naturel.

Cette pile est utile pour :

l’automatisation QA ;
les tests de workflows web ;
l’extraction de données ;
les scénarios backend dépendant d’interfaces web ;
l’expérimentation avec des agents IA locaux.

Ajoutez des tests API avec Apidog lorsque vos agents dépendent d’endpoints backend, afin de vérifier que les contrats d’API restent cohérents avant d’exécuter vos automatisations navigateur.

DEV Community

Comment créer une automatisation de navigateur intelligente avec Python, Ollama et DeepSeek

Pourquoi utiliser Browser Use, Ollama et DeepSeek ?

Prérequis

1. Créer le projet

2. Créer un environnement virtuel Python

3. Ouvrir le projet dans VS Code

4. Installer Ollama

5. Télécharger un modèle DeepSeek

6. Installer Browser Use et les dépendances

7. Installer Playwright

8. Démarrer le serveur Ollama

Exemple : créer un agent IA qui recherche la météo de Boston

Intégrer Apidog pour valider les API utilisées par vos agents

Conseils pour écrire de meilleurs prompts

Utilisez des consignes spécifiques

Décomposez les tâches complexes

Itérez sur le prompt

Débogage et dépannage

Ollama ne répond pas

Le modèle est trop lent

Playwright échoue au lancement

L’agent n’exécute pas la bonne tâche

FAQ

Qu’est-ce que Browser Use ?

Ai-je besoin d’un GPU ?

Puis-je utiliser un autre modèle que DeepSeek ?

Mes données restent-elles locales ?

Puis-je automatiser des connexions et des scénarios multi-étapes ?

Conclusion

Top comments (0)