DEV Community

Cover image for Comment créer une automatisation de navigateur intelligente avec Python, Ollama et DeepSeek
Antoine Laurent
Antoine Laurent

Posted on • Originally published at apidog.com

Comment créer une automatisation de navigateur intelligente avec Python, Ollama et DeepSeek

L’automatisation moderne des navigateurs ne se limite plus à des scripts Selenium fragiles. Avec Browser Use, Ollama et DeepSeek, vous pouvez créer un agent IA local capable de piloter un navigateur, interagir avec des formulaires, extraire des données et exécuter des tâches web à partir d’instructions en langage naturel.

Essayez Apidog dès aujourd'hui

Dans ce guide, vous allez configurer une pile Python complète pour automatiser un navigateur avec un LLM local. L’objectif : exécuter un agent IA capable d’ouvrir Google, rechercher la météo de Boston et retourner le résultat.

Pourquoi utiliser Browser Use, Ollama et DeepSeek ?

Cette pile combine trois composants :

  • Browser Use : package Python qui orchestre les actions navigateur : navigation, clics, saisie, extraction.
  • Ollama : serveur local pour exécuter des modèles LLM sur votre machine.
  • DeepSeek : modèle de raisonnement utilisé pour transformer une tâche en langage naturel en étapes exécutables dans le navigateur.

Avec cette architecture, vous pouvez automatiser :

  • la navigation web ;
  • l’extraction de données ;
  • le remplissage de formulaires ;
  • des scénarios multi-étapes ;
  • des workflows QA ou backend dépendant d’interfaces web.

Prérequis

Avant de commencer, vérifiez votre environnement :

python --version
node --version
git --version
Enter fullscreen mode Exit fullscreen mode

Vous aurez besoin de :

  • Python 3.11+
  • Ollama : ollama.com
  • Node.js, requis par Playwright
  • Git
  • 16 Go de RAM recommandés
  • 12 Go de stockage libre pour certains modèles DeepSeek
  • Un GPU est optionnel, mais utile pour les modèles plus lourds

1. Créer le projet

Créez un dossier de travail dédié :

mkdir browser-use-agent
cd browser-use-agent
Enter fullscreen mode Exit fullscreen mode

Clonez ensuite Browser Use :

git clone https://github.com/browser-use/browser-use.git
cd browser-use
Enter fullscreen mode Exit fullscreen mode

2. Créer un environnement virtuel Python

Isolez les dépendances du projet :

python -m venv venv
Enter fullscreen mode Exit fullscreen mode

Activez l’environnement.

Sur macOS ou Linux :

source venv/bin/activate
Enter fullscreen mode Exit fullscreen mode

Sur Windows :

venv\Scripts\activate
Enter fullscreen mode Exit fullscreen mode

Votre terminal doit afficher un préfixe similaire à :

(venv)
Enter fullscreen mode Exit fullscreen mode

3. Ouvrir le projet dans VS Code

Si vous utilisez VS Code :

code .
Enter fullscreen mode Exit fullscreen mode

Sélectionnez ensuite l’interpréteur Python de l’environnement virtuel :

  1. Ouvrez la palette de commandes.
  2. Tapez Select Python Interpreter.
  3. Choisissez l’interpréteur du dossier venv.

4. Installer Ollama

Téléchargez Ollama depuis ollama.com, puis vérifiez l’installation :

ollama --version
Enter fullscreen mode Exit fullscreen mode

télécharger ollama

5. Télécharger un modèle DeepSeek

Téléchargez le modèle DeepSeek avec Ollama :

ollama pull deepseek/seed
Enter fullscreen mode Exit fullscreen mode

Le modèle peut être volumineux. Si votre machine manque de ressources, vous pouvez tester un modèle plus léger compatible avec Ollama, par exemple :

ollama pull qwen2.5:14b
Enter fullscreen mode Exit fullscreen mode

Vérifiez les modèles disponibles localement :

ollama list
Enter fullscreen mode Exit fullscreen mode

Vous devez voir le modèle téléchargé dans la liste.

télécharger le modèle deepseek

6. Installer Browser Use et les dépendances

Depuis le dossier du dépôt Browser Use, installez le package et ses dépendances de développement :

pip install . ."[dev]"
Enter fullscreen mode Exit fullscreen mode

Installez ensuite LangChain et l’intégration Ollama :

pip install langchain langchain-ollama
Enter fullscreen mode Exit fullscreen mode

Ces packages permettent à l’agent Python d’envoyer ses prompts au modèle local servi par Ollama.

7. Installer Playwright

Browser Use s’appuie sur Playwright pour piloter le navigateur.

Installez les navigateurs nécessaires :

playwright install
Enter fullscreen mode Exit fullscreen mode

Si vous rencontrez des erreurs liées aux dépendances système, exécutez :

playwright install-deps
Enter fullscreen mode Exit fullscreen mode

8. Démarrer le serveur Ollama

Dans un terminal séparé, lancez Ollama :

ollama serve
Enter fullscreen mode Exit fullscreen mode

Le serveur local est disponible par défaut à l’adresse :

http://localhost:11434
Enter fullscreen mode Exit fullscreen mode

Gardez ce terminal ouvert pendant l’exécution de votre agent.

Exemple : créer un agent IA qui recherche la météo de Boston

Créez un fichier test.py à la racine du projet :

import asyncio
from browser_use import Agent
from langchain_ollama import ChatOllama


async def run_search() -> str:
    agent = Agent(
        task="Use Google to find the weather in Boston, Massachusetts",
        llm=ChatOllama(
            model="deepseek/seed",
            num_ctx=32000,
        ),
        max_actions_per_step=3,
        tool_call_in_content=False,
    )

    result = await agent.run(max_steps=15)
    return result


async def main():
    result = await run_search()
    print("\n\n", result)


if __name__ == "__main__":
    asyncio.run(main())
Enter fullscreen mode Exit fullscreen mode

Exécutez le script :

python test.py
Enter fullscreen mode Exit fullscreen mode

L’agent va :

  1. ouvrir un navigateur ;
  2. aller sur Google ;
  3. rechercher la météo à Boston ;
  4. extraire le résultat ;
  5. l’afficher dans le terminal.

recherche browser-use

Si l’exécution échoue, vérifiez d’abord que le serveur Ollama tourne bien :

ollama serve
Enter fullscreen mode Exit fullscreen mode

Puis consultez les logs Ollama :

ls ~/.ollama/logs
Enter fullscreen mode Exit fullscreen mode

résultat de la recherche browser-use

Intégrer Apidog pour valider les API utilisées par vos agents

Si votre agent IA interagit avec des API web, vous devez aussi valider les contrats d’API. Par exemple, un agent peut automatiser une interface web qui dépend d’endpoints backend. Si ces endpoints changent ou échouent, votre automatisation navigateur devient instable.

Apidog peut être utilisé dans ce type de workflow pour :

  • automatiser les tests d’API ;
  • vérifier que les endpoints répondent comme prévu ;
  • gérer des cas de test API ;
  • valider les contrats entre staging et production.

Vous pouvez ainsi tester les API dont dépend votre agent avant d’exécuter les scénarios navigateur.

Tests de contrat d'API avec Apidog

Tests de contrat d’API avec Apidog

Conseils pour écrire de meilleurs prompts

La qualité du prompt influence directement la qualité de l’automatisation.

Utilisez des consignes spécifiques

Préférez :

Go to kayak.com, search flights from Zurich to Beijing, 25.12.2025–02.02.2026, sort by price
Enter fullscreen mode Exit fullscreen mode

Au lieu de :

Find flights.
Enter fullscreen mode Exit fullscreen mode

Décomposez les tâches complexes

Exemple :

Visit LinkedIn, search for ML jobs, save links to a file, apply to top 3.
Enter fullscreen mode Exit fullscreen mode

Pour des workflows sensibles, commencez par une tâche simple, puis ajoutez les étapes progressivement.

Itérez sur le prompt

Si l’agent clique au mauvais endroit ou extrait une mauvaise donnée :

  • rendez le prompt plus explicite ;
  • limitez le nombre d’actions ;
  • réduisez la portée de la tâche ;
  • testez une seule étape à la fois.

Débogage et dépannage

Ollama ne répond pas

Vérifiez que le serveur est lancé :

ollama serve
Enter fullscreen mode Exit fullscreen mode

Confirmez que le modèle est installé :

ollama list
Enter fullscreen mode Exit fullscreen mode

Le modèle est trop lent

Essayez un modèle plus léger ou réduisez le contexte :

llm=ChatOllama(
    model="qwen2.5:14b",
    num_ctx=8000,
)
Enter fullscreen mode Exit fullscreen mode

Playwright échoue au lancement

Réinstallez les navigateurs :

playwright install
Enter fullscreen mode Exit fullscreen mode

Sur Linux, ajoutez les dépendances système :

playwright install-deps
Enter fullscreen mode Exit fullscreen mode

L’agent n’exécute pas la bonne tâche

Modifiez la chaîne task dans votre script :

task="Go to GitHub and find the number of stars for browser-use/browser-use"
Enter fullscreen mode Exit fullscreen mode

Vous pouvez ainsi réutiliser la même structure de script pour différents scénarios.

FAQ

Qu’est-ce que Browser Use ?

Browser Use est un package Python pour l’automatisation de navigateur basée sur l’IA. Il utilise Playwright pour contrôler le navigateur.

Lien : GitHub

Ai-je besoin d’un GPU ?

Non, ce n’est pas obligatoire pour les petits modèles. Un GPU peut cependant accélérer les modèles plus grands.

Puis-je utiliser un autre modèle que DeepSeek ?

Oui. Vous pouvez utiliser tout modèle compatible avec Ollama et suffisamment performant pour raisonner sur des actions navigateur.

Lien : GitHub

Mes données restent-elles locales ?

Oui, si vous utilisez Ollama localement et que vous ne configurez pas de service externe. L’inférence s’exécute sur votre machine.

Puis-je automatiser des connexions et des scénarios multi-étapes ?

Oui. Décrivez la tâche de haut niveau dans task, puis laissez l’agent la décomposer en actions navigateur.

Conclusion

Avec Python, Browser Use, Ollama et DeepSeek, vous pouvez construire un agent IA local capable de piloter un navigateur réel à partir d’instructions en langage naturel.

Cette pile est utile pour :

  • l’automatisation QA ;
  • les tests de workflows web ;
  • l’extraction de données ;
  • les scénarios backend dépendant d’interfaces web ;
  • l’expérimentation avec des agents IA locaux.

Ajoutez des tests API avec Apidog lorsque vos agents dépendent d’endpoints backend, afin de vérifier que les contrats d’API restent cohérents avant d’exécuter vos automatisations navigateur.

Top comments (0)