Digitalisation des devis BTP : comment l'IA vocale change le quotidien des artisans
Le problème réel sur le chantier
Sur 50 petites entreprises de bâtiment que nous avons interrogées en 2025, 78 % remplissaient encore leurs devis sur papier ou Excel. Pourquoi ? Pas parce qu'ils n'aiment pas la technologie, mais parce que les outils existants obligent l'artisan à :
- Prendre des notes à la main pendant la visite de site
- Revenir au bureau pour taper ces notes
- Assembler manuellement les tarifs, quantités et marges
- Envoyer par email ou imprimer le PDF
C'est 2-3 heures par devis — sur un chiffre d'affaires où chaque heure compte.
Nous avons voulu casser ce flux. L'idée : que l'artisan dicte son devis directement sur le chantier, en temps réel, et que l'IA fasse le reste.
Pourquoi l'IA vocale, pas un formulaire tactile ?
Un formulaire mobile, ça semble logique. Mais sur un chantier :
- Les mains sont occupées (mesurer, photographier, tenir un mur)
- Les gants bloquent le tactile
- L'interface doit être vocale pour être vraiment mains-libres
En 2025, les modèles de reconnaissance vocale français (Whisper d'OpenAI, modèles Hugging Face fine-tunés sur le français technique) atteignent 94-97 % de précision sur le vocabulaire BTP. C'est suffisant pour un premier brouillon que l'artisan peut corriger en 2 clics.
Architecture technique : ce que nous avons appris
Capturer la voix en production
Device (iPad/Android)
→ captures PCM 16kHz, mono
→ envoie chunks de 1s via WebSocket
→ serveur accumule et envoie à Whisper toutes les 3s
→ transcription revenait en 1.2s
→ utilisateur peut corriger en direct
Piège #1 : essayer de traiter 100 % de la parole en temps réel = impossible. Solution : on transcrit par chunks, on affiche le brouillon, on laisse l'utilisateur corriger. C'est plus rapide qu'on ne le pense.
Piège #2 : Whisper par défaut ne connaît pas "Knauf" ou "Isover" (marques BTP). Solution : fine-tuning sur ~1000 lignes de devis réels. Boost de 8 points de précision.
Parser le devis en structure
Une fois qu'on a "3 paquets de briques Terreal 230x110, 45 euros pièce", il faut extraire :
- Quantité : 3
- Article : "Briques Terreal 230x110"
- PU HT : 45 €
- Devise : EUR
Nous avons construit un petit parser LLM (appel à Claude 3.5 Sonnet, 0.3s par ligne). Pas de regex — l'LLM gère les variantes ("3 boîtes", "trois paquets", "1 palette de 300 briques").
{
"quantity": 3,
"unit": "packet",
"label": "Briques Terreal 230x110x100",
"unit_price_ht": 45.00,
"currency": "EUR",
"confidence": 0.94
}
Coût : ~0.002 € par ligne. Sur 30 lignes, ça ajoute 6 centimes au devis. Acceptable.
Intégration avec la facturation Factur-X 2026
Une fois le devis accepté, il doit devenir une facture Factur-X valide. Le format Factur-X est un XML embedded en PDF — obligatoire en France depuis 2024 pour les échanges B2B.
Les champs critiques :
- InvoiceNumber : doit être séquentiel et unique (on utilise UUID hashé)
- IssueDate : horodatage du serveur (pas du client — dérive horaire)
- BillingAddress : extraction depuis l'adresse du chantier (géocodage Nominatim gratuit)
- TaxTotal : calcul TVA sur chaque ligne (taux différencié pour matériel/main-d'œuvre en France)
Ligne 1 : 3 briques @ 45 € HT = 135 € HT
TVA 20 % = 27 € TTC
Ligne 2 : 5 jours main-d'œuvre @ 300 € HT = 1500 € HT
TVA 10 % (déductible BTP) = 150 € TTC
↓
Total HT : 1635 €
Total TTC : 1677 € (TVA agrégée)
On génère le XML via python-facturx, on l'attache au PDF iText, on envoie par email.
Les gains mesurés après 3 mois
Sur 15 PME utilisant le système :
| Métrique | Avant | Après | Gain |
|---|---|---|---|
| Temps/devis | 2h45 | 18 min | -87 % |
| Erreurs de prix | 3-4 par devis | 0.1 | -96 % |
| Taux d'acceptation client | 72 % | 89 % | +17 pts |
| Délai entre visite et envoi | 3 jours | 30 min | -99 % |
Le vrai gain : l'artisan envoie son devis depuis le chantier, le client peut accepter par SMS, et la facture Factur-X est générée instantanément. Zéro retypage.
Ce qui reste dur
Mots techniques rares — un artisan en Alsace va dire "clavetage" (joint dilatation), l'IA entend "clavage". Fine-tuning par région = possible mais lourd.
Devis complexes avec variantes — "Soit option A : 500 €, soit option B : 800 €". L'IA capture rarement la structure optionnelle. Solution : interface semi-automatique, pas full vocale.
Photos intégrées — certains devis incluent des photos du chantier. Reconnaissance d'objet + annotation vocale = possible mais encore buggy.
Comment mettre cela en production chez vous
Si tu es dev dans une PME BTP ou une scale-up proptech :
- Commencer par Whisper + Groq — accès gratuit via API, latence 0.5s
- Parser simple avec regex au départ (pas d'LLM), valider le concept
- Ajouter LLM une fois que tu as 100 devis réels et que tu vois les patterns d'erreur
- Factur-X : utilise python-facturx, c'est du standard, zéro risque
Des outils clé-en-main existent aussi — Anodos propose un système complet voix → facture Factur-X 2026 depuis iPad/Android. L'avantage : tu n'as pas à gérer le parsing, l'API, la validation TVA — c'est prêt à l'emploi.
Mais si tu veux built-in, c'est 6-8 semaines pour MVP solide (voix + devis JSON), 12 semaines pour Factur-X full compliance.
Pour finir
La digitalisation du devis BTP n'est pas un problème d'interface — c'est un problème d'intégration vocale dans un flux physique. Dès que tu acceptes que le premier brouillon sera imparfait et que l'artisan corrigera en 2 clics, tout devient simple.
Et une fois qu'on a un devis structuré en JSON, générer une facture Factur-X valide est un problème résolu — c'est du CRUD + XML templating.
Olivier Ebrahim
Fondateur d'Anodos — SaaS gestion de chantier avec commandes vocales et facturation Factur-X pour PME du bâtiment.
Top comments (0)