RAG en entreprise : ce que j'ai appris en le déployant chez un industriel (REX)

#ai #llm #rag #machinelearning

J'ai remplacé le guide générique qui occupait cette page. À la place, voici ce que j'aurais aimé lire avant de mettre un système RAG en production chez un client industriel : ce qui a marché, ce qui a raté, et les chiffres réels. Version d'origine et suite sur le blog Jaikin.

Le contexte

Le client est une PME familiale alsacienne, fabricant d'enseignes lumineuses depuis plus de soixante ans. Chaque enseigne posée exige une demande d'autorisation préalable, et la règle change d'une commune à l'autre : plans locaux d'urbanisme, règlements locaux de publicité, arrêtés municipaux — des centaines de documents, aucun au même format.

Avant le projet, le chargé d'affaires fouillait ces textes à la main pour vérifier la faisabilité d'une enseigne, puis remplissait les formulaires administratifs un par un. Personne ne trouvait ça anormal : c'était le métier.

Nous avons construit un assistant documentaire RAG qui répond aux questions réglementaires en citant ses sources, couplé à l'extraction automatisée des données pour préremplir les formulaires. Résultat mesuré : temps administratif divisé par trois. Voici les cinq leçons qui ont réellement fait la différence — aucune ne figure dans les tutoriels.

Leçon 1 : le corpus réel est sale, et c'est là que part le budget

Les benchmarks de vector stores comparent des jeux de données propres. Un règlement local de publicité, c'est un PDF scanné par une mairie, avec des tableaux, des annexes cartographiques et des renvois vers des arrêtés introuvables. Plus de la moitié de l'effort du projet est parti dans l'ingestion : OCR, découpage par article réglementaire (pas par nombre de tokens), détection des versions abrogées.

Le choix Pinecone vs pgvector, qui obsède les comparatifs, s'est réglé en une heure. La qualité du corpus a occupé des semaines. Si vos documents sources sont contradictoires ou périmés, le RAG les restituera fidèlement — avec l'aplomb d'une réponse générée par IA en prime.

Leçon 2 : la citation de source n'est pas une option, c'est la condition d'adoption

Un chargé d'affaires n'engagera jamais un dossier en mairie sur la foi d'un paragraphe généré. Ce qui a fait basculer l'équipe : chaque réponse cite l'article exact du règlement et renvoie au passage d'origine. L'utilisateur vérifie en dix secondes au lieu de chercher pendant vingt minutes.

Conséquence architecturale : chaque chunk porte des métadonnées structurées — commune, type de document, date d'entrée en vigueur. Sans elles, impossible de filtrer la version 2022 d'un règlement remplacée en 2025. C'est l'erreur silencieuse la plus dangereuse que j'aie vue sur ce type de corpus.

Leçon 3 : le vectoriel pur rate les questions qui comptent

Les questions réelles contiennent des noms de communes, des références d'articles, des dimensions en mètres. La recherche sémantique seule confond des règlements de communes voisines dont le contenu se ressemble à 90 %. La recherche hybride (BM25 + vectoriel) n'a pas été une optimisation de fin de projet : sans elle, le système était inutilisable sur les cas précis — précisément ceux pour lesquels on le payait.

Leçon 4 : « je ne sais pas » est la fonctionnalité la plus importante

Sur de la réglementation, une hallucination ne coûte pas un sourire gêné : elle coûte un dossier refusé, ou une enseigne posée qu'il faut déposer. Le système est instruit de refuser de répondre quand les sources récupérées ne couvrent pas la question, et d'escalader vers l'humain. Nous avons passé plus de temps à régler ce comportement de refus qu'à améliorer les bonnes réponses. C'est contre-intuitif, et c'est ce qui a rendu l'outil digne de confiance.

Leçon 5 : l'IA prend la corvée, l'humain garde la signature

Le chargé d'affaires relit et valide chaque dossier. L'assistant a supprimé la recherche documentaire, pas la responsabilité. C'est aussi pour ça que l'équipe l'a adopté en quelques semaines au lieu de le saboter : il travaille pour elle, il ne la remplace pas.

Quand ne PAS faire de RAG

Le conseil que je donne maintenant en audit : si votre corpus tient dans la fenêtre de contexte d'un modèle récent et qu'il change rarement, commencez sans RAG — un prompt bien construit avec les documents joints suffit, pour un dixième du coût. Le RAG se justifie quand le corpus est volumineux, mouvant, et que la traçabilité des sources est exigée. C'était exactement notre cas ; ce n'est peut-être pas le vôtre.

Le bilan

Temps administratif divisé par trois, adoption complète parce que l'outil s'est branché sur la chaîne existante au lieu de la remplacer, et six projets IA en production chez ce client aujourd'hui — chacun financé par les gains du précédent.

Je suis Victor Glesskrumhorn, fondateur de Jaikin, cabinet de conseil en IA, data et automatisation pour PME et ETI (Strasbourg). Si vous voulez creuser l'architecture ou challenger votre projet RAG : jaikin.eu/contact.