elboKazQC

Posted on Jun 26

La dictée vocale en français québécois, c'est pas un gadget : c'est un problème de code-switching

#buildinpublic #productivity #ai #indiehackers

J'utilise la dictée vocale tous les jours depuis six mois. Pas pour taper moins vite. Pour penser plus vite quand je vibe-code avec Claude Code et Cursor.

Pis j'ai fini par construire mon propre outil parce que les outils existants me tapaient sur les nerfs d'une façon très précise.

Le problème réel

Quand tu travailles en tech au Québec, tes phrases ressemblent à ça :

"OK fa que je fais un useState pour le component pis je passe le handler en props"

Ça, c'est une phrase normale. Personne en tech QC ne parle autrement. Pas parce qu'on est négligents avec la langue. Parce que le vocabulaire technique vient de l'anglais et qu'on le soude naturellement au français au fil de la pensée.

Ça s'appelle le code-switching. Et c'est là que la plupart des outils de dictée craquent.

Ce que les outils mainstream font mal

Dragon NaturallySpeaking

Dragon, c'est le vieux standard. Médical, juridique, corporate. Ça coûte environ 500$ en une shot. C'est lourd à installer et à entraîner. Et sa gestion du français québécois avec des termes tech intercalés... c'est en gros zéro.

"useState" devient "usé état". "Fa que" devient "faque" parfois, "fake" d'autres fois. C'est aléatoire. T'as intérêt à corriger après chaque phrase.

Wispr Flow

Wispr Flow est plus moderne. UX propre, cross-platform, et leur gestion du français s'est améliorée. Leur plan Pro coûte 15$/mois, soit environ 144$/an.

Mais il y a un problème structurel que leur propre doc admet : la détection de langue se fait par session, pas par mot.

Autrement dit : Wispr détecte la langue une fois au début de la session. Si tu commences en français, il reste en mode français jusqu'à la fin. Les mots anglais qui arrivent dans la phrase, il tente de les translittérer en français. "Handler" peut devenir "andler" ou "ender", "props" survit parfois, parfois pas. C'est variable.

Pour une phrase de temps en temps avec un mot anglais, ça passe. Pour un vibe-coder québécois qui switch constamment dans la même phrase, ça ne passe pas.

Pourquoi c'est un vrai problème, pas un détail

La dictée vocale utile, c'est quand tu peux parler aussi vite que tu penses et que la transcription suit. Le moment où tu dois ralentir pour articuler différemment, ou corriger constamment après, tu perds exactement l'avantage pour lequel t'as adopté l'outil.

J'ai fini par faire le calcul : le temps de correction de franglais = le temps que je sauvais à dicter. Retour à la case départ.

Fa que j'ai décidé de régler ça directement.

Ce que j'ai construit

Tania Dictée est un outil de dictée vocale Windows, 100% local. Tu maintiens F6, tu parles, tu relâches. Le texte se colle dans n'importe quelle app active : VS Code, Cursor, Claude Code, Gmail, peu importe.

La différence principale par rapport aux outils existants :

Traitement par phrase, pas par session. Chaque phrase passe à travers Whisper (via faster-whisper) avec un glossaire FR-QC intégré d'office. "useState", "handler", "fa que", "pis", "Supabase", "Cursor", tout ça est dans le glossaire. Le modèle sait que c'est du franglais québécois. Il n'essaie pas de choisir une langue et de tout forcer dedans.

100% local, zéro cloud. Ce que tu dictes reste sur ton PC. Pas de compte à créer. Pas de tokens qui partent sur un serveur externe. Pour un consultant sous NDA ou un dev avec du code proprio, ça compte.

Windows-first, sans friction. Installeur d'environ 63 MB. Pas de Python à installer, pas de droits admin. Tu dézippe, tu lances, ça marche.

Prix : 9$ CAD une seule fois. Pas d'abonnement. Un achat, c'est fini.

Le code est open source MIT sur GitHub (github.com/elboKazQC/tania-dictee).

Ce que je ne prétends pas (build-in-public oblige)

Je construis en transparent, alors voici ce qui est vrai à date :

Zéro utilisateur externe. C'est moi qui l'utilise tous les jours. La première vraie validation externe, c'est ce que je cherche en ce moment.

Pas de version Mac ou Linux. Windows only, point.

L'UX est en alpha. Il n'y a pas encore de paramètres graphiques élaborés, pas d'onboarding fancy.

Le benchmark de précision (protocole WER contre Whisper vanilla et Dragon) n'est pas encore publié. Le protocole est prêt et les mesures arrivent. Je ne vais pas inventer des chiffres d'ici là.

Pourquoi ça peut quand même marcher

La niche est petite mais réelle : développeurs et consultants qui travaillent en franglais québécois, qui vibe-codent, qui ont du code proprio à protéger. Les outils qui existent ne sont pas conçus pour eux.

La preuve du concept existe : moi. Six mois d'usage quotidien, ça m'a économisé du temps réel. Si ça marche pour moi, il y a probablement d'autres personnes avec le même problème.

Si t'as déjà pesté contre Dragon ou Wispr Flow quand tu dictes du franglais tech, j'aimerais t'entendre. Qu'est-ce qui t'a le plus agacé ? Est-ce que c'était le code-switching, la précision globale, ou autre chose ?

La waitlist est à https://elbokazqc.github.io/tania-dictee. 9$ CAD, achat unique, si jamais tu veux soutenir le projet et être parmi les premiers testeurs externes.

-- Vincent

DEV Community