<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Kohen Avocats</title>
    <description>The latest articles on DEV Community by Kohen Avocats (@kohenavocats).</description>
    <link>https://dev.to/kohenavocats</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F3685095%2F6a576a3b-d7c4-4c28-800a-c06e8ccbf154.png</url>
      <title>DEV Community: Kohen Avocats</title>
      <link>https://dev.to/kohenavocats</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/kohenavocats"/>
    <language>en</language>
    <item>
      <title>MCP Server Google Vision : Donnez la vue à Claude pour lire vos documents scannés et manuscrits</title>
      <dc:creator>Kohen Avocats</dc:creator>
      <pubDate>Mon, 29 Dec 2025 23:47:12 +0000</pubDate>
      <link>https://dev.to/kohenavocats/mcp-server-google-vision-donnez-la-vue-a-claude-pour-lire-vos-documents-scannes-et-manuscrits-2a43</link>
      <guid>https://dev.to/kohenavocats/mcp-server-google-vision-donnez-la-vue-a-claude-pour-lire-vos-documents-scannes-et-manuscrits-2a43</guid>
      <description>&lt;p&gt;Les LLMs comme Claude excellent dans l'analyse de texte, mais ils ont une limitation majeure : ils ne peuvent pas nativement lire des PDFs scannés, déchiffrer l'écriture manuscrite, ou traiter des documents mal orientés.&lt;/p&gt;

&lt;p&gt;J'ai développé &lt;strong&gt;mcp-server-google-vision&lt;/strong&gt;, un serveur MCP (Model Context Protocol) qui donne des capacités de vision avancées aux modèles de langage via l'API Google Cloud Vision.&lt;/p&gt;

&lt;h2&gt;
  
  
  🎯 Le problème résolu
&lt;/h2&gt;

&lt;p&gt;Ce serveur permet aux LLMs de :&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Lire des &lt;strong&gt;PDF scannés&lt;/strong&gt; (images sans couche texte)&lt;/li&gt;
&lt;li&gt;Déchiffrer l'&lt;strong&gt;écriture manuscrite&lt;/strong&gt;
&lt;/li&gt;
&lt;li&gt;Traiter des &lt;strong&gt;documents mal orientés&lt;/strong&gt; ou inversés&lt;/li&gt;
&lt;li&gt;Extraire du texte de &lt;strong&gt;photos de documents&lt;/strong&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  💼 Cas d'usage
&lt;/h2&gt;

&lt;p&gt;Ce projet est né d'un besoin concret dans mon cabinet d'avocats parisien, où nous devons quotidiennement traiter des pièces scannées, correspondances manuscrites, et documents anciens.&lt;/p&gt;

&lt;p&gt;Autres applications :&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Alimentation de RAG&lt;/strong&gt; : Extraction de texte pour indexation&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Traitement documentaire&lt;/strong&gt; : OCR de masse avec gestion multi-pages&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Accessibilité&lt;/strong&gt; : Transcription pour personnes malvoyantes&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  ⚡ Fonctionnalités clés
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;OCR haute précision (imprimé et manuscrit)&lt;/li&gt;
&lt;li&gt;Support multi-pages (jusqu'à 2000 pages)&lt;/li&gt;
&lt;li&gt;Détection automatique d'orientation&lt;/li&gt;
&lt;li&gt;9 features Vision API disponibles&lt;/li&gt;
&lt;li&gt;Retry intelligent avec backoff exponentiel&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  🚀 Installation rapide
&lt;/h2&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight shell"&gt;&lt;code&gt;pip &lt;span class="nb"&gt;install &lt;/span&gt;mcp-server-google-vision
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;


&lt;p&gt;Configuration avec Claude Desktop (via uvx) :&lt;br&gt;
&lt;/p&gt;
&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight json"&gt;&lt;code&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="nl"&gt;"mcpServers"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="nl"&gt;"google-vision"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"command"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"uvx"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"args"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;[&lt;/span&gt;&lt;span class="s2"&gt;"--from"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"mcp-server-google-vision"&lt;/span&gt;&lt;span class="p"&gt;,&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"mcp-google-vision"&lt;/span&gt;&lt;span class="p"&gt;],&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="nl"&gt;"env"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="p"&gt;{&lt;/span&gt;&lt;span class="w"&gt;
        &lt;/span&gt;&lt;span class="nl"&gt;"GOOGLE_API_KEY"&lt;/span&gt;&lt;span class="p"&gt;:&lt;/span&gt;&lt;span class="w"&gt; &lt;/span&gt;&lt;span class="s2"&gt;"votre_clé_api"&lt;/span&gt;&lt;span class="w"&gt;
      &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
    &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
  &lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;span class="p"&gt;}&lt;/span&gt;&lt;span class="w"&gt;
&lt;/span&gt;&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;

&lt;h2&gt;
  
  
  📦 Liens
&lt;/h2&gt;

&lt;p&gt;

&lt;/p&gt;
&lt;div class="ltag-github-readme-tag"&gt;
  &lt;div class="readme-overview"&gt;
    &lt;h2&gt;
      &lt;img src="https://assets.dev.to/assets/github-logo-5a155e1f9a670af7944dd5e12375bc76ed542ea80224905ecaf878b9157cdefc.svg" alt="GitHub logo"&gt;
      &lt;a href="https://github.com/KohenAvocats" rel="noopener noreferrer"&gt;
        KohenAvocats
      &lt;/a&gt; / &lt;a href="https://github.com/KohenAvocats/mcp-server-google-vision" rel="noopener noreferrer"&gt;
        mcp-server-google-vision
      &lt;/a&gt;
    &lt;/h2&gt;
    &lt;h3&gt;
      MCP server providing OCR capabilities to LLMs via Google Cloud Vision API - Read scanned PDFs, handwritten text, and images with any orientation
    &lt;/h3&gt;
  &lt;/div&gt;
  &lt;div class="ltag-github-body"&gt;
    
&lt;div id="readme" class="md"&gt;
&lt;div class="markdown-heading"&gt;
&lt;h1 class="heading-element"&gt;mcp-server-google-vision&lt;/h1&gt;
&lt;/div&gt;

&lt;p&gt;Serveur MCP &lt;a href="https://modelcontextprotocol.io/introduction" rel="nofollow noopener noreferrer"&gt;Model Context Protocol&lt;/a&gt; permettant aux LLMs comme Claude de lire des documents scannés, du texte manuscrit et des images avec l'API Google Cloud Vision.&lt;/p&gt;

&lt;div class="markdown-heading"&gt;
&lt;h2 class="heading-element"&gt;Description&lt;/h2&gt;
&lt;/div&gt;

&lt;p&gt;Ce projet implémente un serveur MCP qui donne des capacités de vision avancées aux modèles de langage. Développé par &lt;a href="https://kohenavocats.com" rel="nofollow noopener noreferrer"&gt;Kohen Avocats&lt;/a&gt;, un cabinet d'avocats parisien, cet outil est utilisé quotidiennement pour traiter des documents juridiques complexes : pièces scannées, courriers manuscrits, PDF mal orientés, etc.&lt;/p&gt;

&lt;div class="markdown-heading"&gt;
&lt;h3 class="heading-element"&gt;Le problème résolu&lt;/h3&gt;
&lt;/div&gt;

&lt;p&gt;Les LLMs comme Claude excellent dans l'analyse de texte, mais ne peuvent pas nativement :&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Lire des PDF scannés (images sans couche texte)&lt;/li&gt;
&lt;li&gt;Déchiffrer l'écriture manuscrite&lt;/li&gt;
&lt;li&gt;Traiter des documents mal orientés ou inversés&lt;/li&gt;
&lt;li&gt;Extraire du texte de photos de documents&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Ce serveur MCP comble cette lacune en fournissant une interface standardisée vers Google Cloud Vision, permettant aux LLMs de "voir" et lire n'importe quel document.&lt;/p&gt;

&lt;div class="markdown-heading"&gt;
&lt;h3 class="heading-element"&gt;Cas d'usage&lt;/h3&gt;

&lt;/div&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Cabinets d'avocats&lt;/strong&gt; : Lecture de pièces…&lt;/li&gt;
&lt;/ul&gt;
&lt;/div&gt;
  &lt;/div&gt;
  &lt;div class="gh-btn-container"&gt;&lt;a class="gh-btn" href="https://github.com/KohenAvocats/mcp-server-google-vision" rel="noopener noreferrer"&gt;View on GitHub&lt;/a&gt;&lt;/div&gt;
&lt;/div&gt;




&lt;ul&gt;
&lt;li&gt;&lt;a href="https://pypi.org/project/mcp-server-google-vision/" rel="noopener noreferrer"&gt;Package PyPI&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href="https://modelcontextprotocol.io/" rel="noopener noreferrer"&gt;Documentation MCP&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;




&lt;p&gt;Le projet est &lt;strong&gt;open source&lt;/strong&gt; sous licence MIT. N'hésitez pas à contribuer ou à partager vos cas d'usage !&lt;/p&gt;

&lt;p&gt;&lt;em&gt;Développé par Maître Hassan KOHEN, &lt;a href="https://www.kohenavocats.com" rel="noopener noreferrer"&gt;avocat en droit pénal à Paris&lt;/a&gt;, fondateur de Kohen Avocats.&lt;/em&gt;&lt;/p&gt;

</description>
      <category>mcp</category>
      <category>ai</category>
      <category>python</category>
      <category>opensource</category>
    </item>
  </channel>
</rss>
