DEV Community

innermost47
innermost47

Posted on • Originally published at blog.anthony-charretier.fr

J'ai construit un réseau GPU coopératif pour l'IA musicale. Et je cherche 10 personnes.

OBSIDIAN Neural — distributed GPU network

4 200 téléchargements. 8 pays. Présenté à l'AES AIMLA 2025 à Londres. OBSIDIAN Neural est un plugin VST3/AU qui génère de l'audio par IA en temps réel, sur scène, pendant que tu joues. Aujourd'hui je passe à l'étape suivante : un réseau d'inférence distribué, coopératif, entièrement open source. Et je cherche 10 personnes pour le lancer.


Le problème avec les plateformes d'IA musicale centralisées

Suno, Udio, Adobe — même modèle partout. Tu paies un abonnement. Leurs serveurs génèrent. Ils gardent les revenus. L'infrastructure est opaque. Le pricing est arbitraire.

Je voulais construire autre chose. Pas juste un meilleur plugin — une relation différente entre l'outil, ceux qui l'utilisent, et ceux qui le font tourner.

"Et si les gens qui font tourner les GPU possédaient une part de ce qu'ils construisent ?"


Ce qu'est OBSIDIAN Neural

OBSIDIAN Neural est un plugin VST3/AU pour la génération audio IA en temps réel. Tu le charges dans ton DAW — Ableton, Reaper, Logic, n'importe lequel — tu tapes un prompt, tu génères, et tu récupères un sample WAV en quelques secondes. Pendant un live. Pendant que tout le reste joue.

Le plugin appelle un serveur central qui route la requête vers un provider GPU sur le réseau, lance l'inférence via Stable Audio Open, valide l'output, et renvoie l'audio. Toute la chaîne est open source. Chaque ligne de code est publique.

Stack technique

  • Plugin : C++ / JUCE, VST3 + AU, Windows / macOS / Linux
  • Serveur central : FastAPI Python, async, queue par provider
  • Modèle : Stable Audio Open 1.0 (8GB VRAM) ou Small (4GB VRAM)
  • Fallback : fal.ai si aucun provider disponible
  • License : AGPL-3.0

Le modèle coopératif

Le réseau tourne sur un pool de providers GPU distribués. N'importe qui avec une carte NVIDIA compatible peut rejoindre, faire tourner le provider kit, et recevoir une part des revenus mensuels d'abonnement.

Bénéficiaire Part
Providers (toi) 85%
Plateforme (infrastructure + maintenance) 15%

Le split est égal entre tous les providers actifs éligibles. Pas de hiérarchie. Pas de négociation. Chaque mois, 85% des revenus sont distribués automatiquement via Stripe Connect. Le détail complet est publié publiquement à api.obsidian-neural.com/api/v1/public/finances — auditable par n'importe qui, à tout moment.

En tant que provider, tu reçois aussi 500 crédits de génération gratuits chaque mois pour utiliser le plugin toi-même.


L'architecture technique

Serveur central

  • Système de heartbeat push depuis les providers — pas de polling
  • Queue asyncio par provider (1 génération à la fois)
  • Clés API hashées SHA-256, clés utilisateurs chiffrées Fernet
  • Stripe Connect pour la redistribution automatique des revenus
  • Rapport financier public mis à jour après chaque cycle

Provider kit

  • Un seul script Python, 15 minutes d'installation
  • Compatible Windows, Linux, macOS — CUDA obligatoire
  • Resampling automatique BPM-aware via librosa + SoundTouch
  • Validation WAV par FFmpeg avant retour de l'audio

Proof-of-work audio

À des intervalles aléatoires entre 1h et 5h, le serveur sélectionne 30% des providers actifs au hasard et leur envoie un seed et un prompt de test communs, choisis aléatoirement parmi un pool de 70 prompts. Chaque provider génère l'audio. Le serveur calcule le spectrogramme mel de chaque output et compare via cosine similarity.

Serveur central
    → seed aléatoire + prompt de test
    → 30% des providers sélectionnés au hasard
    → POST /verify { prompt, seed, duration }
    → collecte des WAVs
    → spectrogramme mel → cosine similarity
    → similarity < 0.85 → flag
    → 3 flags consécutifs → ban automatique
Enter fullscreen mode Exit fullscreen mode

Un provider qui envoie du silence, du bruit, ou rejoue le même sample en boucle produit un fingerprint mel qui diverge du groupe. Un provider qui fait vraiment tourner le bon modèle avec le bon seed produit un output cohérent avec le reste du pool.


Pourquoi l'open source change tout

Suno et Udio ne peuvent pas faire ce que fait OBSIDIAN Neural. Pas parce que la technologie est plus difficile — parce que leur modèle économique l'interdit. Ils ont des investisseurs. Ils ont des obligations. Partager 85% des revenus avec la communauté est structurellement impossible pour eux.

L'open source ici n'est pas un choix marketing. C'est la seule architecture qui rend le modèle coopératif crédible. Tu peux lire le calcul des revenus. Tu peux auditer le système de vérification. Tu peux vérifier que les 15% de frais plateforme sont exactement ce qu'ils prétendent être. Rien n'est caché parce que rien ne peut être caché.


Ce que j'ai appris en construisant ça

La partie la plus intéressante n'était pas l'inférence — c'était de réaliser que le modèle économique coopératif est techniquement plus simple à implémenter que le modèle extractif. Un split égal distribué automatiquement via Stripe Connect, c'est moins de code qu'un système de pricing à plusieurs niveaux.

La deuxième leçon : la transparence radicale n'est pas un risque, c'est un argument de vente. Publier les finances en JSON public n'a jamais inquiété personne — au contraire, c'est systématiquement la première chose que les providers potentiels vont vérifier.

La troisième : un GPU qui tourne chez quelqu'un génère de la chaleur de toute façon. Autant qu'il génère de la musique et un peu d'argent en même temps.


Je cherche 10 personnes pour la phase 1

Tu peux être :

  • Un musicien qui utilise déjà le plugin et veut contribuer à l'infrastructure
  • Un développeur curieux de l'inférence IA distribuée
  • Un architecte intéressé par les modèles économiques coopératifs appliqués à l'IA
  • Quelqu'un avec une NVIDIA qui tourne à l'arrêt 16h par jour
  • N'importe qui qui pense que le paysage actuel de l'IA musicale manque quelque chose

Il n'y a pas encore d'abonnés payants. C'est le rez-de-chaussée. Le réseau doit exister avant d'être utile — et les gens qui le construisent depuis le début sont ceux qui décident de comment il grandit.


Les liens

La phase 1 est limitée à 10 providers. Si ça t'intéresse — lis le code, vérifie les chiffres, pose des questions difficiles. Puis écris-moi.


Présenté à l'AES AIMLA 2025 — Queen Mary University London

Top comments (0)