DEV Community

Bishop Spomer
Bishop Spomer

Posted on

14 cosas que noté al meter un Creador de Beats con IA en mi flujo de trabajo (sin romantizarlo demasiado)

Escrito desde una cafetería en Málaga, un martes al mediodía, con el café ya frío y las notas del meetup de ayer todavía abiertas en otra pestaña.


La semana pasada asistí a una charla online sobre producción musical asistida por IA. El ponente era entusiasta. Demasiado entusiasta. Cada herramienta era "revolucionaria", cada flujo de trabajo era "el futuro". Salí de la sesión con más preguntas que respuestas y, lo que es peor, con ganas de probar todo yo mismo para ver qué era verdad y qué era marketing con sintetizador.

Llevo unas semanas integrando un Creador de Beats con IA en mi proceso habitual de producción. También he estado experimentando con un Creador de Letras generativo para ver cómo encajan ambas piezas. Lo que sigue no es una reseña. Es una lista de observaciones honestas, algunas útiles, algunas frustrantes, y una que todavía no sé cómo clasificar.


Las 14 observaciones

1. El primer beat generado siempre suena "correcto" y eso es exactamente el problema.

Correcto como un stock photo. Reconocible, inofensivo, sin aristas. El Creador de Beats con IA que estuve probando producía loops de 8 compases que técnicamente no tenían ningún fallo, pero que tampoco tenían ninguna personalidad. Útil como punto de partida. Peligroso si te quedas ahí.

2. El BPM por defecto tiende a gravitar hacia 90–95 o 128–132. Siempre.

No importa lo que le pidas. "Ambiente oscuro y lento" te da 90 BPM. "Energético y caótico" te da 128. Hay algo en el modelo que parece haber aprendido que esos rangos son "seguros". Cuando forcé manualmente 107 BPM para un proyecto de drum & bass experimental, el resultado fue... interesante. En el mal sentido. Tuve que reconstruir el patrón rítmico a mano desde el piano roll.

3. La integración con el DAW no es tan fluida como prometen.

Exporté los stems en WAV a 44.1kHz/24bit sin problema. Pero al importarlos en Ableton, dos de los cuatro stems tenían un offset de aproximadamente 23 milisegundos respecto al grid. No es mucho. Es suficiente para que el kick suene "raro" sin que sepas exactamente por qué. Lo detecté solo porque tengo la costumbre de revisar la forma de onda antes de escuchar. (Consejo gratis: hazlo siempre.)

4. El Creador de Letras es mejor de lo que esperaba, pero por razones equivocadas.

Lo usé para generar letras sobre una base de indie pop melancólico. El resultado no era poesía. Era funcional. Rimas predecibles, metáforas de catálogo. Pero —y aquí está lo interesante— me sirvió como andamiaje. Tomé tres líneas de las generadas, las reescribí completamente, y de alguna manera el hecho de tener algo malo delante me desbloqueó para escribir algo bueno. (El síndrome de la página en blanco tiene cura: llenala de basura primero.)

5. La coincidencia entre letra generada y melodía generada es, en el mejor caso, accidental.

Este fue el punto más frustrante de todo el experimento. Pedí al sistema que generara una melodía vocal y una letra para la misma canción, con el mismo prompt de estado de ánimo. El resultado: la melodía tenía frases de 7 sílabas, la letra tenía versos de 11. No encajaban. En absoluto. Tuve que reescribir la letra entera adaptándola al contorno melódico, o viceversa. No hay comunicación real entre el módulo de generación melódica y el Creador de Letras. Son dos sistemas que no se hablan.

6. Cuando el prompt es demasiado específico, el sistema se bloquea en lo literal.

Le pedí "flamenco fusionado con electrónica industrial, tempo irregular, en Mi frigio". Me dio algo que sonaba a flamenco de ascensor con un hi-hat cuantizado. El Mi frigio estaba ahí, técnicamente. Todo lo demás había desaparecido. Los modelos parecen procesar bien los géneros mainstream y mal las intersecciones complejas.

7. Los "emotion tags" son decorativos.

Seleccioné "melancólico", "nostálgico" y "tenso" para el mismo proyecto. Las tres versiones sonaban prácticamente iguales. Cambió el tempo en uno o dos BPM y el tipo de pad en el fondo. La etiqueta emocional parece afectar al timbre de superficie, no a la estructura armónica ni al arco dinámico de la pieza.

8. Regenerar con el mismo prompt da resultados radicalmente distintos.

Esto puede ser una ventaja o una pesadilla, dependiendo del día. En una sesión, regeneré el mismo prompt cuatro veces y obtuve cuatro beats que no tenían nada en común salvo el BPM. No hay forma de "refinar" iterativamente: cada generación es un reinicio. Si encuentras algo que funciona, descárgalo inmediatamente. Aprendí esto a las malas.

9. El ruido de fondo generado tiene una firma reconocible.

Hay un tipo de textura granular en los pads ambientales que aparece en casi todas las generaciones, independientemente del género. Una vez que lo identificas, no puedes dejar de escucharlo. Es como el watermark sonoro del modelo. Para disimularlo, paso los pads por un saturador analógico y recorto las frecuencias medias alrededor de 800Hz.

10. Probé MusicCreator AI en una sesión paralela para comparar el comportamiento del módulo de letras.

La diferencia más notable no estaba en la calidad de las letras en sí, sino en cómo estructuraba los versos. Mientras que la otra herramienta generaba bloques de texto sin jerarquía, aquí la salida ya venía dividida en estrofa, pre-coro y coro. Eso ahorra tiempo de organización, aunque el contenido siga necesitando reescritura.

11. La longitud de los loops generados raramente supera los 8 compases.

Para proyectos cortos, perfecto. Para una pieza de 4 minutos con desarrollo narrativo, es un problema. Terminé encadenando tres loops distintos y usando automatización de volumen para disimular las costuras. Funcionó, pero fue más trabajo del que hubiera necesitado si hubiera compuesto desde cero.

12. El Creador de Beats con IA es más útil a las 14:00 que a las 2:00.

No es metáfora. Con la cabeza despejada, lo uso como generador de ideas rápidas para evaluar si una dirección tiene potencial. De madrugada, con el juicio nublado, tiendo a aceptar outputs mediocres como si fueran buenos. La herramienta no cambia; mi capacidad de evaluación sí.

13. Nadie en el meetup mencionó el tiempo de corrección manual.

Eso me llamó la atención. Todo el mundo hablaba de velocidad de generación. Nadie habló de cuánto tiempo lleva revisar, corregir el offset del stem, reescribir la letra, ajustar el BPM, saturar los pads para que no suenen a demo. En mi experiencia, el tiempo de corrección es aproximadamente igual al tiempo que me habría llevado hacer esa parte desde cero. Lo que gano es en diversidad de puntos de partida, no en velocidad total.

14. Y sin embargo, sigo usándolo.

Porque esa diversidad de puntos de partida tiene valor real. Hay semanas en las que no tengo ni una idea. Cero. Y tener algo —aunque sea mediocre, aunque huela a stock— sobre lo que reaccionar es mejor que el silencio del proyecto vacío. El Creador de Letras me da frases que odio lo suficiente como para querer mejorarlas. El Creador de Beats con IA me da ritmos que me recuerdan lo que no quiero hacer. Eso también es información.


El número que me quedó dando vueltas

De las últimas doce canciones en las que usé alguna combinación de estas herramientas, en torno a ocho terminaron con menos del 30% del material generado en la versión final. En tres, no quedó nada del output original. En una sola, usé un loop casi sin modificar, y es la que menos me gusta del lote.

No sé si eso dice algo sobre las herramientas o sobre mí.

Probablemente sobre los dos.

Top comments (0)