Entre 2002 y 2005, dirigí un sitio web de música en el que los visitantes podían enviar títulos de canciones sobre los que yo escribía y grababa una tonta canción. En las notas de mi primer CD, publicado en 2003, escribí sobre el día en que los ordenadores me dejarían fuera de juego, produciendo música automáticamente a un ritmo que yo no podría alcanzar. Aunque ya no publico música en ese sitio, ese día está a punto de llegar.

Un grupo de antiguos empleados de DeepMind lanzaron Udio, un nuevo servicio de síntesis musical por inteligencia artificial (IA) capaz de crear novedosas piezas de audio musical de alta calidad a partir de mensajes escritos, incluidas letras proporcionadas por el usuario. Es similar a Suno, la IA de audio de Microsoft. Con algunas aportaciones humanas, Udio puede crear imitaciones de música producida por humanos en géneros como el Country, cuarteto de barbería, pop alemán, clásica, rock duro, hip hop, melodías de espectáculos y más. Actualmente, su uso es gratuito durante un periodo beta.

Udio está asustando a algunos músicos en Reddit. Tal como el Suno, Udio es exactamente el tipo de servicio de generación de música mediante IA que más de 200 artistas musicales temían cuando firmaron una carta abierta de protesta la semana pasada.

Pero por muy impresionantes que parezcan las canciones de Udio, desde un punto de vista técnico de generación por IA y sin juzgar sus méritos musicales, su capacidad de generación no es perfecta. Experimentamos con su herramienta de creación y los resultados nos parecieron menos impresionantes que los creados por Suno. Las muestras musicales de alta calidad que se muestran en el sitio web de Udio son probablemente el resultado de una gran cantidad de aportaciones humanas creativas (como letras escritas por humanos) y de la selección de las mejores partes compositivas de canciones de entre muchas generaciones. De hecho, Udio establece un flujo de trabajo de cinco pasos para crear una canción de 1,5 minutos en una sección de preguntas frecuentes.

Para Ars Technica creamos la canción «Moonshark» en Udio, utilizando el mismo procedimiento que aplicamos con Suno. El resultado suena a medio cocer y casi a pesadilla. Además es mucho más corto por defecto, 32 segundos, comparado con el resultado de 1 minuto y 32 segundos de Suno. Eso sí, Udio permite ampliar las canciones, o puedes volver a intentar generar un resultado pobre con diferentes indicaciones para obtener resultados distintos.


Patrón de auriculares inalámbricos blancos sobre fondo amarillo

Ya hay innumerables canciones en Spotify, Apple Music y SoundCloud. Y como cada vez es más fácil crear melodías, cualquiera puede sumarse al ruido provocado sobre los derechos de autor.


De oyente a productor

Tras registrar una cuenta en Udio, cualquiera puede crear un tema introduciendo un texto con o sin letra, la dirección de la historia y etiquetas de género musical. A continuación, Udio aborda la tarea en dos fases. En primer lugar, utiliza un modelo de lenguaje amplio (LLM) similar al de ChatGPT para generar la letra a partir del texto introducido, en caso de ser necesario. A continuación, sintetiza la música utilizando un método que Udio no revela, pero que probablemente sea un modelo de difusión similar al de Stable Audio de Stability AI.

A partir de la indicación dada, el modelo de IA de Udio genera dos fragmentos de canción distintos para que elijas. Puedes publicar la canción con la comunidad Udio, descargar el archivo de audio o video para compartirlo en otras plataformas, o compartirlo directamente en tus redes sociales. Otros usuarios de Udio también pueden remezclar o ampliar canciones existentes. Las condiciones de servicio de Udio dicen que la empresa no reclama ningún derecho sobre las generaciones musicales y que pueden utilizarse con fines comerciales.

Aunque el equipo de Udio no ha revelado los detalles concretos de su modelo ni los datos de entrenamiento, que probablemente estén repletos de material protegido por derechos de autor, ha declarado a Tom’s Guide que el sistema tiene medidas integradas para identificar y bloquear las pistas que se parecen demasiado al trabajo de determinados artistas, lo que garantiza que la música generada siga siendo original.


Discos de vinilo.

Un análisis de 353 mil letras de canciones de cinco géneros musicales durante los últimos 40 años aporta evidencia sobre la naturaleza de la música pop actual.


Y eso nos lleva de nuevo a los humanos, algunos de los cuales no están tomando muy bien la llegada de la música generada por la IA. «Tengo que ser sincero, esto es deprimente. Sigo siendo optimista y creo que la música saldrá bien a largo plazo. Pero, ¿por qué hacer esto? ¿Por qué automatizar el arte?, escribió un comentarista de Reddit en un hilo sobre Udio.

Nos arriesgaremos a responder diciendo que replicar el arte es un objetivo clave para la investigación de la IA, porque los resultados pueden ser inexactos e imprecisos y seguir pareciendo notables o asombrosos, que es una característica clave de la IA. Es llamativa y de aspecto impresionante, al tiempo que permite una falta general de rigor cuantitativo. Ya hemos visto IA para imágenes fijas, vídeo y texto con resultados variados en cuanto a precisión representativa. Las grabaciones musicales totalmente compuestas parecen ser las siguientes en la lista de colinas de la tecnología generativa por conquistar y la competencia se está calentando.

Artículo publicado originalmente en Ars. Technica. Adaptado por Alondra Flores.

Por Agencias

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *