La clonación de voces se está abriendo camino en una industria adyacente al entretenimiento: el mundo de la música. En un acuerdo histórico, SoundLabs AI, una startup de música con inteligencia artificial, proporcionará a la amplia lista de músicos de Universal Music Group una gama de nuevas tecnologías, incluida una función de «transposición de idioma».
La próxima característica de SoundLabs, MicDrop, permite a los artistas usar sus propias voces para crear patrones vocales. Estos modelos, también conocidos como clones de voz, no estarán disponibles al público.
Esta cláusula es un claro guiño a las preocupaciones expresadas por muchos profesionales creativos, como los actores, que temen que su imagen pueda ser utilizada sin su permiso.
Una vez creado un clon de voz, un artista (o un productor, con el consentimiento del artista) puede modificarlo y adaptarlo para diferentes usos. Por ejemplo, la funcionalidad MicDrop incluye funciones como voz a instrumento, que permite que una voz imite diferentes instrumentos, así como voz a canto.
MicDrop, descrito como «un complemento vocal de IA de vanguardia», también ofrece lo que SoundLabs llama «transposición lingüística». Según un comunicado de prensa de UMG del 18 de junio de 2024, esta función «podría ayudar a los artistas a lanzar canciones en todo el mundo sin barreras idiomáticas».
Ni SoundLabs ni UMG han desarrollado la tecnología detrás de MicDrop, pero es lógico que se base en investigaciones anteriores y avances recientes en la traducción de voz. Esta tarea ha experimentado mejoras notables desde 2022, una oleada de actividad inversora (particularmente para el doblaje automático) y una competencia continua entre gigantes tecnológicos como Google, Meta y Alibaba.
«¡Estamos encantados de asociarnos con Universal Music Group para ofrecer a sus artistas modelos de IA vocal capacitados éticamente!» exclamó SoundLabs en LinkedIn.
Un equipo unido y reservado
SoundLabs mantiene un perfil bajo, salvo los nombres de sus cofundadores. El director ejecutivo, BT (también conocido como Brian Transeau), es un productor, compositor, compositor y desarrollador de software electrónico nominado al Grammy, con un currículum que incluye trabajos con artistas como Madonna, Sting y David Bowie.
El desarrollador principal Michael Hetrick, PhD, y el director de innovación, Joshua Dickinson, son desarrolladores de software igualmente célebres y cofundadores de Unfiltered Audio, que desarrolla herramientas de audio creativas. Completando el equipo está la directora de operaciones (y esposa de BT), Lacy Transeau, quien también sirve como enlace con los artistas.
En una entrevista de mayo de 2024 con MusicTech, BT compartió que SoundLabs había cerrado una ronda previa a la semilla y se burló, sin nombrar, de MicDrop, diciendo que la compañía ha «construido diligentemente algunas tecnologías tradicionales de DSP y aprendizaje automático/inteligencia artificial extremadamente nueva en una suite». de complementos».
Y añadió: «Estas son tecnologías que cambian totalmente las reglas del juego, ninguna de las cuales es tecnología de cara al público actualmente disponible para los fabricantes. (…) Decir que estoy entusiasmado con ellas es quedarse corto del siglo».
Rolling Stone informó que los artistas de UMG tendrán acceso a MicDrop «a finales de este verano». Por ahora no hay disponible una versión beta, aunque los posibles usuarios pueden apuntarse en una lista de espera.