Voicebox, la IA de Meta para optimizar la edición de audio
Esta tecnología tiene el potencial de transformar la forma en que interactuamos con el audio.
Voicebox, la innovadora creación de Meta, ha llegado para revolucionar el mundo del sonido. Este modelo generativo de Inteligencia Artificial (IA) ofrece una amplia gama de funciones que pueden ayudar a los creadores de contenido, editores de video y sonidistas a mejorar sus pistas de audio.
Una de las aplicaciones más destacadas de Voicebox es su capacidad para ayudar a las personas con discapacidad visual a escuchar los mensajes de sus amigos utilizando sus propias voces. Además, puede facilitar la comunicación en idiomas extranjeros sin necesidad de conocerlos, permitiendo a las personas hablar utilizando su propia voz.
Meta ha destacado las siguientes características principales de Voicebox:
- Con tan solo unos segundos de muestra de audio, Voicebox puede adaptar el estilo de audio y utilizarlo para generar texto a voz.
- Voicebox puede recrear partes de un discurso interrumpido por ruido o sustituir palabras mal pronunciadas sin necesidad de volver a grabar todo el discurso.
- Al proporcionar una muestra de habla de una persona y un pasaje de texto en diferentes idiomas como inglés, francés, alemán, español, polaco o portugués, Voicebox puede leer el texto en cualquiera de esos idiomas, incluso si la muestra de habla y el texto están en idiomas diferentes.
- Gracias a su entrenamiento con una amplia variedad de datos, Voicebox puede generar un habla más representativa de cómo las personas se expresan en el mundo real en los seis idiomas mencionados.
La capacidad de Voicebox para realizar tareas de generación de habla, como edición, muestreo y estilización, no fue diseñada específicamente, sino que ha sido aprendida a través del contexto.