Voicebox, la IA de Meta para optimizar la edición de audio

Esta tecnología tiene el potencial de transformar la forma en que interactuamos con el audio.

22 de June del 2023

Twittear

E-mail

Copiar url

Voicebox, la IA de Meta para optimizar la edición de audio

Voicebox, la innovadora creación de Meta, ha llegado para revolucionar el mundo del sonido. Este modelo generativo de Inteligencia Artificial (IA) ofrece una amplia gama de funciones que pueden ayudar a los creadores de contenido, editores de video y sonidistas a mejorar sus pistas de audio.

Una de las aplicaciones más destacadas de Voicebox es su capacidad para ayudar a las personas con discapacidad visual a escuchar los mensajes de sus amigos utilizando sus propias voces. Además, puede facilitar la comunicación en idiomas extranjeros sin necesidad de conocerlos, permitiendo a las personas hablar utilizando su propia voz.

Meta ha destacado las siguientes características principales de Voicebox:

- Con tan solo unos segundos de muestra de audio, Voicebox puede adaptar el estilo de audio y utilizarlo para generar texto a voz.

- Voicebox puede recrear partes de un discurso interrumpido por ruido o sustituir palabras mal pronunciadas sin necesidad de volver a grabar todo el discurso.

- Al proporcionar una muestra de habla de una persona y un pasaje de texto en diferentes idiomas como inglés, francés, alemán, español, polaco o portugués, Voicebox puede leer el texto en cualquiera de esos idiomas, incluso si la muestra de habla y el texto están en idiomas diferentes.

- Gracias a su entrenamiento con una amplia variedad de datos, Voicebox puede generar un habla más representativa de cómo las personas se expresan en el mundo real en los seis idiomas mencionados.

La capacidad de Voicebox para realizar tareas de generación de habla, como edición, muestreo y estilización, no fue diseñada específicamente, sino que ha sido aprendida a través del contexto.

MÁS EN Innovación

Nueva tecnología podría ayudar a la NASA a encontrar planetas habitables

Moonshot presenta Kimi K3: el modelo de IA abierto más grande del mundo

Crean la primera célula sintética con ciclo de vida completo

Apple presenta iOS 27 con nueva Siri AI y más en la WWDC 2026

Computex 2026 convierte a Taiwán en el epicentro global de la IA

¿Los smartphones modulares por fin tienen futuro? El concepto de Tecno reabre el debate