Moshi es el nuevo asistente de IA que podría redefinir la conversación digital
Kyutai irrumpe en la carrera de la inteligencia artificial con Moshi, una innovadora IA capaz de hablar y escuchar en tiempo real, desafiando a gigantes como OpenAI.
En el competitivo campo de la inteligencia artificial, una startup francesa está causando sensación. Kyutai, fundada en noviembre de 2023, ha lanzado Moshi, un asistente de IA que promete revolucionar la conversación digital. Respaldada por grandes nombres del mundo tecnológico y financiero, la empresa ha conseguido 300 millones de euros de inversión y se ha propuesto un ambicioso objetivo: redefinir la IA con un enfoque en código abierto y transparencia.
Moshi no es un asistente de IA cualquiera. Equipado con Helium, un modelo de lenguaje de 7,000 millones de parámetros, Moshi puede expresar hasta 70 emociones y estilos diferentes, procesando y generando audio y texto de manera simultánea. Esta capacidad le permite "pensar mientras habla", lo que representa un avance significativo en la interacción con máquinas. Con una latencia de solo 200 milisegundos, Moshi opera en tiempo casi real, superando lo que otras IA, como GPT-4o de OpenAI, aún no han logrado implementar.
Detrás de Kyutai se encuentra un equipo de destacados líderes en tecnología y negocios. Xavier Niel, fundador de Iliad, y Rodolphe Saadé, CEO de CMA CGM, son solo dos de los multimillonarios que han apostado por esta empresa. A ellos se suman Eric Schmidt, ex presidente ejecutivo de Google, y Patrick Pérez, exdirector de Valeo, quien ahora dirige Kyutai. Además, la dirección científica está a cargo de Hervé Jégou, antiguo miembro de Google DeepMind y Meta, quien aporta su vasta experiencia en el desarrollo de tecnologías avanzadas.
El camino hacia el desarrollo de Moshi ha incluido un entrenamiento intensivo con 100,000 conversaciones sintéticas "de estilo oral", además de 20 horas de grabaciones realizadas por una actriz de voz conocida únicamente como "Alice". Kyutai, sin embargo, ha sido discreta en cuanto a los detalles específicos de esta colaboración. No obstante, han asegurado que todas las creaciones de Moshi incorporan una marca de agua para indicar que son generadas por una IA, abordando así las preocupaciones éticas y de seguridad relacionadas con el contenido sintético.
En cuanto al futuro, Kyutai tiene grandes planes. La empresa planea liberar el código fuente de Helium, junto con su modelo de lenguaje, el códec de audio y todo el stack tecnológico, permitiendo que desarrolladores y empresas de todo el mundo contribuyan y mejoren la tecnología. Además, las versiones futuras de Moshi (1.1, 1.2 y 2.0) serán refinadas en base al feedback de los usuarios, con la intención de crear una licencia lo más permisiva posible para fomentar la adopción y la innovación.
Moshi no solo marca un avance en el ámbito de la IA conversacional, sino que también representa un desafío directo al dominio de Silicon Valley. Con un enfoque en la transparencia y el código abierto, y respaldada por figuras influyentes, Kyutai está posicionando a Europa como un jugador clave en el futuro de la inteligencia artificial. Con esta estrategia, Kyutai no solo busca innovar, sino también equilibrar el poder tecnológico entre continentes, y Moshi es su carta fuerte para lograrlo. Por ahora, aquellos interesados pueden probar esta revolucionaria IA en línea y formar parte de una nueva era en la conversación digital.