SeamlessM4T de Meta: traducción y transcripción en tiempo real
SeamlessM4T de Meta: traducción y transcripción en tiempo real

Meta desarrolla un traductor simultáneo de 101 idiomas y rompe las barreras idiomáticas

El lenguaje define nuestra cultura, identidad y forma de comunicarnos. Sin embargo, las barreras idiomáticas persisten en el mundo digital. Meta, con su iniciativa SeamlessM4T, busca derribar estas barreras.

Óscar Villegas

SeamlessM4T, el innovador modelo de traducción simultánea de Meta, ha recorrido un camino de progreso constante desde su presentación en agosto de 2023. En su lanzamiento inicial, ya permitía la traducción entre 101 idiomas, soportando diferentes formatos de entrada y salida, como texto a texto, voz a texto, voz a voz y texto a voz.

Desde entonces, la compañía de Mark Zuckerberg ha mejorado su modelo de inteligencia artificial y ahora SeamlessM4T se expande hacia la traducción voz a voz a 36 idiomas y aumenta su precisión. Un cambio muy importante que supone una transición hacia un modelo unificado; con una mejora en su precisión que puede llegar hasta el 23% y mejora en la latencia.

SeamlessM4T: traducción y transcripción en tiempo real

SeamlessM4T es un modelo de IA de Meta que se centra en la traducción y transcripción en tiempo real para 101 idiomas de entrada. Soporta traducción de voz a voz (speech-to-speech), de voz a texto (speech-to-text), de texto a voz (text-to-speech) y de texto a texto (text-to-text), cubriendo un amplio espectro de necesidades. Imagina conversar con alguien en otro idioma y escuchar la traducción al instante, o ver la transcripción de una conversación en tiempo real.

Ventajas de SeamlessM4T: precisión y eficiencia

SeamlessM4T, además de su gran tolerancia al ruido, permite un mejor rendimiento incluso en entornos o ambientes con interferencias. Actualmente SeamlessM4T ofrece:

  • Traducción voz a voz para 36 idiomas.
  • Traducción voz a texto para casi 100 idiomas.
  • Traducción texto a texto para casi 100 idiomas.
  • Traducción texto a voz para 35 idiomas además del inglés.

Para qué podemos utilizar SeamlessM4T

La capacidad de SeamlessM4T, para la traducción simultánea voz a voz, lo convierte en un candidato ideal para integrarse en plataformas de comunicación como Skype, Zoom, Google Meet y otras similares. Imagina una videoconferencia donde los participantes hablan diferentes idiomas, pero se entienden perfectamente gracias a la traducción en tiempo real.

La integración del modelo de Meta en estas plataformas eliminaría la necesidad de intérpretes o la incomodidad de las pausas para la traducción. Las conversaciones fluirían de forma natural, facilitando la colaboración y el intercambio de ideas entre personas de diferentes culturas e idiomas. Además, su capacidad para transcribir la conversación en tiempo real podría ser una herramienta invaluable para generar subtítulos y facilitar el acceso a personas con discapacidades auditivas.

Meta, además, integró capacidades de IA, incluyendo traducción en tiempo real, en sus gafas inteligentes Ray-Ban Meta pero no ha confirmado que hayan utilizado el modelo SeamlessM4T. El desarrollo de hardware específico con esta tecnología, tal vez, podría ser una dirección futura. A medida que la tecnología evoluciona, es posible que veamos en el futuro SeamlessM4T integrado también en dispositivos como altavoces inteligentes, wearables, dispositivos de realidad aumentada o virtual u otros.

Comparte este artículo