GeboArt.Dev

[ad_1]

Este martes 22 de agosto Mark Zuckerberg anunció que Meta está lanzando para sus productos el traductor hecho con IA, SeamlessM4T, que trabaja con más de 100 idiomas, y permite no solo la traducción, sino que además transformación en audio y transcripción.

Disponible en código abierto junto con SeamlessAlign, un nuevo conjunto de datos de traducción, Meta afirma que SeamlessM4T representa un «avance significativo» en el campo de la conversión de voz a voz y voz a texto impulsadas por IA.

«Nuestro modelo único proporciona traducciones bajo demanda que permiten a las personas que hablan diferentes idiomas comunicarse de manera más efectiva», escribe Meta en una publicación de blog. «SeamlessM4T reconoce implícitamente los idiomas de origen sin la necesidad de un modelo de identificación de idiomas separado».

Imagen utilizada con permiso del titular de los derechos de autor

Este traductor se basa en Massively Multilingual Speech, el marco de Meta que proporciona tecnología de reconocimiento de voz, identificación de idiomas y síntesis de voz en más de 1.100 idiomas.

Los investigadores alinearon 443,000 horas de habla con textos y crearon 29,000 horas de alineaciones de «voz a voz», que «enseñaron» a SeamlessM4T cómo transcribir voz a texto, traducir texto, generar voz a partir de texto e incluso traducir palabras habladas en un idioma a palabras en otro idioma.

«Con resultados de vanguardia, creemos que SeamlessM4T es un avance importante en la búsqueda de la comunidad de IA hacia la creación de sistemas multitarea universales», escribió Meta en la publicación del blog.






[ad_2]

Source link


Descubre más desde GeboArt.Dev

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Ir al contenido