DeepL, una empresa de traducción mejor conocida por sus herramientas de texto, lanzó hoy un paquete de traducción de voz a voz que cubre casos de uso como reuniones, conversaciones móviles y web, y conversaciones de grupos de trabajadores de primera línea a través de aplicaciones personalizadas. La compañía también está lanzando una API que permite a las empresas y desarrolladores externos aprovechar la tecnología de DeepL para casos de uso personalizados, como centros de llamadas.
«La voz fue un paso natural para nosotros después de pasar años trabajando en la traducción de textos», dijo el director ejecutivo de DeepL, Jarek Kutylowski, a TechCrunch en una entrevista. «Hemos recorrido un largo camino en lo que respecta a la traducción de textos y documentos, pero pensamos que había un gran producto para la traducción de voz en tiempo real».
Kutylowski dijo que los desafíos en la creación de productos de traducción en tiempo real se centran en lograr un equilibrio entre reducir la latencia (el retraso entre alguien que habla y el audio traducido que se reproduce) y mantener resultados precisos.
DeepL lanza complementos para plataformas como Zoom y Microsoft Teams. Los oyentes pueden escuchar traducciones en tiempo real mientras otros oyentes hablan en su idioma nativo, o pueden seguir el texto traducido en tiempo real en la pantalla. Actualmente, el programa se encuentra en acceso temprano y la compañía está invitando a organizaciones a unirse a su lista de espera. La empresa también ofrece productos para conversaciones móviles y basadas en la web que se producen en persona o de forma remota.
DeepL permite a los usuarios participar en conversaciones grupales en entornos como sesiones de capacitación y talleres, donde los participantes pueden participar a través de códigos QR.
DeepL dijo que su tecnología de síntesis de voz también puede aprender y adaptar términos específicos de la industria y vocabulario personalizado, como nombres personales y de empresas.
Kutylowski dijo que la IA está reinventando cómo será el servicio al cliente en los próximos años. Señaló que una capa de traducción puede ayudar a las empresas a brindar soporte en idiomas donde el personal calificado es escaso y costoso de contratar.
evento de crisis tecnológica
San Francisco, California
|
13-15 de octubre de 2026
La compañía dijo que controla toda la pila entre voces. Sin embargo, los sistemas actuales convierten la voz en texto, aplican traducciones y luego vuelven a convertirla en voz. DeepL lleva muchos años trabajando en la traducción de textos, por lo que creemos que tenemos una ventaja en la calidad de la traducción. En el futuro, la empresa espera desarrollar un modelo de traducción de voz de un extremo a otro que omita por completo el paso del texto.
DeepL se enfrenta a la competencia de varias nuevas empresas bien financiadas que operan en rincones adyacentes del espacio. Sanas, que el año pasado recaudó 65 millones de dólares de Quadrille Capital con la participación de Teleperformance, utiliza IA para corregir el acento de un hablante en tiempo real, una herramienta dirigida principalmente a agentes de centros de llamadas.
Camb.AI, con sede en Dubai, se centra en la síntesis de voz y la traducción para empresas de medios y entretenimiento, ayudándolas a doblar y localizar contenido de vídeo a escala.
Palabra, respaldada por la empresa Seven Seven Six del cofundador de Reddit, Alexis Ohanian, está construyendo un motor de traducción de voz en tiempo real diseñado para preservar tanto el significado como el audio original del hablante, lo que lo pone en competencia más directa con lo que DeepL está construyendo actualmente.
La historia se ha actualizado para reflejar que Teleperformance se ha unido a la ronda.
Source link
