Una startup llamada Palabra AI, que desarrolla un motor de traducción de voz con IA, está abordando uno de los aspectos más difíciles de enseñar modelos de idiomas a gran escala (LLM) para comprender múltiples idiomas.
Hoy, LLM hace que el texto sea más fácil de convertir de un idioma a otro, pero según Alexis Ohanian, cofundador de Reddit, la traducción del habla no es tan simple.
«La IA puede generar contenido y traducir texto. Sin embargo, la traducción (Voice) es un problema único porque requiere el cambio de lenguaje en tiempo real y el audio también debe ser de corazón humano», dijo Ohanian.
Ohanian y su compañía de riesgo Seven Seven Six (776) creen que Palabra Ai podría ser la respuesta a la pregunta. Es por eso que la compañía lidera la startup en una ronda de semillas de $ 8.4 millones. En la ronda, los participantes de Creator Ventures se unieron en conjunto con inversores individuales, incluido el cofundador de Instacart, Max Mullen, la ex socia de A16Z Anne Lee Skates y el ex jefe de productos de Mehdi Ghissassi.
Ohanian, de Seven Seven Six, también señaló que la combinación de la ejecución de productos de Palabra y la experiencia en el equipo requiere que la compañía invierta.
«Con Palabra, la capa de traducción funciona muy bien. La compañía tiene un poderoso equipo de investigación de inteligencia artificial que hace un trabajo de alta calidad, centrándose en el habla. Además, las nuevas empresas han hecho una gran opción en el diseño del producto y la calidad de la producción», agregó.
Parabra fue fundada en 2023 por Artem Kukharanko y Alexander Kabakov. Kukharanko, una ex ingeniera de aprendizaje automático en Samsung, dijo que vive en varios países como un nómada digital y enfrenta problemas con su idioma. Así que quería combinar experiencias de aprendizaje automático para resolver traducciones en tiempo real.
Eventos de TechCrunch
San Francisco
|
27-29 de octubre de 2025

«Muchas otras compañías han tratado de resolver el problema de la traducción. Sin embargo, al combinar varias tecnologías, como las API de voz a texto y texto a voz durante la traducción, el número de latencia aumentó y la traducción no fue en tiempo real.
Kukharanko agregó que la compañía ha creado una tubería de datos personalizada para permitir a las nuevas empresas agregar fácilmente soporte para nuevos idiomas en cuestión de semanas. Dijo que al final de esta tubería, Parabra colocará a un intérprete humano verificando la calidad de la salida. La startup dice que el algoritmo también explica una variedad de escenarios, como entornos ruidosos e interrupciones.
Palabra AI tiene productos de traducción de consumidores y comerciales. La compañía ofrece aplicaciones de escritorio para Mac y Windows. Funciona con aplicaciones populares de videollamadas como Google Meet, Zoom, Discord, Slack y Microsoft Teams. La aplicación puede admitir la traducción en más de 30 idiomas. Esto significa que puede escuchar a las personas hablar en su idioma nativo en su idioma elegido. Esto es útil para las llamadas que involucran a participantes de diversas nacionalidades.

Palabra dice en su sitio web que la aplicación de escritorio pronto admitirá funciones de traducción nativa para sitios de contenido como YouTube, Netflix, Twitch y Vimeo.
Obtenga 30 minutos de transferencias gratuitas cada mes. Con el límite, puede pagar los planes a partir de $ 25 al mes por traducciones de 60 minutos en la aplicación.
Las nuevas empresas proporcionan API y SDK a las empresas para integrar la traducción en sus productos.
Hoy, la tecnología impulsa plataformas de video como Agora para transmisiones multilingües en vivo. Además, los proveedores de servicios de idiomas como GIS Group utilizan las herramientas de Palabra junto con los intérpretes humanos. La compañía dijo que múltiples organizadores de eventos también utilizarán la tecnología para proporcionar flujos multilingües.
Parabra está en una dura competencia en el mercado de traducción. Al final de los consumidores, las nuevas empresas como EZDubs, con el apoyo de Y-Combinator, están creando aplicaciones que funcionan para cara a cara o llamadas. A principios de este año, Google comenzó la traducción en tiempo real de videocamas para el torneo. Al final del negocio, startups como Camb.ai, con sede en Dubai, están construyendo tecnología de traducción para transmitir eventos en vivo en múltiples idiomas.
Para destacarse, Palabra está trabajando actualmente en un nuevo modelo de predicción de transmisión, que podría dar lugar a reducciones dramáticas en la latencia. También estamos trabajando para apoyar la traducción de más de 10,000 transmisiones de audio simultáneas.
¡Constantemente apuntamos a evolucionar y puede ayudarnos proporcionando información sobre TechCrunch y su perspectiva y comentarios sobre nuestra cobertura y eventos! ¡Complete esta investigación para hacernos saber cómo estamos y tener la oportunidad de ganar un premio a cambio!
Source link
