La humanidad está comenzando a implementar el «modo de voz» en su aplicación Claude Chatbot.
Según la cuenta oficial de Anthrope en X, el modo de voz (ahora beta) permite que los usuarios de aplicaciones móviles de Claude tengan «conversaciones completas de idioma hablado con Claude», y llegarán al inglés en las próximas semanas.
Al menos un usuario en X informa que podrá acceder al modo de audio el martes por la noche. Por defecto, está equipado con 4 modelos antrópicos de soneto Claude.
«Modo de audio … puedes hablar con Claude y escuchar la respuesta a través del audio, lo que facilita el uso de Claude cuando tus manos están ocupadas, pero no en tu mente», dice la página de soporte. «El modo de voz traduce la forma en que interactúas con Claude. Muestra puntos clave en la pantalla para que Claude pueda hablar (y) hablar con Claude y escuchar la respuesta de voz de Claude».
Muchas compañías de IA, incluida OpenAI, ofrecen experiencias de chat de voz para sus respectivos chatbots. Por ejemplo, Google tiene Gemini Live y XAI tiene el modo de voz de Grok. Usando cada uno, los usuarios interactúan con el bot hablando en lugar de escribir, haciendo que la conversación se sienta más natural e intuitiva.
El sabor del modo de voz de Anthrope permite a los usuarios chatear sobre documentos, imágenes y más, y elegir entre cinco opciones de audio diferentes. Los usuarios también pueden alternar entre texto y audio en la marcha y ver la transcripción y el resumen después de la conversación.
Hay ciertas limitaciones para la característica. Las conversaciones de voz cuentan para los límites de uso normal: la humanidad dice que 20-30 conversaciones son algo que la mayoría de los usuarios libres pueden esperar. Además, solo los suscriptores de Claude pagados pueden usar el Connector del espacio de trabajo de Google, que permite que el modo de voz acceda a las citas del calendario de Google y los correos electrónicos de Gmail (la integración de Google Docs es solo para los planes empresariales de Claude).
En una entrevista con el Financial Times a principios de marzo, el CPO de la humanidad, Mike Krieger, confirmó que está trabajando en las capacidades de audio de Claude. La humanidad debía consultar con Amazon, el principal inversor y socio de la compañía y la startup de IA centrada en la voz Elevenlabs, para promover las capacidades de voz futuras de Claude, según el informe.
No está claro cuál de estas asociaciones ha llegado a buen término.