OpenAI lanza agente de voz
El 21 de marzo a la 01:00 (UTC+8), OpenAI realizó una transmisión técnica en vivo y lanzó tres nuevos modelos de voz específicamente para desarrollar Agentes de Voz de IA. Dos son modelos de voz a texto, GPT-40 Transcribe y GPT-4 Mini Transcribe; uno es un modelo de texto a voz, GPT-40 Mini TTS. Cabe mencionar que los desarrolladores pueden controlar la emoción y el estilo vocal del modelo GPT-40 Mini TTS. OpenAI ha añadido un potente modo de transmisión a su API de voz a texto, permitiendo a los desarrolladores introducir flujos de audio continuos en el modelo en tiempo real, y el modelo también puede devolver texto y respuestas continuas en tiempo real. Esta característica de interacción en tiempo real es muy útil para aplicaciones que requieren retroalimentación inmediata, como sistemas de diálogo de voz en tiempo real, transcripción de reuniones de voz, etc. (Comunidad Abierta AIGC)
Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.
También te puede gustar
Walrus: El sitio web para reclamar el airdrop de WAL ya está abierto
Walrus pronto lanzará la función de recompensas por staking de WAL
En tendencia
MásPrecios de las criptos
Más








