OpenAI Realtime API 直接吃语音、回语音,不走 STT → LLM → TTS 三段管线 — 跟 ChatGPT 语音模式同模型。延迟更低、对话节奏更自然。按音频分钟计费。
编辑试用心得
对话自然度比绝对延迟重要时对 — 打断、停顿、情绪都会通过,不像三段管线会被消灭。比自建 STT+LLM+TTS 贵,要问:对你的产品,自然度是否值这个价。消费级语音应用、用户会察觉质量的场景,常常划算。
适合做什么
- voice-to-voice api
- realtime conversation
- voice agent
评论
还没有人留评论。当第一个。
最后更新: 2026-04-29