OpenAI Realtime API 直接吃語音、回語音,不走 STT → LLM → TTS 三段管線 — 跟 ChatGPT 語音模式同模型。延遲更低、對話節奏更自然。按音訊分鐘計費。
編輯試用心得
對話自然度比絕對延遲重要時對 — 打斷、停頓、情緒都會通過,不像三段管線會被消滅。比自建 STT+LLM+TTS 貴,要問:對你的產品,自然度是否值這個價。消費級語音應用、使用者會察覺品質的場景,常常划算。
適合做什麼
- voice-to-voice api
- realtime conversation
- voice agent
評論
還沒有人留評論。當第一個。
最後更新: 2026-04-29