Deepgram 是开发者圈热门的实时 ASR API — Nova-3 模型在准确度跟延迟上顶尖。是很多语音 agent 产品的 STT 后端。有免费 credit,按用量计费。
编辑试用心得
做语音 agent 的人默认 STT — Nova-3 在流式用例真的强。定价合理。注意:纯批次转录录好的文件(podcast、会议),AssemblyAI 有更多「理解」功能(摘要、主题、情绪)、价格类似。
适合做什么
- real-time speech-to-text
- voice agent stt
- transcription api
评论
还没有人留评论。当第一个。
最后更新: 2026-04-29