Mistral 把新的中阶模型 Medium 3.5 跟他们称为「vibe remote agents」的功能一起推 — 在 chat 窗口外长时间跑的 agentic 工作流。这个 framing 把 Mistral 放进跟 OpenAI operator、Anthropic computer-use Claude 同一个对话里。
对 builder 来说,实际问题是 Medium 3.5 在 agent 任务上能不能拉近跟 Sonnet 级模型的成本-质量差距。HN 早期反应好坏参半 — 有人赞定价,有人指出 benchmark 不算完全对等比较。如果你 production 已经在跑 Mistral,值得实测。
对华语圈开发者来说,Mistral 仍是少数中文表现过得去的非美国前沿选项,值得跟 Qwen、DeepSeek 在你的 agent 场景并排评估一次。