Anthropic 今天上线 Claude Opus 4.7,旗舰级正式吃到 1M token 上下文。之前这个功能只有 Sonnet 用户在 beta 拿得到,Opus 付旗舰价格反而卡在 200K,被社群抱怨很久。
这次 release notes 点名几个跑分有实质进步:SWE-bench Verified 比 4.6 高 3.2 分、Terminal-Bench、加上一个新的内部「多日 agent 任务」基准。价格维持 $15/$75 per million input/output,但超过 200K 后跳到 $30/$150,跟 Sonnet 的长上下文分级一样。
对中文圈开发者实际的问题是:Opus 4.7 在 agentic coding 上有没有真的赢过 Sonnet 4.5(Sonnet 便宜很多)。社群初步测试指出大型 codebase 任务 Opus 赢,日常 refactor Sonnet 还是够用。换进 CI pipeline 前先跑一轮结构化评估比较保险。