Haiku 4.5、Sonnet 4.6、Opus 4.7 到底怎么选

Claude 中文知识站 Lv4

我上个月账单 2300 多美元,拆开看,Sonnet 4.6 占了 72%,Haiku 4.5 占 19%,Opus 4.7 只占 9%。这个比例跟一年前完全反过来——那会儿我还在迷信 Opus,什么活都往上堆,结果成本打到地板,很多任务 Sonnet 做得一样好。

这篇就讲讲怎么别犯我去年犯过的错。

2026 Q2 的真实价格

先把数字摆出来,按百万 tokens 计:

  • Haiku 4.5:输入 1 美元 / 输出 5 美元
  • Sonnet 4.6:输入 3 美元 / 输出 15 美元
  • Opus 4.7:输入 15 美元 / 输出 75 美元

注意这里有几个坑,我去年是一个一个踩过的:

输出永远比输入贵 5 倍。这意味着如果你让模型写长文,成本主要花在输出上。我帮一个朋友算过,他让 Opus 输出 10 万 tokens 的研报,光一次就是 7.5 美元,一天跑 20 份就是 150 刀,一个月 4500 刀——然后他发现 Sonnet 跑出来的东西他客户根本看不出差别。

Opus 是 Sonnet 的 5 倍。不是”稍贵一点”,是 5 倍。这个倍数值不值你得算一下。

缓存 token 单独计价,这个很多人不知道,我专门写过一篇 prompt caching 深度指南,上下文重复度高的场景能省 80% 以上。

速度实测,不是官方宣传数字

我在 us-east-1 附近的 VPS 上用同一段 2000 字中文输入做 streaming 压测,20 次取中位数:

  • Haiku 4.5:约 1100 tok/s,首字延迟 300ms 左右
  • Sonnet 4.6:约 720 tok/s,首字 600ms
  • Opus 4.7:约 230 tok/s,首字 1.2s

Haiku 的 1100 tok/s 是什么概念?一个 500 字的中文回答,它 0.5 秒就输出完了,比你眨眼慢一点。这就是为什么我把所有”用户界面里要让人感觉没延迟”的交互都挂 Haiku。

Opus 的 230 tok/s 慢吗?慢,但它做的事一般值得等。我让它分析一份复杂合同,等 8 秒出一段推理清晰的判断,我愿意等。如果同样的活让 Haiku 做,它可能 1 秒给我一段但结论是错的——那就没意义。

按任务类型的选型决策树

我自己画了一棵树,给团队新人讲过好多次,大致这样:

第一问:这个任务错了会怎样?

  • 错了客户要投诉/打官司/赔钱 → 直接 Opus,不要省这个钱
  • 错了我自己修一下就行 → 往下看

第二问:这个任务每天跑多少次?

  • 每天 10 万次以上 → 无脑 Haiku,成本压不下来就 run 不起
  • 每天几十到几千次 → Sonnet
  • 每天几次到几十次,但每次很重要 → Opus

第三问:用户在等结果吗?

  • 用户在界面上盯着进度条 → Haiku 或 Sonnet,不要 Opus
  • 是后台批处理,用户不等 → 按复杂度选

这套问下来 90% 情况能定。剩下 10% 是边界案例,比如”每天跑几千次但每次都很重要”,这种我一般会用 Haiku 路由再向上 fallback 的方案——先让 Haiku 判断难度,难的才交给 Sonnet 或 Opus。

我自己项目里三档各占多少

我手里几个活的的比例,给你做参考:

客服机器人(日均 8 万次对话):Haiku 90%,Sonnet 10%(遇到 Haiku 判断不了的升级路由)。Opus 0%,完全用不上。

合同审查工具(日均 30 份):Sonnet 60%,Opus 40%。重要条款和有争议的部分交给 Opus,一般条款 Sonnet 搞定。

我用 Sonnet 当日常生产力主力的内容生成管线(日均 200 篇):Sonnet 95%,Opus 5%(只有长篇深度文章会用 Opus)。

内部 RAG 知识库问答(日均 3000 次):Haiku 70% 做初筛和简单问答,Sonnet 30% 做复杂推理。

加起来的综合比例就是我前面说的 Sonnet 72% / Haiku 19% / Opus 9%。Sonnet 4.6 确实是 2026 年的主力驮马。

几个我踩过的坑

坑一:别用 Opus 做简单翻译。我早期把 Opus 当万能钥匙用,翻译几百字的产品说明都上 Opus,一个月多花 400 多美元。换成 Haiku 之后质量基本没降。

坑二:别用 Haiku 做多步推理。去年我图便宜让 Haiku 做一个”读完合同→提取条款→判断风险→输出报告”的四步任务,结果第二步之后的上下文它就开始忘,最后给出的风险判断全是瞎说。这种活交给 Sonnet 稳得多。

坑三:Opus 不是任何时候都比 Sonnet 强。在我做过的一批代码审查任务里,Sonnet 4.6 的表现反而比 Opus 4.7 更一致——Opus 偶尔会想得太多,加一堆用户没问的建议。

最后的建议

如果你刚上手,别纠结这个选择。先所有任务都丢给 Sonnet 4.6,跑两周看账单和效果。然后把账单里贵的那几个任务挑出来:

  • 质量够了但太贵 → 降级到 Haiku 试试
  • 质量明显不够 → 升级到 Opus 试试

不要一上来就做复杂的路由方案,先用最简单的规则跑顺了再优化。

想系统学 Claude?

已经选定了模型,下一步可以看15 分钟跑通第一个 API 请求。要把成本再打下来一半,Haiku 路由降本实战这篇是我项目里真的在用的方案。把 Sonnet 的日常用法榨干,可以接着看Sonnet 日常生产力主力的 20 种用法

  • 标题: Haiku 4.5、Sonnet 4.6、Opus 4.7 到底怎么选
  • 作者: Claude 中文知识站
  • 创建于 : 2026-04-18 14:37:00
  • 更新于 : 2026-04-19 11:20:00
  • 链接: https://claude.cocoloop.cn/posts/claude-family-haiku-sonnet-opus/
  • 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。
评论