两次踩雷,一次小伤一次差点翻车第一次是 2025 年 8 月。我在一台跑着甲方客户数据的 staging 机上用 Claude Code 做日志分析。当时设了 acceptEdits,以为”编辑自动通过,Bash 还是要问的”。然后让 Claude 清理 /var/log/app/ 下的老日志,它跑了一条 find /var/log -mtime +3...
做产品的都知道一个事:Claude 三个模型的单价差很大。Haiku 4.5、Sonnet 4.5、Opus 4.5 之间 input 价差大概是 1 : 3.75 : 18.75 这样。意思是一次 Opus 调用 = 18.75 次 Haiku 调用。
但大家看定价表经常陷入一个误区:以为便宜的模型就是性价比高。其实要看「每美元产生多少业务...
上个月帮客户做 MCP 架构评审,翻了一圈他们现有的 11 个 server。
看完我问:”为什么全部都只有 tools?”客户 AI 平台负责人愣了一下:”还能有别的?”
这不是他一个人的问题。我顺手扫了 GitHub 上 Star 数前 50 的公开 MCP server,46 个只实现了 tools,只有 4 个碰了 resources,实现了 ...
先说件真事,到现在我还有心理阴影。
上个月某个周四,我改了一个叫 code-summarizer 的 Skill,把输出格式从 markdown 改成了带前缀的结构化格式,想让下游更好解析。本地测了两个 case 觉得没问题,推了。
周五早上四个团队的人在群里炸了。他们有的工作流依赖这个 Skill 的 markdown 格式做正则提取,我一改,全挂。...
前年夏天做过一个电商评论情感分类的项目。客户要求不用微调,只能靠 prompt 解决。我最开始用零样本,就一句”判断下面这条评论是正面、负面还是中性”,跑了 500 条标注数据,准确率 68%。客户皱了皱眉,说能不能再高点。
我加了 3 条示例进去,升到 81%。再加到 5 条,到 89%。客户说够了够了,上线。
后来我自己出于好奇,又加到 10 条示...
去年 10 月一个朋友在做 Fintech 的创业公司找我。12 人研发,Node 做 API 层,Go 做结算核心,每周 PR 60-90 个。他们之前招了一个 senior 兼职做 code review,一周 20 小时,后来这哥们跳槽了,招不到合适的接棒。
CTO 问我:「你觉得 Claude 能不能顶上?我们不是要 AI 取代人,我们是真的找...
前情提要:我接了个任务,给公司 PR 流程做 Claude Code 自动化。
最开始我写了个叫 pr-helper 的 Skill,正文 2,817 字,把所有事儿都放里面——分析 diff、评估风险、写描述、建议测试、生成 changelog、推荐审阅人。一条龙。
跑起来就出事。
为什么单个大 Skill 干不动复杂工作流三个问题,越用越明显。
第...
公司 AI 平台组的 lead 上个月让我写个技术选型报告。
背景:团队要推一批内部 MCP server 给各业务线用,后端组 Python 强、前端和 infra 组 TS 强,到底哪个语言做标准栈?lead 的原话是”别拍脑袋,给我跑数据”。
我搞了三天,用 TS 和 Python 各搓了一版同功能 MCP server(操作公司内部 GitLa...
我上个月账单 2300 多美元,拆开看,Sonnet 4.6 占了 72%,Haiku 4.5 占 19%,Opus 4.7 只占 9%。这个比例跟一年前完全反过来——那会儿我还在迷信 Opus,什么活都往上堆,结果成本打到地板,很多任务 Sonnet 做得一样好。
这篇就讲讲怎么别犯我去年犯过的错。
2026 Q2 的真实价格先把数字摆出来,按百万 ...
92 分钟和 20 分钟的差距从哪来先把场景说清楚。甲方是一家上市物流公司的前端团队,他们两年前基于 Chakra UI 1.x 写了 340 个业务组件。Chakra 3 改了一大堆 API,emotion 换成 vanilla extract,<Box> 的 shorthand 全变了。
我第一天用 Claude Code 一个会话串行...
这个项目是去年 7 月接的。客户是一家做 HR SaaS 的公司,服务中小企业,月活企业 1200 家左右,月工单稳定在 2847 张(我拉了 6 个月均值)。
找到我之前他们已经做过一版客服机器人,用的是 GPT 套壳加几十条 FAQ,用户一问两句就转人工,首响转人工率 57%。销售副总跟我说:「这玩意基本等于没有。我们还是得养 8 个客服。」
我做...
去年 11 月第一次看到 Batch API 的定价时我挺激动的:input / output / cache 全线五折。对一个月跑两三千刀 API 费用的小团队来说,这相当于免费续命。
当晚我就把一个批量打 tag 的脚本改成了 batch 模式,第二天跑完发现结果顺序全乱了,而且有 3.2% 的条目返回了莫名其妙的错误。调了两天...