写了小半年 Agent SDK,给各种 agent 加过大概 30 多个自定义工具。有给数据库查询的,有拉监控指标的,有调内部 RPC 的,也有跑机器学习推理的。加得多了,就摸出四种主要的加法。
每种我都用过至少两三次,踩过的坑也各不相同。今天摊开聊。
四种加法的全景先列一下这四种:
in-process 工具。直接在 agent runner 进程里...
一个”Claude 越来越笨”的错觉上个月有个做法律 SaaS 的朋友来问我:他们的产品用 Claude Sonnet 4.5,上线半年用户一直反馈”有时候答得特别准,有时候完全跑题”。他们以为是模型退化了,想换 Opus。
我让他把 retrieval 的日志拉给我看。一看就笑了——每次捞 top-10 文档扔给 Claude,前 3 名里经常掺着风...
去年十月我接了个活儿:从一批医疗器械注册文件里抽取 14 个字段。文件结构乱、术语杂、有中文有英文。我一开始用 markdown 写的 prompt,测完一批,准确率 74%。
改天心血来潮,把同一个 prompt 的分区从 ## 文档内容 改成 <document>...</document>、## 抽取要求 改成 <i...
先放一个让我当时很崩溃的对比。
同一个 Skill,干同一件事(从代码里抽出所有 TODO 并归类),只是 frontmatter 的 description 写法不同:
版本 A:「帮助用户整理代码中的 TODO 项」—— 触发准确率 58.2%
版本 B:「扫描项目中所有 TODO/FIXME/HACK 注释,按紧急程度和模块...
一开始我真以为搓个 MCP server 得学一堆新概念。
看完规范以后预期是:至少要写个 transport 层、处理 JSON-RPC 路由、搞 capability handshake……结果打开 @modelcontextprotocol/sdk,发现核心代码也就十几行。40 行能出一个能用的 server。
这篇我按”我第一次做的时候希望有人...
起因是一个 review 会上的尴尬2026 年 1 月,我们做一个面向医疗的 B 端项目,代码 review 一直靠 Claude Code。那天周会老板让看 velocity 数据,发现 4 个工程师用 Claude Code 的方式差得离谱——A 让 Claude 检查 security,B 让 Claude 检查 performance,C 基...
去年 11 月,朋友介绍一家律所找我。规模不大,60 来个律师,主做公司并购和涉外合规。他们老合伙人开口就是:「我们一天要审 14 份合同,长的 80 多页,主审律师看完一份脑子就空了。你看 AI 能不能帮一把。」
我先去他们办公室蹲了三天,拿了 200 份历史合同样本。看完之后发现问题不是「读不读得懂」,而是优先级——律师不怕条款多,怕漏掉一个藏在第...
一个 187K token 的惨痛教训去年九月接了一个保险行业的 AI 客服项目。甲方最开始那位产品经理的原话我到现在记得——“Claude 不是有 200K 窗口吗?那我们所有保单条款、历史对话、用户档案,全塞进去,让模型自己找答案。”
我当时就懵了一下,但没反驳。毕竟客户是上帝嘛,先跑一版看看。
跑了一周测试集,F1 从基线的 0.76 掉到了 0...
上周给一个做法律 AI 的客户 review 线上代码,看到他 system prompt 里塞了足足 850 个字。开头是”你是一个专业、严谨、客观、富有同理心且极其注重细节的法律助手”,后面跟了两段职业操守、三段风格要求,还夹了一条”请确保你的回答准确无误”。
user 那边呢?就一句:”请帮我分析这份合同的风险点。”然后把合同全文贴上去。
我看完...
一次差点被 fire 的 commit2025 年 11 月,给一家做营销 SaaS 的甲方做后端重构。Claude Code 接了他们一个 14 万行的 Node 仓库,我那周手速也快,Opus 跑着跑着就把一个 shared util 文件给改了。表面看 tsc 过了、vitest 过了,PR 也被 review 通过。
然后 merge 到 ma...
被客户技术负责人问住那天,我其实挺尴尬的。
他问:”MCP 和 OpenAI function calling 本质区别在哪?”我当时就懵了,脑子里只有”一个是协议一个是接口”这种废话。回去之后关了钉钉,把 @modelcontextprotocol/specification 仓库 clone 下来,从 schema.ts 一行行看到 transpo...
先说结论:Agent SDK 的 quickstart 真的很友好,3 分钟出效果那种。但这个 3 分钟和我后来折腾的 3 天之间,隔着一条相当宽的沟。
从一行 npx 开始2025 年 Anthropic 把 Agent SDK 开源出来之后,我一直想找个周末摸一摸。那天晚上 10 点多,我打开终端敲了第一行:
1npx @anthropic-ai/...