先放一个让我当时很崩溃的对比。
同一个 Skill,干同一件事(从代码里抽出所有 TODO 并归类),只是 frontmatter 的 description 写法不同:
版本 A:「帮助用户整理代码中的 TODO 项」—— 触发准确率 58.2%
版本 B:「扫描项目中所有 TODO/FIXME/HACK 注释,按紧急程度和模块...
被客户技术负责人问住那天,我其实挺尴尬的。
他问:”MCP 和 OpenAI function calling 本质区别在哪?”我当时就懵了,脑子里只有”一个是协议一个是接口”这种废话。回去之后关了钉钉,把 @modelcontextprotocol/specification 仓库 clone 下来,从 schema.ts 一行行看到 transpo...
92 分钟和 20 分钟的差距从哪来先把场景说清楚。甲方是一家上市物流公司的前端团队,他们两年前基于 Chakra UI 1.x 写了 340 个业务组件。Chakra 3 改了一大堆 API,emotion 换成 vanilla extract,<Box> 的 shorthand 全变了。
我第一天用 Claude Code 一个会话串行...
去年十二月我换了新电脑,重装环境的时候顺手把 Cursor、Cline(当时还叫 Claude Dev)、Claude Code CLI 三个都装上了。当时想的是挨个试一圈看哪个最顺手,没想到一试就是四个月,到今天为止三个都还在我机器里跑着,各自占据了不同的位置。
这四个月我大概写了三万行代码——两个接私活的项目、一个自己的开源玩具、公司一个中型重构。...
Q2 这三个月我机器上同时挂着三家 API——Anthropic、OpenAI、Google。每次有新项目启动,我都会用这三家分别跑一轮同样的任务,看哪家合适就用哪家做主力,其余两家备着。
这篇文章不是那种”看完就能做决策”的权威指南——我也做不到,任何说自己能做到的人都是在忽悠你。不同场景、不同预算、不同风险偏好,最优解完全不一样。这里只讲我自己在 ...
写了小半年 Agent SDK,给各种 agent 加过大概 30 多个自定义工具。有给数据库查询的,有拉监控指标的,有调内部 RPC 的,也有跑机器学习推理的。加得多了,就摸出四种主要的加法。
每种我都用过至少两三次,踩过的坑也各不相同。今天摊开聊。
四种加法的全景先列一下这四种:
in-process 工具。直接在 agent runner 进程里...
三月那张账单发下来的时候我愣了一下。$2,847.12,比二月多了快四成,但流量没涨。我打开 Anthropic Console 想看看到底哪里漏钱了,Usage 页面上一堆柱状图我看不懂。
于是把 CSV 下载下来用 Excel 打开,列标题有 17 个。我当时就懵了,不是说好只有 input / output 吗。
后来花了整整三个月,一...