置顶
说实话,去年这个时候我对 Claude 其实挺无感。那时候大家都在 ChatGPT 和 Gemini 里左右横跳,偶尔听到有人吹 Claude 的长上下文,我点进去试两下,觉得也就那样,就又退回 GPT-4 了。
真正让我切过来的契机挺偶然——春节前那阵我在做一个合同解析的私活,原始 PDF 塞进 GPT 之后它经常胡说八道,把”甲方”和”乙方”认反,...
第一次接培训这活儿是个意外。客户原本让我做技术咨询,第三次开会后他们 HR 突然插了一句:”你能不能顺便把培训材料也写了?” 我当时心想这有啥难的,不就写几份 PPT 么。
结果第一版开发者培训我写了 92 页 PPT,讲完现场问问题的只有两个人,三周后调研发现真正在用 Claude 的工程师不到 15%。
我当场破防了。回去重写。
培训做不好的根本原...
给第一家公司做审计的那周,我在他们办公室蹲了五天。每天都像挖盲盒——每拉一条日志出来,心跳就加速一次。
最后交付那份 43 页报告,CISO 看完给我发微信,就一句话:”这比我想象的还糟。”
那家公司之后三个月把治理体系重搭了一遍。我根据在他们那儿以及后来两家的经验,整出这 8 条铁律。不是网上抄的 best practice,是我亲眼见过违反之后出事...
去年 12 月,某头部车企的 CTO 把我拉进他办公室。他桌上摊着一份 PPT,标题是”AI 辅助研发三年规划”。翻到第三页,我就乐了——那是我半年前给他们画的迁移路线图,被运营部门加了 23 页”愿景”和”赋能矩阵”(这词儿我最讨厌)之后变成了现在这个样子。
他问我:”你帮我看看,到底哪几步是真的要做的?”
我跟他说:”你把我原来那份拿出来,就 6 ...
合规部门的同事第一次把我叫进会议室,是去年 11 月的事。那天他们摊开一份 32 页的 DPA 草稿让我看,问我一个问题:”你让我签字可以,但你先告诉我,这些 prompt 数据到底跑哪儿去了?”
我当时的回答是:”得看你走哪条路。”
然后我们就这一条路、那一条路讲了整整三小时。我后来意识到,很多技术团队在跟合规部门对接的时候,根本答不上来这个问题。不...
一个让我重新做人的实验两年前我还比较自信,觉得写 prompt 这事儿我摸得差不多了。直到一个周五晚上,跟同事吃饭时他随口问我:”你们 prompt 里的文档是按什么顺序排的?”
我说按相关度降序啊,最相关的放最前面,这不是常识吗?
他笑了笑说他们团队最近发现——把最相关的放最后,准确率反而高。
我第二天一早就跑去跑实验。我当时就懵了:同样 20 段 ...
Agent SDK 本地跑起来挺舒服。但是一旦你要把它塞进生产环境——容器里跑、k8s 里调度、被监控系统盯着——就会发现本地那套玩法不够用。
这篇是把我自己踩过的坑和客户现场见过的部署方式整理成一份清单。不保证面面俱到,但至少少走弯路。
1. 多阶段 Dockerfile别用单阶段,node:20 基础镜像加依赖动辄 1.2GB。我的模板大概是这样:...
去年 10 月到今年 3 月,我陆陆续续被三家甲方拉去当”采购顾问”。一家是南方某城商行,一家是头部零售连锁,一家是三甲医院的信息科。三家要解决的问题都不一样,但问题的起点居然一模一样——他们的 CIO 都在我面前摊开一张 Excel,上面列了 Claude、GPT-4o、Gemini、还有国产几个,问我:”这个分数表你看怎么打?”
我当时就懵了。因为...
一次线上事故引发的思考去年有个事故我记到现在。
客户是家做法律咨询的,AI 助手用的 Claude Sonnet。用户在对话第 15 轮说自己有一笔 48 万的遗产纠纷,要咨询继承顺序。第 16 到第 40 轮中间聊了一堆背景——父母离异、兄弟几个、有一个继父、继父带来的两个子女。
到第 42 轮,用户问了一句”那我应该起诉谁”。
我们那会儿做了简单的...
写这篇之前我犹豫过要不要写。因为我们监控这套做了挺久,调了不少参数,怕写出来别人照抄反而不合适。但转念一想,这正是可观测性的魅力——每个 agent 系统的工作负载都不同,分享思路比给配方重要。
SDK 层 hook 和 Claude Code hook 的区别先澄清一个容易混的东西。
Claude Code CLI 有一套 hook 系统,配在 ~/...
上周帮一个做跨境电商的朋友排查,他说”Claude 买贵了”。我一问,他同时开了 Claude Pro 订阅(桌面端)、Claude Code 订阅,还在 API 上充了 200 刀,以为这三个是分开收费的产品,要买三份才能全用。
我跟他解释完他愣了半天,差点把不用的那份退掉。
这种混乱我这两年见了太多次,干脆整理一篇。
四个入口的真实定位先把定位讲清...
去年 10 月某个周五凌晨,我手机震了一下。Anthropic 的 budget alert:当日消费已超 $300。
我爬起来打开控制台,发现是一个长文档摘要 agent 跑飞了,进入了一个自我引用的死循环。每次调用都把前一次的输出塞回 context,越滚越大。跑了大概 4 小时,烧掉 $347.18。
后来做善后的时候意识到一个事:如果我在流式输...