置顶
说实话,去年这个时候我对 Claude 其实挺无感。那时候大家都在 ChatGPT 和 Gemini 里左右横跳,偶尔听到有人吹 Claude 的长上下文,我点进去试两下,觉得也就那样,就又退回 GPT-4 了。
真正让我切过来的契机挺偶然——春节前那阵我在做一个合同解析的私活,原始 PDF 塞进 GPT 之后它经常胡说八道,把”甲方”和”乙方”认反,...
一个让我重新做人的实验两年前我还比较自信,觉得写 prompt 这事儿我摸得差不多了。直到一个周五晚上,跟同事吃饭时他随口问我:”你们 prompt 里的文档是按什么顺序排的?”
我说按相关度降序啊,最相关的放最前面,这不是常识吗?
他笑了笑说他们团队最近发现——把最相关的放最后,准确率反而高。
我第二天一早就跑去跑实验。我当时就懵了:同样 20 段 ...
一次线上事故引发的思考去年有个事故我记到现在。
客户是家做法律咨询的,AI 助手用的 Claude Sonnet。用户在对话第 15 轮说自己有一笔 48 万的遗产纠纷,要咨询继承顺序。第 16 到第 40 轮中间聊了一堆背景——父母离异、兄弟几个、有一个继父、继父带来的两个子女。
到第 42 轮,用户问了一句”那我应该起诉谁”。
我们那会儿做了简单的...
上周帮一个做跨境电商的朋友排查,他说”Claude 买贵了”。我一问,他同时开了 Claude Pro 订阅(桌面端)、Claude Code 订阅,还在 API 上充了 200 刀,以为这三个是分开收费的产品,要买三份才能全用。
我跟他解释完他愣了半天,差点把不用的那份退掉。
这种混乱我这两年见了太多次,干脆整理一篇。
四个入口的真实定位先把定位讲清...
两年前我刚开始在生产环境跑 Claude,第一个痛点就是 JSON 不稳定。
你在 playground 里跑 10 次都好好的,上线之后一天跑一万次,总有几十次它给你塞一句”Here is the JSON you requested:”开头,或者最后多个 markdown 代码块标记,或者引号没闭合,或者塞了个注释(JSON 是不允许注释的)。
那...
上周又有朋友来问我”Claude API 怎么用”,我发现每次都要重讲一遍,干脆整理成文。
这篇是完全按照”一个新手第一次碰 Claude API”的真实顺序来的,我自己按表计了时——从注册到第一个请求跑出来,熟手 5 分钟,生手大概 15 分钟。
Step 1:到 console.anthropic.com 注册这个地址要认准。不是 claude.a...
为什么记忆这件事这么难先说个直观感受。人类聊天为什么不会失忆?因为我们有工作记忆(几秒到几分钟)、短期记忆(几小时到几天)、长期记忆(几年)。每种用不同的脑区,有不同的编码方式,大脑自动做 routing。
LLM 没有这套。它每次推理就是把你给的 context 从头到尾读一遍,context 之外的东西对它来说不存在。所以”长期记忆”在 LLM 语...
大概一年半前我做过一个医疗 FAQ 智能客服,核心任务是”从 800 条标准问答里召回最相关的 3 条”。0-shot + 结构化 prompt 跑下来准确率 92%,客户验收通过。
上线一个月后我想着优化一下,加了 <thinking> 让模型”先分析问题意图再选择答案”。心想这肯定更稳吧,结果一跑——84%。
整整掉了 8 个点。我反复...
接入 MCP 之前和之后我 2025 年 9 月之前用 Claude Code 基本就是”读代码、写代码、跑 bash”三件套。碰到线上排错,还是得自己开 5 个终端窗口:一个 kubectl、一个 psql、一个 grep 日志、一个翻 GitHub issue、一个发 Slack 汇报。
MCP 生态起来之后我开始一个个接,到 2026 年 3 月...
有个朋友上周开了 Claude 账号,问我第一天该怎么用。我发了几句,他说太多了记不住。我想想也是,与其甩一堆能力清单,不如按”正常人真的会遇到的顺序”排一条上手路径。
下面这 10 个场景是我带过十几个非技术朋友之后总结的,按他们实际使用的先后顺序排,不是按官方文档的功能分类。
1. 总结一篇读不下去的长文章这是 90% 的人第一次用 Claude ...
两次踩雷,一次小伤一次差点翻车第一次是 2025 年 8 月。我在一台跑着甲方客户数据的 staging 机上用 Claude Code 做日志分析。当时设了 acceptEdits,以为”编辑自动通过,Bash 还是要问的”。然后让 Claude 清理 /var/log/app/ 下的老日志,它跑了一条 find /var/log -mtime +3...
前年夏天做过一个电商评论情感分类的项目。客户要求不用微调,只能靠 prompt 解决。我最开始用零样本,就一句”判断下面这条评论是正面、负面还是中性”,跑了 500 条标注数据,准确率 68%。客户皱了皱眉,说能不能再高点。
我加了 3 条示例进去,升到 81%。再加到 5 条,到 89%。客户说够了够了,上线。
后来我自己出于好奇,又加到 10 条示...