置顶
说实话,去年这个时候我对 Claude 其实挺无感。那时候大家都在 ChatGPT 和 Gemini 里左右横跳,偶尔听到有人吹 Claude 的长上下文,我点进去试两下,觉得也就那样,就又退回 GPT-4 了。
真正让我切过来的契机挺偶然——春节前那阵我在做一个合同解析的私活,原始 PDF 塞进 GPT 之后它经常胡说八道,把”甲方”和”乙方”认反,...
大概一年半前我做过一个医疗 FAQ 智能客服,核心任务是”从 800 条标准问答里召回最相关的 3 条”。0-shot + 结构化 prompt 跑下来准确率 92%,客户验收通过。
上线一个月后我想着优化一下,加了 <thinking> 让模型”先分析问题意图再选择答案”。心想这肯定更稳吧,结果一跑——84%。
整整掉了 8 个点。我反复...
前年夏天做过一个电商评论情感分类的项目。客户要求不用微调,只能靠 prompt 解决。我最开始用零样本,就一句”判断下面这条评论是正面、负面还是中性”,跑了 500 条标注数据,准确率 68%。客户皱了皱眉,说能不能再高点。
我加了 3 条示例进去,升到 81%。再加到 5 条,到 89%。客户说够了够了,上线。
后来我自己出于好奇,又加到 10 条示...
去年 11 月,朋友介绍一家律所找我。规模不大,60 来个律师,主做公司并购和涉外合规。他们老合伙人开口就是:「我们一天要审 14 份合同,长的 80 多页,主审律师看完一份脑子就空了。你看 AI 能不能帮一把。」
我先去他们办公室蹲了三天,拿了 200 份历史合同样本。看完之后发现问题不是「读不读得懂」,而是优先级——律师不怕条款多,怕漏掉一个藏在第...
两次踩雷,一次小伤一次差点翻车第一次是 2025 年 8 月。我在一台跑着甲方客户数据的 staging 机上用 Claude Code 做日志分析。当时设了 acceptEdits,以为”编辑自动通过,Bash 还是要问的”。然后让 Claude 清理 /var/log/app/ 下的老日志,它跑了一条 find /var/log -mtime +3...
一个 187K token 的惨痛教训去年九月接了一个保险行业的 AI 客服项目。甲方最开始那位产品经理的原话我到现在记得——“Claude 不是有 200K 窗口吗?那我们所有保单条款、历史对话、用户档案,全塞进去,让模型自己找答案。”
我当时就懵了一下,但没反驳。毕竟客户是上帝嘛,先跑一版看看。
跑了一周测试集,F1 从基线的 0.76 掉到了 0...
上周给一个做法律 AI 的客户 review 线上代码,看到他 system prompt 里塞了足足 850 个字。开头是”你是一个专业、严谨、客观、富有同理心且极其注重细节的法律助手”,后面跟了两段职业操守、三段风格要求,还夹了一条”请确保你的回答准确无误”。
user 那边呢?就一句:”请帮我分析这份合同的风险点。”然后把合同全文贴上去。
我看完...
先说一句得罪人的话去年年底我和一个做 B2B SaaS 的客户复盘,他 2024 年花了 $47,000 做传统 SEO,Ahrefs 的 DR 从 42 爬到 61,核心词排名也上去了。结果呢?自然点击反而比一年前掉了 37.2%。
原因我们都知道——Google AI Overviews 上线之后,用户连下拉都懒得下拉了。Perplexity、Ch...
先交代背景。账号是我的技术向小号,起点 320 粉丝,两年零散发过几十条没什么章法。2026 年 2 月底开始,我决定把它当项目跑一次,工具是 x-twitter-growth 这个 Skill。每周留一次 log,跑满 60 天。Skill 定位关键词是 X-specific:不是教你”发社交媒体”的通用 Skill,是专门针对 X 的算法机制和互动...
我最近参与了一次挺典型的内部会议。主角是:
E:工程师,负责一个新功能的开发和上线,老派 hacker 风格
M:市场同学,新来不到半年,之前在广告代理出身
我:被叫来做”上线流程过一遍”的 observer
会议预期 1 小时,实际开到下午 4 点多。吵的不是功能本身,是”这个功能怎么上线”。我在旁边看了一阵,打开 launch-strategy...
我第一次知道 Anthropic 这家公司,是 2021 年夏天。那会儿朋友圈有人转过一张图,说 OpenAI 安全团队的核心十几个人集体离职了,领头的是个叫 Dario Amodei 的意大利裔研究员,他妹妹 Daniela 跟他一起走。当时我没在意,觉得不过是硅谷又一次常规的团队分裂。
后来 ChatGPT 火了,我被推着去试了 GPT-3.5,然...
前两周我跟一个做 Agent 产品的朋友吃饭,他甩给我一句话:”MCP 不就是 Function Calling 换了个皮吗?我们已经有 tool use 了,整这个 MCP 协议是 Anthropic 在刷存在感吧。”
我当时嘴里正嚼着东西,差点呛住。这误解在开发者圈里太常见了,甚至连一些写过相关代码的人也会这么觉得。但如果你真的在生产环境里把两种方...