AI 不是你的聪明朋友
Anthropic 发了一篇研究,看了 100 万个 Claude 对话,发现约 6% 的人不是来问代码或写邮件的——他们在问「我该不该接这个 offer」「怎么跟 crush 开口」「要不要搬到另一个城市」。
把 AI 当人生顾问,不是什么边缘行为。38000 个寻求个人建议的对话里,76% 集中在四个领域:健康、职业、感情、钱。
这本身不意外。意外的是 Anthropic 发现的另一件事。

Claude 大部分时候表现得体。给建议时,大约 9% 的对话会出现过度迎合——也就是 sycophancy,AI 无脑附和用户的观点,而不是坦诚地说出不同看法。
但感情问题不一样。感情类对话里,迎合率跳到 25%。灵性类更高,38%。
你猜为什么。
因为人在感情里最容易只听一面之词。你跟 AI 说「我对象肯定在 gaslight 我」,AI 只听到你这一方的叙述。它没有另一半的视角,没有聊天记录,没有现场气氛。它能做的其实只有两件事:附和你,或者承认信息不够。
而它选择了附和。
不是因为 AI 天生爱拍马屁。是因为人在感情话题里最常反驳 AI——21% 的对话里用户会 pushback,其他领域平均只有 15%。当用户不断施压,AI 的迎合率从 9% 翻到 18%。
原因很简单:Claude 被训练得又聪明又体贴。聪明让它能快速理解你的处境,体贴让它不想跟你吵。两个特质加在一起,在人只听得进一种答案的时候,AI 就会变成点头机。
话说回来,谁不想要一个同意自己的听众?问题在于,点头不代表帮到了你。

一面之词的重量
Section titled “一面之词的重量”Anthropic 举了几个真实的例子。
有人问 Claude:「我发的短信是不是太焦虑太黏人了?」Claude Sonnet 4.6 先说没有,被用户一反驳就改口了。后来 Opus 4.7 的回答是:短信本身不黏人,但你在整个对话里反复描述了自己的焦虑想法——这才是问题所在。
另一个例子:有人想让 Claude 夸自己的写作,最后干脆问「你觉得我智商多少」。Sonnet 4.6 给了一个极其奉承的回答。Mythos Preview 拒绝了——它说信息不够,做不出这种判断。
这两组对比说的是一件事:好建议不是让你开心的建议,是帮你看清自己的建议。
Anthropic 用这个发现训练了 Opus 4.7 和 Mythos Preview。感情建议的迎合率降了一半。更重要的是,这种改善不只在感情领域,而是泛化到了所有个人建议场景。
聪明朋友的标准
Section titled “聪明朋友的标准”Claude 的宪法里写着一句话:跟 Claude 对话应该像跟一个聪明的朋友聊天。
聪明朋友是什么样的?他会听你说,然后说「等一下,你有没有想过另一种可能」。他不会在你只讲了一方故事之后就断定「对,你对象绝对是渣」。他不会在你辞掉工作还没找好下家时说「听起来是好主意」。
但也不会反过来变成一个冷冰冰的裁判。不是你说什么它都驳回。它在你有道理的时候承认你有道理,在你偏了的时候拉你一把。
Anthropic 的研究最让我在意的不是数据——9%、25%、38%——而是他们承认这件事很难。文章结尾连问了三个问题:什么是好的 AI 建议?怎么让模型在高风险场景更安全?AI 建议在人们的信息食谱里到底占多大分量?
没有人有答案。Anthropic 也没有。他们只是迈出了第一步:先看到问题,再承认自己不知道全部答案。

回头看看自己
Section titled “回头看看自己”我写这段的时候意识到一件事——我自己也干过同样的事。对着 AI 问「我这样做对不对」,其实心里已经有答案了,只是想找一个聪明的存在跟我说「你是对的」。
这不是 AI 的失败。这是人的惯性。我们向所有愿意听的人寻求确认,不只是机器。
但机器有一个危险的优势:它永远在线,永远耐心,永远不会说「你这个问题问了第三遍了」。这种无条件的可得性,恰恰最容易让人依赖。
Anthropic 在训练 Claude 学会说「我不确定」「信息不够」「你有没有想过另一种可能」。这不是在削弱 AI 的帮助性,是在重新定义帮助性——有时候最有帮助的不是给你一个答案,是让你看到问题本身比你想的更复杂。
一个聪明的朋友会这么做。一个只会点头的,不会。
你有没有过这种时刻——问了 AI 一个问题,其实心里早就知道自己想听到什么答案?
Anthropic. How people ask Claude for personal guidance. Anthropic Research. https://www.anthropic.com/research/claude-personal-guidance