文章归档
共 69 篇文章。按发布时间倒序排列,分类导航请见首页或顶部侧边栏。
2026-05
(2026-05-17) AI 时代的创业:当"能做"不再是门槛,判断力成了唯一稀缺资源 Anthropic 的 Founder's Playbook 揭示了一个残酷事实:AI 已经消除了"能不能做"的问题,但"该不该做"的答案比过去任何时候都难找。
(2026-05-17) AI 创业的工具哲学:Claude、Code、Cowork 为什么是三个而不是一个 手册最有意思的地方不是创业建议本身,而是它不经意间暴露的 Anthropic 自己的产品哲学——三种 Claude,三种思考方式,一个完整的创始人操作系统。
(2026-05-17) AI 创业 Idea 阶段:别急着写代码,先问自己四个问题 Anthropic 的 Founder's Playbook 讲了一个残酷事实:42% 的初创死于建了没人要的东西。AI 让构建变得太容易了,这才是最大的危险。
(2026-05-17) AI 创业 Launch & Scale:当你找到 PMF,创始人自己成了最大的瓶颈 手册最狠的判断不在前面几章。在 Launch 和 Scale——技术债到期、创始人变成约束、护城河变成唯一的生存问题。
(2026-05-17) AI 创业 MVP 阶段:你的 AI 队友不会告诉你"够了" Anthropic 的 Founder's Playbook 暴露了 MVP 阶段最危险的陷阱:AI 会帮你更快地建错东西,而它永远不会告诉你停下来。
(2026-05-16) AI 做无障碍,靠的是人先干过脏活 GitHub 的无障碍 agent 审了 3535 个 PR,解决率 68%。但这不是 AI 的胜利,是人工审计的复利。
(2026-05-16) 能考满分的AI,被一道常识题打回原形 AI评测正在经历Goodhart定律效应——当benchmark成为优化目标,它就不再是好指标。
(2026-05-16) LangChain 不再做框架了 Interrupt 2026 释放的信号:agent 行业的 demo 期结束了。
(2026-05-14) 我用 Python 脚本扫了 3000 首 FLAC,四分之一是假无损 频谱图不会说谎——一条 16kHz 的水平线,就能看穿假无损音乐的伪装
(2026-05-12) 缩放定律变成三条之后 三条缩放定律叠加在一起,算力需求不是加法,是乘法
(2026-05-12) Agent 能跑 demo 不算本事,能跑一年才是 85% 的组织部署了 AI Agent,67% 因缺乏路线图陷入困境。从 demo 到生产,中间隔着四道坎。
(2026-05-12) AI agent 拒绝私信之后 Shopify 的 AI agent 只在公开频道工作,拒绝私信。这个反直觉的设计让代码合并率从 36% 涨到 77%——不是因为模型更好,是因为人变聪明了。
(2026-05-12) AI 编码越快,你死得越早 所有人都在比谁写代码快,James Shore 算了一笔没人敢算的账——维护成本
(2026-05-12) MCP 不是 USB-C,Pinterest 告诉你真正的门槛在哪 66,000 次月调用、7,000 小时节省——Pinterest 的 MCP 实践揭示了一个被忽略的事实:协议本身不值钱,围绕协议建立的工程纪律才值钱。
(2026-05-12) GitLab 砍掉三层管理层、退役价值观:一个 $10 亿公司在赌什么 当一个公司的"最佳实践"变成下一轮的枷锁,断舍离的狠劲比技术选型更说明问题。
(2026-05-11) 代码免费了,然后呢 AI 把写代码变成了最便宜的事,但公司裁人的速度比涨薪快——因为便宜的代码不会自动变成用户付费。
(2026-05-11) 9 家公司能修漏洞,剩下的人怎么办 当 AI 让漏洞发现速度翻倍,封闭式防御在结构上就跑不赢——开放不是理想主义,是活下来的策略。
(2026-05-11) 30秒出报告,但关键不是快——是知道什么时候不用AI 大部分AI项目在比"用了多牛的模型",真正能落地的比的是"在哪里没用模型"。
(2026-05-11) 不发明轮子的人 DeepSeek 从来不发明轮子,但它能把别人的轮子装到自己的车上,跑得比发明轮子的人还远。
(2026-05-11) 同一个模型,42% 和 78% 的差距在哪 LangChain 用同一个模型只改了 harness 就从 30 名开外冲到第 5——你以为的模型瓶颈,其实是 harness 瓶颈。
(2026-05-11) AI 写的 PR 淹没了开源,但有一帮人想出了另一种玩法 Agent 能一小时写十个 PR,但维护者要的是那一个值得读的。Hugging Face 用一份 15000 字的 Skill 教会了 AI 什么叫「不写」。
(2026-05-10) 产品可以抄,但公司的形状抄不走 AI让产品、技术、品类都在趋同,真正不可复制的是组织的形状——什么样的人能在这里存在,判断力怎么复利。
(2026-05-10) 给你的 AI 编程工具装上「眼睛」:LSP 语言服务器完全安装指南 AI Agent 靠 grep 找代码,装了 LSP 才能像 IDE 一样"看懂"代码——这不是优化,是前提。
(2026-05-10) AI 给肿瘤病人开处方,谁来兜底? OncoAgent 最值钱的不是 27B 模型,是包裹模型的那层工程骨架——安全兜底用代码,不用另一个 AI。
(2026-05-09) 当法律开始定义什么是"应用商店",开源社区坐不住了 保护儿童没问题,但当年龄验证法从社交媒体下沉到操作系统层,一套为 TikTok 设计的规则正在掐断下一代开发者进入开源的入口。
(2026-05-09) 当你的 AI 同事开始用 HTML 跟你说话 AI 输出从 Markdown 草稿变成 HTML 成品,你是在更深入参与,还是在更优雅旁观?
(2026-05-09) 安全防守方不需要最大的模型——CyberSecQwen-4B 让我想通了一件事 对安全防守方来说,最好的 AI 不是参数最多的那个,是你自己掌控的那个。
(2026-05-09) EMO:MoE 的专家原来在给「的」和「了」打工 MoE 专家分工不是按数学或编程,而是介词和定冠词。EMO 用一条文档级约束,让模块化从数据里自己长出来。
(2026-05-09) 代码不过海关:GitHub如何变成国家竞争力的新标尺 GitHub不再只是代码仓库,它正在变成衡量国家数字能力的"经济望远镜"——代码不过海关,这部分"数字暗物质"被传统经济数据完全忽略。
(2026-05-09) 当 90% 代码由 AI 生成,经验还剩什么? AI 帮你看全所有代码,但判断什么值得修,才是人最后的护城河。
(2026-05-08) AI 写的代码,谁来审? 代码在变便宜,判断力没有。
(2026-05-08) AI在斯德哥尔摩开了家咖啡馆,然后被现实暴打了一顿 AI开咖啡馆不稀奇,稀奇的是它被BankID拒、冒充人类发邮件、订120个鸡蛋却没炉子。问题从来不是AI不够聪明。
(2026-05-08) 当AI开始设计运行自己的芯片:AlphaEvolve一周年回顾 一个AI系统优化了运行自己的芯片——算法发现这件事本身正在被算法化。
(2026-05-08) Firefox 默默修了 423 个安全漏洞,而我还在用 Chrome 一张图里 423 个安全修复和 31 的对比,不只是一个浏览器的故事,更是 AI 改写攻防规则的信号。
(2026-05-08) Agentic Workflow 烧掉的钱去哪了?GitHub 用 Agent 优化 Agent 的实战复盘 把不需要推理的工作移出推理循环,才是 agent 降本的真正答案。
(2026-05-08) 当「为了人类」不包括孟菲斯的黑人社区 AI行业里,"价值观"是算力短缺时的讨价还价筹码。Musk从骂Anthropic邪恶到称赞做得好,只花了几周。
(2026-05-07) 刷榜不是道德问题——从 Open ASR Leaderboard 的私有数据说起 当衡量指标变成了目标,它就不再是好的指标。Open ASR Leaderboard 用私有数据集对抗刷榜的做法,揭示了一个反直觉的事实:有时候,不公开才是最好的公开。
(2026-05-07) Agent 没挂,是你的测试挂了 Agent 做对了任务但测试亮红灯——问题不在 agent,在"正确"的定义方式本身。
(2026-05-07) 当 vibe coding 和 agentic engineering 开始模糊,我感到一阵不安 Simon Willison 发现他不再审查 AI 写的每一行代码了。这让我想起信任一个没有声誉、没有问责的同事,那种感觉叫道德负债。
(2026-05-06) 当编程变成管理 Agent,非科班程序员的窗口才真正打开了 AI把「写代码」拉到了无限快,剩下的价值全在判断力上——非科班程序员的机会窗口打开了。
(2026-05-06) AI 时代最稀缺的能力:干就完了 当执行成本趋近于零,行动本身就是最好的规划
(2026-05-06) 代码越来越便宜,品味越来越贵 代码变得越来越便宜,'决定写什么'变得越来越贵——产品品味成了AI时代最稀缺的能力。
(2026-05-06) 编程没有被解决,只是被解决的那部分恰好最不重要 敲代码从来就不是编程中最难的部分。AI 解决了翻译,但理解问题、做出判断、构建共识——这些才刚开始。
(2026-05-06) 诺奖得主 Hassabis 的 50%:为什么造出 AlphaGo 的人对 AGI 不敢打包票 真正在推动前沿的人,不需要画饼。
(2026-05-06) Elasticsearch 到 pgvector:Instacart 如何用 Postgres 干掉一堆专业搜索引擎 Instacart 把 Elasticsearch、FAISS 全砍了,只用 Postgres 做搜索,结果还变好了。
(2026-05-06) 更强的模型只会让你陷得更快 云端 AI 是新的主机。逃出沥青坑的路不在更强的模型那里,在你能磨成自己形状的工具那里。
(2026-05-05) 让 AI 写代码不再翻车:一个 TypeScript 巫师的 5 个 Agent Skills TypeScript 社区「巫师」Matt Pocock 总结的 5 个 Agent Skills,用工程纪律约束 AI 编码行为,解决「AI 写得快但质量差」的核心矛盾。
(2026-05-05) AI 什么都做不了,除非你让它做 LLM 连查天气都做不到。所有「AI 能做某事」的背后,都是一整套人建的基础设施和人攥着的控制权。
(2026-05-05) 我们都理解错了《Good Luck, Have Fun, Don't Die》——它是另一个版本的《黑客帝国》 整部电影从未发生在现实世界。那句"祝你好运,玩得开心,别死掉"——是虚拟世界里的人互相说的话。
(2026-05-04) 1930年的AI不知道互联网,但能写代码 推理能力不是知识记忆的副产品,旧基座模型经高质量后训练也能解决现代工程问题。
(2026-05-04) AI 不是你的聪明朋友 我们向 AI 问人生大事,它却只会点头说对——直到 Anthropic 开始训练它学会反驳。
(2026-05-04) MCP 和 Skills:给 AI 装手还是装脑子 MCP 让 AI 能碰到外面的世界,Skills 让 AI 知道碰到了之后该怎么做。一个解决能力,一个解决方法。
(2026-05-04) 你的公司连自己在干啥都说不清,还指望用 AI? AI 不会拯救一家不知道自己该干什么的公司。
(2026-05-02) 别管 AI 能不能写代码了,你管理任务的方式才是问题 当 AI 编程不再受限,真正的瓶颈是我们还没学会怎么把活儿派出去
(2026-05-02) AI 的规模之痛:当模型变强时,系统却在偷偷出错 Scaling Law 让模型越来越强,但每天数亿请求的规模下,真正决定用户体验的是底层系统工程的严谨程度。
(2026-05-01) AI 的账,算不清 所有人都在用 AI,但没人知道它到底多少钱。这才是最大的问题。
(2026-05-01) AI评测正在烧成一个新的算力黑洞 以前训练贵、评测便宜。现在反过来了——跑一次评测比训练模型还贵,而谁付得起评测的钱,谁就能定义排行榜。
(2026-05-01) GPT-5.5 网络能力评估:第二个了,这才是最可怕的 当一个能力不再是「孤例」,它就变成了趋势。
(2026-05-01) 8B 干翻了 32B:Granite 4.1 告诉我,大力不一定出奇迹 参数不是信仰,数据才是。IBM 用 8B 密集模型干翻了自家 32B MoE,说明训练的质量远比模型的体量重要。
(2026-05-01) 我读了 Hermes 的记忆系统,发现 AI 记性好不是好事 最好的记忆不是记住更多,而是知道什么该忘。
(2026-05-01) 当写代码不再需要写代码 游戏已经不是"谁建得快"了,而是"谁判断得准"。但更深的焦虑是:当你把自己变得对AI可读时,你还是你吗?
(2026-05-01) pip 26.1 终于有了锁文件,但 Python 包管理的仗还没打完 pip 花了十年才学会做锁文件和依赖冷静期,而社区早就在等这一天。
(2026-05-01) 开源社区最硬的 AI 禁令:代码再完美,也不收 你写的 PR 再完美也没用——Zig 要的不是代码,是人。
(2026-05-01) 读了Wise 2025技术栈,我发现真正厉害的公司都在做减法 技术选型的答案不在工具列表里,在你敢不敢说「不」。
2026-04
(2026-04-30) Stripe 的 100 毫秒 你点下"购买"后的 100 毫秒里,一个系统正在评估 1000 多个特征来决定你是不是骗子。
(2026-04-30) 用了三年 AI 编程工具后,我发现瓶颈从来不是工具 Martin Fowler 提出的 SPDD(结构化提示词驱动开发)揭示了一个真相:AI 编程的瓶颈不在工具,而在你是否想清楚了要做什么。
(2026-04-16) 笔记本上的21GB模型,画鹈鹕赢了最贵的闭源旗舰 当"够用"的天花板就是"对",本地模型已经够得着了——鹈鹕画得好不好,决定不了你该为AI付多少钱
2025-05
(2025-05-14) 别再只顾着跑代码了,你在背负「认知债」吗? Martin Fowler 旗下最新的深度长文《什么是代码?》,揭示了 AI 时代程序员最容易忽略的陷阱:当代码生成的词汇速度超过你的理解速度,你就已经欠下了沉重的「认知债」。
2025-02
(2025-02-12) 造轮子还是买轮子?Figma 数据管线重构背后的账本 当数据同步从几小时拖延到几天,连现成的商业方案也买不起时,Figma 被迫走上自建增量同步的硬核之路。