Jun 4, 2026

第0篇：这个系列为什么存在——它讲什么

系列：我们构建了一条几万行代码的流水线。Agents为何做不到。

AI 正在重塑每一个行业。这一点已经不需要任何人来解释了。

但“重塑”在不同环境中意味着截然不同的事。一个初创公司用智能体快速原型化，和一家机构投资者用 AI 处理数千家公司的 ESG 数据，这两件事之间的距离，比大多数科技新闻头条承认的要远得多。

这个系列来自一名量化开发者的视角。我所在部门的核心目标，是帮助各投资团队实现投资流程和决策的现代化。日常工作是构建数据流水线、分析工具和评估框架，服务于投资组合经理、分析师和风险团队。

这不是理论，也不是预测。它只是我在这个背景下实际构建生产 AI 系统所积累的经验分享，不代表其他环境下的所有答案。

一段话说清论点

我们构建了一条几万行代码的生产流水线，可以从全球任意企业网站获取完整 ESG 信息。

它只在真正需要语义判断的 10% 场景中使用 LLM：理解一个链接是否与 ESG 相关，一个发现的域名是否属于同一家公司，一个页面是真正的披露还是只是营销文案。

其余 90%——链接提取、浏览器级联、状态管理、重试逻辑、PDF 处理、预算分配——都使用确定性代码。

不是因为我们对 AI 持怀疑态度。恰恰相反，是因为我们试过多种替代方案，而它们都在重要维度上失败了：

AI 理解意义。代码保证行为。经验知道何处用何者。

三者缺一不可。

智能体 AI 的炒作说，LLM 可以自主处理一切：只需给它们工具，让它们自己搞定。我们的经验恰恰相反。LLM 在判断上非凡，在控制流上糟糕。

构建有效 AI 系统的工程师，不是在用智能体替代代码。他们在组合智能与精确，并运用来之不易的经验来判断边界在哪里。

这不是一个反 AI 的论点。这个项目每天都在用大语言模型工具。它们简直太美妙了。这条流水线现在也正在用它们重构。

论点是：编码能力不再是稀缺资源，工程判断才是。再多的智能体框架也改变不了这一点。好吧，我们还是给它一个时限：起码几年内如此。

篇次	标题	核心一句
1	不可能的任务	投资组合经理需要 5000 个网站的 ESG 数据。聊天机器人和正则都失败了。
2	7400 行是怎么来的	七层分类，每一层都是前一次失败的教训。
3A	智能体会毁掉的 90%（上）	大语言模型在语义判断上不可替代；剩下 90% 全是编排。
3B	智能体会毁掉的 90%（下）	六个看起来简单的问题，每一个都会让智能体翻车。
4	诚实的对比	流水线 vs. 智能体：成本、复利式失败，以及长流程正确完成的概率。
5A	研究怎么说：数据篇	可靠性断崖；劳动力研究发现增强而非自动化。
5B	研究怎么说：框架篇	组合，而非替代。
6	杠杆差距	资深 + AI = 团队。职业阶梯的第一级台阶升高了。
7	上下文积累	编码能力已解决。工程判断没有。
8A	委托难题	模糊目标静默漂移。工具有天花板，模型看不见。
8B	自主性光谱	连倡导者说的都比标题复杂。未来是差异化自主。
9	另一个极端	“大语言模型已死”和“智能体统治世界”一样引人注目。两个都以同样的方式错了。
10	两个房间	演示爱好者做不完。领域专家不开始。流水线交付了——因为它听了两边的话。
11	证据（本篇）	最初被当作又一次演示的项目，最终成为生产系统。成功不在模型，在工程。

篇次	标题	核心一句
A	反驳	我们让 AI 拆自己的系列。五轮攻防，诚实回应。
B	理解系统，才有资格委托系统	AI 降低了学习系统的门槛，但没有取消理解系统的必要。提问不是理解的替代。
C	站在中间地带	半夜醒来的那个念头。不是恐惧——是一种更复杂的东西。

如果你是一名业界工程师，正在决定哪里用智能体、哪里用代码，这是来自一个投资机构开发者的实地报告。

如果你是一名管理者，听说智能体可以取代你的工程团队，这里可能有演示不会经常展示的内容。

如果你是一名初级开发者，想知道 AI 是否让你的技能过时，第 6 篇专门写给你。答案是细致的、诚实的，不是乐观派或末日派告诉你的那样。

如果你只是好奇，2026 年在一个投资机构开发 AI 应用系统是什么体验，欢迎围观。

开始阅读：第 1 篇——投资组合经理的不可能任务。