第0篇:这个系列为什么存在——它讲什么

系列:我们构建了一条几万行代码的流水线。Agents为何做不到。

Read the English version.

AI 正在重塑每一个行业。这一点已经不需要任何人来解释了。

但“重塑”在不同环境中意味着截然不同的事。一个初创公司用智能体快速原型化,和一家机构投资者用 AI 处理数千家公司的 ESG 数据,这两件事之间的距离,比大多数科技新闻头条承认的要远得多。

这个系列来自一名量化开发者的视角。我所在部门的核心目标,是帮助各投资团队实现投资流程和决策的现代化。日常工作是构建数据流水线、分析工具和评估框架,服务于投资组合经理、分析师和风险团队。

这不是理论,也不是预测。它只是我在这个背景下实际构建生产 AI 系统所积累的经验分享,不代表其他环境下的所有答案。

一段话说清论点

我们构建了一条几万行代码的生产流水线,可以从全球任意企业网站获取完整 ESG 信息。

它只在真正需要语义判断的 10% 场景中使用 LLM:理解一个链接是否与 ESG 相关,一个发现的域名是否属于同一家公司,一个页面是真正的披露还是只是营销文案。

其余 90%——链接提取、浏览器级联、状态管理、重试逻辑、PDF 处理、预算分配——都使用确定性代码。

不是因为我们对 AI 持怀疑态度。恰恰相反,是因为我们试过多种替代方案,而它们都在重要维度上失败了:

  • 完整性
  • 一致性
  • 成本
  • 规模化可靠性

核心结论

AI 理解意义。代码保证行为。经验知道何处用何者。

三者缺一不可。

智能体 AI 的炒作说,LLM 可以自主处理一切:只需给它们工具,让它们自己搞定。我们的经验恰恰相反。LLM 在判断上非凡,在控制流上糟糕。

构建有效 AI 系统的工程师,不是在用智能体替代代码。他们在组合智能与精确,并运用来之不易的经验来判断边界在哪里。

这不是一个反 AI 的论点。这个项目每天都在用大语言模型工具。它们简直太美妙了。这条流水线现在也正在用它们重构。

论点是:编码能力不再是稀缺资源,工程判断才是。再多的智能体框架也改变不了这一点。好吧,我们还是给它一个时限:起码几年内如此。

系列目录

篇次标题核心一句
1不可能的任务投资组合经理需要 5000 个网站的 ESG 数据。聊天机器人和正则都失败了。
27400 行是怎么来的七层分类,每一层都是前一次失败的教训。
3A智能体会毁掉的 90%(上)大语言模型在语义判断上不可替代;剩下 90% 全是编排。
3B智能体会毁掉的 90%(下)六个看起来简单的问题,每一个都会让智能体翻车。
4诚实的对比流水线 vs. 智能体:贵 3–10 倍,指数级失败率,完美运行概率 0.6%。
5A研究怎么说:数据篇可靠性断崖;劳动力研究发现增强而非自动化。
5B研究怎么说:框架篇组合,而非替代。
6杠杆差距资深 + AI = 团队。职业阶梯的第一级台阶升高了。
7上下文积累编码能力已解决。工程判断没有。
8A委托难题模糊目标静默漂移。工具有天花板,模型看不见。
8B自主性光谱连倡导者说的都比标题复杂。未来是差异化自主。
9另一个极端“大语言模型已死”和“智能体统治世界”一样引人注目。两个都以同样的方式错了。
10两个房间演示爱好者做不完。领域专家不开始。流水线交付了——因为它听了两边的话。
11证据(本篇)最初被当作又一次演示的项目,最终成为生产系统。成功不在模型,在工程。

番外

篇次标题核心一句
A反驳我们让 AI 拆自己的系列。五轮攻防,诚实回应。
B理解系统,才有资格委托系统AI 降低了学习系统的门槛,但没有取消理解系统的必要。提问不是理解的替代。
C站在中间地带半夜醒来的那个念头。不是恐惧——是一种更复杂的东西。

写给谁

如果你是一名业界工程师,正在决定哪里用智能体、哪里用代码,这是来自一个投资机构开发者的实地报告。

如果你是一名管理者,听说智能体可以取代你的工程团队,这里可能有演示不会经常展示的内容。

如果你是一名初级开发者,想知道 AI 是否让你的技能过时,第 6 篇专门写给你。答案是细致的、诚实的,不是乐观派或末日派告诉你的那样。

如果你只是好奇,2026 年在一个投资机构开发 AI 应用系统是什么体验,欢迎围观。

开始阅读:第 1 篇——投资组合经理的不可能任务。


Originally published externally: source article.