番外篇:站在中间地带

系列:“我们构建了一条数万行代码的流水线。智能体为何做不到。”

上篇:番外篇——理解系统,才有资格委托系统。

Read the English version.

半夜醒来的那个念头,不只是恐惧。更准确地说,是一种被增强之后的不安。

本文是整个系列的最后一篇番外。

前面的主线已经基本走完:第6篇讲杠杆差距,第7篇讲上下文积累,第8篇讲委托和自主边界,第9篇反驳“LLM 已死”的另一种极端,第10篇讲组织里的两个房间,第11篇讲真正搭出来之后发生了什么。

这一篇不再继续证明系统为什么有效。

它想写的是,系统有效之后,留下的那种更复杂的感受。

半夜三点

有一天半夜三点,笔者突然醒来,脑子里出现了一个很清楚的念头:

如果这些工具继续变强,那么接下来会发生什么?

这个问题并不新鲜。AI 会不会替代人,AI 会不会重写职业路径,AI 会不会改变组织结构,这些问题每天都有人在讨论。

但那一刻的不安,不是来自抽象讨论。

它来自一个更具体的事实:我们确实已经把一部分原来需要人投入大量时间的工作,做成了系统。

它不是演示。它能跑。它能被用。它能被团队依赖。它把一部分材料收集、筛选、判断、记录和反馈循环变成了可重复的流程。

这当然是好事。

但也正因为它是好事,问题才变得不那么容易回答。

两个同时为真的感受

这件事带来的感受不是单一的。

一方面,它让人很兴奋。因为你真的看到,AI 不是只能写段落、总结网页、生成玩具应用。只要把模型放在正确的位置,用工程、数据、约束和人的判断托住,它可以进入真实工作流,扩大人的杠杆,减少重复劳动,把复杂流程变得更可控。

另一方面,它也让人不安。因为同一件事也说明:很多原来被认为需要大量人力、经验和时间的环节,正在被重新拆分、压缩、系统化。

这两种感受并不矛盾。

它既是机会,也是压力。

它既让人觉得“终于可以做以前做不到的事”,也让人意识到“以前用来定义能力的一部分东西,可能正在被系统吃掉”。

这不是简单的乐观或悲观。

更准确地说,是站在中间地带的感受。

为什么要把这些写下来

写这个系列,一开始并不是为了写一篇关于“AI 时代人怎么办”的文章。

一开始的问题非常具体:我们构建了一条数万行代码的生产流水线。为什么一个智能体不能直接替代它?

这个问题看起来是工程问题。但一路写下来,它慢慢变成了更大的问题。

为什么强模型不能自然拥有系统上下文?

为什么能生成代码,不等于能负责地维护系统?

为什么能完成局部动作,不等于能承接完整工作流?

为什么组织里的 Demo 爱好者和领域专家总是彼此误解?

为什么系统真正成功之后,反而会让人更不舒服?

最后这个问题,是这一篇的入口。

因为系统一旦真的有效,它就不只是证明了技术路线。它也会改变人对自己工作的理解。

当“有技术”不再那么容易判断

过去,很多工作里的技术能力相对容易识别。

会写代码、会搭框架、会调数据库、会处理数据、会部署服务、会写脚本、会把流程自动化——这些能力很具体,也相对可见。

AI 出现之后,这些能力并没有消失。但它们的可见性变了。

一个人不会从零手写完整系统,也可能在 AI 帮助下做出一个看起来不错的工具。

一个人不理解底层机制,也可能让模型一步步带着自己跑通一个流程。

一个人没有长期工程经验,也可能在短时间内搭出一个漂亮的 demo。

这不是假的。

这些变化真实存在,也非常重要。

但问题在于,外部观察者越来越难判断:一个东西“做出来了”,到底意味着什么。

它是因为人真正理解了系统,还是因为模型临时拼出了一个可运行结果?

它是因为问题被解决了,还是因为演示路径刚好没有撞到边界?

它是因为能力可持续,还是因为上下文暂时足够幸运?

“能做出来”这件事,正在失去一部分原来的区分度。

能做出来,不再足够说明问题

这也是为什么,这个系列反复强调“演示”和“生产系统”的区别。

演示可以证明可能性。生产系统要承担责任。

在 AI 之前,能把东西做出来,本身就已经说明了很多问题。因为实现成本足够高,能做出来通常意味着你至少理解了相当一部分路径。

但当模型大幅降低实现成本之后,“能做出来”本身就不再足够。

真正的问题变成:

  • 你是否知道系统为什么能跑;
  • 你是否知道它什么时候会错;
  • 你是否知道它错了以后怎么查;
  • 你是否知道哪些地方必须由人复核;
  • 你是否知道哪些输出可以信,哪些只是看起来合理;
  • 你是否知道当需求变化时,系统应该怎么改。

这些问题不一定在 demo 里出现。

但它们会在真实使用里出现。

所以,技术能力并没有变得不重要。

它只是从“能不能实现”,往“能不能理解、约束、维护、判断和负责”移动。

快会赢,深要自证

这带来一个非常现实的压力:

快的人会赢得更多注意力。

深的人需要更努力地证明自己为什么重要。

AI 时代的很多产品和故事,都天然偏向“快”。几天做出一个 app,一周上线一个工具,一个人完成过去一个团队的事。这些故事很有传播力,因为它们清楚、直接、振奋。

而“深”的价值通常更难展示。

你避免了一次静默失败,没有人看见。

你把系统设计得可追溯,没有人兴奋。

你没有让模型越权,没有人截图。

你把异常处理、预算控制、反馈闭环、审计路径都做好了,外部看起来只是:它正常工作。

这就是尴尬之处。

越成熟的系统,越会隐藏自己的复杂性。

越可靠的系统,越容易让人忘记可靠性是被设计出来的。

这并不是 AI 独有的问题。所有基础设施都有类似命运。只是 AI 把这个问题放大了:因为模型会让“看起来能用”的东西更容易出现,也会让“真正可靠”的部分更难被外部看见。

复杂性如何在组织里被压缩

组织天然喜欢压缩复杂性。

这不是坏事。组织必须压缩复杂性,否则无法决策。没有人能在每次讨论里重新理解所有技术细节、所有失败模式、所有上下文历史。

所以组织会把复杂系统压缩成简单标签:

这是一个 AI 项目。

这是一个自动化工具。

这是一个数据流水线。

这是一个搜索系统。

这是一个效率提升。

这些标签都不完全错。

但它们也都不够。

真正困难的部分,常常藏在标签后面:输入怎么定义,证据怎么追溯,边界怎么划,失败怎么处理,用户反馈怎么进入下一轮,责任在哪里停下来。

这也是为什么,系统越进入真实组织,越需要有人在中间翻译。

不是把技术翻译成口号。

而是把模型能力、工程约束、业务判断和组织责任翻译到同一个平面上。

这件事很难被看见,但它极其重要。

中间地带:不仅是两个房间,而是多个房间

第10篇写“两个房间”:Demo 爱好者看见能力,领域专家看见风险。

但真实组织里往往不止两个房间。

还有平台房间,关心统一入口、权限、治理和复用。

还有工程房间,关心可维护性、可观测性、成本和故障恢复。

还有业务房间,关心是否真的解决问题、是否能节省时间、是否值得改变流程。

还有管理房间,关心优先级、资源、风险和叙事。

还有合规或控制房间,关心责任边界、审计路径和可解释性。

每个房间都看见了一部分真相。

每个房间也都容易把自己看见的那部分当成全部真相。

站在中间地带,不是站在一个折中位置上各打五十大板。

它更像是在不同房间之间来回走,试图让它们看见彼此看不见的东西。

告诉 Demo 爱好者:能力是真的,但能力不是系统。

告诉领域专家:风险是真的,但风险不是拒绝开始的理由。

告诉平台视角:统一很重要,但不能抹平具体工作流的复杂性。

告诉工程视角:可靠性很重要,但不能把所有新问题都压成旧工程模式。

告诉业务视角:效率很重要,但要知道效率来自哪里,风险被放在哪里。

这就是中间地带的工作。

它不总是舒服。因为它很难提供简单口号。

但也正因为如此,它可能是这类系统真正能落地的地方。

证据之后的不舒服

第11篇讲证据。

投资团队以为又是一次演示。结果拿到了生产系统。

这是一个令人高兴的结果。

但它也带来另一层问题。

当系统证明自己能用之后,人会自然地开始问:

那下一步呢?

还能自动化什么?

还能压缩多少时间?

还能让多少流程被重写?

这并不是坏问题。事实上,这些问题非常合理。一个系统一旦证明了价值,组织当然会希望它扩展。

真正让人不舒服的是:成功本身会推动边界继续移动。

这就是系统完成之后的第一层悖论:

你越把一件复杂的事做成系统,它就越容易被看成“已经解决”。

你越把判断沉淀进流程,判断本身就越容易从能力变成基础设施。

而一旦它成为基础设施,它就会继续走向标准化、流程化,甚至商品化。

除此之外,还有第二层不舒服,来自工作边界的变化。

一个有用的系统,不能简单地被描述成“替代人”。真实工作流里的价值不只是完成动作,还包括判断、复核、责任和语境。更准确的说法是:它把一部分重复筛选和材料整理交给系统,让人把时间更多留给真正需要判断的地方。

这当然是好事。

但当系统真的承担掉一部分重复工作,它也会让原本模糊的工作边界变得更清楚:哪些事情只是重复处理,哪些事情包含真正判断;哪些地方可以交给系统,哪些地方必须由人继续承担责任。

这不是简单的“替代”。

它更像是工作边界被重新分配。

所以,证据不是终点。

证据只是把问题从“这条路是不是对的”,推进到了更深的一层:

当这条路开始成立时,人、系统、组织和用户之间的边界会如何变化?

到这里,问题已经不只是 AI 会不会替代人。

而是:当边界持续移动、判断标准持续变化、工作流本身开始被重写时,人还能把自己放在哪里。

能做的:继续往垂直深处移动

至少对笔者来说,缓解这种焦虑的方式,并不是选边站,也不是假装自己看不见。

比较可行的做法,是继续跟着技术边界移动。

但“继续移动”并不是简单地追逐更新的工具,也不是烧更多的 token。它首先意味着,对“技术”这件事本身的理解也要跟着变化。

过去,笔者也很容易把技术理解成某种更专业、更规范、更工程化的能力:代码写得够不够好,测试是否完整,框架是否成熟,结构是否优雅,流程是否标准。这些当然重要,尤其是在一个系统真正要长期运行的时候。

但在真实工作里,越来越明显的是:这些并不是全部,甚至不总是最难的部分。

更难的,是把一个还没有完全成形的问题带进现实:看见一个尚未被充分探索的方向,把业务判断、数据约束、模型能力、工程实现、用户反馈和责任边界连接起来,让它变成一个可以运行、可以复核、可以被真实团队依赖的系统。

从这个意义上说,继续移动,不只是继续学习新工具,而是继续往问题还没有被清楚定义、路径还没有被充分探索、答案还不能被一次性生成的地方走。

这句话听起来很抽象,但在实际工作里,它往往非常具体。

这条流水线从一个简单的爬虫长到几万行代码,不是因为有人一开始规划了一座完整建筑,而是因为每一次遇到模型做不到、不能稳定做、不能负责地做的事,系统就被迫往外长一圈。

浏览器级联、PDF 评分、域名级别停止规则、预算控制、异常恢复、证据追溯、用户反馈记录——这些东西没有一个适合在第一次演示里讲得很漂亮。但它们决定了一个工具能不能从“看起来有用”,走到“真的被人依赖”。这也是“自主性光谱”落到工程里之后真正指向的问题:哪些可以委托,哪些必须保留监督,哪些必须让人把控。

如果把这种“继续移动”说得再具体一点,笔者个人现在更倾向于投注“垂直/纵深”这一边,而不是“平台/横向”那一边。

这里说的不是商业判断上的简单站队,更不是断言谁会赢得整个 AI 时代。平台当然重要。统一入口、权限、治理、工具链、复用能力,这些都是真实问题。问题在于,平台叙事有时会过早简化一个更困难的问题:仿佛只要模型足够强、接口足够统一、入口足够标准,真实工作流里的大部分复杂性就会自然消失。

但真实世界往往不是这样运转的。尤其是在充满私有信息、内部规则、预算约束、非公开资产、专有流程、延迟反馈和责任归属的地方,模型的“聪明”必须被系统、上下文和专家持续托住。

所以,如果一定要说这是一个赌注,那么它不是在赌人类专家永远不会被替代。至少对笔者来说,更值得继续投入的位置,仍然更像是那些把模型嵌进具体工作流、具体证据链、具体判断结构和具体责任边界里的地方。

它更可能是在那些不容易被一句平台叙事带过的地方:数据不公开的地方,规则不写在文档里的地方,结果要被长期验证的地方,责任不能轻易外包的地方,系统必须和人一起收敛的地方。

这不提供安全感。但至少提供了一个更具体的方向。

这不是一次性的迁移。这是一种持续运动。而且它不会结束,因为边界不会停下来。站在中间地带的人感受到的,不只是机会或风险,而是一种持续的、没有终点的责任。

每一次新模型发布,都会再次提醒人:问题不是边界会不会移动,而是在边界移动之后,自己还能不能重新理解应该站在哪里。

更大的问题

而在这一切之外,还有一个更根本的问题:当杠杆比持续改变——当越来越少的人能完成越来越多的工作——社会层面的后果是什么?

就业结构、收入分配、消费基础、人的价值感,这些问题比任何技术博客能覆盖的范围都大,也比技术问题本身更复杂。

这个系列不可能回答这些问题。

它能做的,只是尽量诚实地描述正在发生的事:不夸大,不回避,不假装有答案。

如果要把这种不舒服压缩成一句话,大概是:

我们还没搞清楚问题是什么,就已经开始被要求对答案负责。

这种不舒服并不是系统失败的结果,也不会因为系统成功而自动消失。

它更像是这个阶段本身的一部分。

边界还在移动。人能做的,也许只是不断重新理解自己站在哪里。

相关主线:→ 第6篇:杠杆差距 · 第7篇:上下文积累 · 第8A篇:委托难题 · 第8B篇:自主性光谱 · 第9篇:另一个极端 · 第10篇:两个房间 · 第11篇:证据

其他番外:→ 番外篇:反驳——我们让 AI 拆自己的系列 · 番外篇:理解系统,才有资格委托系统

附:系列目录

篇目核心观点
00 — 引言这个系列为什么存在
01 — 不可能的任务一切的起点
02 — 7400+ 行代码是怎么来的流水线是怎样滚雪球的
03A — 智能体会毁掉的90%(上)大语言模型在语义判断上不可替代;剩下 90% 全是编排
03B — 智能体会毁掉的90%(下)六个看起来简单的问题,每一个都会让智能体翻车
04 — 诚实的对比流水线 vs. 智能体,用数字说话
05A — 研究怎么说:数据篇METR 的可靠性断崖;Anthropic 发现增强而非自动化
05B — 研究怎么说:框架篇Karpathy 说组合而非替代
06 — 杠杆差距资深 + AI = 团队。职业阶梯的第一级台阶升高了
07 — 上下文积累编码能力已解决。工程判断没有
08A — 委托难题模糊目标静默漂移。工具有天花板,模型看不见
08B — 自主性光谱连倡导者说的都比标题复杂。未来是差异化自主
09 — 另一个极端“大语言模型已死”和“智能体统治世界”一样引人注目。两个都以同样的方式错了
10 — 两个房间演示爱好者做不完。领域专家不开始。流水线交付了——因为它听了两边的话
11 — 证据团队以为又是一次演示。他们拿到了生产系统。成功不在模型,在工程
番外 — 反驳我们让 AI 拆自己的系列。八个犀利攻击。诚实回应
番外 — 理解系统,才有资格委托系统提问不是理解的替代
番外 — 站在中间地带← 你在这里