Jun 27, 2026

番外篇：站在中间地带

系列：“我们构建了一条数万行代码的流水线。智能体为何做不到。”

上篇：番外篇——理解系统，才有资格委托系统。

Read the English version.

半夜醒来的那个念头，不只是恐惧。更准确地说，是一种被增强之后的不安。

本文是整个系列的最后一篇番外。

前面的主线已经基本走完：第6篇讲杠杆差距，第7篇讲上下文积累，第8篇讲委托和自主边界，第9篇反驳“LLM 已死”的另一种极端，第10篇讲组织里的两个房间，第11篇讲真正搭出来之后发生了什么。

这一篇不再继续证明系统为什么有效。

它想写的是，系统有效之后，留下的那种更复杂的感受。

半夜三点

有一天半夜三点，笔者突然醒来，脑子里出现了一个很清楚的念头：

如果这些工具继续变强，那么接下来会发生什么？

这个问题并不新鲜。AI 会不会替代人，AI 会不会重写职业路径，AI 会不会改变组织结构，这些问题每天都有人在讨论。

但那一刻的不安，不是来自抽象讨论。

它来自一个更具体的事实：我们确实已经把一部分原来需要人投入大量时间的工作，做成了系统。

它不是演示。它能跑。它能被用。它能被团队依赖。它把一部分材料收集、筛选、判断、记录和反馈循环变成了可重复的流程。

这当然是好事。

但也正因为它是好事，问题才变得不那么容易回答。

两个同时为真的感受

这件事带来的感受不是单一的。

一方面，它让人很兴奋。因为你真的看到，AI 不是只能写段落、总结网页、生成玩具应用。只要把模型放在正确的位置，用工程、数据、约束和人的判断托住，它可以进入真实工作流，扩大人的杠杆，减少重复劳动，把复杂流程变得更可控。

另一方面，它也让人不安。因为同一件事也说明：很多原来被认为需要大量人力、经验和时间的环节，正在被重新拆分、压缩、系统化。

这两种感受并不矛盾。

它既是机会，也是压力。

它既让人觉得“终于可以做以前做不到的事”，也让人意识到“以前用来定义能力的一部分东西，可能正在被系统吃掉”。

这不是简单的乐观或悲观。

更准确地说，是站在中间地带的感受。

为什么要把这些写下来

写这个系列，一开始并不是为了写一篇关于“AI 时代人怎么办”的文章。

一开始的问题非常具体：我们构建了一条数万行代码的生产流水线。为什么一个智能体不能直接替代它？

这个问题看起来是工程问题。但一路写下来，它慢慢变成了更大的问题。

为什么强模型不能自然拥有系统上下文？

为什么能生成代码，不等于能负责地维护系统？

为什么能完成局部动作，不等于能承接完整工作流？

为什么组织里的 Demo 爱好者和领域专家总是彼此误解？

为什么系统真正成功之后，反而会让人更不舒服？

最后这个问题，是这一篇的入口。

因为系统一旦真的有效，它就不只是证明了技术路线。它也会改变人对自己工作的理解。

当“有技术”不再那么容易判断

过去，很多工作里的技术能力相对容易识别。

会写代码、会搭框架、会调数据库、会处理数据、会部署服务、会写脚本、会把流程自动化——这些能力很具体，也相对可见。

AI 出现之后，这些能力并没有消失。但它们的可见性变了。

一个人不会从零手写完整系统，也可能在 AI 帮助下做出一个看起来不错的工具。

一个人不理解底层机制，也可能让模型一步步带着自己跑通一个流程。

一个人没有长期工程经验，也可能在短时间内搭出一个漂亮的 demo。

这不是假的。

这些变化真实存在，也非常重要。

但问题在于，外部观察者越来越难判断：一个东西“做出来了”，到底意味着什么。

它是因为人真正理解了系统，还是因为模型临时拼出了一个可运行结果？

它是因为问题被解决了，还是因为演示路径刚好没有撞到边界？

它是因为能力可持续，还是因为上下文暂时足够幸运？

“能做出来”这件事，正在失去一部分原来的区分度。

能做出来，不再足够说明问题

这也是为什么，这个系列反复强调“演示”和“生产系统”的区别。

演示可以证明可能性。生产系统要承担责任。

在 AI 之前，能把东西做出来，本身就已经说明了很多问题。因为实现成本足够高，能做出来通常意味着你至少理解了相当一部分路径。

但当模型大幅降低实现成本之后，“能做出来”本身就不再足够。

真正的问题变成：

你是否知道系统为什么能跑；
你是否知道它什么时候会错；
你是否知道它错了以后怎么查；
你是否知道哪些地方必须由人复核；
你是否知道哪些输出可以信，哪些只是看起来合理；
你是否知道当需求变化时，系统应该怎么改。

这些问题不一定在 demo 里出现。

但它们会在真实使用里出现。

所以，技术能力并没有变得不重要。

它只是从“能不能实现”，往“能不能理解、约束、维护、判断和负责”移动。

快会赢，深要自证

这带来一个非常现实的压力：

快的人会赢得更多注意力。

深的人需要更努力地证明自己为什么重要。

AI 时代的很多产品和故事，都天然偏向“快”。几天做出一个 app，一周上线一个工具，一个人完成过去一个团队的事。这些故事很有传播力，因为它们清楚、直接、振奋。

而“深”的价值通常更难展示。

你避免了一次静默失败，没有人看见。

你把系统设计得可追溯，没有人兴奋。

你没有让模型越权，没有人截图。

你把异常处理、预算控制、反馈闭环、审计路径都做好了，外部看起来只是：它正常工作。

这就是尴尬之处。

越成熟的系统，越会隐藏自己的复杂性。

越可靠的系统，越容易让人忘记可靠性是被设计出来的。

这并不是 AI 独有的问题。所有基础设施都有类似命运。只是 AI 把这个问题放大了：因为模型会让“看起来能用”的东西更容易出现，也会让“真正可靠”的部分更难被外部看见。

复杂性如何在组织里被压缩

组织天然喜欢压缩复杂性。

这不是坏事。组织必须压缩复杂性，否则无法决策。没有人能在每次讨论里重新理解所有技术细节、所有失败模式、所有上下文历史。

所以组织会把复杂系统压缩成简单标签：

这是一个 AI 项目。

这是一个自动化工具。

这是一个数据流水线。

这是一个搜索系统。

这是一个效率提升。

这些标签都不完全错。

但它们也都不够。

真正困难的部分，常常藏在标签后面：输入怎么定义，证据怎么追溯，边界怎么划，失败怎么处理，用户反馈怎么进入下一轮，责任在哪里停下来。

这也是为什么，系统越进入真实组织，越需要有人在中间翻译。

不是把技术翻译成口号。

而是把模型能力、工程约束、业务判断和组织责任翻译到同一个平面上。

这件事很难被看见，但它极其重要。

中间地带：不仅是两个房间，而是多个房间

第10篇写“两个房间”：Demo 爱好者看见能力，领域专家看见风险。

但真实组织里往往不止两个房间。

还有平台房间，关心统一入口、权限、治理和复用。

还有工程房间，关心可维护性、可观测性、成本和故障恢复。

还有业务房间，关心是否真的解决问题、是否能节省时间、是否值得改变流程。

还有管理房间，关心优先级、资源、风险和叙事。

还有合规或控制房间，关心责任边界、审计路径和可解释性。

每个房间都看见了一部分真相。

每个房间也都容易把自己看见的那部分当成全部真相。

站在中间地带，不是站在一个折中位置上各打五十大板。

它更像是在不同房间之间来回走，试图让它们看见彼此看不见的东西。

告诉 Demo 爱好者：能力是真的，但能力不是系统。

告诉领域专家：风险是真的，但风险不是拒绝开始的理由。

告诉平台视角：统一很重要，但不能抹平具体工作流的复杂性。

告诉工程视角：可靠性很重要，但不能把所有新问题都压成旧工程模式。

告诉业务视角：效率很重要，但要知道效率来自哪里，风险被放在哪里。

这就是中间地带的工作。

它不总是舒服。因为它很难提供简单口号。

但也正因为如此，它可能是这类系统真正能落地的地方。

证据之后的不舒服

第11篇讲证据。

投资团队以为又是一次演示。结果拿到了生产系统。

这是一个令人高兴的结果。

但它也带来另一层问题。

当系统证明自己能用之后，人会自然地开始问：

那下一步呢？

还能自动化什么？

还能压缩多少时间？

还能让多少流程被重写？

这并不是坏问题。事实上，这些问题非常合理。一个系统一旦证明了价值，组织当然会希望它扩展。

真正让人不舒服的是：成功本身会推动边界继续移动。

这就是系统完成之后的第一层悖论：

你越把一件复杂的事做成系统，它就越容易被看成“已经解决”。

你越把判断沉淀进流程，判断本身就越容易从能力变成基础设施。

而一旦它成为基础设施，它就会继续走向标准化、流程化，甚至商品化。

除此之外，还有第二层不舒服，来自工作边界的变化。

一个有用的系统，不能简单地被描述成“替代人”。真实工作流里的价值不只是完成动作，还包括判断、复核、责任和语境。更准确的说法是：它把一部分重复筛选和材料整理交给系统，让人把时间更多留给真正需要判断的地方。

这当然是好事。

但当系统真的承担掉一部分重复工作，它也会让原本模糊的工作边界变得更清楚：哪些事情只是重复处理，哪些事情包含真正判断；哪些地方可以交给系统，哪些地方必须由人继续承担责任。

这不是简单的“替代”。

它更像是工作边界被重新分配。

所以，证据不是终点。

证据只是把问题从“这条路是不是对的”，推进到了更深的一层：

当这条路开始成立时，人、系统、组织和用户之间的边界会如何变化？

到这里，问题已经不只是 AI 会不会替代人。

而是：当边界持续移动、判断标准持续变化、工作流本身开始被重写时，人还能把自己放在哪里。

能做的：继续往垂直深处移动

至少对笔者来说，缓解这种焦虑的方式，并不是选边站，也不是假装自己看不见。

比较可行的做法，是继续跟着技术边界移动。

但“继续移动”并不是简单地追逐更新的工具，也不是烧更多的 token。它首先意味着，对“技术”这件事本身的理解也要跟着变化。

过去，笔者也很容易把技术理解成某种更专业、更规范、更工程化的能力：代码写得够不够好，测试是否完整，框架是否成熟，结构是否优雅，流程是否标准。这些当然重要，尤其是在一个系统真正要长期运行的时候。

但在真实工作里，越来越明显的是：这些并不是全部，甚至不总是最难的部分。

更难的，是把一个还没有完全成形的问题带进现实：看见一个尚未被充分探索的方向，把业务判断、数据约束、模型能力、工程实现、用户反馈和责任边界连接起来，让它变成一个可以运行、可以复核、可以被真实团队依赖的系统。

从这个意义上说，继续移动，不只是继续学习新工具，而是继续往问题还没有被清楚定义、路径还没有被充分探索、答案还不能被一次性生成的地方走。

这句话听起来很抽象，但在实际工作里，它往往非常具体。

这条流水线从一个简单的爬虫长到几万行代码，不是因为有人一开始规划了一座完整建筑，而是因为每一次遇到模型做不到、不能稳定做、不能负责地做的事，系统就被迫往外长一圈。

浏览器级联、PDF 评分、域名级别停止规则、预算控制、异常恢复、证据追溯、用户反馈记录——这些东西没有一个适合在第一次演示里讲得很漂亮。但它们决定了一个工具能不能从“看起来有用”，走到“真的被人依赖”。这也是“自主性光谱”落到工程里之后真正指向的问题：哪些可以委托，哪些必须保留监督，哪些必须让人把控。

如果把这种“继续移动”说得再具体一点，笔者个人现在更倾向于投注“垂直/纵深”这一边，而不是“平台/横向”那一边。

这里说的不是商业判断上的简单站队，更不是断言谁会赢得整个 AI 时代。平台当然重要。统一入口、权限、治理、工具链、复用能力，这些都是真实问题。问题在于，平台叙事有时会过早简化一个更困难的问题：仿佛只要模型足够强、接口足够统一、入口足够标准，真实工作流里的大部分复杂性就会自然消失。

但真实世界往往不是这样运转的。尤其是在充满私有信息、内部规则、预算约束、非公开资产、专有流程、延迟反馈和责任归属的地方，模型的“聪明”必须被系统、上下文和专家持续托住。

所以，如果一定要说这是一个赌注，那么它不是在赌人类专家永远不会被替代。至少对笔者来说，更值得继续投入的位置，仍然更像是那些把模型嵌进具体工作流、具体证据链、具体判断结构和具体责任边界里的地方。

它更可能是在那些不容易被一句平台叙事带过的地方：数据不公开的地方，规则不写在文档里的地方，结果要被长期验证的地方，责任不能轻易外包的地方，系统必须和人一起收敛的地方。

这不提供安全感。但至少提供了一个更具体的方向。

这不是一次性的迁移。这是一种持续运动。而且它不会结束，因为边界不会停下来。站在中间地带的人感受到的，不只是机会或风险，而是一种持续的、没有终点的责任。

每一次新模型发布，都会再次提醒人：问题不是边界会不会移动，而是在边界移动之后，自己还能不能重新理解应该站在哪里。

更大的问题

而在这一切之外，还有一个更根本的问题：当杠杆比持续改变——当越来越少的人能完成越来越多的工作——社会层面的后果是什么？

就业结构、收入分配、消费基础、人的价值感，这些问题比任何技术博客能覆盖的范围都大，也比技术问题本身更复杂。

这个系列不可能回答这些问题。

它能做的，只是尽量诚实地描述正在发生的事：不夸大，不回避，不假装有答案。

如果要把这种不舒服压缩成一句话，大概是：

我们还没搞清楚问题是什么，就已经开始被要求对答案负责。

这种不舒服并不是系统失败的结果，也不会因为系统成功而自动消失。

它更像是这个阶段本身的一部分。

边界还在移动。人能做的，也许只是不断重新理解自己站在哪里。

其他番外：→ 番外篇：反驳——我们让 AI 拆自己的系列 · 番外篇：理解系统，才有资格委托系统

附：系列目录

篇目	核心观点
00 — 引言	这个系列为什么存在
01 — 不可能的任务	一切的起点
02 — 7400+ 行代码是怎么来的	流水线是怎样滚雪球的
03A — 智能体会毁掉的90%（上）	大语言模型在语义判断上不可替代；剩下 90% 全是编排
03B — 智能体会毁掉的90%（下）	六个看起来简单的问题，每一个都会让智能体翻车
04 — 诚实的对比	流水线 vs. 智能体，用数字说话
05A — 研究怎么说：数据篇	METR 的可靠性断崖；Anthropic 发现增强而非自动化
05B — 研究怎么说：框架篇	Karpathy 说组合而非替代
06 — 杠杆差距	资深 + AI = 团队。职业阶梯的第一级台阶升高了
07 — 上下文积累	编码能力已解决。工程判断没有
08A — 委托难题	模糊目标静默漂移。工具有天花板，模型看不见
08B — 自主性光谱	连倡导者说的都比标题复杂。未来是差异化自主
09 — 另一个极端	“大语言模型已死”和“智能体统治世界”一样引人注目。两个都以同样的方式错了
10 — 两个房间	演示爱好者做不完。领域专家不开始。流水线交付了——因为它听了两边的话
11 — 证据	团队以为又是一次演示。他们拿到了生产系统。成功不在模型，在工程
番外 — 反驳	我们让 AI 拆自己的系列。八个犀利攻击。诚实回应
番外 — 理解系统，才有资格委托系统	提问不是理解的替代
番外 — 站在中间地带	← 你在这里