番外篇:站在中间地带

系列:“我们构建了一条数万行代码的流水线。智能体为何做不到。”
半夜醒来的那个念头,不只是恐惧。更准确地说,是一种被增强之后的不安。
本文是整个系列的最后一篇番外。
前面的主线已经基本走完:第6篇讲杠杆差距,第7篇讲上下文积累,第8篇讲委托和自主边界,第9篇反驳“LLM 已死”的另一种极端,第10篇讲组织里的两个房间,第11篇讲真正搭出来之后发生了什么。
这一篇不再继续证明系统为什么有效。
它想写的是,系统有效之后,留下的那种更复杂的感受。
半夜三点
有一天半夜三点,笔者突然醒来,脑子里出现了一个很清楚的念头:
如果这些工具继续变强,那么接下来会发生什么?
这个问题并不新鲜。AI 会不会替代人,AI 会不会重写职业路径,AI 会不会改变组织结构,这些问题每天都有人在讨论。
但那一刻的不安,不是来自抽象讨论。
它来自一个更具体的事实:我们确实已经把一部分原来需要人投入大量时间的工作,做成了系统。
它不是演示。它能跑。它能被用。它能被团队依赖。它把一部分材料收集、筛选、判断、记录和反馈循环变成了可重复的流程。
这当然是好事。
但也正因为它是好事,问题才变得不那么容易回答。
两个同时为真的感受
这件事带来的感受不是单一的。
一方面,它让人很兴奋。因为你真的看到,AI 不是只能写段落、总结网页、生成玩具应用。只要把模型放在正确的位置,用工程、数据、约束和人的判断托住,它可以进入真实工作流,扩大人的杠杆,减少重复劳动,把复杂流程变得更可控。
另一方面,它也让人不安。因为同一件事也说明:很多原来被认为需要大量人力、经验和时间的环节,正在被重新拆分、压缩、系统化。
这两种感受并不矛盾。
它既是机会,也是压力。
它既让人觉得“终于可以做以前做不到的事”,也让人意识到“以前用来定义能力的一部分东西,可能正在被系统吃掉”。
这不是简单的乐观或悲观。
更准确地说,是站在中间地带的感受。
为什么要把这些写下来
写这个系列,一开始并不是为了写一篇关于“AI 时代人怎么办”的文章。
一开始的问题非常具体:我们构建了一条数万行代码的生产流水线。为什么一个智能体不能直接替代它?
这个问题看起来是工程问题。但一路写下来,它慢慢变成了更大的问题。
为什么强模型不能自然拥有系统上下文?
为什么能生成代码,不等于能负责地维护系统?
为什么能完成局部动作,不等于能承接完整工作流?
为什么组织里的 Demo 爱好者和领域专家总是彼此误解?
为什么系统真正成功之后,反而会让人更不舒服?
最后这个问题,是这一篇的入口。
因为系统一旦真的有效,它就不只是证明了技术路线。它也会改变人对自己工作的理解。
当“有技术”不再那么容易判断
过去,很多工作里的技术能力相对容易识别。
会写代码、会搭框架、会调数据库、会处理数据、会部署服务、会写脚本、会把流程自动化——这些能力很具体,也相对可见。
AI 出现之后,这些能力并没有消失。但它们的可见性变了。
一个人不会从零手写完整系统,也可能在 AI 帮助下做出一个看起来不错的工具。
一个人不理解底层机制,也可能让模型一步步带着自己跑通一个流程。
一个人没有长期工程经验,也可能在短时间内搭出一个漂亮的 demo。
这不是假的。
这些变化真实存在,也非常重要。
但问题在于,外部观察者越来越难判断:一个东西“做出来了”,到底意味着什么。
它是因为人真正理解了系统,还是因为模型临时拼出了一个可运行结果?
它是因为问题被解决了,还是因为演示路径刚好没有撞到边界?
它是因为能力可持续,还是因为上下文暂时足够幸运?
“能做出来”这件事,正在失去一部分原来的区分度。
能做出来,不再足够说明问题
这也是为什么,这个系列反复强调“演示”和“生产系统”的区别。
演示可以证明可能性。生产系统要承担责任。
在 AI 之前,能把东西做出来,本身就已经说明了很多问题。因为实现成本足够高,能做出来通常意味着你至少理解了相当一部分路径。
但当模型大幅降低实现成本之后,“能做出来”本身就不再足够。
真正的问题变成:
- 你是否知道系统为什么能跑;
- 你是否知道它什么时候会错;
- 你是否知道它错了以后怎么查;
- 你是否知道哪些地方必须由人复核;
- 你是否知道哪些输出可以信,哪些只是看起来合理;
- 你是否知道当需求变化时,系统应该怎么改。
这些问题不一定在 demo 里出现。
但它们会在真实使用里出现。
所以,技术能力并没有变得不重要。
它只是从“能不能实现”,往“能不能理解、约束、维护、判断和负责”移动。
快会赢,深要自证
这带来一个非常现实的压力:
快的人会赢得更多注意力。
深的人需要更努力地证明自己为什么重要。
AI 时代的很多产品和故事,都天然偏向“快”。几天做出一个 app,一周上线一个工具,一个人完成过去一个团队的事。这些故事很有传播力,因为它们清楚、直接、振奋。
而“深”的价值通常更难展示。
你避免了一次静默失败,没有人看见。
你把系统设计得可追溯,没有人兴奋。
你没有让模型越权,没有人截图。
你把异常处理、预算控制、反馈闭环、审计路径都做好了,外部看起来只是:它正常工作。
这就是尴尬之处。
越成熟的系统,越会隐藏自己的复杂性。
越可靠的系统,越容易让人忘记可靠性是被设计出来的。
这并不是 AI 独有的问题。所有基础设施都有类似命运。只是 AI 把这个问题放大了:因为模型会让“看起来能用”的东西更容易出现,也会让“真正可靠”的部分更难被外部看见。
复杂性如何在组织里被压缩
组织天然喜欢压缩复杂性。
这不是坏事。组织必须压缩复杂性,否则无法决策。没有人能在每次讨论里重新理解所有技术细节、所有失败模式、所有上下文历史。
所以组织会把复杂系统压缩成简单标签:
这是一个 AI 项目。
这是一个自动化工具。
这是一个数据流水线。
这是一个搜索系统。
这是一个效率提升。
这些标签都不完全错。
但它们也都不够。
真正困难的部分,常常藏在标签后面:输入怎么定义,证据怎么追溯,边界怎么划,失败怎么处理,用户反馈怎么进入下一轮,责任在哪里停下来。
这也是为什么,系统越进入真实组织,越需要有人在中间翻译。
不是把技术翻译成口号。
而是把模型能力、工程约束、业务判断和组织责任翻译到同一个平面上。
这件事很难被看见,但它极其重要。
中间地带:不仅是两个房间,而是多个房间
第10篇写“两个房间”:Demo 爱好者看见能力,领域专家看见风险。
但真实组织里往往不止两个房间。
还有平台房间,关心统一入口、权限、治理和复用。
还有工程房间,关心可维护性、可观测性、成本和故障恢复。
还有业务房间,关心是否真的解决问题、是否能节省时间、是否值得改变流程。
还有管理房间,关心优先级、资源、风险和叙事。
还有合规或控制房间,关心责任边界、审计路径和可解释性。
每个房间都看见了一部分真相。
每个房间也都容易把自己看见的那部分当成全部真相。
站在中间地带,不是站在一个折中位置上各打五十大板。
它更像是在不同房间之间来回走,试图让它们看见彼此看不见的东西。
告诉 Demo 爱好者:能力是真的,但能力不是系统。
告诉领域专家:风险是真的,但风险不是拒绝开始的理由。
告诉平台视角:统一很重要,但不能抹平具体工作流的复杂性。
告诉工程视角:可靠性很重要,但不能把所有新问题都压成旧工程模式。
告诉业务视角:效率很重要,但要知道效率来自哪里,风险被放在哪里。
这就是中间地带的工作。
它不总是舒服。因为它很难提供简单口号。
但也正因为如此,它可能是这类系统真正能落地的地方。
证据之后的不舒服
第11篇讲证据。
投资团队以为又是一次演示。结果拿到了生产系统。
这是一个令人高兴的结果。
但它也带来另一层问题。
当系统证明自己能用之后,人会自然地开始问:
那下一步呢?
还能自动化什么?
还能压缩多少时间?
还能让多少流程被重写?
这并不是坏问题。事实上,这些问题非常合理。一个系统一旦证明了价值,组织当然会希望它扩展。
真正让人不舒服的是:成功本身会推动边界继续移动。
这就是系统完成之后的第一层悖论:
你越把一件复杂的事做成系统,它就越容易被看成“已经解决”。
你越把判断沉淀进流程,判断本身就越容易从能力变成基础设施。
而一旦它成为基础设施,它就会继续走向标准化、流程化,甚至商品化。
除此之外,还有第二层不舒服,来自工作边界的变化。
一个有用的系统,不能简单地被描述成“替代人”。真实工作流里的价值不只是完成动作,还包括判断、复核、责任和语境。更准确的说法是:它把一部分重复筛选和材料整理交给系统,让人把时间更多留给真正需要判断的地方。
这当然是好事。
但当系统真的承担掉一部分重复工作,它也会让原本模糊的工作边界变得更清楚:哪些事情只是重复处理,哪些事情包含真正判断;哪些地方可以交给系统,哪些地方必须由人继续承担责任。
这不是简单的“替代”。
它更像是工作边界被重新分配。
所以,证据不是终点。
证据只是把问题从“这条路是不是对的”,推进到了更深的一层:
当这条路开始成立时,人、系统、组织和用户之间的边界会如何变化?
到这里,问题已经不只是 AI 会不会替代人。
而是:当边界持续移动、判断标准持续变化、工作流本身开始被重写时,人还能把自己放在哪里。
能做的:继续往垂直深处移动
至少对笔者来说,缓解这种焦虑的方式,并不是选边站,也不是假装自己看不见。
比较可行的做法,是继续跟着技术边界移动。
但“继续移动”并不是简单地追逐更新的工具,也不是烧更多的 token。它首先意味着,对“技术”这件事本身的理解也要跟着变化。
过去,笔者也很容易把技术理解成某种更专业、更规范、更工程化的能力:代码写得够不够好,测试是否完整,框架是否成熟,结构是否优雅,流程是否标准。这些当然重要,尤其是在一个系统真正要长期运行的时候。
但在真实工作里,越来越明显的是:这些并不是全部,甚至不总是最难的部分。
更难的,是把一个还没有完全成形的问题带进现实:看见一个尚未被充分探索的方向,把业务判断、数据约束、模型能力、工程实现、用户反馈和责任边界连接起来,让它变成一个可以运行、可以复核、可以被真实团队依赖的系统。
从这个意义上说,继续移动,不只是继续学习新工具,而是继续往问题还没有被清楚定义、路径还没有被充分探索、答案还不能被一次性生成的地方走。
这句话听起来很抽象,但在实际工作里,它往往非常具体。
这条流水线从一个简单的爬虫长到几万行代码,不是因为有人一开始规划了一座完整建筑,而是因为每一次遇到模型做不到、不能稳定做、不能负责地做的事,系统就被迫往外长一圈。
浏览器级联、PDF 评分、域名级别停止规则、预算控制、异常恢复、证据追溯、用户反馈记录——这些东西没有一个适合在第一次演示里讲得很漂亮。但它们决定了一个工具能不能从“看起来有用”,走到“真的被人依赖”。这也是“自主性光谱”落到工程里之后真正指向的问题:哪些可以委托,哪些必须保留监督,哪些必须让人把控。
如果把这种“继续移动”说得再具体一点,笔者个人现在更倾向于投注“垂直/纵深”这一边,而不是“平台/横向”那一边。
这里说的不是商业判断上的简单站队,更不是断言谁会赢得整个 AI 时代。平台当然重要。统一入口、权限、治理、工具链、复用能力,这些都是真实问题。问题在于,平台叙事有时会过早简化一个更困难的问题:仿佛只要模型足够强、接口足够统一、入口足够标准,真实工作流里的大部分复杂性就会自然消失。
但真实世界往往不是这样运转的。尤其是在充满私有信息、内部规则、预算约束、非公开资产、专有流程、延迟反馈和责任归属的地方,模型的“聪明”必须被系统、上下文和专家持续托住。
所以,如果一定要说这是一个赌注,那么它不是在赌人类专家永远不会被替代。至少对笔者来说,更值得继续投入的位置,仍然更像是那些把模型嵌进具体工作流、具体证据链、具体判断结构和具体责任边界里的地方。
它更可能是在那些不容易被一句平台叙事带过的地方:数据不公开的地方,规则不写在文档里的地方,结果要被长期验证的地方,责任不能轻易外包的地方,系统必须和人一起收敛的地方。
这不提供安全感。但至少提供了一个更具体的方向。
这不是一次性的迁移。这是一种持续运动。而且它不会结束,因为边界不会停下来。站在中间地带的人感受到的,不只是机会或风险,而是一种持续的、没有终点的责任。
每一次新模型发布,都会再次提醒人:问题不是边界会不会移动,而是在边界移动之后,自己还能不能重新理解应该站在哪里。
更大的问题
而在这一切之外,还有一个更根本的问题:当杠杆比持续改变——当越来越少的人能完成越来越多的工作——社会层面的后果是什么?
就业结构、收入分配、消费基础、人的价值感,这些问题比任何技术博客能覆盖的范围都大,也比技术问题本身更复杂。
这个系列不可能回答这些问题。
它能做的,只是尽量诚实地描述正在发生的事:不夸大,不回避,不假装有答案。
如果要把这种不舒服压缩成一句话,大概是:
我们还没搞清楚问题是什么,就已经开始被要求对答案负责。
这种不舒服并不是系统失败的结果,也不会因为系统成功而自动消失。
它更像是这个阶段本身的一部分。
边界还在移动。人能做的,也许只是不断重新理解自己站在哪里。
相关主线:→ 第6篇:杠杆差距 · 第7篇:上下文积累 · 第8A篇:委托难题 · 第8B篇:自主性光谱 · 第9篇:另一个极端 · 第10篇:两个房间 · 第11篇:证据
其他番外:→ 番外篇:反驳——我们让 AI 拆自己的系列 · 番外篇:理解系统,才有资格委托系统
附:系列目录
| 篇目 | 核心观点 |
|---|---|
| 00 — 引言 | 这个系列为什么存在 |
| 01 — 不可能的任务 | 一切的起点 |
| 02 — 7400+ 行代码是怎么来的 | 流水线是怎样滚雪球的 |
| 03A — 智能体会毁掉的90%(上) | 大语言模型在语义判断上不可替代;剩下 90% 全是编排 |
| 03B — 智能体会毁掉的90%(下) | 六个看起来简单的问题,每一个都会让智能体翻车 |
| 04 — 诚实的对比 | 流水线 vs. 智能体,用数字说话 |
| 05A — 研究怎么说:数据篇 | METR 的可靠性断崖;Anthropic 发现增强而非自动化 |
| 05B — 研究怎么说:框架篇 | Karpathy 说组合而非替代 |
| 06 — 杠杆差距 | 资深 + AI = 团队。职业阶梯的第一级台阶升高了 |
| 07 — 上下文积累 | 编码能力已解决。工程判断没有 |
| 08A — 委托难题 | 模糊目标静默漂移。工具有天花板,模型看不见 |
| 08B — 自主性光谱 | 连倡导者说的都比标题复杂。未来是差异化自主 |
| 09 — 另一个极端 | “大语言模型已死”和“智能体统治世界”一样引人注目。两个都以同样的方式错了 |
| 10 — 两个房间 | 演示爱好者做不完。领域专家不开始。流水线交付了——因为它听了两边的话 |
| 11 — 证据 | 团队以为又是一次演示。他们拿到了生产系统。成功不在模型,在工程 |
| 番外 — 反驳 | 我们让 AI 拆自己的系列。八个犀利攻击。诚实回应 |
| 番外 — 理解系统,才有资格委托系统 | 提问不是理解的替代 |
| 番外 — 站在中间地带 | ← 你在这里 |