Jun 18, 2026

第6篇：杠杆差距——谁真正从 AI 中受益

系列：“我们构建了一条数万行代码的流水线。智能体为何做不到。”

前五篇证明了一件事：AI 无法自主构建系统——但在专家指导下，它能完成系统中大量、甚至大部分可被明确约束的执行工作。瓶颈不是 AI 的能力，而是指导它的人类判断力。这就拉开了一条新的差距：拥有这种判断力的人，能用 AI 撬动原本需要整个团队才能完成的工作；缺乏这种判断力的人，则发现自己正在被 AI 加持的少数人所替代。公司在围绕这个差距重组——有时基于正确的判断，有时基于对技术的过度预期。

上篇：第5B篇——研究到底说了什么：框架篇。METR 的可靠性悬崖、Anthropic 自己的数据、Karpathy 的组合框架、SWE-CI 的演化失败——六条证据线，一个结论：至少在当前 LLM 架构下，智能体是组件，不是系统。

前五篇讲清楚了 AI 为什么不能自主构建系统——它只是整个解决方案的大约 10%，不能独立处理架构决策、边界情况、跨组件的权衡。读到这里，很容易得出一个结论：既然 AI 只是 10%，那它的影响也有限。但这个结论漏掉了故事的另一半。

没有讲完的故事

前五篇反复强调的是 AI 做不到什么。这一篇要先讲一个前五篇没有展开的事实：AI 在这条流水线里到底做了多少。

表面上看，LLM 只负责大约 10% 的工作——链接分类、相关性判断、内容打分。另外 90% 是浏览器级联、重试逻辑、PDF 处理、状态管理、错误恢复。听起来像是“AI 做了 10%，人做了 90%”。

但实际情况不是这样。

那 90% 的代码——浏览器级联的七层降级、重试预算的指数退避、PDF 评分的启发式规则——大部分也是由 AI 写出来的。不是 AI 自主写出来的，而是在一个有系统经验的工程师指导下写出来的：哪些边界情况会在第 500 家公司的网站上爆掉，哪些重试策略会在规模之下崩溃，哪些看似合理的架构决策会在三个月后变成技术债。AI 负责执行，但方向、约束、停止条件、架构选择——这些都来自人类的判断。

所以真正的图景不是“AI 做了 10%，人做了 90%”。而是：AI 在专家指导下完成了大量、甚至大部分可被明确约束的执行工作——前提是有人先把边界与约束想清楚。

这改变了整个等式。AI 的影响不是有限的——它是巨大的。但这种影响有一个前提条件：指导它的人需要有足够的判断力。没有这个前提，AI 只是一个会自信地犯错的自动补全工具。有了这个前提，一个人加上 AI 就能交付原本需要一个团队的成果。

这就是杠杆差距的来源。差距不在“AI 能不能取代人”——前五篇已经证明它不能自主做到。差距在“谁有能力指导 AI”。拥有这种能力的人获得了巨大的杠杆；而那些工作内容更容易被标准化、不需要太多判断的角色，则面临着越来越大的压力——不是因为 AI 取代了所有人，而是因为 AI 让少数有判断力的人变得太强了。

公司已经在围绕这个差距做决策了。有时基于正确的判断，有时跑在了技术前面。我们来看看发生了什么。

Block 裁掉接近四成员工，股价涨了约 24%

2026 年 2 月。Block——Jack Dorsey 的金融科技公司——裁掉了 4000 多名员工，约占员工总数的 40%。

Dorsey 把那句心里话说出来了：“一个明显更小的团队，使用我们正在构建的工具，能做更多、做得更好。”

CFO Amrita Ahuja 更精确：“我们看到了一个机会，用更小的、高度有才华的团队，借助 AI 自动化更多工作，从而更快地推进。”

Amrita Ahuja 的用词很值得注意：她强调的不是“现有团队加上新工具”，而是“更小的、高度有才华的团队”。这几乎把杠杆差距写进了组织语言里——管理层已经在围绕“哪些工作可以被 AI 放大、哪些判断仍然稀缺”来重新切分岗位。

连锁反应

这波重组里，有些公司把 AI 与裁员直接绑定：Atlassian 裁员 1600 人，官方公告明确说是为了 self-fund AI 投资并重塑技能结构；CrowdStrike 的 CEO 称 AI 是“force multiplier”，帮公司压平了招聘曲线；Chegg 裁员 45%，直接归因于 AI 和搜索流量的变化。有些公司把裁员、组织瘦身和 AI 投资同步推进：Pinterest 裁掉近 15% 员工，在 SEC 文件中写明要把资源重新分配到 AI 方向；Amazon 裁掉约 16000 个岗位，同时加大 AI 投入，但官方说明强调的是减少层级、提高责任感和降低官僚成本，而不是声称这些岗位已被 AI 直接替代。

Dorsey 的预言：“在未来一年内，我相信大多数公司会得出相同的结论，做出类似的结构性改变。”

这些公司的公开表述有一个共同方向：它们都不再把“现有岗位结构 + AI 工具”视为默认组合，而是在重塑技能结构，优先保留或增配那些能与 AI 协作、指导 AI、并在关键环节做判断的人。Anthropic 的劳动力研究没有发现系统性失业上升，但给出了一个值得关注的早期信号：在 AI 暴露更高的职业中，年轻人的进入似乎在变难。作者明确把这称为 suggestive evidence，并提醒存在多种替代解释——年轻人可能留在了原岗位、转向了其他职业、或回了学校。相关讨论特别指向 22–25 岁这类传统上承担“在指导下执行”角色的年轻人群，但这一信号目前仍属于边缘显著、需要持续观察的早期现象。

这个模式不是“AI 取代人类”。这是一个更具体的结构性筛选：你的工作是独立执行标准化任务，还是在不确定性中做需要上下文的判断？前者的风险从来就存在——外包潮的时候就存在，流程自动化的时候也存在。AI 只是把加速度提高了一个量级。

Oracle：当这个模式被推到极端

这句预言说了不到几个月，Oracle 就把它推到了极端——分析师估计裁员可能波及两三万人。这个数字是分析师和媒体的估算，Oracle 并未确认最终总人数。

Oracle 的案例值得单独看，因为它揭示了一个比“AI 取代岗位”更深的机制。

Oracle 近几个季度的利润增长强劲。这不是一家亏损的公司在裁员求生。广泛的报道和分析师估算表明，Oracle 正在通过大规模裁员释放现金流，以支撑其高强度的 AI 基础设施投入——数百亿美元级别的 AI 数据中心建设。如果顺着外部报道和分析师估算往下推，一个更深的机制会浮现出来：这不只是“裁员 + AI 投资”，而更像是把原本用于人的成本空间，兑换成 AI 基建的资本预算——为一场还没有回报的 AI 基建赌注续命。

公开报道显示裁员横跨多条业务线，但公司没有公布完整分布。因此，能确认的是裁员并不局限于某一种岗位；不能直接确认的是，它是否精确地按照“标准化、可独立执行”这一条线筛选。

这恰好呼应了 Dorsey 那句“高度有才华的团队”。用一个不算夸张的说法，这些岗位并不只是“被裁掉”，它们所释放出来的成本空间，正在被重定向为 AI 基建的资本预算。这当然不是 Oracle 自己的措辞，而是顺着外部报道和分析师估算往下推的一种解释。

这不是临时调整。这更像是“生产力”定义的一次结构性转变。公司不只是在用 AI 来帮助现有团队。它们在围绕新的杠杆比重新构建组织——更少的人，每个人有更大的 AI 放大效应，按判断力而非产出量来筛选。

时代转换：从助手到执行者

2023 年的 AI 更像一个助手。你写代码，它建议补全。初级员工 + GPT-4 还是个初级员工，只是快了点。

到 Claude Opus 4 这一代，变化更像质变而不是量变。AI 不只是自动补全——它开始实现。你描述架构，它写代码。你指定约束，它生成方案。你审查并迭代。如果把近两年的变化压缩成一句话：AI 正在把很多组织对“执行型人力”的需求，往“少数人定方向、更多执行由工具完成”的方向推。

这里有一个本系列不会装看不见的现实：至少在一部分标准化、可复制、可通过明确约束描述的软件工作上——维护脚本、标准 CRUD 应用、典型前端页面、模板驱动的移动 App——很多组织已经开始把 AI 视为压缩纯执行角色的理由。这些都是真实的岗位，由真实的人担任。这里重要的不只是技术能力本身，也包括管理层对“哪类执行可以被工具承接”的判断。下次裁员新闻出来的时候——“XX 公司裁掉 500 名工程师”——先看看裁的是什么再下结论。

这个转变不是从“人写代码”到“AI 写代码”。而是从“很多人执行指令”到“少数人定方向，AI 执行”。这会逐步改变哪些角色在组织里最关键——而且这种变化很可能不会等所有人都准备好。

这个转变对写这条流水线的人意味着什么——既是被加速的兴奋，也是不确定性的焦虑——在番外篇：站在中间地带里有更私人的讨论。

改写人头数的算术

这条流水线本身就是杠杆差距的活证据：在 AI 辅助下，一个有判断力的人可以处理原本需要更大团队协作的工作量。问题不在于“人少了”，而在于指导能力成了新的瓶颈——有它的人杠杆倍增，没有它的人变得可替代。

这种杠杆差距不只存在于公司裁员表和宏观情景里，也存在于组织内部——“官方自动化”与真实问题复杂度之间。换句话说，这一篇讲的不只是“谁被替代”，更是“哪些问题值得被组织认真自动化、哪些问题仍然需要高判断力的人来兜底”。

机构提供的替代方案

为了把流水线投入生产，开发者需要一个能支撑大规模浏览器自动化的受管运行环境。一个内部小组建议试试组织现有的可视化自动化方案，并安排了演示。

很快答案就清楚了。那个工具是一个专有的图形化编程环境——你在画面上拖拽可视化模块，让它导航到某个网站（大多是内部系统），按固定模式点击链接，把结果保存到某个共享位置。一个稳健的、点击式的自动化操场。对它的本来用途——可重复的、可预测的、针对稳定内部页面的任务——确实管用。

但它做不了的事情是：跨数千个陌生域名分类链接、处理反爬虫挑战、管理重试预算、按相关性对 PDF 打分、在浏览器级联中逐级降级、做需要判断力的决策。本系列第3篇讲的那些工程挑战——浏览器级联、重试逻辑、PDF 评分——虽然大部分代码是在人类专家指导下由 AI 写出来的，但需要有人知道该写什么。这完全不在那个工具的世界里。

讲这个故事不是为了嘲笑这个工具背后的人。它解决了一个真实问题——为可预测的工作流提供自动化。这个故事之所以重要，是因为它揭示了杠杆差距的另一面：不只是 AI 放大了个体工程师的能力，还有很多组织的制度化工具箱根本没有跟上自己业务部门试图解决的问题的复杂度。外面的炒作世界在高喊智能体将取代一切。而企业内部，官方提供的自动化方案是一个点击录制器。

这个差距不只是“采用 AI 的公司”和“没采用 AI 的公司”之间的差距。而是 AI 能够实现的东西和机构实际提供的东西之间的差距。而落入这个缝隙里的人——问题太复杂、机构工具解决不了，但自己又没有工程能力来构建解决方案——恰恰是最可能抓起一个智能体、然后祈祷它能行的人。

杠杆的账

想象一个光谱：一端是数据、量化、工程工具链，另一端是领域知识、行业经验、业务判断。大多数人一辈子站在其中一端——因为中间的壁垒太高了。一个工程师想真正理解 ESG 披露规则，以前要花几年时间浸泡在行业里；一个投资经理想写出生产级的浏览器级联，以前要从零学编程。

AI 正在拆掉这道壁垒。它不是替代光谱的任何一端，而是成为连接两端的桥——一个懂架构的工程师，用 AI 在一个下午走通整个 CSRD 框架；一个投资经理，用 AI 把自己的领域直觉翻译成可执行的代码约束。两边都在向中间移动。杠杆不是“AI 帮你做得更快”——那只是加速。杠杆是你能横跨光谱的两端，而别人只守着一端。跨得越宽，AI 能放大的东西越多。

但横跨光谱不是自动发生的。一位花了十几年调试系统、跟生产事故搏斗的工程师，对“什么东西会在生产中悄悄坏掉”有深刻的直觉——但这并不自动意味着知道 LLM 在哪里可靠、在哪里会出错。那是另一种判断力，需要额外投入才能建立。真正获得杠杆的，是那些既有一端的深度、又愿意用 AI 作为桥去探索另一端的人。

这个模式在每个行业都适用。但为了把账算清楚，用软件工程的例子来量化：

你付这样一位资深 50 万美元年薪。五个初级员工每人 10 万，总成本一样。但是：

这位资深写 CLAUDE.md——架构、约束、设计决策——AI 执行。输出是生产级的，因为指导是生产级的。
五个初级员工用同一个 AI，但写不出那个指导。不知道该要求什么，没法评估输出能不能扛住生产，更容易接受看似合理但实际错误的输出。
2023 年，初级员工至少在敲代码。2026 年，AI 敲代码，资深指导。初级员工传统上承担的“在指导下执行”，恰恰是 AI 现在越来越擅长承接的部分。

这笔账算起来让人不舒服。无论是否被公开说出来，类似的算术很可能已经进入了不少 CTO 和管理层的讨论。而且有一个反直觉的事实让这笔账更难反驳：AI 确实在短期内拉平了技能差距——给初级员工一个好的 AI 工具，他们在 AI 擅长的任务上确实能接近资深水平。但这对就业市场未必有同样直接的帮助——因为如果资深 + AI 可以交付原来需要一个团队的成果，那些岗位就未必会开放。

但这笔账有个反面。一个资深 + AI 不是无限可扩展的。资深会成为瓶颈——审查容量、上下文切换成本、决策疲劳。到了某个点，你需要更多资深，而资深不是凭空冒出来的。他们从获得了通过实战积累判断力机会的初级员工成长而来。砍掉所有初级岗位，你优化的是本季度的利润率，牺牲的是五年后的人才梯队。

这个张力——现在优化 vs. 为将来储备能力——没有干净利落的答案。做得好的公司是那些保留了一部分初级岗位并重新定义了它们的：不再是“我让你敲什么你就敲什么”，而是“跟着一个已经会指导 AI 的人学着一起指导 AI”。

如果所有公司都这样做，会发生什么

前面是已经发生的事——公司公告、分析师估算、劳动力数据。下面是一个思想实验：把同样的趋势外推到系统级别。证据的性质不同了，请带着不同的眼光阅读。

宏观后果：理性的决策，非理性的结果

一家公司缩减团队、利润率改善——聪明的决策。所有公司同时这么干——出问题了。

Citrini Research 的“2028 全球智能危机”用一个思想实验建模了这个场景。这不是预测，不是证据——而是一份以 2028 年 6 月为背景的虚构宏观备忘录，一个“如果每家公司都做了同样理性的决定，系统级别会发生什么”的情景推演。它的价值不在于预言，而在于它和我们这个系列一直在描述的结构问题是完全同构的：单独正确的决策，叠加出一个坏掉的系统。

每家公司的决策单独看都是理性的：

Block 裁掉 4000 多人。股价跳涨约 24%。
Atlassian 裁掉 1600 人，目标是强化公司的财务状况。
Oracle 可能裁掉上万人——分析师的解释不是 AI 已经取代了全部工作，而是释放现金流来赌 AI 基建。
每位 CFO 看到同样的表格：更小的团队 + AI = 更高的利润率。

集体结果是一个负反馈循环：

公司缩减团队 → 利润率改善
被裁的人消费减少 → 需求下降
营收承压 → 继续裁 → 加大 AI 投入
循环往复

Citrini 称之为智能置换螺旋——最令人不安的是每一步都是单独正确的。没有人犯错。系统犯了错。

数字很具体：收入前 10% 的人驱动了超过 50% 的消费支出。白领职位减少不只是减少人数——它掏空了需求基础。白领就业减少 2%，转化为可选消费支出下降 3–4%，中间有几个月的储蓄缓冲隐藏了损失，直到它已经很深了。

再强调一遍：这是情景推演中的假设，不是已经发生的统计事实，也不是本文的预测。但它背后的结构逻辑——合成谬误，对每个部分好的事情对整体不好——是真实的经济学原理，不是科幻。

那么个人呢

从公司和宏观回到个体。如果杠杆差距是真的，路在哪里？

如果杠杆差距是真的，初级员工还有什么路径

路没有封死。只是变窄了，方向也不一样了。

一家公司原来招 100 个初级员工，现在可能招 40 个。门槛不是在领域专业知识上提高了——你不能要求刚入行的人具备那些。门槛提高在能和 AI 协作，而不是通过 AI 工作。

这个区别很重要。通过 AI 工作，意思是把它当高级自动补全用——把问题贴过去，把答案复制回来，继续走。和 AI 协作，意思是理解它擅长什么、不擅长什么，以及怎么验证两者的区别。

2023 年的一项实地实验发现，当任务落在 AI 能力边界之外时，使用 AI 的顾问比不使用 AI 的顾问更容易给出错误答案，说明不去质疑看似合理的输出会付出代价。到了 2026 年 AI 能力更强、输出更像模像样的时代，这个陷阱只会更深。如果这个趋势继续下去，那些更可能被录用的初级员工，很可能不是最会用 AI 生成答案的人，而是更早建立起校准过的信任的人：知道什么时候依赖 AI，什么时候质疑它。

没有经验怎么建立这种能力？做这条流水线的开发过程在小尺度上看起来是这样的：

把 AI 当探索工具，而不是理解的替代品。 当 AI 生成一个答案，让它解释。试着搞坏它。建立一个关于为什么能用的心智模型——而不只是它能用。
真正能建立判断力的，往往不是教程项目。 而是那些会暴露边缘情况、失败模式和真实约束的“真东西”。这条流水线关于 PDF 处理和浏览器级联的教训，只在规模之下、压力之中才浮现出来。
与其信基准测试，不如在自己的问题上做最小规模的实测。 在 100 个案例上跑一遍，数错误。这比任何营销材料都更快建立校准感。
在 AI 更强的环境里，能否把边界、停止条件、预算和例外写清楚，往往比“会不会下 prompt”更重要。 一个初级员工提示“给我写个爬虫”和一个写“爬 ESG 页面，遵循这些停止条件、这些重试预算、这个 robots.txt 合规规则，标记任何不匹配这些模式的东西”——两者之间的差距就是 Demo 和系统的差距。CLAUDE.md 不是魔法。它是积累的工程判断力的文字化。

竞争前移了。光有 CS 学位然后在职学习已经不够了。但也不是绝望——而是不同了。那些到来时已经建过真东西、在自己的项目上测量过 AI 的失败模式、养成了质疑看似合理输出的本能的初级员工，往往会比想象中更有优势——因为他们所在的环境里，指导 AI 的能力比充当 AI 的延伸更有价值。

而且这不只是给初级员工的建议。自主学习是整个杠杆差距里最被低估的变量。AI 把跨越光谱的试错成本大幅降了下来——前面说过，工程师可以用一个下午走通 ESG 框架，投资经理可以用 AI 把领域直觉翻译成代码约束。关键不是 AI 让学习自动发生——而是它把门槛从“能否获取知识”更多地推向了“有没有好奇心和自驱力去获取并校准它”。至少在越来越多能被 AI 辅助探索的领域里，获取知识本身的门槛正在下降；真正更稀缺的，开始变成主动去获取并校准它的意愿。

这条流水线就是这个光谱模型的活证据。它不可能由一个纯软件工程师构建——不知道哪些 ESG 披露重要，就会采集到一堆错误的文档。也不可能由一个纯领域专家构建——写不出浏览器级联和重试预算，就只能手动复制粘贴。它存在，是因为一个人用 AI 作为桥，同时占领了光谱的两端。

在 AI 放大跨界能力的环境里，“不需要懂业务”或“不需要懂技术”这种单边站位的风险正在上升。AI 不取代任何一端——但它让能跨越两端的人获得越来越大的优势，也让只守着一端的人在很多组织里变得越来越脆弱。

职业阶梯没有消失。但第一级台阶升高了，阶梯也变短了——因为 AI 压缩了中间层——而且它不再是沿着一个学科笔直往上爬。它在学科之间曲折前行。如果把前面的组织变化、岗位压缩与跨学科杠杆放在一起看，那么，从“会写代码”到“能架构一个解决领域问题的系统”的路径，正在变成越来越重要、也越来越高回报的一条路径。

这条流水线花了九个月。在这个过程中，它积累了一种智能体在起步时并不自然拥有的东西：上下文。

下一篇：第7篇——上下文积累：智能体难以自然拥有的东西。

系列目录

篇目	核心观点
00 — 引言	这个系列为什么存在
01 — 不可能的任务	一切的起点
02 — 7400+ 行代码是怎么来的	流水线是怎样滚雪球的
03A — 大脑与身体	LLM = 10% 大脑，代码 = 90% 身体
03B — 六个看起来简单的问题	让智能体翻车的边缘情况
04 — 诚实的对比	流水线 vs 智能体，用数字说话
05A — 研究到底说了什么：数据篇	METR 的可靠性断崖，Anthropic 的劳动力研究
05B — 研究到底说了什么：框架篇	Karpathy、SWE-CI、长尾、汇聚
06 — 杠杆差距	你在这里
07 — 上下文积累	智能体难以自然拥有的东西
08A — 委托问题	为什么你不能直接丢给它
08B — 自主性光谱	找到合适的级别
09 — 另一个极端	当怀疑变成瘫痪
10 — 两个房间	Demo 狂热者 vs 领域怀疑论者
11 — 证据	流水线作为证据
番外 — 反方论点	AI 反驳整个系列
番外 — 站在中间地带	半夜醒来的那个念头

参考资料

Block. Q4 2025 Shareholder Letter.
Atlassian. “An Important Update on Our Team.” 2026。
Pinterest. Form 8-K: Global Restructuring Plan. 2026。
Chegg. “Chegg to Remain a Standalone Public Company.” 2025。
Amazon. “Update on Our Organization.” 2026。
Massenkoff, M. & McCrory, P. “Labor Market Impacts of AI.” 2026。
Citrini Research. “The 2028 Global Intelligence Crisis.” 2026。
CrowdStrike. Form 8-K and Employee Communication. 2025。
CIO / TD Cowen. “Oracle May Slash Up to 30,000 Jobs to Fund AI Data-Center Expansion.” 2026。
Reuters. “Jack Dorsey’s Block to Cut Nearly Half Its Workforce in AI Overhaul.” 2026。
Dell’Acqua, F. 等。 “Navigating the Jagged Technological Frontier.” 2023。