读论文:煤矿中的金丝雀?关于人工智能近期就业影响的六个事实
原文:https://digitaleconomy.stanford.edu/wp-content/uploads/2025/08/Canaries_BrynjolfssonChandarChen.pdf
Erik Brynjolfsson* Bharat Chandar† Ruyu Chen‡
2025 年 8 月 26 日
摘要
本文使用来自美国最大薪资软件提供商的高频行政数据,研究了受生成式人工智能影响的职业在劳动力市场上发生的变化。我们提出了六个事实来描述这些转变。我们发现,自生成式人工智能被广泛采用以来,在人工智能暴露度最高的职业中,处于职业生涯早期的工人(22-25 岁)的就业率在控制了公司层面的冲击后,仍然出现了 13%的相对下降。相比之下,在暴露度较低领域的工人以及在相同职业中经验更丰富的工人的就业情况保持稳定或持续增长。我们还发现,劳动力市场的调整主要通过就业而非薪酬来实现。此外,就业下降集中在人工智能更可能自动化而非增强人类劳动的职业中。我们的研究结果对于其他解释(例如排除科技相关公司和排除适合远程工作的职业)是稳健的。这六个事实提供了早期、大规模的证据,与人工智能革命已开始对美国劳动力市场的入门级工人产生重大且不成比例的影响这一假设相符。
- 斯坦福大学与美国国家经济研究局(NBER);[email protected]
- †斯坦福大学;[email protected]
- ‡斯坦福大学;[email protected]
- 感谢 Nick Bloom、Joshua Gans、David Autor、Daniel Rock、李飞飞、Frank Li、Christina Langer、Sarah Bana、Cody Cook、Chris Forman、Andrew Wang、Brad Ross、Omeed Maghzian、Basil Halperin、裴家昕、Phil Trammell、Eric Bergman 以及斯坦福数字经济实验室研讨会参与者提供的有益反馈。我们感谢 ADP 提供数据访问权限以及斯坦福数字经济实验室的财务支持。文责自负。
最新版本:https://digitaleconomy.stanford.edu/publications/canaries-in-the-coal-mine/
1 引言
生成式人工智能(AI)的扩散引发了一场关于其对劳动力市场潜在影响的全球性辩论。这场跨越学术界、公共政策、商界和大众媒体的讨论,涵盖了从生产力提升的乌托邦式预测,到大规模失业的敌托邦式恐惧,再到认为人工智能对就业或生产力影响甚微的怀疑论观点。从历史上看,技术以不同方式影响着不同的任务、职业和行业,在某些领域取代工作,在另一些领域增强工作,并改变其余领域。这些异质性效应表明,可能存在一些“煤矿中的金丝雀”,它们是人工智能产生更广泛影响的预兆 1。
人工智能在多个领域的能力已取得迅速提升。例如,根据最新的《人工智能指数报告》,2023 年,人工智能系统在广泛使用的软件工程基准测试 SWE-Bench 上只能解决 4.4%的编程问题,但到 2024 年,这一性能提升至 71.7% (Maslej et al., 2025)¹。人工智能在其他基准测试(包括语言理解、学科知识和推理)方面也有所改进。与此同时,人工智能系统正被日益广泛地采用。根据 Hartley et al. (2025) 的数据,到 2025 年 6 月/7 月,在美国 18 岁以上的受访者中,大型语言模型(LLM)在工作中的采用率达到了 46%² 1。
鉴于能力的提升和广泛的采用,一个核心担忧(近期头条新闻也放大了这一点)是,人工智能是否已开始取代人类劳动,特别是对于像软件工程和客户服务这类高暴露度职业中的年轻、入门级工人 ³ 1。
尽管这场辩论异常激烈,但实证证据却难以跟上技术进步的步伐,导致许多基本问题悬而未决。本文通过利用来自美国最大薪资软件提供商 ADP 的大规模、高频行政数据集,来应对这一实证空白。我们的样本包含截至 2025 年 7 月的月度、个人层面的薪资记录,涵盖了数万家公司的数百万名工人。这种丰富的面板数据结构使我们能够以高度的粒度追踪就业动态,提供近乎实时的劳动力市场调整视图。通过将这些数据与已建立的职业人工智能暴露度及其他变量指标相结合,我们可以量化自生成式人工智能广泛采用以来已实现的就业变化 1。
本文系统地呈现了从数据中得出的六个关键事实,评估了人工智能革命如何重塑美国劳动力。
我们的第一个关键发现是,我们揭示了在人工智能暴露度最高的职业中(如软件开发人员和客户服务代表),处于职业生涯早期的工人(22-25 岁)的就业出现了大幅下降。相比之下,在相同职业中经验更丰富的工人,以及在暴露度较低的职业(如护理助理)中所有年龄段工人的就业趋势则保持稳定或持续增长 1。
我们的第二个关键事实是,整体就业继续强劲增长,但特别是年轻工人的就业增长自 2022 年底以来一直停滞不前。在人工智能暴露度较低的工作中,年轻工人的就业增长与年长工人相当。相比之下,在人工智能暴露度最高的职业中,22 至 25 岁的工人在 2022 年底至 2025 年 7 月期间就业下降了 6%,而年长工人的就业则增长了 6-9%。这些结果表明,人工智能暴露度高的工作岗位就业下降,是导致 22 至 25 岁年轻人整体就业增长乏力的主要原因,而年长工人的就业则在持续增长 1。
我们的第三个关键事实是,并非所有人工智能的应用都与就业下降相关。具体而言,入门级就业在人工智能实现工作自动化的应用中出现下降,但在那些主要起增强作用的应用中则没有。我们通过估算观察到的对大型语言模型 Claude 的查询在多大程度上替代或补充了该职业中的任务,从而在经验上区分了自动化和增强。我们发现,在人工智能主要实现工作自动化的职业中,年轻工人的就业出现下降,而在人工智能使用最具增强性的职业中,我们发现了就业增长。这些发现与人工智能的自动化应用替代劳动力,而增强性应用则不然的观点相符 1。
第四,我们发现,在控制了公司-时间效应后,年轻、人工智能暴露度高的工人的就业下降依然存在。对我们观察到的模式的一种解释是,它们可能是由行业或公司层面的冲击(如利率变化)驱动的,这些冲击与年龄和测量的 AI 暴露度的分布模式相关。我们通过在事件研究回归中控制公司-时间效应来检验这类混淆因素,从而吸收了影响公司所有工人(无论 AI 暴露度如何)的总体公司冲击。对于 22-25 岁的工人,我们发现 AI 暴露度最高的五分位数群体的相对就业率比较低的五分位数群体下降了 12 个对数点,这是一个巨大且具有统计显著性的效应。其他年龄组的估计值在幅度上要小得多,且不具有统计显著性。这些发现意味着我们观察到的就业趋势并非由那些雇佣了不成比例的高 AI 暴露度年轻工人的公司所受到的差异化冲击所驱动 1。
第五,劳动力市场的调整更多地体现在就业上,而非薪酬上。与我们对就业的发现相反,我们发现按年龄或暴露度五分位数划分的年薪趋势差异很小,这表明可能存在工资粘性。如果是这样,人工智能对就业的影响可能比对工资的影响更大,至少在初期是如此 1。
第六,以上事实在各种替代样本构建中基本保持一致。我们发现,我们的结果并非仅仅由计算机职业或易受远程工作和外包影响的职业所驱动。我们还发现,在更早的时间里,即在大型语言模型广泛使用之前,包括在由 COVID-19 大流行引发的失业率飙升期间,人工智能暴露度分类法并不能有意义地预测年轻工人的就业结果。我们观察到的数据模式似乎从 2022 年底开始最为明显,这恰逢生成式人工智能工具迅速普及的时期 ⁴。这些模式在大学毕业生比例高的职业和比例低的职业中都成立,这表明 COVID-19 期间教育成果的恶化并非我们结果的驱动因素。对于非大学学历的工人,我们发现经验可能在缓冲劳动力市场冲击方面的作用较小,因为在大学毕业生比例低的职业中,直到 40 岁的工人都表现出按人工智能暴露度划分的就业结果分化 1。
虽然我们提醒,我们记录的事实可能部分受到生成式人工智能以外因素的影响,但我们的结果与生成式人工智能已开始影响入门级就业的假设是一致的。我们打算继续持续追踪数据,以评估这些趋势未来是否会发生变化 1。
为什么人工智能对受影响的入门级工人的负面影响可能比其他年龄组更大?一种可能性是,由于模型训练过程的性质,人工智能取代了可编码的知识,即构成正规教育核心的“书本知识”。人工智能可能不那么擅长取代隐性知识,即那些随经验积累的独特的技巧和窍门 ⁵。由于年轻工人提供的可编码知识相对多于隐性知识,他们可能在受影响的职业中面临更多的任务替代,从而导致更大的就业再分配 (Acemoglu and Autor, 2011)。相比之下,拥有累积隐性知识的年长工人可能面临较少的任务替代。这些隐性知识的好处对于那些在经验回报率低的职业中的非大学学历工人来说可能较少。此外,经验更丰富的工人可能在其他方面技能更高,使他们不易被人工智能工具替代 (Ide, 2025)。一个重要的研究方向是进一步建模和检验这些预测 1。
¹ SWE-bench 旨在评估大型语言模型(LLMs)在真实世界软件工程任务上的表现。它使用一系列 GitHub 问题来评估 LLM 生成解决这些问题的代码的能力 1。
² 类似地,Bick et al. (2024) 发现,在 2024 年底,近 40%的 18-64 岁美国人口报告使用过生成式人工智能,其中 23%的在职受访者表示他们在过去一周至少有一次因工作使用生成式人工智能,9%的人每个工作日都使用 1。
³ 某职业工人的生产力提高可能导致就业减少或增加,这取决于,除其他因素外,对这些工人产出的需求弹性有多大 1。
⁴ OpenAI 于 2022 年 11 月推出了 ChatGPT 1。
⁵ 具有讽刺意味的是,相比于在大学计算机科学课堂上学习,更可能在工作中习得的实用技能之一或许是如何使用人工智能软件进行开发 1。
2 相关文献
本文探讨了学术界、公共政策、商界和媒体中关于人工智能就业影响的一场广泛的公开辩论。这场讨论大多集中在人工智能是否正在取代软件工程师等受影响职业的工人 ⁶。一些研究指出,大学毕业生的失业率已超过非毕业生,认为这是人工智能导致就业中断的证据 (Thompson, 2025)。另一些人则指出,这些趋势远在人工智能普及之前就已存在,并指出公开可得的数据,如当期人口调查(CPS),显示在人工智能暴露度高的职业中,就业变化的证据是混合的 (Lim et al., 2025; The Economist, 2025; Smith, 2025; Eckhardt and Goldschlag, 2025; Frick, 2025)。这些辩论仍未解决,亟需关于受影响群体劳动力市场变化的高质量数据。本文提供了大规模数据,以高粒度和高精度衡量就业变化,发现人工智能暴露度高的职业中的年轻工人确实经历了就业下降 ⁷ 1。
在学术界,旨在衡量人工智能就业影响的研究日益增多。这一文献的开端是一系列有影响力的论文,它们建立了估算哪些职业和任务易受自动化影响的方法论 (Frey and Osborne, 2017; Brynjolfsson and Mitchell, 2017; Brynjolfsson et al., 2018; Felten et al., 2018, 2019; Webb, 2019; Felten et al., 2021)。近期,诸如 Eloundou et al. (2024)、Felten et al. (2023)、Gmyrek et al. (2023)、Handa et al. (2025) 和 Tomlinson et al. (2025) 的研究将此方法应用于生成式人工智能,构成了本分析所用暴露度指标的基础。虽然这些研究识别了潜在的颠覆,但我们的研究将这些暴露度指标与实际的就业变化联系起来。我们发现,这些暴露度指标确实能够预测在生成式人工智能普及后时期年轻工人的重大就业变化 1。
我们的工作补充并扩展了那些在更具体环境中发现显著影响的研究,例如在线自由职业平台 (Hui et al., 2023; Demirci et al., 2025) 或个别公司内部 (Brynjolfsson et al., 2025; Dillon et al., 2025)⁸。我们衡量了横跨美国经济的各职业的劳动力市场变化 1。
从这个意义上说,我们的工作补充了一小部分但日益增多的使用全经济范围数据来衡量人工智能影响的论文。近期的发现各不相同。Humlum and Vestergaard (2025) 使用丹麦的行政数据得出结论,对收入或工作小时数的影响微乎其微,而 Jiang et al. (2025) 则发现,在美国,人工智能暴露度与更长的工作小时数相关 ⁹。Hampole et al. (2025) 使用 Revelio Labs 从 2011 年到 2023 年的招聘信息和 LinkedIn 个人资料记录,发现总体就业影响有限,公司整体劳动力需求的增长抵消了对受影响职业需求的相对下降。Chandar (2025b) 使用 CPS 数据比较了人工智能暴露度较高和较低职业的就业变化,发现总体上差异趋势不大,但指出由于有效样本量有限,衡量年轻工人的变化存在困难。Dominski and Lee (2025) 同样使用 CPS 数据和替代性暴露度指标,发现在人工智能暴露度高的职业中就业有所下降,但 CPS 的数据限制了统计推断的能力。Johnston and Makridis (2025) 使用季度就业与工资普查(QCEW)数据,发现在人工智能暴露度更高的州-行业对中就业有所增加 ¹⁰。这些先前的论文使用的数据要么缺乏足够的粒度,要么不够及时,无法可靠地按人工智能暴露度和年龄研究就业变化 (O’Brien, 2025)¹¹。相比之下,本文使用大规模、近乎实时的数据,为解决当前关于人工智能对年轻工人就业影响的持续辩论迈出了一步 1。
⁶ 近期关于此话题的一些媒体报道包括 Horowitch (2025); Ettenheim (2025); Raman (2025); Roose (2025); Peck (2025); Hoover (2025); Milmo and Almeida (2025); Wu (2025); Raval (2025)。一些科技公司高管也警告了人工智能可能带来的失业 (Allen, 2025; Sherman, 2025; Bacon, 2025),或为了增加人工智能投资而裁员 (Jamali, 2025) 1。
⁷ 来自行业的报告也显示了混合的发现。招聘平台 TrueUp 暗示科技行业的招聘信息近期有所增加 (Lenny Rachitsky, 2025)。另一方面,Revelio Labs 发现招聘信息有所下降,且对入门级工人的下降更为陡峭 (Simon, 2025)。事实上,招聘信息数据显示新毕业生的招聘信息有所下降,但在人工智能暴露度较低的职业中也发现了这种下降 (Lim et al., 2025)。Chandar (2025b) 指出,近年来招聘信息与就业之间的相关性一直很弱。SignalFire 发现科技行业新毕业生招聘人数与疫情前水平相比急剧下降 (Doshay and Bantock, 2025),这与本文的发现一致。来自 Gusto 的数据也表明新毕业生招聘有所下降 (Bowen, 2025) 1。
⁸ 另见 Noy and Zhang (2023); Peng et al. (2023); Dell’Acqua et al. (2023) 1。
⁹ 另见 Acemoglu et al. (2022); Bonney et al. (2024); Bick et al. (2024); Hartley et al. (2025); Frank et al. (2025); Chen et al. (2025) 1。
¹⁰ Johnston and Makridis (2025) 通过将 Eloundou et al. (2024) 的职业暴露度按州-行业就业加权平均来衡量州-行业暴露度。如果公司进行资本投资或以提高整体劳动力需求的方式提高生产力,行业层面的劳动力市场变化可能与本文研究的职业层面变化不同 (Hampole et al., 2025) 1。
¹¹ 作为比较,自 2021 年以来,CPS 每月调查总共介于 44,000 至 51,000 名所有年龄组的就业人员。其中 10,000 至 12,000 个观测值属于即将轮换出组的样本,并包含收入记录。我们主要分析样本中的数据每月仅在 22 至 25 岁年龄段就包括 250,000 至 350,000 名就业人员,且均有收入记录 1。
3 数据描述
3.1 薪资数据
本研究使用来自美国最大薪资处理公司 ADP 的数据。该公司为雇佣超过 2500 万美国工人的公司提供薪资服务。我们利用这些信息来追踪在被衡量为或多或少暴露于人工智能的职业中工人的就业变化 1。
我们对主要分析样本施加了若干样本限制。我们只包括那些使用 ADP 薪资产品来维护工人工资记录的公司的雇员。我们还从分析中排除了被公司归类为兼职的员工,并将样本限定在 18 至 70 岁之间的人群 ¹² 1。
使用薪资服务的公司集合随时间变化,因为公司会加入或离开 ADP 的平台。我们通过只保留从 2021 年 1 月到 2025 年 7 月每个月都有员工收入记录的公司,来维持我们主要样本期内一致的公司集合 1。
此外,ADP 观察到其系统中约 70%工人的职位头衔。我们排除了没有记录职位头衔的工人。有超过 7,000 个标准化的职位头衔,例如“搜索引擎优化专员”、“企业内容管理经理”和“工厂文件控制专员”。该公司的内部研究团队利用职位描述、行业、地点和其他相关数据等信息,将这些职位头衔映射到 2010 年标准职业分类(SOC)代码 1。
在这些限制之后,我们的主要分析样本每月有 350 万到 500 万工人的记录,尽管我们考虑了对替代性分析的稳健性,例如允许公司进入和离开样本。虽然 ADP 数据每月包括数百万工人,但使用 ADP 服务的公司分布与整个美国经济中的公司分布不完全匹配。关于公司构成差异的更多细节可以在 Cajner et al. (2018) 和 ADP Research (2025) 中找到 ¹³ 1。
3.2 职业人工智能暴露度
我们使用两种不同的方法来衡量职业对人工智能的暴露度。第一种方法使用来自 Eloundou et al. (2024) 的暴露度指标。Eloundou et al. (2024) 使用经过人工标注验证的 ChatGPT,按 O*NET 任务估算了人工智能暴露度。然后,他们通过将任务数据汇总到 2018 年 SOC 代码级别来构建职业暴露度指标。我们重点关注他们论文中基于 GPT-4 的暴露度指标 1。
我们采用的第二种主要方法使用来自 Anthropic 经济指数(Handa et al., 2025)的生成式人工智能使用数据。该指数报告了基于对 Anthropic 的生成式人工智能模型 Claude 的数百万次对话样本,与每个 O*NET 任务相关的查询的估计份额。然后,它根据这些任务份额将数据汇总到职业层面。Anthropic 经济指数的一个特点是,对于每个任务,它还报告了与该任务相关的查询中属于“自动化”、“增强型”或以上皆非的估计份额。我们使用这些信息来估算一个职业的人工智能使用主要是与劳动力互补还是替代 ¹⁴ 1。
Eloundou et al. (2024) 的指标和 Handa et al. (2025) 的指标都按 2018 年 SOC 代码估算人工智能暴露度。我们使用美国劳工统计局(BLS)的 2010 年 SOC 代码到 2018 年 SOC 代码的转换表,将暴露度指标与薪资数据进行合并。表 A1 显示了每种人工智能暴露度指标下的职业示例 1。
3.3 其他数据
为了比较可远程工作与不可远程工作的职业的就业变化,我们使用了来自 Dingel and Neiman (2020) 的数据。我们使用 BLS 的个人消费支出(PCE)指数来计算实际收入,以 2017 年 10 月为基准。我们使用月度当期人口调查(CPS)数据作为我们主要发现的比较对象 1。
¹² 虽然我们观察到每个工人的出生年份,但出于隐私原因,我们无法观察到确切的出生日期。我们使用美国疾病控制与预防中心的数据,根据美国的出生月份分布来推算出生月份 1。
¹³ Cajner et al. (2018) 使用 2016 年 3 月的数据发现,与季度就业与工资普查(QCEW)相比,制造业和服务业公司的份额略高。他们还发现 ADP 在东北地区的公司代表性略高。此外,使用 ADP 的公司平均增长速度快于美国经济中的典型公司 1。
¹⁴ 具体来说,Handa et al. (2025) 首先使用 Claude 将对话分为六类:指令型(Directive),指以最少互动完成任务委托;反馈循环型(Feedback Loop),指在环境反馈指导下完成任务,例如反复向模型传递编码错误;任务迭代型(Task Iteration),指协作式的完善过程;学习型(Learning),指知识获取和理解;验证型(Validation),指工作核实和改进;或“以上皆非”(None),模型被指示“自由地”选择此选项。被分类为指令型或反馈循环型的对话被视为自动化(Automative),而被分类为任务迭代型、学习型或验证型的对话被视为增强型(Augmentative)。更多细节请参见 Handa et al. (2025)。表 A2 复制了 Handa et al. (2025) 的表 1,并显示了关于自动化和增强指标的更多细节 1。
4 结果
4.1 事实 1:在人工智能暴露度高的职业中,年轻工人的就业有所下降
以软件工程师和客户服务代理为例,这两个职业通常被认为高度暴露于生成式人工智能工具。媒体关注引发了人们对年轻软件工程师尤其可能面临广泛就业冲击的担忧 (Thompson, 2025; Raman, 2025; Allen, 2025; Horowitch, 2025) 1。
图 1 显示了这些职业按年龄组的就业变化,以 2022 年 10 月为 1 进行归一化。两个职业呈现出相似的模式:最年轻工人的就业在 2022 年后显著下降,而其他年龄组的就业则继续增长。到 2025 年 7 月,22-25 岁软件开发人员的就业与其 2022 年底的峰值相比下降了近 20%。图 A1 显示,类似的模式在计算机职业和服务文员中也普遍存在 1。
图 1:软件开发人员和客户服务代理按年龄的就业变化,以 2022 年 10 月为 1 进行归一化。
顶部图表:软件开发人员(归一化)按年龄组的员工人数变化
底部图表:客户服务(归一化)按年龄组的员工人数变化
图例:职业早期 1 (22-25), 职业早期 2 (26-30), 发展期 (31-34), 职业中期 1 (35-40), 职业中期 2 (41-49), 资深期 (50+)
图 2 以另外四个职业作为案例研究,这些职业根据 Eloundou et al. (2024) 的指标,涵盖了不同的人工智能暴露度水平。市场营销和销售经理,处于人工智能暴露度的第四个五分位数,其年轻工人的就业下降情况与软件和客户服务类似,尽管幅度较小。一线生产和运营主管,处于第三个五分位数,其年轻工人的就业有所增加,但就业增长幅度小于 35 岁以上工人的增幅 1。
相比之下,Eloundou et al. (2024) 评为暴露度较低的职业的趋势与暴露度较高的职业模式不符。库存文员和订单处理员,处于第二个五分位数,按年龄划分没有明显差异。引人注目的是,包括护理助理、精神病护理助理和家庭健康助理在内的健康助理系列职业,其趋势与软件或客户服务截然不同:年轻工人的就业增长速度快于年长工人 1。
图 2:市场营销和销售经理(暴露度五分位数 4)、一线生产主管(暴露度五分位数 3)、库存文员和订单处理员(暴露度五分位数 2)以及健康助理(暴露度五分位数 1)的就业变化,以 2022 年 10 月为 1 进行归一化。暴露度五分位数基于 Eloundou et al. (2024) GPT-4 β 指标定义。
图 3 显示,这些模式在各职业中更为普遍。左上图显示了 22-25 岁工人在暴露度较高和较低的职业中就业结果的分化,暴露度较高的职业就业下降。对于年长年龄组,我们发现在不同人工智能暴露度五分位数之间的就业增长差异要小得多 1。
图 3:按年龄和暴露度五分位数的就业变化,使用 Eloundou et al. (2024) 的 GPT-4 β 指标。暴露度五分位数基于 GPT-4 β 指标定义。深色线条代表暴露度更高的五分位数。红线显示了所有五分位数的总体趋势。
4.2 事实 2:尽管整体就业持续增长,但年轻工人的就业增长尤其停滞
图 4 显示了所有职业合并后按年龄组的总体就业趋势。整体就业保持强劲,与后疫情时期全国低失业率相符。然而,图 4 表明,年轻工人的就业增长相对于其他年龄组有所放缓,这与近期关于入门级工人就业市场可能恶化的讨论一致 (Chen, 2025; Federal Reserve Bank of New York, 2025) 1。
图 4:按年龄的就业变化。包括所有职业。
图 5 揭示了这些趋势与人工智能暴露度的关系。对于每个年龄组,从 2022 年底到 2025 年 7 月,最低的三个 AI 暴露度五分位数的就业增长为 6-13%,按年龄划分的就业增长没有明确的顺序。相比之下,对于最高的两个暴露度五分位数,22-25 岁工人的就业在 2022 年底至 2025 年 7 月期间下降了 6%,而 35-49 岁工人的就业增长了超过 9%。这些结果表明,在 AI 暴露度高的工作中就业下降,是导致 22 至 25 岁工人整体就业增长乏力的驱动因素 1。
图 5:2022 年 10 月至 2025 年 7 月期间按年龄和基于 GPT-4 β 的 AI 暴露度分组的就业增长情况。
虽然这些发现表明年轻工人的就业结果因 AI 暴露度而异,但我们提醒,这前两个事实中观察到的趋势可能由美国经济中的其他变化所驱动。我们接下来的事实将评估这些结果在替代性分析下的稳健性 1。
4.3 事实 3:入门级就业在人工智能自动化工作的应用中下降,而在增强型应用中变化不大
人工智能暴露度既可以补充劳动力,也可以替代劳动力。这可能对劳动力市场产生截然不同的影响 (Brynjolfsson, 2022) 1。
为了评估就业模式如何根据人工智能与劳动力的互补性或替代性而变化,我们使用了来自 Anthropic 经济指数(Handa et al., 2025)的生成式人工智能使用数据。该指数提供了与每个职业相关的查询份额的估计值。此外,对于每个任务,它报告了与该任务相关的查询中属于“自动化”、“增强型”或以上皆非的估计份额。我们使用这些信息来估算一个职业的人工智能使用主要是劳动力的替代品还是补充品 ¹⁵。表 A1 显示了每种指标下最高和最低暴露度类别的职业示例 1。
图 6 显示了按 Claude 相关查询的总体流行度的就业变化。这些模式与使用 Eloundou et al. (2024) 指标的发现非常吻合 1。
图 6:总体 Claude 使用情况。按年龄和暴露度五分位数的就业变化,使用来自 Handa et al. (2025) 的 Claude 使用数据。暴露度五分位数根据与某职业相关任务的 Claude 查询份额定义。深色线条代表暴露度更高的五分位数。红线显示了所有五分位数的总体趋势。其相关任务均低于使用数据中最低查询次数的职业被视为一个单独类别,编码为 0。
同样,图 7 显示,估计自动化份额最高的职业中,最年轻工人的就业出现了下降 1。
图 7:自动化。按年龄和自动化水平的就业变化,使用来自 Handa et al. (2025) 的 Claude 使用数据。自动化水平根据与某职业相关的查询中被 Claude 分类为自动化性质的份额定义。深色线条代表自动化程度更高。红线显示了所有自动化水平的总体趋势。其相关任务均低于使用数据中最低查询次数的职业被视为一个单独类别,编码为 0。注意,超过 20%的查询次数高于最低阈值的职业的估计自动化份额为 0。因此,第一和第二五分位数的所有职业被归为第 1 级。其余五分位数编码为 2、3 和 4。
相比之下,图 8 表明,估计增强份额最高的职业并未出现类似的模式。年轻工人的就业变化并未按增强暴露度排序,因为第五个五分位数的就业增长率是最高的之一。这些发现与人工智能的自动化应用替代劳动力,而增强性应用则不然的观点是一致的 ¹⁶ 1。
图 8:增强。按年龄和增强五分位数的就业变化,使用来自 Handa et al. (2025) 的 Claude 使用数据。增强五分位数根据与某职业相关的查询中被 Claude 分类为增强型的份额定义。深色线条代表增强性更高的五分位数。红线显示了所有五分位数的总体趋势。其相关任务均低于使用数据中最低查询次数的职业被视为一个单独类别,编码为 0。
¹⁵ 图 A2 和 A3 显示,在剔除总体 Claude 使用率较低的职业后,自动化和增强的结果相似 1。
¹⁶ 注意,增强指标的前两个五分位数的职业总体 Claude 使用率非常低,这些五分位数中的平均职业分别占对话的 0.01%和 0.09%。这些职业的对话中有很高比例被分类为既非自动化也非增强型。相比之下,第三至第五五分位数的职业平均占 Claude 对话的 0.47%、0.39%和 0.33%。对于自动化指标,总体 Claude 使用率随自动化份额平均增加,最低暴露度组平均占对话的 0.05%,最高组平均占 0.73% 1。
4.4 事实 4:在控制公司-时间冲击后,年轻、人工智能暴露度高的工人的就业下降依然存在
虽然我们目前的结果与生成式人工智能导致入门级就业下降的假设一致,但存在其他合理的解释。一类解释是,我们观察到的模式是由行业或公司层面的冲击所解释的,这些冲击与年龄和测量的 AI 暴露度的分布模式相关。例如,一种可能性是,具有高测量 AI 暴露度的年轻工人不成比例地倾向于进入那些极易受利率上升影响的公司。
我们通过控制一组丰富的固定效应来检验这类混淆因素。对于每个年龄组,我们估计泊松回归:
log(E[yf,q,t])=q′=1∑j=−1∑γq′,j1{t=j}1{q′=q}+αf,q+βf,t+ϵf,q,t(4.1)
其中,f 指公司,q 指 Eloundou et al. (2024) 的暴露度五分位数,t 指月份,其中 t=−1 对应 2022 年 10 月。结果变量 yf,q,t 是在公司 f、五分位数 q、时间 t 的就业人数。方程 4.1 是一个控制了公司-五分位数效应 (αf,q) 和公司-时间效应 (βf,t) 的泊松事件研究回归。公司-时间效应吸收了对每个暴露度五分位数影响相等的总体公司冲击。公司-五分位数效应调整了公司内部各五分位数之间招聘的基线差异。我们感兴趣的系数 γq,t 衡量了在考虑了公司-时间效应和公司-五分位数效应后,各五分位数之间就业增长的差异变化 ¹⁷ 1。
这种方法之所以强大,是因为它有效地将分析范围缩小到公司内部。它不再是简单地比较雇佣大量软件工程师的科技公司与雇佣大量护士的医疗保健公司。相反,它是在问一个更精细的问题:“在同一家公司内部,在同一时间点,年轻、高 AI 暴露度员工(如初级程序员)的就业情况与该公司内其他员工(如年长的程序员或低 AI 暴露度的员工)相比如何变化?”通过这样做,可以排除那些影响整个公司的外部因素,例如行业衰退或利率变化。如果年轻、高暴露度员工的就业下降在这种严格的比较下仍然存在,那么这就强烈表明,这种下降是由特定于他们角色和年龄的因素驱动的,这与 AI 替代的假设高度一致 1。
我们对每个年龄组分别运行此回归。对于每个回归,我们限制在样本的每个时期内在该年龄组中雇佣至少 10 名工人的公司。此外,对于每个 q,∑tyf,q,t 必须至少等于 100,这意味着公司在样本的各个月份中,平均必须从每个暴露度五分位数雇佣约 2 名工人 ¹⁸。标准误按公司进行聚类 1。
结果如图 9 所示,该图绘制了每个年龄组的 γq,t 系数。对于 22-25 岁的工人,较高五分位数的估计值大且具有统计显著性,相对就业下降了 12 个对数点,其幅度与图 3 原始数据中的估计值相当。其他年龄组的估计值通常在幅度上小得多,且不具有统计显著性。这些发现意味着我们观察到的就业趋势并非由那些雇佣了不成比例的高 AI 暴露度年轻工人的公司所受到的差异化冲击所驱动 1。
图 9:按年龄和 AI 暴露度的就业变化的泊松回归事件研究估计。所有估计都是相对于职业暴露度五分位数 1 而言。暴露度五分位数使用 Eloundou et al. (2024) GPT-4 β 指标。估计控制了公司-时间和公司-五分位数固定效应,遵循方程 4.1。阴影区域为 95%置信区间。标准误按公司聚类。
一个不会被公司-时间效应控制的替代性混淆因素是,即使在公司层面,高 AI 暴露度的工人在 COVID-19 大流行后被过度招聘,导致随后他们的招聘收缩。为了评估这类替代方案,我们在第 4.6 节中考虑了各种其他稳健性检验,例如移除计算机职业和根据职业是否适合在家工作进行条件控制 1。
¹⁷ 由于结果变量中存在零计数,我们遵循 Chen and Roth (2024) 的指导,估计泊松回归而非对数形式的普通最小二乘(OLS)回归 1。
¹⁸ 结果对这些限制不敏感,尽管在泊松回归中,每个公司-月份和每个公司-五分位数中必须至少有一个非零值,以避免观测值被丢弃 1。
4.5 事实 5:劳动力市场的调整更多地体现在就业而非薪酬上
除了就业,我们还观察到工人的年度基本薪酬。我们利用这些信息来检验劳动力市场在薪酬方面的调整 ¹⁹。薪资数据使用 PCE 指数平减至 2017 年美元 ²⁰ 1。
结果如图 10 所示。研究结果表明,与就业相比,薪酬在暴露度较高和较低的职业之间的分化不那么明显。图 11 显示了按年龄和基于 Eloundou et al. (2024) 的暴露度五分位数的结果。我们发现按年龄或暴露度五分位数划分的薪酬趋势差异很小 1。
图 10:按年龄和职业的年度基本薪酬变化。年度基本薪酬使用 PCE 平减指数平减至 2017 年美元。
图 11:年度基本薪酬。按年龄和暴露度五分位数的年度基本薪酬变化。暴露度五分位数根据 Eloundou et al. (2024) 的 GPT-4 β 指标定义。深色线条代表暴露度更高的五分位数。红线显示了所有五分位数的总体趋势。年度基本薪酬使用 PCE 平减指数平减至 2017 年美元。
Autor and Thompson (2025) 先前的研究指出,替代非专家任务的技术可能会减少职业就业但增加职业工资;替代专家任务的技术可能会产生相反的效果。工资效应的符号取决于被取代任务的总体份额以及这些任务是专家任务还是非专家任务。我们发现的工资变化有限,表明这些效应可能相互抵消,至少在短期内是这样。或者,结果可以由短期内的工资粘性来解释,这与 Davis and Krolikowski (2025) 的近期证据一致 1。
4.6 事实 6:研究发现在替代性样本构建下基本保持一致
我们检验了这些结果对替代性样本构建和稳健性检验的稳健性 1。
排除科技职业 一种可能性是,我们的结果是由 2022 年至 2023 年科技行业招聘普遍放缓所解释的,因为公司从 COVID-19 大流行中恢复 ²¹。图 A4 显示了在排除计算机职业(对应于以 15-1 开头的 2010 年 SOC 代码)后,按年龄和暴露度五分位数的就业变化。图 A5 显示了排除信息行业(NAICS 代码 51)公司的结果。结果非常相似,与上述案例研究一致,表明就业变化在多种职业中都可见。图 9 中包含公司-时间固定效应的结果进一步表明,我们的发现对于影响一般招聘趋势的公司或行业层面冲击是稳健的。这些结果表明,我们的发现并非特定于技术岗位 1。
远程工作 图 A6 和 A7 显示了根据 Dingel and Neiman (2020) 的分类,适合远程工作(telework)和不适合远程工作的职业的结果 ²²。我们发现,对于年轻工人,无论是在可远程工作的职业还是在不可远程工作的职业中,暴露度越高的职业就业增长越慢。特别是不可远程工作职业的结果表明,我们的发现并非仅仅由外包或在家工作的中断所驱动 ²³ 1。
更长样本期 图 A8 显示了将平衡的公司样本扩展到 2018 年的结果。这减少了样本量,并使数据略显嘈杂。尽管如此,在后 GPT 时代,趋势基本上仍按暴露度排序,而这在 2022 年之前并非如此。一个担忧是,对于 Eloundou et al. (2024) 的指标,最高暴露度的五分位数从 2020 年左右开始就业增长放缓。但对于 Anthropic 暴露度指标(如图 A9、A10 和 A11 所示),情况并非如此。对于这些指标,在生成式人工智能出现之前的整个时期,最高暴露度群体的就业增长相当,之后才出现分化趋势 1。
教育变化 另一种可能性是,我们观察到的变化受到了 COVID-19 大流行期间教育成果恶化的影响。COVID-19 对教育成果造成了持续的损害 (Kuhfeld and Lewis, 2025)。由于受教育程度越高的工人平均测得的 AI 暴露度也越高,近年来教育质量的下降可能会影响我们观察到的趋势 ²⁴。在图 A12 中,我们显示了根据 2017 年美国社区调查(ACS),超过 70%的工人拥有大学学位的职业的趋势 ²⁵。在图 A13 中,我们显示了不到 30%的工人拥有大学学位的职业的趋势。大学毕业生比例高的职业总体就业下降,与我们的主要结果相比,暴露度较高和较低的职业之间的差异不大。相比之下,大学毕业生比例低的职业总体就业上升,其中 AI 暴露度最低的职业增长,而暴露度最高的职业就业下降。此外,对于大学毕业生比例较低的职业,就业结果的分散在更高年龄组中也可见,直到 40 岁的工人都显示出按 AI 暴露度的就业趋势分离。这些发现表明,教育成果恶化不能完全解释我们的主要结果。它们还表明,对于非大学学历的工人,经验可能不像对大学学历工人那样能有效缓冲劳动力市场冲击 1。
其他稳健性检验 图 A14 和 A15 分别显示了男性和女性的结果。结果相似,表明男性和女性前景的分化并非我们发现的驱动因素。图 A16 显示,当我们不采用平衡的公司样本时,结果相似。图 A17 显示,当包括兼职和临时工时,结果相似 ²⁶ 1。
与 CPS 数据的比较 对我们的发现进行比较的一个有用基准是将其与月度当期人口调查(CPS)的估计值进行比较。CPS 每月在全国范围内调查约 60,000 个家庭,以收集有关就业和其他劳动力特征的数据。这些数据在参考月份后几周发布,提供了近乎实时的就业统计估计。许多先前的分析都使用 CPS 来评估 AI 如何影响入门级工作 (Chandar, 2025b; Dominski and Lee, 2025; Lim et al., 2025; Eckhardt and Goldschlag, 2025)。我们将 ADP 数据中的一些主要发现与 CPS 的估计值进行比较。图 A18 至 A20 显示了使用 CPS 数据按年龄划分的软件开发人员、客户服务代表和家庭健康助理的就业变化。尽管全美有数百万工人从事这些职业,但估计值波动性很大,月度估计就业人数的常见波动达到 20%或更高。图 A21 显示了使用 CPS 按年龄和暴露度五分位数估计的就业变化,也表明估计值具有高度波动性。CPS 微观数据的这种波动性反映了样本量小以及 CPS 的抽样设计并非旨在针对这些人口-职业子群体的就业统计数据 ²⁷。因此,CPS 的样本量和抽样程序可能使其难以在本研究考虑的时间范围内以高度可信度评估按年龄和 AI 暴露度的就业变化 (Chandar, 2025b; O’Brien, 2025)。其他大规模数据源,如美国社区调查(ACS),可能为 ADP 数据提供更可靠的比较,尽管 ACS 的发布与 ADP 数据相比有显著滞后。我们鼓励在其他数据源(如 ACS)发布后,将我们的发现与它们的结果进行比较 ²⁸ 1。
¹⁹ 总薪酬可能还包括奖金、加班费、佣金、股权、小费和其他项目。这些可能对某些职业和年龄组的总体薪酬产生比其他组更大的影响 1。
²⁰ 与就业序列不同,薪酬的结果截止于 2025 年 6 月,这是 PCE 指数最近可用的月份 1。
²¹ 根据《减税与就业法案》,2022 年颁布的《国内税收法典》第 174 条修正案也禁止公司立即扣除研发支出,包括软件开发成本。这些成本必须资本化,并在五年(国内研究)或十五年(国外研究)内摊销 1。
²² 一个职业是否适合远程工作与 AI 暴露度呈正相关。根据 GPT-4 β 指标,只有两个可远程工作的职业属于最低的 AI 暴露度五分位数。同样,很少有不可远程工作的职业属于最高的 AI 暴露度五分位数。因此,在图 A6 中,我们将最低的两个 AI 暴露度五分位数合并为一组。在图 A7 中,我们将最高的两个 AI 暴露度五分位数合并 1。
²³ 具有高 AI 暴露度的不可远程工作职业包括银行出纳员、旅行社代理和税务申报员 1。
²⁴ Chandar (2025a) 发现,大学毕业生平均技能水平的下降解释了近几十年来大学工资溢价增长放缓的相当一部分 1。
²⁵ 在基于 GPT-4 β 的暴露度指标的第一个五分位数中,没有一个职业的大学毕业生比例超过 35%,因此该五分位数被排除在图 A12 的结果之外 1。
²⁶ 另一种可能性是,就业趋势是由 COVID-19 大流行时期的刺激支票所驱动,这些支票扭曲了劳动力供给。然而,这些刺激支付是有收入要求的,而 AI 暴露度越高的职业平均收入也越高 (Kochhar, 2023),这表明观察到的 AI 暴露度高职业的下降不太可能由这一渠道驱动 1。
²⁷ 在我们的样本期内,CPS 每月包括 26 至 53 名年龄在 22 至 25 岁之间的年轻软件开发人员。它包括 49 至 95 名年轻的客户服务代表,以及 2 至 14 名年轻的家庭健康助理 1。
²⁸ 2024 年 ACS 1 年期公共使用微数据样本计划于 2025 年 10 月 16 日发布 1。
5 结论
我们记录了关于人工智能近期劳动力市场影响的六个事实。
- 首先,我们发现在人工智能暴露度最高的职业中,如软件开发和客户支持,处于职业生涯早期的工人的就业出现了大幅下降。
- 其次,我们表明,全经济范围内的就业持续增长,但年轻工人的就业增长已停滞不前。
- 第三,入门级就业在人工智能自动化工作的应用中下降,而在增强型应用中影响不大。
- 第四,在控制了公司-时间效应后,这些就业下降依然存在,最高暴露度职业的年轻工人相对就业下降了 13%。
- 第五,这些劳动力市场的调整更多地体现在就业上,而非薪酬上。
- 第六,我们发现这些模式在不受远程工作影响的职业中以及在各种替代性样本构建中都成立。
虽然我们的主要估计可能受到生成式人工智能以外因素的影响,但我们的结果与生成式人工智能已开始显著影响入门级就业的假设是一致的 1。
新技术的采用通常会导致工人群体间的异质性效应,从而产生一个调整期,因为工人会从被取代的工作形式重新分配到劳动力需求增长的新形式中 (Autor et al., 2024)。这种内生调整可能已经随着人工智能的出现而发生,有新证据表明大学专业正从计算机科学等 AI 暴露度高的类别转移 (Horowitch, 2025)。过去的技术转型,如信息技术革命,在物质和人力资本调整后,最终导致了就业和实际工资的强劲增长,尽管一些工人比其他人受益更多 (Bresnahan et al., 2002; Brynjolfsson et al., 2021) 1。
持续追踪就业趋势将有助于确定对人工智能的调整是否遵循类似的模式。因此,我们将继续监测这些结果,以评估本文记录的趋势未来是否会加速。未来的工作将受益于更好的公司层面人工智能采用数据,这将为估计人工智能对就业的合理因果效应提供更清晰的变异 1。
参考文献 (按原文格式保留,未作翻译)
ACEMOGLU, D. AND D. AUTOR (2011): “Skills, Tasks and Technologies: Implications for Employment and Earnings*,” in Handbook of Labor Economics, ed. by D. Card and O. Ashenfelter, Elsevier, vol. 4, 1043-1171.
ACEMOGLU, D., D. AUTOR, J. HAZELL, AND P. RESTREPO (2022): “Artificial Intelligence and Jobs: Evidence from Online Vacancies,” Journal of Labor Economics, 40, S293-S340, publisher: The University of Chicago Press.
ADP RESEARCH (2025): “ADP National Employment Report,”.
ALLEN, MIKE, J. V. (2025): “Behind the Curtain: Top AI CEO foresees white-collar bloodbath,” Axios.
AUTOR, D., C. CHIN, A. SALOMONS, AND B. SEEGMILLER (2024): “New Frontiers: The Origins and Content of New Work, 1940-2018*,” The Quarterly Journal of Economics, 139, 1399-1465.
AUTOR, D. AND N. THOMPSON (2025): “Expertise,” Working Paper, NBER.
BACON, A. (2025): “Nvidia’s Jensen Huang says AI could lead to job losses ‘if the world runs out of ideas’ | CNN Business,” CNN.
BICK, A., A. BLANDIN, AND D. J. DEMING (2024): “The Rapid Adoption of Generative AI,” Working Paper, National Bureau of Economic Research.
BONNEY, Κ., C. BREAUX, C. BUFFINGTON, E. DINLERSOZ, L. FOSTER, N. GOLDSCHLAG, J. HALTIWANGER, Z. KROFF, AND K. SAVAGE (2024): “The impact of AI on the workforce: Tasks versus jobs?” Economics Letters, 244, 111971.
BOWEN, T. (2025): “Graduating into a Slowdown: Class of 2025 Meets a Frozen Job Market,”.
BRESNAHAN, T. F., E. BRYNJOLFSSON, AND L. M. HITT (2002): “Information Technology, Workplace Organization, and the Demand for Skilled Labor: Firm-Level Evidence*,” The Quarterly Journal of Economics, 117, 339-376.
BRYNJOLFSSON, E. (2022): “The Turing Trap: The Promise and Peril of Human-Like Artificial Intelligence,” Daedalus, 151, 272-287.
BRYNJOLFSSON, E., D. LI, AND L. RAYMOND (2025): “Generative AI at Work*,” The Quarterly Journal of Economics, 140, 889-942.
BRYNJOLFSSON, E. AND T. MITCHELL (2017): “What Can Machine Learning Do? Workforce Implications,” Science, 358, 1530-1534.
BRYNJOLFSSON, E., T. MITCHELL, AND D. Rock (2018): “What Can Machines Learn, and What Does It Mean for Occupations and the Economy?” AEA Papers and Proceedings, 108, 43-47.
BRYNJOLFSSON, E., D. ROCK, AND C. SYVERSON (2021): “The Productivity J-Curve: How Intangibles Complement General Purpose Technologies,” American Economic Journal: Мастое-conomics, 13, 333-372.
CAJNER, T., L. CRANE, R. DECKER, A. HAMINS-PUERTOLAS, C. KURZ, AND T. RADLER (2018): “Using Payroll Processor Microdata to Measure Aggregate Labor Market Activity,” Tech. rep., The Federal Reserve Board of Governors.
CHANDAR, B. (2025a): “Shifts in the Composition of College Workers: Implications for US Inequality and Labor Demand,” Tech. rep., Social Science Research Network.
(2025b): “Tracking Employment in AI-Exposed Jobs,” Tech. rep., Social Science Research Network.
CHEN, J. AND J. ROTH (2024): “Logs with Zeros? Some Problems and Solutions*,” The Quarterly Journal of Economics, 139, 891-936.
CHEN, J. L. A. T.-P. (2025): “Young Graduates Are Facing an Employment Crisis,” WSJ, section: Economy.
CHEN, W. X., S. SRINIVASAN, AND S. ZAKERINIA (2025): “Displacement or Complementarity? The Labor Market Impact of Generative AI,”.
DAVIS, S. J. AND P. M. KROLIKOWSKI (2025): “Sticky Wages on the Layoff Margin,” American Economic Review, 115, 491-524.
DELL’ACQUA, F., E. MCFOWLAND III, E. R. MOLLICK, H. LIFSHITZ-ASSAF, K. KELLOGG, S. RAJENDRAN, L. KRAYER, F. CANDELON, AND K. R. LAKHANI (2023): “Navigating the Jagged Technological Frontier: Field Experimental Evidence of the Effects of AI on Knowledge Worker Productivity and Quality,” SSRN Scholarly Paper, Social Science Research Network, Rochester, NY.
DEMIRCI, O., J. HANNANE, AND X. ZHU (2025): “Who is AI replacing? The impact of generative AI on online freelancing platforms,” Management Science.
DILLON, E., S. JAFFE, S. PENG, AND A. CAMBON (2025): “Early Impacts of M365 Copilot,” Tech. Rep. MSR-TR-2025-18, Microsoft.
DINGEL, J. I. AND B. NEIΜΑΝ (2020): “How many jobs can be done at home?” Journal of Public Economics, 189, 104235.
DOMINSKI, J. AND Y. S. LEE (2025): “Advancing AI Capabilities and Evolving Labor Outcomes,” Tech. rep., arXiv, arXiv:2507.08244 [econ].
DOSHAY, H. AND A. BANTOCK (2025): “The SignalFire State of Tech Talent Report 2025,”.
ECKHARDT, S. AND N. GOLDSCHLAG (2025): “AI and Jobs: The Final Word (Until the Next One),” Economic Innovation Group.
ELOUNDOU, T., S. MANNING, P. MISHKIN, AND D. ROCK (2024): “GPTs are GPTs: Labor market impact potential of LLMs,” Science, 384, 1306-1308, publisher: American Association for the Advancement of Science.
ETTENHEIM, L. E. A. K. B. J. G. в. R. (2025): “AI Is Wrecking an Already Fragile Job Market for College Graduates,” WSJ, section: Tech.
FEDERAL RESERVE BANK OF NEW YORK (2025): “The Labor Market for Recent College Graduates,”
FELTEN, E., M. RAJ, AND R. SEAMANS (2021): “Occupational, industry, and geographic exposure to artificial intelligence: A novel dataset and its potential uses,” Strategic Management Journal, 42, 2195-2217, eprint: https://onlinelibrary.wiley.com/doi/pdf/10.1002/smj.3286.
(2023): “How will Language Modelers like ChatGPT Affect Occupations and Industries?” Tech. rep., arXiv, arXiv:2303.01157 [econ].
FELTEN, E. W., M. RAJ, AND R. SEAMANS (2018): “A Method to Link Advances in Artificial Intelligence to Occupational Abilities,” AEA Papers and Proceedings, 108, 54-57.
(2019): “The Occupational Impact of Artificial Intelligence: Labor, Skills, and Polarization,” SSRN Scholarly Paper, Social Science Research Network, Rochester, NY.
FRANK, M. R., Y.-Y. AHN, AND E. MORO (2025): “AI exposure predicts unemployment risk: A new approach to technology-driven job loss,” PNAS Nexus, 4, pgaf107.
FREY, C. B. AND M. A. OSBORNE (2017): “The future of employment: How susceptible are jobs to computerisation?” Technological Forecasting and Social Change, 114, 254-280.
FRICK, W. (2025): “AI Is Everywhere But the Jobs Data,” Bloomberg.com.
GMYREK, P., J. BERG, AND D. BESCOND (2023): “Generative AI and Jobs: A Global Analysis of Potential Effects on Job Quantity and Quality,” SSRN Scholarly Paper, Social Science Research Network, Rochester, NY.
HAMPOLE, M., D. PAPANIKOLAOU, L. D. SCHMIDT, AND B. SEEGMILLER (2025): “Artificial Intelligence and the Labor Market,” Working Paper, National Bureau of Economic Research.
HANDA, K., A. TAMKIN, M. MCCAIN, S. HUANG, E. DURMUS, S. HECK, J. MUELLER, J. HONG, S. RITCHIE, T. BELONAX, K. K. TROY, D. AMODEI, J. KAPLAN, J. CLARK, AND D. GANGULI (2025): “Which Economic Tasks are Performed with AI? Evidence from Millions of Claude Conversations,” Tech. rep., arXiv, arXiv:2503.04761 [cs].
HARTLEY, J., F. JOLEVSKI, V. MELO, AND B. MOORE (2025): “The Labor Market Effects of Generative Artificial Intelligence,” SSRN Scholarly Paper, Social Science Research Network, Rochester, NY.
HOOVER, A. (2025): “The AI coding apocalypse,” Business Insider.
HOROWITCH, R. (2025): “The Computer-Science Bubble Is Bursting,” The Atlantic, section: Economy.
HUI, X., O. RESHEF, AND L. ZHOU (2023): “The Short-Term Effects of Generative Artificial Intelligence on Employment: Evidence from an Online Labor Market,” SSRN Scholarly Paper, Rochester, NY.
HUMLUM, A. AND E. VESTERGAARD (2025): “Large Language Models, Small Labor Market Effects,” Working Paper, National Bureau of Economic Research.
IDE, E. (2025): “Automation, AI, and the Intergenerational Transmission of Knowledge,” arXiv preprint arXiv:2507.16078.
JAMALI, L. (2025): “Microsoft to cut up to 9,000 jobs as it invests in AI,” BBC.
JIANG, W., J. PARK, R. XIAO, AND S. ZHANG (2025): “AI and the Extended Workday: Productivity, Contracting Efficiency, and Distribution of Rents,” SSRN Scholarly Paper, Social Science Research Network, Rochester, NY.
JOHNSTON, A. AND C. MAKRIDIS (2025): “The Labor Market Effects of Generative AI: A Difference-in-Differences Analysis of AI Exposure,” SSRN Scholarly Paper, Social Science Research Network, Rochester, NY.
KOCHHAR, R. (2023): “Which U.S. Workers Are More Exposed to AI on Their Jobs?” Pew Research Center.
KUHFELD, M. AND K. LEWIS (2025): “5 years after COVID-19 hit: Test data converge on math gains, stalled reading recovery,” Brookings.
LENNY RACHITSKY (2025): “State of the product job market in 2025,” Lenny’s Newsletter, accessed: 2025-05-30.
LIM, S., D. STRAUSS, J. BURN-MURDOCH, AND C. MURRAY (2025): “Is AI killing graduate jobs?” Financial Times.
MASLEJ, N., L. FATTORINI, R. PERRAULT, Y. GIL, V. PARLI, N. KARIUKI, E. CAPSTICK, A. REUEL, E. BRYNJOLFSSON, J. ETCHEMENDY, ET AL. (2025): “Artificial intelligence index report 2025,” arXiv preprint arXiv:2504.07139.
MILMO, D. AND L. ALMEIDA (2025): “”Workforce crisis’: key takeaways for graduates battling AI in the jobs market,” The Guardian.
NOY, S. AND W. ZHANG (2023): “Experimental evidence on the productivity effects of generative artificial intelligence,” Science, 381, 187-192, publisher: American Association for the Advancement of Science.
O’BRIEN, C. (2025): “A viral chart on recent graduate unemployment is misleading,” Agglomerations.
PECK, E. (2025): “AI is keeping recent college grads out of work,” Axios.
PENG, S., E. KALLIAMVAKOU, P. CIHON, AND M. DEMIRER (2023): “The Impact of Al on Developer Productivity: Evidence from GitHub Copilot,” Tech. rep., arXiv, arXiv:2302.06590 [cs].
RAMAN, A. (2025): “Opinion I’m a LinkedIn Executive. I See the Bottom Rung of the Career Ladder Breaking.” The New York Times.
RAVAL, A. (2025): “The Al job cuts are accelerating,” Financial Times.
ROOSE, K. (2025): “For Some Recent Graduates, the A.I. Job Apocalypse May Already Be Here,” The New York Times.
SHERMAN, N. (2025): “Amazon boss says AI will replace jobs at tech giant,” BBC News.
SIMON, L. K. (2025): “Is AI responsible for the rise in entry-level unemployment?” Revelio Labs.
SMITH, N. (2025): “Stop pretending you know what AI does to the economy,”.
THE ECONOMIST (2025): “Why AI hasn’t taken your job,” The Economist.
THOMPSON, D. (2025): “Something Alarming Is Happening to the Job Market,” The Atlantic, section: Economy.
TOMLINSON, K., S. JAFFE, W. WANG, S. COUNTS, AND S. SURI (2025): “Working with AI: Measuring the Occupational Implications of Generative AI,” Tech. rep., arXiv, arXiv: 2507.07935 [cs].
WEBB, M. (2019): “The Impact of Artificial Intelligence on the Labor Market,” SSRN Scholarly Paper, Social Science Research Network, Rochester, NY.
Wu, T. (2025): “Opinion A ‘White-Collar Blood Bath Doesn’t Have to Be Our Fate,” The New York Times.
附录
图 A1:计算机职业(2010 年 SOC 代码以 15-1 开头)和服务文员(以 43-4 开头)的就业变化,以 2022 年 10 月为 1 进行归一化。
图 A2:按年龄和自动化水平的就业变化,使用来自 Handa et al. (2025) 的 Claude 使用数据。排除了没有 Claude 使用数据或在有使用数据的职业中总体 Claude 使用率处于最低五分位数的职业。
图 A3:按年龄和增强五分位数的就业变化,使用来自 Handa et al. (2025) 的 Claude 使用数据。排除了没有 Claude 使用数据或在有使用数据的职业中总体 Claude 使用率处于最低五分位数的职业。
图 A4:按年龄和暴露度五分位数的就业变化,使用来自 Eloundou et al. (2024) 的指标。排除了计算机职业(2010 年 SOC 代码以 15-1 开头)。
图 A5:按年龄和暴露度五分位数的就业变化,使用来自 Eloundou et al. (2024) 的指标。排除了信息行业的公司(NAICS 代码 51)。
图 A6:按年龄和暴露度分组的就业变化,使用来自 Eloundou et al. (2024) 的指标。仅包括根据 Dingel and Neiman (2020) 可远程工作的职业。注意,很少有可远程工作的职业属于最低暴露度五分位数。因此,第一和第二五分位数的所有职业被归为第 1 级。其余五分位数编码为 2、3 和 4。
图 A7:按年龄和暴露度分组的就业变化,使用来自 Eloundou et al. (2024) 的指标。仅包括根据 Dingel and Neiman (2020) 不可远程工作的职业。注意,很少有不可远程工作的职业属于最高暴露度五分位数。因此,第四和第五五分位数的所有职业被归为第 4 级。其余五分位数编码为 1、2 和 3。
图 A8:按年龄和暴露度五分位数的就业变化,使用来自 Eloundou et al. (2024) 的指标。数据从 2018 年到 2025 年。
图 A9:按年龄和暴露度五分位数的就业变化,使用来自 Handa et al. (2025) 的 Claude 使用数据。其相关任务均低于使用数据中最低查询次数的职业被视为一个单独类别,编码为 0。数据从 2018 年到 2025 年。
图 A10:按年龄和自动化水平的就业变化,使用来自 Handa et al. (2025) 的 Claude 使用数据。数据从 2018 年到 2025 年。
图 A11:按年龄和增强五分位数的就业变化,使用来自 Handa et al. (2025) 的 Claude 使用数据。数据从 2018 年到 2025 年。
图 A12:按年龄和暴露度五分位数的就业变化,使用来自 Eloundou et al. (2024) 的指标。仅考虑在 2017 年 ACS 中至少 70%的工人拥有大学学位的职业。注意,没有此类职业位于基于 GPT-4 β 的暴露度指标的五分位数 1 中。
图 A13:按年龄和暴露度五分位数的就业变化,使用来自 Eloundou et al. (2024) 的指标。仅考虑在 2017 年 ACS 中最多 30%的工人拥有大学学位的职业。
图 A14:按年龄和暴露度五分位数的就业变化,使用来自 Eloundou et al. (2024) 的指标。仅考虑男性。
图 A15:按年龄和暴露度五分位数的就业变化,使用来自 Eloundou et al. (2024) 的指标。仅考虑女性。
图 A16:按年龄和暴露度五分位数的就业变化,使用来自 Eloundou et al. (2024) 的指标。使用完整的公司样本。
图 A17:按年龄和暴露度五分位数的就业变化,使用来自 Eloundou et al. (2024) 的指标。包括兼职和临时工。
图 A18:软件开发人员按年龄的就业变化,以 2022 年 10 月为 1 进行归一化。数据来自月度 CPS。
图 A19:客户服务代表按年龄的就业变化,以 2022 年 10 月为 1 进行归一化。数据来自月度 CPS。
图 A20:家庭健康助理按年龄的就业变化,以 2022 年 10 月为 1 进行归一化。数据来自月度 CPS。
图 A21:按年龄和暴露度五分位数的就业变化,使用来自 Eloundou et al. (2024) 的指标。数据来自月度 CPS。
表 A1:按暴露度类别的职业示例
指标 | 暴露度最低 (示例) | 暴露度最高 (示例) |
---|---|---|
Eloundou et al. (2024) GPT-4 B | • 维修和修理工,通用 • 护理、精神病和家庭健康助理 • 体力劳动者和货物、库存及物料搬运工 • 女佣和家政清洁工 | • 客户服务代表 • 会计师和审计师 • 软件开发人员,应用程序和系统软件 • 秘书和行政助理 |
Handa et al. (2025) (总体) | • 出租车司机和私人司机 • 生产和操作工一线主管 • 体力劳动者和货物、库存及物料搬运工 • 女佣和家政清洁工 | • 计算机程序员 • 财务经理 • 会计师和审计师 • 销售代表,批发和制造业 |
Handa et al. (2025) (自动化) | • 维修和修理工,通用 • 经理,所有其他 • 护理、精神病和家庭健康助理 • 司机/销售员和卡车司机 | • 总经理和运营经理 • 会计师和审计师 • 软件开发人员,应用程序和系统软件 • 接待员和信息员 |
Handa et al. (2025) (增强) | • 厨师 • 焊接、钎焊和铜焊工 • 出纳员 • 绘图员 | • 首席执行官 • 维修和修理工,通用 • 注册护士 • 计算机和信息系统经理 |
表 A2:摘自 Handa et al. (2025) 的表 1。Handa et al. (2025) 根据人们如何将 AI 整合到工作流程中,将来自大型语言模型 Claude 的对话分为两大类下的五种不同模式。
自动化行为 | 增强型行为 |
---|---|
AI 以最少的人类参与直接执行任务 | AI 通过协作增强人类能力 |
指令型: 以最少互动完成任务委托 | 任务迭代型: 协作式的完善过程 |
示例: “将这份技术文档格式化为 Markdown” | 示例: “我们来为新产品起草一份营销策略。开头不错,但我们能加一些具体的指标吗?” |
反馈循环型: 在环境反馈指导下完成任务 | 学习型: 知识获取和理解 |
示例: “这是我用于数据分析的 Python 脚本,它报了一个 IndexError 错误。你能帮忙修复吗?现在我遇到了一个不同的错误……” | 示例: “你能解释一下神经网络是如何工作的吗?” |
验证型: 工作核实和改进 | |
示例: “我写了这条 SQL 查询来查找重复的客户记录。你能检查一下我的逻辑是否正确并提出任何改进建议吗?” |