Meta-Scale 交易一周年：数据标注行业正在经历一场无声的权力重构——从廉价劳动力到专家网络，从 RLHF 到 RL 环境，从中立供应商到战略资产

2025 年 6 月，Meta 以 143 亿美元收购了数据标注公司 Scale AI 49% 的股权，同时将创始人 Alexandr Wang 招入麾下，执掌新成立的 Meta Superintelligence Labs。这笔交易当时被多数观察者解读为一次昂贵的「收购式招聘」——一个社交网络巨头花大价钱买来一位 28 岁的明星创始人。

整整一年后，2026 年 6 月 16 日，Forbes 发表了一篇措辞犀利的回顾文章，标题直指核心：「那 143 亿美元买的不是模型，而是 AI 经济中资本无法制造的稀缺资源。」

这篇文章的发表时机耐人寻味。就在同一周，Meta 内部工程师开始将 AI 部门称为「古拉格」，Zuckerberg 发出内部备忘录承认重组过程中犯了「错误」，而 Meta 用这笔交易打造的前沿模型 Muse Spark 被一位 AI 高管评价为「令人打哈欠」。Meta 股价在过去一年下跌了 18%，在美股科技巨头中垫底。

但 Forbes 的论点——也是本文试图展开分析的核心——是：市场在批改错误的考卷。Meta-Scale 交易真正的冲击波不在模型层面，而在数据层面。它从根本上改变了 AI 训练数据供应链的权力结构，并触发了一场仍在持续的行业重组。

一、交易回顾：143 亿美元买到了什么

2025 年 6 月 13 日，Scale AI 官方确认 Meta 完成了一笔「重大」投资，将公司估值推至 290 亿美元。Meta 以约 143 亿美元获得 49% 股权，但不拥有任何投票权。Alexandr Wang 卸任 CEO，加入 Meta 负责「超级智能」研发；Scale 原首席战略官 Jason Droege 接任临时 CEO。

Scale AI 成立于 2016 年，最初是一家数据标注公司——招募全球工人为 AI 系统标注图像、文本和视频。但到 2025 年，它的角色已经远超「标注工厂」。Scale 已成为 OpenAI、Google、Anthropic 等几乎所有前沿 AI 实验室的核心训练基础设施提供商，通过 RLHF（基于人类反馈的强化学习）为 LLM 提供对齐数据。Sacra 的数据显示，Scale 2025 年营收达到 20 亿美元，远高于 2024 年的 8.7 亿美元，数据业务首次实现盈利。

TechCrunch 在交易报道中特别指出，Scale 及其竞争对手当时已开始大规模招募高技能人才——「博士科学家和资深软件工程师」——来为前沿 AI 实验室生成高质量数据。这标志着数据标注行业正在从低技能劳动向专家知识密集型服务转型。

二、客户出逃：中立性的终结

交易宣布后数日内，行业地震接踵而至。

OpenAI 率先开始逐步终止与 Scale 的合作。据 TechCrunch 和 Computerworld 报道，Google 也出于对 Meta 可能获取其 AI 研发信息的担忧而考虑切断关系。xAI 同样踩下了刹车。原因很简单：没有一家 AI 实验室愿意将自己的训练数据交给一个由竞争对手持股 49% 的供应商。

这次客户出逃产生了两个直接后果：

第一，Scale 的客户集中度风险急剧上升。 据 TSG Invest 分析，2025 年 Meta 投资后，Scale 的主要客户——包括 Google、OpenAI 和 xAI——减少或暂停了合作，原因是数据保密顾虑。Scale 一度是「全行业的军火商」，如今却变成了 Meta 的专属引擎。

第二，竞争对手获得了历史性窗口。 Surge AI 是最大的受益者。这家由 Edwin Chen 创立、此前从未融资的 bootstrapped 公司，在 2024 年营收已超过 12 亿美元，超越 Scale 同期的 8.7 亿美元。2025 年 7 月，Reuters 独家报道 Surge AI 寻求首次融资，目标金额高达 10 亿美元，估值超过 150 亿美元。到 2025 年 8 月，Surge AI 营收达到 14 亿美元，估值推至 200 亿美元。

与此同时，Mercor 等新型平台也在崛起。Mercor 定位为「AI 人才市场」，连接 AI 实验室与领域专家——科学家、临床医生、律师、工程师——为模型训练和评估提供专业判断。其模式与传统的众包标注截然不同，更接近「专家网络」。

三、Scale 的自我重塑：从标注到 RL 环境

面对客户出逃，Scale 在 Jason Droege 的领导下启动了一场深刻的业务转型。2025 年，Scale 在官方博客中宣布推出 Scale RL Environments——一套模拟真实工作场景的强化学习训练环境。

这是一个战略性转向。Scale 不再仅仅是「为数据打标签」的公司，而是开始构建 AI 智能体（Agent）在其中试错、学习、被评估的「模拟世界」。据 Forbes 报道，Scale 近一半的新项目已经是 RL 环境，而非传统的数据标注。

Epoch AI 在 2025 年底对 RL 环境行业进行了深度调研，采访了 18 位来自 RL 环境创业公司、前沿实验室和相关机构的从业者，结论是：RL 环境已成为前沿 AI 实验室训练模型的核心基础设施。正如 Andrej Karpathy 在 2025 年回顾中所言，通过在多样化、可验证的任务环境中训练 LLM，这些模型「自发地发展出人类看起来像『推理』的策略」。

Scale 的 RL 环境产品覆盖消费者、企业和领域特定场景，允许模型构建者在高度逼真的模拟系统中训练和测试智能体，而无需承担在生产环境中部署未经验证行为的风险。这在本质上是对「数据」概念的一次升级：从静态的标注数据到动态的、可交互的、可验证的模拟环境。

四、数据标注行业的范式迁移

Meta-Scale 交易是一个引爆点，但它揭示的行业趋势早在交易前就已酝酿。纵观 2025—2026 年的数据标注行业，三个结构性转变正在发生：

从数量到质量。 2026 年，数据标注服务的竞争焦点已从「谁能标注更多数据」转向「谁能提供更高质量的数据」。Kili Technology 在一份 2026 年行业报告中指出，高达 85% 的 AI 模型失败源于劣质数据，这使得多层质量控制成为 2026 年数据标注服务的核心差异化因素。

从通用标注到专家判断。 传统的众包标注——雇佣廉价劳动力进行图像框选、情感标签——正在被专家驱动的评估工作取代。前沿实验室需要的不再是「这个边界框是否准确」，而是「这个量子物理问题的解答是否正确」「这份法律合同的条款是否合理」。Amplify Partners 在一篇分析中一针见血地指出：「为 AI 做标注并不具备可扩展性」——因为模型越强，需要的标注者就越专业，而专业人才是稀缺的。

从 RLHF 到 RL 环境。 RLHF 仍是模型对齐的基础技术，但行业正在从「人类评估模型输出」的单一步骤，转向构建完整的 RL 环境，让模型在其中自主探索和学习。RLAIF（基于 AI 反馈的强化学习）作为 RLHF 的补充方案也在快速兴起，AI 系统作为「裁判」对模型输出进行评分，人类仅对抽样切片进行验证。FutureAGI 的分析指出，2026 年的主流模式是「LLM-as-judge + 人类验证采样」，在保持质量的同时大幅降低成本和时间。

五、Meta 的真正赌注

回到 Forbes 文章的核心论点：如果把 Meta-Scale 交易仅仅看作一次模型竞赛的筹码，就完全误解了 Zuckerberg 的战略意图。

2026 年 Q1，Meta 报告营收 563 亿美元，同比增长 33%，其中广告收入约 550 亿美元。驱动这一增长的核心引擎是 AI——Meta 的 GEM 基础模型在其生态系统中训练广告内容和用户参与数据，然后指导下游系统进行广告投放优化。AI 创意工具在约四个月内将广告主数量从 400 万翻倍至 800 万，GEM 和 Lattice 系统带来了 6% 的落地页转化提升。

Forbes 的论点是：Zuckerberg 多年前就认识到，大语言模型会商品化，成为免费功能而非付费产品。真正的价值积累在平台和数据层面，而非模型本身。 143 亿美元买下的不是模型，而是数据工厂——一个资本无法单纯用钱建造的稀缺资产。

当整个行业面临「训练数据墙」——Epoch AI 和 Forbes 都指出，公开可用的高质量文本数据正趋于枯竭——拥有规模化数据生产能力的公司就拥有了结构性优势。Meta 的赌注不是 Muse Spark 能否在基准测试中击败 GPT 或 Gemini，而是它能否在数据层和分发层建立不可替代的壁垒。

六、未竟之局

一年过去，Meta-Scale 交易的故事远未结束。

Scale 在 Jason Droege 的领导下仍在努力重建客户基础。Forbes 2026 年 5 月的后续报道称，Scale 的销售已经反弹，预计 2026 年营收将超过 10 亿美元。其国际公共部门业务在 2025 年翻倍，预计 2026 年将再次翻倍。

Surge AI 在吸纳了 OpenAI 和 Google 等出走客户后，估值已飙升至 200 亿美元以上，但其能否将 10 亿美元级别的融资有效转化为增长动能，仍是未解之题。

Mercor 等新玩家正在重新定义「数据标注」的边界——从标注像素到设计评估体系，从执行指令到构建 RL 环境。正如其 CEO 所言：「评估将取代知识工作。」

而对于整个行业来说，最深刻的转变或许在于：数据不再只是模型的「燃料」，它正在成为 AI 竞争中最稀缺、最具有战略价值的资产。 当芯片可以建厂生产、电力可以建站供应时，高质量的训练数据——尤其是来自领域专家的人类判断——却是无法用资本简单复制的。

Meta 的 143 亿美元赌注，无论最终结果如何，已经不可逆转地改变了这个行业的游戏规则。

来源：

Forbes, "Why Meta Paid $14.3B For Scale AI And Alexandr Wang's Data Empire," 2026-06-16. https://www.forbes.com/sites/jonmarkman/2026/06/16/why-meta-paid-143b-for-scale-ai-and-alexandr-wangs-data-empire
TechCrunch, "Scale AI confirms 'significant' investment from Meta," 2025-06-13. https://techcrunch.com/2025/06/13/scale-ai-confirms-significant-investment-from-meta-says-ceo-alexandr-wang-is-leaving
Sacra, "Scale AI revenue, valuation & funding." https://sacra.com/c/scale-ai
Computerworld, "Meta's $14.3B stake triggers Scale AI customer exodus." https://www.computerworld.com/article/4009714/metas-14-3b-stake-triggers-scale-ai-customer-exodus-could-be-a-windfall-for-rivals-like-mercor.html
Reuters, "Scale AI's bigger rival Surge AI seeks up to $1 billion capital raise," 2025-07-01. https://www.reuters.com/business/scale-ais-bigger-rival-surge-ai-seeks-up-1-billion-capital-raise-sources-say-2025-07-01
Scale AI, "The Next Frontier of Data Training: RL Environments." https://scale.com/blog/rl-environments
Epoch AI, "An FAQ on Reinforcement Learning Environments." https://epoch.ai/gradient-updates/state-of-rl-envs
TSG Invest, "Scale AI Stock: $29B Valuation — Is It a Buy?" https://tsginvest.com/scale-ai
Kili Technology, "The Best Data Labeling Services in 2026 (Reviewed)." https://kili-technology.com/blog/the-best-data-labeling-services-in-2026-reviewed
FutureAGI, "Human vs LLM Annotation 2026: Accuracy, Cost, Tools." https://futureagi.com/blog/human-vs-llm-annotation-2025
Amplify Partners, "Annotation for AI doesn't Scale." https://amplifypartners.com/blog-posts/annotation-for-ai-doesnt-scale