這是用戶在 2025-7-1 20:47 為 https://36kr.com/p/3351211196672645 保存的雙語快照頁面,由 沉浸式翻譯 提供雙語支持。了解如何保存?

一家數據標註公司,估值追上百度和理想汽車

雪豹財經社·2025 年 06 月 25 日 09:39
最新估值2000億
理想汽車
已上市北京市2015-07
智慧新能源汽車研發商
我要聯繫
  1. 數據標註公司 Scale AI 在 2024 年的營收為 8.7 億美元,Meta 出資 143 億美元獲得其 49%股份,將它的估值一舉推高到了 290 億美元。
  2. 這家公司的真正優勢在於,它已經從一家單純的數據標註公司,一躍成為能夠深度參與數據管理與模型訓練流程的數據基礎設施企業。
  3. 買數據、挖情報、搶人...... Meta 通過對 Scale AI 的收購,已經將矽谷的 AI 大戰帶到了新的高度。

一提到「數據標註公司」,外界的印象通常是:

技術含量低、工作內容重複枯燥、依賴大量低成本人力完成簡單機械的標註任務,例如給圖片打標籤、文本分類或音頻轉錄。 這類公司被視作 AI 產業鏈底層“苦力”,利潤微薄、附加值低,很難形成核心競爭力或行業話語權。 在公眾眼中,它們更多是幕後無名的外包工廠,而非高科技創新企業。

不過,隨著一筆矽谷投資交易浮出水面,你可能要重新構建對數據標註公司的價值評估了。

據多家媒體報導,6 月中旬,Facebook 母公司 Meta 出資 143 億美元(約合人民幣 1028 億元)獲得數據標註公司 Scale AI 的 49%無投票權股份,將後者的估值一舉推高到了 290 億美元(約合人民幣 2082 億元)。

你可能對290億美元的估值沒有概念。 截至6月20日收盤,百度和理想汽車的市值分別是287.5億美元和263.6億美元。

這是 Meta 歷史上第二大投資,僅次於 2014 年以 190 億美元收購 WhatsApp。 作為交易的一部分,Scale AI 創始人兼 CEO Alexandr Wang 在保留原公司董事會成員身份的同時,也將攜部分公司成員加入 Meta。

Scale AI 創始人 Alexandr Wang,圖源:Scale AI

一石激起千層浪。

得知這一消息后,包括谷歌、微軟、OpenAI、馬斯克的 xAI 等在內多家 AI 巨頭先後表示計劃撤出與 Scale AI 的合作。 而 Scale AI 空出的訂單,正被一眾同行瘋搶。

一家數據標註公司何以賣出千億,Meta 這次的大動作背後,藏著多少 AI 巨頭們殘酷爭鬥的暗線?

何以估值2000億?

算力是 AI 軍備競賽中的關鍵戰略資源。 要下場做大模型就得囤顯卡,已然成為了一個共識。 但易為人忽視的是,訓練數據的質量決定了模型能力的上限,它與囤卡同樣至關重要。

打個比方,如果說大模型是一個勤奮的學生,訓練數據就相當於它的教材。 只有給大模型投喂高質量的數據,大模型才能夠給出真實、準確、全面和符合倫理的回答。 反之,則會越學越糊塗,無法提供符合預期的輸出。

流傳於業內的一句俗語說,「垃圾進,垃圾出」,說的就是這個道理。 在 Scaling Laws 逐漸失效,靠算力和模型規模硬解的打法陷入瓶頸的當下,提高數據質量有時甚至能起到點石成金的奇效。

以往,數據標註工作主要集中在文本、圖像和音視頻等方面。 但現在的數據標註開始變得更為複雜。 隨著行業轉向帶有“思維鏈”的推理模型,專家數據成為了 AI 巨頭們眼中的金礦。

OpenAI 等 AI 巨頭轉向推理模型,使專家數據成為關鍵資源,圖源:unsplash

這也是為什麼如今的 AI 標註團隊里,你不僅能看到完成單調原始工作的合同工和外包人員,有時也會看到不同學科和領域的專業人士。 他們會寫下解決複雜問題所需要的思考步驟,輔導大模型模仿人類的思考方式。

Scale AI 的商業模式,正是為客戶提供數據標註解決方案。 通過 Remotasks 和 Outlier AI 這樣的平臺,他們招募並管理著全球數以十萬計的工作力。 同時,他們也開出不菲的時薪來吸引計算機科學、數學、自然科學、社會科學等專業的博士來撰寫語料。

但若只是如此,Scale AI 和市面上其他的數據標註公司並沒有形成差異。

這家公司的真正優勢在於,通過 AI 輔助的自動化標註能力和成熟的平臺體系,他們能夠高效且靈活地滿足不同客戶的定製化需求,從一家單純的數據標註公司,一躍成為能夠深度參與數據管理與模型訓練流程的數據基礎設施企業。

Scale AI 目前的業務重心是生成式 AI 所需要的數據,圖源:Scale AI

此前,Scale AI 已經贏得了 Meta、OpenAI、Google、微軟和美國政府等大金主的訂單。 這些頂級客戶不僅為 Scale AI 帶來了不菲的收入,也為之提高了聲譽,給估值的水漲船高提供了背書。

2024 年,Scale AI 的營收達到 8.7 億美元,其估值在與 Meta 的交易之前就來到了 140 億美元。

Meta 下場,谷歌們“割席”

Meta 拿下 Scale AI 的 49%股份,最顯而易見的收穫當然是後者在數據標註業務上的能力。

有了 Scale AI 的加持,Meta 可以依託前者現有的平臺,建立起一個大型的高品質數據標註網路,助力自家大模型 Llama 的開發。

今年 4 月初,Meta 發佈了最新開源大模型 Llama 4,可它卻完全沒有了前代產品的驚豔,不但在實測中表現平平,甚至還被爆出了疑似在基準測試中作弊的醜聞。 而其旗艦模型 Behemoth 一再推遲發佈,至今難產。

Llama 4 的發佈計劃中包含 Behemoth、Maverick 和 Scout 三款模型,圖源:Meta

如果能夠通過訓練數據品質的提升來改善模型的真實水平,或許可以拯救 Meta 在開發大模型這一戰線上的頹勢,縮小與 OpenAI 和 Anthropic 等對手的身位差距。

不過,光看這一點,可能還無法解釋 Meta 為何願意按照 Scale AI 一年前估值(140 億美元)的兩倍來出價,尤其是考慮到從 2023 年到 2024 年,Scale AI 的營收不過從 7.6 億美元提高到 8.7 億美元。

有業內人士猜測,除了搶佔大模型訓練數據這一座山頭之外,Meta 對 Scale AI 的這筆大額投資,其實還有通過 Scale AI 了解對手研發動態的目的。

正如 Handshake(Scale AI 的競爭對手)的 CEO Garrett Lord 所說:“如果你是通用汽車或豐田,你不會希望你的競爭對手走進你的製造工廠,看你的流程是如何運轉的。 ”

雖然 Scale AI 作為一家數據標註公司無法接觸到大模型的核心演算法,但他們有機會從接觸到的數據和產品模型對客戶的商業戰略和研發重點進行瞭解。

可能正是出於這樣的擔憂,儘管 Scale AI 的發言人 Joe Osborne 在一份聲明中表示“公司將繼續保持獨立”,多家主要客戶(包括谷歌、微軟、OpenAI、馬斯克的 xAI 等)都決定退出與 Scale AI 的合作。

Scale AI 在其官網列出的部分客戶名單,圖源:Scale AI

這其中,谷歌作為 Scale AI 的最大客戶,原本計劃在今年支付 2 億美元購買人工標註數據。 去年 Scale AI 8.7 億美元的營收中,谷歌一家就貢獻了 1.5 億美元。

AI 巨頭們果斷切割的想法其實很好理解,與 Scale AI 的合作涉及高度敏感的商業機密,他們不可能放心將這些交給 Meta 大額持股的公司。

當下,各家數據標註公司還在鯰魚搶食,冀望吃下 Scale AI “被分手”以後空出的訂單量。 Handshake 一夜之間訂單量激增到原來的三倍,Labelbox 的 CEO 則表示,該公司可能會從 Scale AI 的老客戶那裡獲得數億美元的收入。

Scale AI 將如何度過這一波使用者流失潮,目前還不得而知。 但這筆交易可能會成為數據標註行業的轉捩點。 可以預見的是,AI 巨頭們要麼會加大投入去養自家的數據標註團隊,要麼就會將需求分散到多家供應商。

無論哪種模式下,數據標註行業或許將很難再滋養出一家超大公司——AI 巨頭們不會允許自己的數據供應鏈被一家獨大的供應商拿捏。

AI 大戰來到新高度

僅從帳面上看,Meta 花費如此大的代價投資 Scale AI,算不上是一筆好買賣。

Scale AI 原本被看好在 2025 年實現 20 億美元的營收,但在流失了多家重量級客戶之後,哪怕汽車自動駕駛和政府業務相關的客戶全部留下,要達到這一業績也難度頗高。

而其 290 億美元的天價估值,也將在對客戶的吸引力下降后冷卻下來。 有媒體報導稱,Scale AI 的一位早期投資者已經萌生了套現離場的想法。

很難想像 Meta 會對這樣的業界反應毫無預料,但或許從一開始,Meta 就沒有帶著要在財務投資中獲利的心態去做交易。

Meta 真正的意圖是什麼? 他們想要的不僅是 Scale AI,還有 Scale AI 背後的領路人 Alexandr Wang。

Alexandr Wang 是 AI 圈最受關注的年輕企業家之一,圖源:Entrepreneur

類似的「招聘式投資」近些年在矽谷早有先例。

去年,微軟花費 6.5 億美元,換來 AI 初創公司 Inflection 的軟體授權,並聘用了該公司包括老闆 Mustafa Suleyman 在內的大部分員工。 在一筆類似的操作中,谷歌以逾 20 億美元的估值投資 Character.ai,好讓後者團隊中的 30 人加入 Gemini 的開發。

對於規模龐大、組織僵化以至於缺乏創新土壤的大公司來說,直接以這種方式引入經過市場驗證的人才,也不失為一種破局的手段。

Meta 確實也十分看重 Alexandr Wang 的加盟,他們一度想授予這位年輕人“首席 AI 官”的頭銜。 接下來,Meta 計劃讓他擔任新部門「超級智慧(Superintelligence)」的高級崗位,直接向紮克伯格彙報。

有趣的是,雖然 Alexandr Wang 即將成為「超級智慧」實驗室的領導者,但他卻並非科班出身的研究人員。

2016 年,年僅 19 歲的 Alexandr Wang 在用 AI 攝像頭來監控冰箱庫存的嘗試中,發現了 AI 數據標註的巨大商機,當年他就從 MIT 輟學並創立了 Scale AI。

在經歷了初期的探索后,這家公司開始專注於與自動駕駛相關的數據標註工作,隨後又開始將業務重心轉向生成式 AI。 24 歲時,Alexandr Wang 成為全世界最年輕的白手起家億萬富翁。

Alexandr Wang 也以其過人的社交能力在圈內著稱,OpenAI 的 CEO Altman 就和他關係密切。 Scale AI 能夠接連從 AI 巨頭和美國政府手裡接下訂單,與 Alexandr Wang 強大的人脈也不無關係。

此前,據 Altman 爆料,Meta 曾拿出 1 億美金的簽約獎金到 OpenAI 撬牆角未果。 隨著 Alexandr Wang 的加盟,Meta 不但完成了一次頂級人才的重磅引進,也給後續繼續招兵買馬增加了砝碼。

在對元宇宙的巨額投資收益慘澹,大模型研發又開始落後於頭部對手的當下,Meta 試圖通過「超級智慧」彎道超車以奪回 AI 大戰主動權,也不失為一次富有魄力的嘗試。

買數據、挖情報、搶人...... Meta 通過對 Scale AI 的收購,已經將矽谷的 AI 大戰帶到了新的高度。 不管接下來還有什麼精彩戲碼上演,這場大戰還遠遠沒有迎來拐點。

本文來自微信公眾號 「雪豹財經社」(ID:xuebaocaijingshe),作者:於米,36 氪經授權發佈。

+1
81

好文章,需要你的鼓勵

參與評論
評論千萬條,友善第一條
后參與討論
提交評論0/1000
36氪
36氪

報導的專案

理想汽車
我要聯繫
智慧新能源汽車研發商

下一篇

工程師來信|“我也一度認為激光雷達只是情緒價值”“激光雷達也是一種第一性原理。 ”

2025-06-25

36 氪 APP讓一部分人先看到未來
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业