一年五輪融資、金額數億元,具身智能跑出一只潛力獨角獸:鹿明機器人。
去年 12 月,它連拿兩輪錢,融了幾個億;去年上半年,它連融了三輪,近 2 億元。
為啥資本瘋搶?核心之一是它研發的 FastUMI Pro 軟硬件系統。
簡單說就是 " 不用機器人本體,也能采數據 " 的方法,2025 年下半年,海外的兩家明星具身智能公司,Generalist 的新模型 Gen 0,以及 Sunday Robotics,都采用了 UMI。
這種技術使得原來人控制機器遙操作采一條數據要 50 秒,現在 10 秒就搞定,成本直接砍了 80%,鹿明還搞 8 道工業級檢查,以前行業里 70% 的數據能用,現在 95% 以上都是好數據。
它的核心本事是 " 泛化 ":一套數據,幾十種機器人都能用,打破數據孤島,讓所有機器人都能 " 互通有無 "!鹿明機器人的崛起,其實在說一個簡單道理:具身智能要落地,先搞定數據。
鹿明機器人由前追覓科技人形機器人業務負責人喻超創立,喻超畢業于清華大學,自 2016 年起便深耕機器人學習算法領域。聯席 CTO 丁琰為紐約州立大學人工智能博士、前上海 AI lab 明星研究員。
從 2024 年 9 月成立,到破解行業數據難題,2026 年他們的目標是百萬小時具身真機數據產能,建成全球最大的具身真機數據集。據稱,全球具身智能圈內,有超過三分之二的頂尖團隊,都在使用 FastUMI Pro,這一系統已經成為行業內驗證和開發 UMI 能力的標配裝備。
也正因如此,鹿明機器人與智元機器人、銀河通用、它石智航一起,被并稱為 " 具身數據四小龍 "。
最近,鉛筆道同多家媒體一起,與喻超、丁琰就機器人數據、商業機會等話題交流,以下是對話精華。
鉛筆道:是什么讓你下定決心出來創業?
喻超:2024 年,我看到了大模型技術在 NLP 領域的突破,我相信 Scaling Law 在具身智能領域也是成立的,通用智能與機器人相結合的拐點已經到來。
而且我看到了行業存在很多待解的痛點,比如基礎設施不夠完善,無法支撐具身智能在場景里規模化落地,現在正是構建行業基礎設施、建立數據標準的最佳時機。
鉛筆道:創業以來都做了哪些事情?
喻超:基于我對于行業的認知,提出了 " 鹿明指數 "。鹿明指數 = 場景價值 / ( 數據成本 × 硬件成本 ) 。
在具身智能領域,真正拉開差距的,是落地成本。數據成本和硬件成本越低,場景價值越大。
基于這個判斷,我們也形成了一個更清晰的共識:基礎設施是否成熟,決定了場景能不能穩定落地;硬件本體是否可靠、貼合場景,決定了能不能長期使用;數據是否高質量、低成本、可規模復制,決定了模型能不能在不同場景中 " 舉一反三 "。
這也是為什么,我們并不只盯著某一個環節做優化。鹿明指數真正想解決的,不是 " 單點領先 ",而是整體效率。它指導我們系統性地搭建從硬件、數據到模型的完整能力。
一個具體的例子是,我們自主研發了 FastUMI Pro 數據采集系統。通過這套系統,真機數據的采集效率提升了 5 倍,成本降低了 80%。構建起從硬件、數據到模型的全棧能力閉環。
鉛筆道:怎么看待數據、模型、硬件之間的關系?
丁琰:數據質量首先取決于數據采集硬件。采集硬件好不好,決定了數據質量高低,而數據質量又決定了模型能力的上限。如果數據質量不好,模型不可能訓練好。
然后是硬件。當數據與模型完成適配后,最終要部署到硬件本體上,如果本體性能跟不上,模型的效果也很難完全發揮出來。
這三者是相互影響的關系。也正因為這樣,我們最近會發布一款 " 為 UMI 量身打造 " 的輕量級機械臂,希望它能最大程度發揮數據和模型的能力,把整體性能推到一個比較極致的狀態。
鉛筆道:你們既賣設備,也圍繞數據。你們真正的核心競爭力是什么?為什么客戶會選擇你們,而不只是買一個 " 本體硬件 "?
丁琰:在具身智能行業,如果模型訓不出來,那一切都沒有意義。
硬件不是一個孤立的東西。傳感器選型、數據處理方式、數據如何被模型使用,這些是一個有機整體。我們賣的并不是一個 " 夾爪 ",而是一整套如何為模型提供高質量物理訓練數據的解決方案。
用 3D 打印也能做出一個外形類似的東西,但關鍵不在 " 像不像 ",而在于——它采的數據,能不能真正訓練出模型。
我們從市場得到的反饋是,用我們的設備采集到的數據,是少有的能真正能把模型訓出來的。
鉛筆道:你們和同行的差異具體體現在哪?
丁琰:經過長時間的探索,我們反復驗證了一件事:數據采集硬件和模型訓練經驗是分不開的。
如果完全不做模型,對訓練沒有感知,就直接去做硬件,那這個硬件基本是 " 廢的 "。
即便外觀、傳感器參數看起來一樣,但里面的東西完全不一樣。
舉一個具體的例子:鏡頭選型。我們用了高性能的運動級魚眼鏡頭,是因為在高速運動采集時,普通魚眼會糊、會失真。
而且還有一個細節——動態恢復能力。比如你把手擋住鏡頭,再松開,普通鏡頭可能要 3-4 秒才能恢復,我們的可以瞬間恢復。
對不做算法的人來說,這是小細節;但對做模型的人來說,這決定了任務是 0,還是 100,中間沒有 " 差不多 "。
所以我們在硬件上投入了大量成本,因為不這么做,模型就訓不出來。我們的目標始終是提供能夠用于訓練模型的高質量數據,而 FastUMI Pro 是支持具身智能規模化的關鍵基礎設施。
此外,我們提供的不僅是數據采集設備、高質量數據集,更有行業解決方案以及聯合模型訓練的全棧服務,我們構建了一個完善的 UMI 數據生態體系。我們是一個以數據為紐帶,連接硬件、算法、場景和合作伙伴的生態平臺。
鉛筆道:你們的技術,為什么能做到 " 不挑機器人的身體 "?
丁琰:我舉個比較直觀的例子。我們在數據采集時,會用到兩類設備:一種是手持設備,一種是機載設備。
手持設備本質上是一個夾爪,上面裝了攝像頭,用來記錄夾爪的外觀和操作過程。在部署的時候,只要機器人夾爪的外觀與攝像頭參數和手持設備一致,無論所搭配的機械臂類型如何,采集到的數據都可以相互共用,這就實現了物理層面的本體泛化。
泛化能力本質上是一個 " 見過多少世界 " 的問題。過去的問題在于,數據采集慢、成本高、質量不穩定,一個小時可能只能采三五條數據。但現在這種方式,數據規模可以快速做上去,而且質量是可控的。
鉛筆道:機器人在工廠的哪些環節,已經能比較明顯地提升效率?
丁琰:整體來看,工廠里的任務大概可以分成三大類,難度是逐級上升的。
第一類是最簡單的,比如規則相對明確的 pick&place,不涉及力控。這一類場景是最好落地的。我們之前在合作中,大概有 30% 的場景屬于這一類。
第二類是對力控和穩定性要求更高的任務,比如疊紙盒、包裝,這類任務需要有力反饋,難度就上升了一檔,這一類也大概占 30%。
第三類是既需要力控,又需要精度,比如插線束、做 PCB 相關操作,典型的 3C 場景。這類任務難度最高,對系統要求也最復雜。
這種分層的意義在于,讓系統在真實產線中逐級驗證可靠性。
鉛筆道:你們的 UMI 數據采集方法,資金門檻相對較低,很多中小公司、初創公司都會優先選擇它。那對資金充裕的大廠來說,它會不會成為一種 " 操作數據 " 的平替方案?
丁琰:對中小公司來說,UMI 是一個非常好的起點,能夠以低成本獲得大規模的高質量真機數據;對大公司來說,隨著模型規模擴大,對數據量的需求達到海量級別,遙操作數據的成本過高,從產業角度看,它本質上是一個效率更高的數據解決方案,會推動整個產業分工發生變化。
鉛筆道:在數據采集過程中,最難的是哪一環?
丁琰:數據質量管理。數據必須做即時評估,才能保證數據質量可控。
這也是為什么我們在數據評估和管理體系上投入了這么多精力。我們將 " 可復現 " 作為數據治理的第一性原理,建立了 8 道工業級數據質量評估體系,只交付 100% 可復現的數據。
不同類型的客戶會給我們提出不同的標準,在給客戶交付數據的時候,我們的數據質量不僅全都符合這些標準,甚至還遠高于客戶的標準。
來源:鉛筆道
