

在機器人操控領(lǐng)域,一個能跨任務(wù)、跨平臺靈活適配,還兼顧成本效益的視覺-語言-動作(VLA)模型,一直是行業(yè)追求的目標(biāo)。
28日,螞蟻靈波科技開源具身大模型 LingBot-VLA,憑借海量真實數(shù)據(jù)訓(xùn)練、卓越的泛化能力和超高訓(xùn)練效率,為機器人通用化操控帶來了全新突破。
01 三大優(yōu)勢領(lǐng)跑VLA模型賽道
LingBot-VLA的底氣,來自于包括AgileX C OBOT MAGIC在內(nèi)的9種主流雙臂機器人構(gòu)型的真機操作數(shù)據(jù)。團隊累計采集了近2萬小時的真實世界操控數(shù)據(jù),涵蓋擺盤、插花、擰螺絲等多樣化任務(wù)場景。
不同于以往依賴仿真數(shù)據(jù)的模型,LingBot-VLA的訓(xùn)練數(shù)據(jù)全部來自真實機器人操作。這讓模型學(xué)到的技能更貼近實際應(yīng)用需求。更關(guān)鍵的是,實驗證明隨著數(shù)據(jù)量從3000小時提升到20000小時,模型下游任務(wù)成功率持續(xù)增長,沒有出現(xiàn)飽和跡象。這意味著更多數(shù)據(jù)還能持續(xù)賦能模型性能。
02 真實場景超能打
為驗證模型的真實能力,團隊搭建了嚴(yán)苛的測評體系。他們選取AgileX COBOT MAGIC等三款主流機器人平臺,用包含100個精細(xì)任務(wù)的GM-100基準(zhǔn)測試集開展測試。
實驗表明,LingBot-VLA 在下游任務(wù)中能夠使用更少的數(shù)據(jù),達到超越π0.5的性能;并且性能優(yōu)勢會隨著數(shù)據(jù)量的增加而持續(xù)擴大。目前,LingBot-VLA 已與松靈等機器人廠商完成適配,驗證了模型在不同構(gòu)型機器人上的跨本體遷移能力。
這組數(shù)據(jù)充分證明,LingBot-VLA不僅能在實驗室“跑分”,更能在真實場景中穩(wěn)定輸出。
03 訓(xùn)練效率狂飆1.5-2.8倍,省錢又省時
大模型訓(xùn)練的算力成本一直是行業(yè)痛點,而LingBot-VLA在這方面也交出了高分答卷。
團隊開發(fā)了一套高度優(yōu)化的訓(xùn)練代碼庫。在8卡GPU集群上,這套代碼庫能實現(xiàn)單卡每秒261個樣本的吞吐量。相比現(xiàn)有的VLA專用代碼庫,訓(xùn)練速度提升了1.5-2.8倍。
效率提升的秘訣在于兩點:
一是采用分片數(shù)據(jù)并行策略,大幅降低顯存占用和通信開銷;
二是通過算子融合、靈活注意力機制優(yōu)化,減少計算冗余。這讓模型訓(xùn)練周期大幅縮短,部署成本顯著降低。
04 LingBot-VLA的底層架構(gòu)
LingBot-VLA的出色表現(xiàn),離不開精心設(shè)計的技術(shù)架構(gòu):
1. 混合Transformer架構(gòu):模型以Qwen2.5VL預(yù)訓(xùn)練視覺語言模型為基礎(chǔ),搭配獨立的“行動專家”模塊。兩種模態(tài)通過共享注意力機制協(xié)同工作,既保證語義理解能力,又能精準(zhǔn)生成機器人行動指令。
2.連續(xù)行動建模:采用流匹配(Flow Matching)技術(shù),讓機器人生成的動作更流暢平滑。這避免了機械臂“卡頓”“抖動”等問題。
3.空間感知增強:通過視覺蒸餾技術(shù),將深度信息融入模型。這彌補了傳統(tǒng)VLA模型空間推理能力的短板,讓機器人在抓取、堆疊等精細(xì)操作中更精準(zhǔn)。
05 開源共享:推動機器人學(xué)習(xí)領(lǐng)域共同進步
此次開源,Robbyant團隊不僅提供了模型權(quán)重,還同步開放了包含數(shù)據(jù)處理、高效微調(diào)及自動化評估在內(nèi)的全套代碼庫。Robbyant團隊希望這一舉措可以大幅壓縮模型訓(xùn)練周期,降低商業(yè)化落地的算力與時間門檻,助力開發(fā)者以更低成本快速適配自有場景,提升模型實用性。
基于領(lǐng)先的LingBot-VLA模型,松靈也將與螞蟻靈波科技繼續(xù)攜手,探索更多商業(yè)場景的落地應(yīng)用,促進具身基礎(chǔ)模型生態(tài)發(fā)展。
目前Robbyant團隊的模型、后訓(xùn)練代碼、技術(shù)報告、以及和上海交大共同打造的 GM-100 Bench-mark已全部開源,歡迎大家訪問Robbyant團隊的開源倉庫。
相關(guān)資源可通過以下鏈接獲?。?/p>
項目主頁:
https://technology.robbyant.com/lingbot-vla
模型:
https://huggingface.co/collections/robbyant/lingbot-vla
https://www.modelscope.cn/collections/Robbyant/
LingBot-VLADatasets:
https://huggingface.co/datasets/robbyant/lingbot-GM-100
代碼倉庫:
https://github.com/Robbyant/lingbot-vla
項目論文:
https://arxiv.org/abs/2601.18692
松靈機器人成立于2016年,是全球領(lǐng)先的機器人底盤制造商和移動機器人系統(tǒng)解決方案服務(wù)商。目前,松靈機器人已經(jīng)擁有多款適用于不同地形的室內(nèi)外移動機器人底盤,在載重、續(xù)航、速度、運動模式等不同需求場景下實現(xiàn)全矩陣覆蓋。同時,松靈機器人還推出了自動駕駛解決方案,平行駕駛解決方案,機器人科研教育套件等移動機器人底盤配套產(chǎn)品,幫助客戶在自動駕駛、機械控制、計算機、車輛等領(lǐng)域完成實驗驗證。
憑借領(lǐng)先的研發(fā)技術(shù),松靈機器人已經(jīng)與包括阿里巴巴、華為、本田、中建三局在內(nèi)的30多家行業(yè)領(lǐng)軍企業(yè),以及中科院、清華大學(xué)、南方科技大學(xué)、北京理工大學(xué)、新加坡國立大學(xué)、紐約大學(xué)等國內(nèi)外50多所頂尖學(xué)府開展了深度合作。


