

2025年7月14日,日本豐田研究院(Toyota Research Institute,簡(jiǎn)稱(chēng)TRI)發(fā)布了其在機(jī)器人學(xué)習(xí)領(lǐng)域的重要突破——基于“Diffusion Transformer”架構(gòu)的大型行為模型(Large Behavior Model,LB+M)。該團(tuán)隊(duì)研究表明,通過(guò)單一通用行為模型,機(jī)器人在執(zhí)行數(shù)百種操控任務(wù)時(shí)可實(shí)現(xiàn)訓(xùn)練數(shù)據(jù)需求降低達(dá)80%,為通用智能機(jī)器人的發(fā)展提供現(xiàn)實(shí)路徑振奮人心的驗(yàn)證。
TRI成立于2016年,總部設(shè)立于日本加州的高級(jí)研究中心,致力于將AI技術(shù)在機(jī)器人、交通和人機(jī)交互領(lǐng)域?qū)崿F(xiàn)落地。此次發(fā)布的LBM模型,引領(lǐng)機(jī)器人從傳統(tǒng)“任務(wù)單一”向“多任務(wù)泛化”演進(jìn)的關(guān)鍵一步,是其通向“通用助手”或“泛用工廠”戰(zhàn)略的重要里程碑。
TRI團(tuán)隊(duì)通過(guò)掃描近1700小時(shí)涵蓋仿真與現(xiàn)實(shí)世界的機(jī)器人操作數(shù)據(jù),訓(xùn)練出一個(gè)含29類(lèi)任務(wù)的預(yù)訓(xùn)練模型,包括抓取、組合裝配、扭轉(zhuǎn)擰緊等復(fù)雜動(dòng)作。值得關(guān)注的是,該模型僅用原來(lái)20%的訓(xùn)練樣本便達(dá)成相似或更優(yōu)表現(xiàn)——機(jī)器人能在陌生任務(wù)與環(huán)境下實(shí)現(xiàn)快速遷移式學(xué)習(xí),表現(xiàn)出超越傳統(tǒng)Policy網(wǎng)絡(luò)的適應(yīng)能力與魯棒性。
TRI采用的“Diffusion Transformer”架構(gòu),支持將視覺(jué)、語(yǔ)言、力覺(jué)與姿態(tài)等多模態(tài)感知輸入,轉(zhuǎn)化為連續(xù)運(yùn)動(dòng)控制輸出,流程執(zhí)行符合實(shí)時(shí)要求,并在標(biāo)準(zhǔn)A/B盲測(cè)中獲高置信度評(píng)價(jià)。研究團(tuán)隊(duì)還開(kāi)發(fā)出一套統(tǒng)計(jì)評(píng)估系統(tǒng),確保模型表現(xiàn)可靠且可復(fù)制。
TRI機(jī)器人研究副總裁Russ Tedrake指出:“LBM使我們朝‘訓(xùn)練一次,部署多處’的機(jī)器人學(xué)習(xí)范式邁進(jìn),這是建立通用機(jī)器人能力的方向?!焙罄m(xù)的系統(tǒng)改進(jìn),包括引入更多預(yù)訓(xùn)練任務(wù)、強(qiáng)化自我糾錯(cuò)與在線更新機(jī)制,均將在未來(lái)迭代中逐步展開(kāi)。
這項(xiàng)技術(shù)潛在應(yīng)用于制造、物流甚至家庭服務(wù)等多領(lǐng)域。TRI稱(chēng)其為“universal factories”范式:一套模塊化、靈活可編排的機(jī)器人模型,能應(yīng)對(duì)大規(guī)?;旌仙a(chǎn)、小批量定制或復(fù)雜裝配任務(wù),使得“敏捷制造”成為可能。
LBM與傳統(tǒng)DQ/DDP或RL方法相比具備以下優(yōu)勢(shì):其一,依賴(lài)通用預(yù)訓(xùn)練與少量微調(diào)即可適用新任務(wù),增加模型泛化度;其二,減少訓(xùn)練所需采樣、實(shí)驗(yàn)量和計(jì)算資源,將機(jī)器人部署成本大幅壓縮;其三,使機(jī)器人具備“從經(jīng)驗(yàn)學(xué)習(xí)”的能力,不再完全依賴(lài)人類(lèi)教學(xué)或腳本硬編碼。
目前,LBM仍處于初期階段,TRI正與學(xué)界和工業(yè)界密切合作,比如與美國(guó)Boston Dynamics聯(lián)合研究,將LBM部署于Atlas類(lèi)人機(jī)器人,驗(yàn)證其在走路、搬運(yùn)等復(fù)雜全身協(xié)調(diào)任務(wù)中的實(shí)用性與效率。
機(jī)器人操作行業(yè)專(zhuān)家評(píng)價(jià)認(rèn)為,LBM的發(fā)布代表機(jī)器人向“行為基礎(chǔ)模型”方向重構(gòu)的開(kāi)端。相比模型專(zhuān)注單工種、難以擴(kuò)展的歷史,LBM支持機(jī)器人進(jìn)行一體化智能培訓(xùn),類(lèi)似于LLM賦能語(yǔ)言應(yīng)用的范式,將為機(jī)器人快速落地帶來(lái)啟發(fā)。
值得注意的挑戰(zhàn)包括:一是如何獲取高質(zhì)量、多物體、多模態(tài)訓(xùn)練數(shù)據(jù);二是保證模型在現(xiàn)實(shí)世界執(zhí)行的可控性與安全性;三是路徑采樣與決策速度需進(jìn)一步與現(xiàn)場(chǎng)工業(yè)節(jié)拍匹配。
但從根本來(lái)看,Toyota研發(fā)的LBM為機(jī)器人行業(yè)提供了新的智能基石。在全球機(jī)器人成本與效率成為競(jìng)爭(zhēng)關(guān)鍵的背景下,LBM模式可能開(kāi)創(chuàng)新一代通用機(jī)器人生態(tài),為制造、物流、服務(wù)乃至農(nóng)業(yè)環(huán)境帶來(lái)全方位變革。
TRI的這一突破不僅是機(jī)器人技術(shù)層面創(chuàng)新,更為全球產(chǎn)業(yè)智能化提供可復(fù)制路徑。接下來(lái)若Farmbot、Fetch Robotics等行業(yè)方案商能與TRI此類(lèi)模型融合,將帶來(lái)前所未有的研發(fā)效率與商業(yè)應(yīng)用速度,“訓(xùn)練—部署—協(xié)同”將成為機(jī)器人推廣的新框架。

