

美國波士頓動力公司(Boston Dynamics )近日宣布,其旗艦研究平臺 Atlas 實(shí)現(xiàn)重大技術(shù)升級——通過引入 Large Behavior Model(LB+M,大行為模型),讓機(jī)器人能夠從人類演示中學(xué)習(xí)復(fù)雜任務(wù),而非依賴傳統(tǒng)的手工編程。這項(xiàng)研發(fā)由 該公司與日本豐田研究所(Toyota Research Institute(TRI) 聯(lián)合推動,被認(rèn)為是機(jī)器人從“被動執(zhí)行”邁向“主動學(xué)習(xí)”的關(guān)鍵轉(zhuǎn)折點(diǎn)。
此次升級的核心在于讓 Atlas 擁有“全身一體化控制”能力。過去,Atlas 的腿部行走與手臂操作被視為兩套獨(dú)立系統(tǒng),需要分別編程、調(diào)試和平衡。而通過引入大行為模型,這些動作被統(tǒng)一納入同一個控制框架,機(jī)器人可以在保持平衡的同時完成復(fù)雜操作任務(wù)。例如,在演示中,Atlas 被要求在一個工作場景中連續(xù)完成抓取零件、開合抽屜、搬運(yùn)與分類等動作。當(dāng)外部條件突變——如物體滑落、箱蓋意外關(guān)閉時——它能夠根據(jù)環(huán)境變化實(shí)時調(diào)整動作繼續(xù)完成任務(wù)。這種行為適應(yīng)能力標(biāo)志著 Atlas 已具備初步的“策略生成”能力。
據(jù)介紹,大行為模型以多模態(tài)學(xué)習(xí)架構(gòu)為基礎(chǔ),整合了視覺感知、語言提示與自身運(yùn)動狀態(tài)等多維度輸入。研究團(tuán)隊(duì)首先通過人類遠(yuǎn)程操控采集演示數(shù)據(jù),再結(jié)合仿真訓(xùn)練對模型進(jìn)行強(qiáng)化,使其能根據(jù)上下文生成完整動作序列。模型以 30Hz 的頻率運(yùn)算,可同時控制機(jī)器人 28 個關(guān)節(jié),實(shí)現(xiàn)腿、手、軀干的協(xié)同。不同于傳統(tǒng)編程模式,Atlas 不再依賴預(yù)定義的動作腳本,而是通過少量示范數(shù)據(jù)快速掌握任務(wù)意圖,并在不同環(huán)境下靈活遷移。
TRI高級副總裁 Russ Tedrake 表示,大行為模型的引入代表著類人機(jī)器人學(xué)習(xí)模式的根本轉(zhuǎn)變?!拔覀儾辉贋槊恳粋€動作寫代碼,而是通過人類示范直接教會機(jī)器人。隨著模型能力的提升,它需要的示范次數(shù)將越來越少?!辈ㄊ款D動力機(jī)器人研究副總裁 Scott Kuindersma 也強(qiáng)調(diào),這一模型能夠在單一神經(jīng)網(wǎng)絡(luò)中整合行走、抓取、移動等多項(xiàng)任務(wù),為通用型機(jī)器人提供技術(shù)路徑。
演示視頻顯示,Atlas 在執(zhí)行任務(wù)時展現(xiàn)出顯著的穩(wěn)定性與靈活性。當(dāng)任務(wù)中出現(xiàn)物體偏移或障礙時,機(jī)器人能主動重新規(guī)劃路徑,甚至出現(xiàn)了“涌現(xiàn)式行為”——在誤掉物品后自動彎腰撿起。這一過程并非人為編程,而是模型在理解任務(wù)目標(biāo)未完成的情況下自發(fā)生成的動作,體現(xiàn)出較高的情境理解能力。
值得注意的是,大行為模型還具備執(zhí)行速度調(diào)節(jié)機(jī)制,能夠在不修改算法結(jié)構(gòu)的情況下以 1倍、2倍或3倍速完成動作,適用于不同作業(yè)場景的效率要求。研究團(tuán)隊(duì)表示,該模型框架未來有望推廣至更多硬件平臺,使不同類型的機(jī)器人共享同一智能控制邏輯,從而降低系統(tǒng)集成復(fù)雜度。
盡管 Atlas 仍是一款實(shí)驗(yàn)性平臺而非商業(yè)化產(chǎn)品,但此次升級在機(jī)器人學(xué)界意義重大。它不僅證明了行為模型化在實(shí)際物理機(jī)器人上的可行性,也為具身智能(Embodied AI)提供了具體路徑。通過學(xué)習(xí)控制取代手動控制,機(jī)器人不再依賴固定規(guī)則,而能主動適應(yīng)、規(guī)劃并完成未知任務(wù)。
波士頓動力表示,未來將把該技術(shù)成果逐步應(yīng)用到旗下的四足機(jī)器人 Spot 與搬運(yùn)機(jī)器人 Stretch 等產(chǎn)品中,為工業(yè)與物流場景的自動化提供新的智能基礎(chǔ)。此舉標(biāo)志著機(jī)器人從執(zhí)行器械向智能體的轉(zhuǎn)變:它們不僅能行走、抓取,更能理解任務(wù)目標(biāo)、靈活應(yīng)對變化。
業(yè)內(nèi)普遍認(rèn)為,大行為模型的引入將成為類人機(jī)器人發(fā)展的分水嶺。當(dāng)機(jī)器人能夠通過學(xué)習(xí)掌握新技能、通過感知適應(yīng)環(huán)境時,人機(jī)協(xié)作的邊界將被進(jìn)一步拓寬。正如 Tedrake 所言:“真正的通用機(jī)器人,不是執(zhí)行一套固定指令,而是能在陌生環(huán)境中學(xué)會解決問題?!?這場由波士頓動力牽頭的實(shí)驗(yàn),正讓這一未來形態(tài)逐漸成真。
波士頓動力公司(英語:Boston Dynamics)是一家美國的工程與機(jī)器人設(shè)計(jì)公司,此公司的著名產(chǎn)品包含在國防高等研究計(jì)劃署(DARPA)出資下替美國軍方開發(fā)的四足機(jī)器人:波士頓機(jī)械狗,以及DI-Guy,一套用于寫實(shí)人類模擬的現(xiàn)成軟件(COTS)。此公司早期曾和美國系統(tǒng)公司一同接受來自美國海軍航空作戰(zhàn)中心訓(xùn)練處(NAWCTSD)的一份合約,該合約的內(nèi)容是要以DI-Guy人物的互動式3D電腦模擬,取代海軍飛機(jī)彈射任務(wù)訓(xùn)練影片。
波士頓動力是移動機(jī)器人的全球領(lǐng)導(dǎo)者,它應(yīng)對了一些最嚴(yán)峻的機(jī)器人挑戰(zhàn)。我們將動態(tài)控制和平衡原理與復(fù)雜的機(jī)械設(shè)計(jì),尖端的電子設(shè)備以及用于配備感知,導(dǎo)航和智能功能的高性能機(jī)器人的下一代軟件結(jié)合在一起。波士頓動力擁有一支由工程師和科學(xué)家組成的非凡且快速發(fā)展的技術(shù)團(tuán)隊(duì),他們將先進(jìn)的分析思想與大膽的工程技術(shù)和泥濘中的實(shí)用性無縫地結(jié)合在一起。
馬克·雷伯特是該公司的總裁兼專案經(jīng)理,他在1992年令此公司從麻省理工學(xué)院底下獨(dú)立出來。
在2013年12月13日,波士頓動力公司被Google收購。[4]2017年6月9日,軟銀以不公開的條款收購Google母公司Alphabet旗下的波士頓動力公司。2020年12月12日,現(xiàn)代集團(tuán)宣布以11億美元收購波士頓動力,不過收購?fù)瓿珊筌涖y將繼續(xù)通過附屬公司持有波士頓動力20%的股份。2021年6月,現(xiàn)代宣布正式從軟銀手中收購波士頓動力公司的控股權(quán)。


