
機器人技術(shù)面臨的一大挑戰(zhàn)是,必須投入大量精力針對每個機器人、任務(wù)和環(huán)境訓(xùn)練機器學(xué)習(xí)模型?,F(xiàn)在,由谷歌 DeepMind 和其他 33 家研究機構(gòu)聯(lián)合開展的一個新項目旨在通過創(chuàng)建一個通用的人工智能系統(tǒng)來應(yīng)對這一挑戰(zhàn),該系統(tǒng)可以與不同類型的物理機器人協(xié)同工作,并執(zhí)行多種任務(wù)。
谷歌機器人技術(shù)公司高級軟件工程師潘納格-桑凱蒂(Pannag Sanketi)告訴 VentureBeat:"我們觀察到,機器人是很好的專家,但卻是很差的通才。"通常情況下,你必須針對每項任務(wù)、機器人和環(huán)境訓(xùn)練一個模型。改變一個變量往往需要從頭開始。"
為了克服這個問題,使機器人的訓(xùn)練和部署變得更加簡單快捷,這個名為 Open-X Embodiment 的新項目引入了兩個關(guān)鍵組件:一個包含多種機器人類型數(shù)據(jù)的數(shù)據(jù)集,以及一個能夠在各種任務(wù)中轉(zhuǎn)移技能的模型系列。研究人員在機器人實驗室和不同類型的機器人上對這些模型進行了測試,與常用的機器人訓(xùn)練方法相比,取得了卓越的效果。
結(jié)合機器人數(shù)據(jù)
Open X-Embodiment 項目的誕生源于這樣一種直覺:將來自不同機器人和任務(wù)的數(shù)據(jù)結(jié)合起來,可以創(chuàng)建一個優(yōu)于專用模型的通用模型,適用于所有類型的機器人。這一概念部分受到大型語言模型(LLMs)的啟發(fā),在大型通用數(shù)據(jù)集上進行訓(xùn)練后,LLMs 可以與在狹窄的特定任務(wù)數(shù)據(jù)集上訓(xùn)練的小型模型相媲美,甚至更勝一籌。令人驚訝的是,研究人員發(fā)現(xiàn),同樣的原理也適用于機器人技術(shù)。
為了創(chuàng)建 "Open X-Embodiment "數(shù)據(jù)集,研究團隊收集了來自不同國家 20 個機構(gòu)的 22 個機器人實例的數(shù)據(jù)。該數(shù)據(jù)集包含 100 多萬個事件中的 500 多種技能和 15 萬項任務(wù)的示例(一個事件是機器人每次嘗試完成一項任務(wù)時的一連串動作)。
RT-2-X 在新技能(即訓(xùn)練數(shù)據(jù)集中未包含的新任務(wù))方面的成功率是 RT-2 的三倍。特別是,RT-2-X 在需要空間理解的任務(wù)上表現(xiàn)得更好,例如,分辨將蘋果移到布附近與放在布上的區(qū)別。
研究人員在一篇發(fā)布 Open X 和 RT-X 的博文中寫道:"我們的研究結(jié)果表明,與其他平臺的數(shù)據(jù)共同訓(xùn)練為 RT-2-X 注入了原始數(shù)據(jù)集中沒有的額外技能,使其能夠執(zhí)行新穎的任務(wù)。"
邁出機器人研究的未來步伐
展望未來,科學(xué)家們正在考慮將這些進展與DeepMind開發(fā)的自我完善模型RoboCat的見解相結(jié)合的研究方向。RoboCat 可以學(xué)習(xí)在不同的機械臂上執(zhí)行各種任務(wù),然后自動生成新的訓(xùn)練數(shù)據(jù),以提高其性能。
桑凱蒂認為,另一個潛在的方向是進一步研究不同的數(shù)據(jù)集混合物會如何影響跨實驗泛化,以及改進后的泛化是如何實現(xiàn)的。
該團隊已經(jīng)開源了Open X-Embodiment數(shù)據(jù)集和RT-1-X模型的一個小版本,但沒有開源RT-2-X模型。他說:
"我們相信,這些工具將改變機器人的訓(xùn)練方式,并加速這一領(lǐng)域的研究。我們希望數(shù)據(jù)開源和提供安全但有限的模型能夠減少障礙,加快研究。機器人技術(shù)的未來有賴于讓機器人能夠相互學(xué)習(xí),最重要的是讓研究人員能夠相互學(xué)習(xí)。"
2025-09-23 10:04
2025-09-23 10:02
2025-09-23 10:01
2025-09-23 09:59
2025-09-23 09:57
2025-09-23 09:54
2025-09-23 09:53
2025-09-23 09:50
2025-09-22 09:30
2025-09-22 09:28
