nm99热,好吊视频欧美,无码二区三区,久久久精品伦理一区,自拍三区四区,9热无码第一页,久久久日韩无码精品,日韩有码一区在线亚洲,亚洲色91

發(fā)布詢價(jià)單
您的位置:首頁 > 資訊 > 行業(yè)資訊 > 正文

《sciencedirect》:基于人工智能的室內(nèi)環(huán)境中自主移動(dòng)機(jī)器人定位改進(jìn)方法

2025-10-10 09:52 性質(zhì):轉(zhuǎn)載 作者:王守德,努爾·賽茲林?·艾哈邁德 來源:王守德,努爾·賽茲林?·艾哈邁德
免責(zé)聲明:AGV網(wǎng)(m.wnmc.org.cn)尊重合法版權(quán),反對(duì)侵權(quán)盜版。(凡是我網(wǎng)所轉(zhuǎn)載之文章,文中所有文字內(nèi)容和圖片視頻之知識(shí)產(chǎn)權(quán)均系原作者和機(jī)構(gòu)所有。文章內(nèi)容觀點(diǎn),與本網(wǎng)無關(guān)。如有需要?jiǎng)h除,敬請(qǐng)來電商榷?。?/div>
概述室內(nèi)自主移動(dòng)機(jī)器人(AMR)的應(yīng)用大幅增長,因?yàn)樗鼈兡軌蚣筛鞣N傳感器、保持較低的運(yùn)營成本、易于部署,并表現(xiàn)出卓越的機(jī)動(dòng)性。盡管如此,在復(fù)雜的室內(nèi)環(huán)境中導(dǎo)航仍存在巨大挑戰(zhàn),可能會(huì)阻礙 ...

概述

室內(nèi)自主移動(dòng)機(jī)器人(AMR)的應(yīng)用大幅增長,因?yàn)樗鼈兡軌蚣筛鞣N傳感器、保持較低的運(yùn)營成本、易于部署,并表現(xiàn)出卓越的機(jī)動(dòng)性。盡管如此,在復(fù)雜的室內(nèi)環(huán)境中導(dǎo)航仍存在巨大挑戰(zhàn),可能會(huì)阻礙 AMR 性能并降低整體系統(tǒng)效率。為了克服這些障礙,研究人員專注于開發(fā)自主定位技術(shù),使 AMR 能夠在復(fù)雜的環(huán)境中有效地導(dǎo)航和執(zhí)行任務(wù)。人工智能 (AI) 應(yīng)用的最新進(jìn)展深刻地影響了這一領(lǐng)域,增強(qiáng)了 AMR 的控制和決策能力。

本文全面回顧了旨在改善室內(nèi) AMR(包括飛行器)定位的基于 AI 的策略。我們系統(tǒng)地分類和批判性地分析了基于同步定位和地圖構(gòu)建(SLAM) 的方法、基于里程計(jì)的方法和多傳感器融合技術(shù)此外,我們還討論了基于人工智能的方法所面臨的實(shí)時(shí)性能挑戰(zhàn),并闡述了人工智能增強(qiáng)型定位方法與傳統(tǒng)定位技術(shù)之間的區(qū)別,強(qiáng)調(diào)了采用基于人工智能的解決方案的必要性和優(yōu)勢(shì)。通過闡明這些方法,我們的目標(biāo)是加深對(duì)它們的理解,并促進(jìn)其在該領(lǐng)域的廣泛應(yīng)用。最后,我們討論了新興的研究方向和持續(xù)的挑戰(zhàn),為室內(nèi)AMR領(lǐng)域的未來研究和發(fā)展提供指導(dǎo)。

(1)引言

自主移動(dòng)機(jī)器人(AMR) 已成為現(xiàn)代工業(yè)、服務(wù)業(yè)和智能家居中不可或缺的自動(dòng)化工具。這些機(jī)器人涵蓋各種平臺(tái),包括輪式、腿式、空中、醫(yī)療、搜索救援、物流、制造和水下機(jī)器人,均專為自主導(dǎo)航和任務(wù)執(zhí)行而設(shè)計(jì)。然而,在室內(nèi)環(huán)境中,由于無法依賴GPS進(jìn)行定位, AMR 在精確導(dǎo)航和定位方面面臨挑戰(zhàn)。

AMR 的定位方法通常分為兩類:一類依賴于外部射頻 (RF) 傳感器或信標(biāo),例如 Wi-Fi、超寬帶 (UWB) 或低功耗藍(lán)牙(BLE),另一類利用板載傳感器,例如激光雷達(dá)、慣性測(cè)量單元(IMU)、編碼器和攝像頭。表 1對(duì)這兩種方法進(jìn)行了詳細(xì)比較。外部傳感器在受控環(huán)境中提供可靠的定位,但通常需要對(duì)基礎(chǔ)設(shè)施進(jìn)行大量改造,例如安裝信標(biāo)或接入點(diǎn)。此外,這些系統(tǒng)可能面臨信號(hào)干擾、范圍有限以及在動(dòng)態(tài)或混亂環(huán)境中適應(yīng)性降低等問題。相比之下,板載傳感器提供了更靈活、獨(dú)立的定位解決方案,而無需改變現(xiàn)有的基礎(chǔ)設(shè)施。

然而,傳統(tǒng)的基于機(jī)載傳感器的定位技術(shù),例如同步定位與地圖構(gòu)建SLAM和基于里程計(jì)的方法,在實(shí)際應(yīng)用中面臨諸多限制。這些方法通常依賴于幾何特征或原始傳感器數(shù)據(jù),在動(dòng)態(tài)或雜亂的環(huán)境中可能會(huì)遇到困難。它們?cè)趹?yīng)對(duì)光照變化、動(dòng)態(tài)障礙物或具有多個(gè)形狀相似的物體的環(huán)境中表現(xiàn)不佳,這使得 AMR 在實(shí)際部署中難以實(shí)現(xiàn)高效穩(wěn)定的自主移動(dòng)和任務(wù)執(zhí)行。

表1. AMR定位中機(jī)載和外部傳感器的比較。

比較標(biāo)準(zhǔn)板載傳感器外部傳感器
示例激光雷達(dá)、攝像頭、IMU、編碼器、光電傳感器Wi-Fi、UWB、BLE
基礎(chǔ)設(shè)施要求無需額外的基礎(chǔ)設(shè)施需要專用基礎(chǔ)設(shè)施
環(huán)境適應(yīng)性適應(yīng)動(dòng)態(tài)環(huán)境最適合受控環(huán)境
抗干擾性抗射頻干擾易受射頻干擾
成本降低成本成本更高
定位精度取決于環(huán)境復(fù)雜性信號(hào)強(qiáng),穩(wěn)定
可擴(kuò)展性易于擴(kuò)展容量受限
部署時(shí)間快速設(shè)置冗長的設(shè)置

計(jì)算技術(shù)和硬件的最新進(jìn)展使人工智能(AI) 成為幾乎所有工程相關(guān)研究領(lǐng)域的基礎(chǔ)組成部分。對(duì)于缺乏具體解決方案或傳統(tǒng)方法需要大量手動(dòng)調(diào)整的復(fù)雜問題,人工智能是解決這些問題的理想工具。自動(dòng)特征提取消除了對(duì)昂貴的手動(dòng)特征工程的需求,這是人工智能與傳統(tǒng)認(rèn)知算法之間的顯著區(qū)別。通常,人工智能可以檢測(cè)異常,預(yù)測(cè)潛在情景,應(yīng)對(duì)不斷變化的情況,深入了解涉及大型數(shù)據(jù)集的復(fù)雜問題,并識(shí)別可能被人類忽視的模式。它可以利用大數(shù)據(jù)并從中學(xué)習(xí),以增強(qiáng) AMR 的移動(dòng)性和決策能力。此外,與傳統(tǒng)的優(yōu)化方法相比,人工智能可以智能地管理機(jī)載資源。

基于人工智能的 SLAM 和里程計(jì)方法為 AMR 的室內(nèi)定位帶來了顯著的改進(jìn)。傳統(tǒng)方法雖然在靜態(tài)環(huán)境中表現(xiàn)良好,但在動(dòng)態(tài)復(fù)雜環(huán)境中性能往往會(huì)下降。人工智能方法的集成,尤其是深度學(xué)習(xí)(DL) 和機(jī)器學(xué)習(xí)(ML),增強(qiáng)了環(huán)境感知和特征提取能力。人工智能使 AMR 能夠智能地識(shí)別動(dòng)態(tài)障礙物、過濾環(huán)境噪聲并實(shí)時(shí)區(qū)分可移動(dòng)和不可移動(dòng)物體。這大大提高了地圖繪制的準(zhǔn)確性和更新速度,使機(jī)器人即使在不斷變化的環(huán)境中也能保持高效的導(dǎo)航。

此外,人工智能方法有助于優(yōu)化和增強(qiáng)車載傳感器的多模態(tài)數(shù)據(jù)融合,從而提高AMR定位系統(tǒng)的魯棒性。借助人工智能模型,多模態(tài)數(shù)據(jù)融合可以優(yōu)化數(shù)據(jù)冗余,使機(jī)器人在激光傳感器發(fā)生故障或其精度下降時(shí),能夠依靠視覺或IMU數(shù)據(jù)進(jìn)行補(bǔ)充定位。這能夠保持對(duì)環(huán)境的全面感知和理解。這種多模態(tài)融合在動(dòng)態(tài)或復(fù)雜環(huán)境中尤為重要,可確保AMR在不斷變化的條件下保持高精度導(dǎo)航和避障能力。

綜上所述,研究基于人工智能的AMR定位技術(shù)對(duì)未來機(jī)器人系統(tǒng)的發(fā)展具有重要意義?;谌斯ぶ悄艿亩ㄎ幌到y(tǒng)能夠顯著增強(qiáng)AMR在各種室內(nèi)場(chǎng)景下的適應(yīng)性,從而實(shí)現(xiàn)更深入的環(huán)境理解和更高效的決策。因此,本文系統(tǒng)地探討了人工智能在AMR室內(nèi)定位中的應(yīng)用,分析了其在提升定位精度、適應(yīng)性和計(jì)算效率方面的優(yōu)勢(shì)與挑戰(zhàn)。

盡管AMR技術(shù)在過去幾十年中取得了長足的進(jìn)步,但近期的綜述研究主要集中于SLAM、路徑規(guī)劃和傳感器數(shù)據(jù)融合等單個(gè)技術(shù)方面。如表2所示,自2019年以來的現(xiàn)有調(diào)查為這些領(lǐng)域提供了寶貴的見解,探討了AMR中使用的傳感器和機(jī)器人的類型。然而,對(duì)于如何將基于人工智能的方法應(yīng)用于AMR的室內(nèi)定位,目前還缺乏系統(tǒng)的分析和全面的評(píng)估。特別是,尚未對(duì)如何通過基于SLAM的方法、基于里程計(jì)的方法和車載傳感器融合來增強(qiáng)室內(nèi)定位的基于人工智能的集成方法進(jìn)行徹底的綜述。

為了彌補(bǔ)這一差距,本文對(duì)基于人工智能的室內(nèi)AMR定位方法進(jìn)行了全面回顧。我們將內(nèi)容分為三個(gè)層次:車載傳感器、定位技術(shù)和人工智能模型/方法。整體系統(tǒng)架構(gòu)如圖1所示。

2調(diào)查方法

2.1.研究設(shè)計(jì)

本研究采用了系統(tǒng)綜述方法,該方法經(jīng)過精心設(shè)計(jì),旨在識(shí)別與抗菌藥物耐藥性(AMR)局部發(fā)展最相關(guān)的文獻(xiàn)。根據(jù)芬克(Fink)的定義,系統(tǒng)綜述是一種發(fā)現(xiàn)、分析和綜合現(xiàn)有知識(shí)的方法。它要求系統(tǒng)嚴(yán)謹(jǐn)性、明確性、完整性和可重復(fù)性。本研究的研究框架以PRISMA(系統(tǒng)綜述和薈萃分析的首選報(bào)告項(xiàng)目)指南為指導(dǎo)。PRISMA是一種廣受認(rèn)可的循證方法,可確保系統(tǒng)綜述和薈萃分析的全面性和透明度。

研究程序分為四個(gè)主要階段:識(shí)別、篩選、資格評(píng)估和最終納入。每個(gè)階段都經(jīng)過嚴(yán)格執(zhí)行,以確保審查過程的完整性和質(zhì)量。此外,本研究還采用了包含27個(gè)條目的PRISMA清單,以增強(qiáng)研究的結(jié)構(gòu)和形式。該清單確保審查遵循清晰度、可重復(fù)性和系統(tǒng)性評(píng)估的高標(biāo)準(zhǔn),并對(duì)文獻(xiàn)的優(yōu)缺點(diǎn)進(jìn)行透明的評(píng)估。

2.2資格標(biāo)準(zhǔn)

本研究重點(diǎn)關(guān)注基于人工智能的AMR室內(nèi)定位方法,強(qiáng)調(diào)集成先進(jìn)的機(jī)器學(xué)習(xí)算法以提高定位精度和魯棒性。這些算法包括但不限于深度學(xué)習(xí)模型、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN) 和生成對(duì)抗網(wǎng)絡(luò)(GAN)。目標(biāo)應(yīng)用涉及在復(fù)雜室內(nèi)環(huán)境中運(yùn)行的機(jī)器人。

基于人工智能的方法旨在通過處理和解讀來自各種傳感器的數(shù)據(jù)來提高室內(nèi)定位的準(zhǔn)確性和可靠性。這些傳感器可能包括激光雷達(dá)、攝像頭、慣性測(cè)量單元 (IMU)和車輪編碼器。通過利用人工智能算法,機(jī)器人可以更好地理解和導(dǎo)航其環(huán)境,從而實(shí)現(xiàn)更高效、更安全的運(yùn)行。

本綜述全面探討了這些基于人工智能的定位技術(shù)的實(shí)施策略、優(yōu)勢(shì)和局限性。它評(píng)估了如何訓(xùn)練和部署不同的機(jī)器學(xué)習(xí)模型,以便在動(dòng)態(tài)且雜亂的室內(nèi)環(huán)境中有效實(shí)現(xiàn)精確定位。通過對(duì)各種基于人工智能的方法進(jìn)行比較分析,本研究探索了它們?cè)诓煌珹MR場(chǎng)景中的適應(yīng)性及其潛在應(yīng)用。

此外,為了系統(tǒng)地評(píng)估人工智能技術(shù)在室內(nèi)定位中的應(yīng)用,本綜述定義了納入研究的具體資格標(biāo)準(zhǔn)。入選研究需提出或利用基于人工智能的AMR室內(nèi)定位方法,并將機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)與傳感器數(shù)據(jù)相結(jié)合,以提高定位精度,同時(shí)展示基于人工智能的定位方法的實(shí)際有效性,且為過去五年內(nèi)發(fā)表的論文,以確保與當(dāng)前技術(shù)進(jìn)步保持相關(guān)性。

通過遵循這些資格標(biāo)準(zhǔn),本綜述確保全面深入地探索基于人工智能的室內(nèi)定位方法在實(shí)際應(yīng)用中的挑戰(zhàn)和潛力。這種系統(tǒng)性方法有助于全面審視最先進(jìn)的方法,從而確定AMR定位領(lǐng)域的當(dāng)前趨勢(shì)、研究差距和未來發(fā)展方向。

2.3搜索策略

我們采用 PRISMA 2020 框架系統(tǒng)地回顧了基于人工智能的方法在 GPS 受限環(huán)境 (GDE) 中改進(jìn)自主移動(dòng)機(jī)器人定位的文獻(xiàn)?;仡櫟闹攸c(diǎn)是理解和分析這些方法在解決動(dòng)態(tài)目標(biāo)定位相關(guān)的復(fù)雜性和挑戰(zhàn)方面的有效性。為了確保研究的全面性和高質(zhì)量,我們選擇了 Web of Science 和 Scopus 作為主要信息來源。選擇這些數(shù)據(jù)庫是因?yàn)樗鼈儚V泛且高質(zhì)量地涵蓋了科學(xué)技術(shù)領(lǐng)域的文獻(xiàn)。

3.基于AI的室內(nèi)定位方法概述

人工智能在移動(dòng)機(jī)器人領(lǐng)域得到了廣泛的應(yīng)用,尤其是在定位領(lǐng)域,它使機(jī)器人能夠理解周圍環(huán)境并準(zhǔn)確確定其在環(huán)境中的位置。雖然在可見、靜態(tài)或密閉空間中定位相對(duì)簡單,但在動(dòng)態(tài)環(huán)境中卻面臨著巨大的挑戰(zhàn)?;谌斯ぶ悄艿亩ㄎ患夹g(shù)利用先進(jìn)的數(shù)據(jù)驅(qū)動(dòng)方法,增強(qiáng)了移動(dòng)機(jī)器人有效克服這些挑戰(zhàn)的能力。

為了說明基于人工智能的方法在室內(nèi)定位中的應(yīng)用,算法 1 提出了一個(gè)通用的人工智能定位框架。該框架支持多種人工智能方法,包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和混合方法。通過利用這些方法的優(yōu)勢(shì),該框架顯著提升了 AMR 在動(dòng)態(tài)復(fù)雜室內(nèi)環(huán)境中的定位精度、魯棒性和適應(yīng)性。以下章節(jié)將討論幾種主要的基于人工智能的室內(nèi)定位方法。

3.1機(jī)器學(xué)習(xí)(ML)

機(jī)器學(xué)習(xí)是跨學(xué)科執(zhí)行各種任務(wù)的重要框架,在基于人工智能的室內(nèi)機(jī)器人定位中具有重要價(jià)值。定位涉及估計(jì)機(jī)器人在特定環(huán)境中的位置,這對(duì)于機(jī)器人理解環(huán)境和做出導(dǎo)航?jīng)Q策至關(guān)重要。機(jī)器學(xué)習(xí)的最新進(jìn)展極大地推動(dòng)了機(jī)器人技術(shù)的發(fā)展,在運(yùn)動(dòng)控制、抓取、人機(jī)交互、感知、建圖、規(guī)劃和定位等應(yīng)用方面取得了實(shí)質(zhì)性的改進(jìn)。通過機(jī)器學(xué)習(xí),機(jī)器人可以掌握路徑規(guī)劃和軌跡跟蹤等技能,而無需手動(dòng)編碼路點(diǎn),從圖像和激光雷達(dá)等感知輸入生成導(dǎo)航模型,以便在環(huán)境中進(jìn)行實(shí)時(shí)定位和移動(dòng)。

圖 3全面展示了基于機(jī)器學(xué)習(xí) (ML) 的方法在增強(qiáng) AMR 定位方面的優(yōu)勢(shì)。圖 3(a)展示了機(jī)器學(xué)習(xí)模型通過最小化不穩(wěn)定偏差來平滑軌跡的能力,從而確保路徑更穩(wěn)定、更準(zhǔn)確?;跈C(jī)器學(xué)習(xí)的方法有效地糾正了傳統(tǒng)方法中常見的軌跡突變,凸顯了其在管理噪聲傳感器數(shù)據(jù)方面的穩(wěn)健性。

圖 3(b)展示了機(jī)器學(xué)習(xí)在未知環(huán)境中高效探索的能力。在基于機(jī)器學(xué)習(xí)的框架的引導(dǎo)下,機(jī)器人能夠生成一條在探索和目標(biāo)導(dǎo)向?qū)Ш街g取得平衡的軌跡。這在地圖不完整或動(dòng)態(tài)變化的環(huán)境中尤其有利,而傳統(tǒng)的啟發(fā)式方法則難以適應(yīng)這些環(huán)境。

圖 3(c)強(qiáng)調(diào)了機(jī)器學(xué)習(xí)在校準(zhǔn)視覺信號(hào)誤差方面的作用,從而提高了定位精度。通過利用多模態(tài)傳感器融合和誤差校正算法,機(jī)器學(xué)習(xí)模型可以減輕由傳感器噪聲或環(huán)境變化引起的差異,確保預(yù)測(cè)軌跡與地面實(shí)況緊密一致。

最后,圖 3(d)突出顯示了一個(gè)失敗案例,其中機(jī)器學(xué)習(xí)方法由于視覺里程計(jì)中的累積誤差而遭遇挑戰(zhàn)。這一失敗凸顯了機(jī)器學(xué)習(xí)在處理極端輸入失真或與訓(xùn)練數(shù)據(jù)明顯不同的場(chǎng)景時(shí)的局限性。然而,此類案例也表明,通過領(lǐng)域自適應(yīng)和遷移學(xué)習(xí)等技術(shù)可以進(jìn)一步改進(jìn)機(jī)器學(xué)習(xí)模型。

總體而言,基于機(jī)器學(xué)習(xí)的方法優(yōu)于傳統(tǒng)方法,后者通常依賴于預(yù)定義的啟發(fā)式方法,并且不太適應(yīng)動(dòng)態(tài)和嘈雜的環(huán)境。通過利用數(shù)據(jù)驅(qū)動(dòng)的洞察力,機(jī)器學(xué)習(xí)技術(shù)能夠有效地泛化各種條件,適應(yīng)新環(huán)境,并提升在復(fù)雜場(chǎng)景下的性能。這些特性使得基于機(jī)器學(xué)習(xí)的方法對(duì)于推進(jìn)AMR定位至關(guān)重要,尤其是在具有挑戰(zhàn)性的室內(nèi)環(huán)境中。

圖 3.四種室內(nèi)場(chǎng)景中機(jī)器學(xué)習(xí)增強(qiáng)的機(jī)器人定位軌跡性能。紅色圓圈表示起點(diǎn),綠線表示地面真實(shí)軌跡,藍(lán)線表示使用基于機(jī)器學(xué)習(xí)的模塊預(yù)測(cè)的軌跡。藍(lán)色箭頭表示機(jī)器人的最終位置和方向。子圖分別說明了機(jī)器學(xué)習(xí)對(duì) (a) 軌跡平滑、(b) 探索、(c) 誤差校準(zhǔn)和 (d) 故障情況的影響。

3.2 .強(qiáng)化學(xué)習(xí)(RL)

強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)基本范式,與監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)并列,致力于使代理能夠通過與環(huán)境的交互來學(xué)習(xí)最優(yōu)行為,從而最大化累積獎(jiǎng)勵(lì)。通過探索可能的控制行動(dòng)空間,代理可以獲得反饋,例如對(duì)良好表現(xiàn)的獎(jiǎng)勵(lì)和對(duì)不良表現(xiàn)的懲罰。這種反復(fù)試驗(yàn)的方法使代理能夠迭代地改進(jìn)其決策策略。

深度強(qiáng)化學(xué)習(xí)(DRL) 結(jié)合了 DL 強(qiáng)大的函數(shù)逼近能力和RL 的最優(yōu)策略學(xué)習(xí)框架,近年來獲得了廣泛關(guān)注,尤其是在 AlphaGo等應(yīng)用中。圖 4展示了一個(gè)專為改善復(fù)雜動(dòng)態(tài)條件下室內(nèi)移動(dòng)機(jī)器人定位而定制的 DRL 框架。該系統(tǒng)首先從 IMU、LiDAR、攝像頭和編碼器等設(shè)備收集多傳感器測(cè)量數(shù)據(jù)。這些測(cè)量數(shù)據(jù)既能捕捉靜態(tài)環(huán)境特征(如墻壁、門),也能捕捉動(dòng)態(tài)因素(如移動(dòng)障礙物、NLOS 條件)。具有多個(gè)隱藏層的深度神經(jīng)網(wǎng)絡(luò)(DNN) 處理這些高維輸入,以學(xué)習(xí)對(duì)決策至關(guān)重要的潛在表示。

基于此表示,DRL 策略通過最先進(jìn)的算法進(jìn)行訓(xùn)練,涵蓋在線策略方法(例如,Actor-Critic、近端策略優(yōu)化(PPO)、異步優(yōu)勢(shì) Actor-Critic (A3C))和離線策略方法(例如,Q-Learning、深度 Q 網(wǎng)絡(luò) (DQN)、深度確定性策略梯度 (DDPG)、軟 Actor-Critic (SAC))。該策略輸出位置更新或速度命令,使代理能夠?qū)崟r(shí)優(yōu)化其姿勢(shì)。

獎(jiǎng)勵(lì)信號(hào)源自定位誤差指標(biāo)、精度反饋和時(shí)間平滑度,從而驅(qū)動(dòng)持續(xù)的策略更新。這種閉環(huán)學(xué)習(xí)機(jī)制使機(jī)器人能夠快速適應(yīng)環(huán)境不確定性,同時(shí)保持較高的定位精度。通過利用深度強(qiáng)化學(xué)習(xí) (DRL) 自適應(yīng)探索和利用傳感器數(shù)據(jù)的能力,該框架顯著提升了室內(nèi)移動(dòng)機(jī)器人在挑戰(zhàn)性場(chǎng)景下的定位魯棒性和精度。

在室內(nèi)定位和路徑規(guī)劃領(lǐng)域,強(qiáng)化學(xué)習(xí)已成功應(yīng)用于改進(jìn)導(dǎo)航策略,以實(shí)現(xiàn)在動(dòng)態(tài)和未知環(huán)境中的高效移動(dòng)。強(qiáng)化學(xué)習(xí)的仿生學(xué)習(xí)系統(tǒng)模擬了在生物體中觀察到的反復(fù)試驗(yàn)學(xué)習(xí)過程,使機(jī)器人能夠迭代地增強(qiáng)其行為,并提高導(dǎo)航和定位的效率。

然而,強(qiáng)化學(xué)習(xí)在室內(nèi) AMR 中的應(yīng)用也面臨著挑戰(zhàn),尤其是隨機(jī)探索相關(guān)的計(jì)算時(shí)間和成本,這會(huì)限制實(shí)際的效率和可靠性。為了應(yīng)對(duì)這些挑戰(zhàn),研究人員提出了一些優(yōu)化技術(shù),例如有信息偏差的 softmax 回歸,它使用啟發(fā)式成本函數(shù)來減少無效的探索時(shí)間,從而加速收斂。此外,A2C 算法與經(jīng)驗(yàn)回放相結(jié)合,可以更好地捕捉機(jī)器人與障礙物之間復(fù)雜的相互作用。這些優(yōu)化使 RL 對(duì)于室內(nèi) AMR 更加可行和高效,使它們能夠不斷優(yōu)化定位策略,有效避開障礙物,并根據(jù)環(huán)境變化實(shí)時(shí)調(diào)整路徑規(guī)劃。

圖 4.基于DRL 的室內(nèi)定位結(jié)構(gòu)圖?;?DRL 的室內(nèi)定位框架示意圖,突出顯示了靜態(tài)和動(dòng)態(tài)環(huán)境條件下傳感器觀測(cè)、神經(jīng)網(wǎng)絡(luò)推理、策略學(xué)習(xí)和獎(jiǎng)勵(lì)機(jī)制之間的相互作用。

3.3 .深度學(xué)習(xí)

深度學(xué)習(xí)在室內(nèi)自主移動(dòng)機(jī)器人 (AMR) 中扮演著不可或缺的角色,它為感知、特征提取以及集成學(xué)習(xí)和決策系統(tǒng)提供強(qiáng)有力的支持,使其能夠更好地適應(yīng)動(dòng)態(tài)復(fù)雜的環(huán)境。深度學(xué)習(xí)通過遷移學(xué)習(xí),有效地將從模擬中獲得的知識(shí)應(yīng)用到現(xiàn)實(shí)場(chǎng)景中,彌合“現(xiàn)實(shí)差距”。如圖 5所示,用于室內(nèi)機(jī)器人定位的深度學(xué)習(xí)框架展示了深度學(xué)習(xí)技術(shù)與定位過程的集成。該框架分為兩個(gè)部分:模擬和現(xiàn)實(shí),分別針對(duì)任務(wù)的不同方面。

在模擬組件中,幾何特征()從輸入數(shù)據(jù)中提取,以捕捉環(huán)境的空間結(jié)構(gòu)。這些特征通過特征學(xué)習(xí)模塊()生成高級(jí)表示,輸出()提供機(jī)器人位置的初步估計(jì)。

在現(xiàn)實(shí)組件中,通過特征提取來處理實(shí)時(shí)數(shù)據(jù)() 和優(yōu)化模塊 ()來使學(xué)習(xí)到的特征適應(yīng)真實(shí)環(huán)境。這個(gè)過程產(chǎn)生了精細(xì)的輸出(和)來提高定位精度。模擬與現(xiàn)實(shí)之間的反饋確??蚣苣軌蜻m應(yīng)模擬數(shù)據(jù)和真實(shí)世界數(shù)據(jù)之間的差異,從而提高魯棒性。

該框架展示了如何結(jié)合基于模擬的訓(xùn)練和現(xiàn)實(shí)世界的適應(yīng)來解決室內(nèi)機(jī)器人定位中的挑戰(zhàn),利用 DL 的分層特征提取和迭代學(xué)習(xí)能力。

文獻(xiàn)表明,深度學(xué)習(xí)在解決機(jī)器人定位中的感知不確定性方面展現(xiàn)出巨大潛力。例如,CNN能夠高效處理來自環(huán)境的傳感器數(shù)據(jù),提供精確的物體識(shí)別和語義理解,這對(duì)于室內(nèi)定位至關(guān)重要。深度學(xué)習(xí)利用深度神經(jīng)網(wǎng)絡(luò)的特征提取能力,幫助機(jī)器人探索最優(yōu)路徑規(guī)劃和決策策略,在動(dòng)態(tài)和未知的室內(nèi)環(huán)境中表現(xiàn)出色。

GAN通過生成逼真的模擬環(huán)境和數(shù)據(jù)來支持大規(guī)模虛擬訓(xùn)練,從而降低在現(xiàn)實(shí)環(huán)境中進(jìn)行訓(xùn)練的成本和風(fēng)險(xiǎn)。此外,將深度學(xué)習(xí)與不確定性估計(jì)方法(例如貝葉斯方法)相結(jié)合,可以增強(qiáng)機(jī)器人在復(fù)雜室內(nèi)環(huán)境中的決策信心,從而更好地平衡感知信息和環(huán)境交互,最終提高導(dǎo)航和路徑規(guī)劃的可靠性。

圖 5.室內(nèi)AMR 定位的深度學(xué)習(xí)框架。該圖展示了一個(gè)用于室內(nèi)機(jī)器人定位的仿真-現(xiàn)實(shí)集成深度學(xué)習(xí)框架。該框架結(jié)合了基于仿真的特征學(xué)習(xí)和實(shí)時(shí)自適應(yīng)技術(shù),以解決模擬數(shù)據(jù)與真實(shí)世界數(shù)據(jù)之間的差異。反饋機(jī)制通過迭代改進(jìn)來提高定位精度和魯棒性。

如圖 6所示,結(jié)果凸顯了各種特征提取方法在室內(nèi)環(huán)境中的性能。幾何方法(例如 ORB-SLAM2(圖 6(a))依賴于手工制作的特征,在結(jié)構(gòu)化環(huán)境中提供了可靠的性能。ORB-SLAM3(圖 6(b))在此方法的基礎(chǔ)上,通過逐步改進(jìn)特征匹配,在特定條件下增強(qiáng)了魯棒性。然而,這些幾何方法在動(dòng)態(tài)且混亂的室內(nèi)環(huán)境中往往表現(xiàn)不佳,手工制作的特征可能無法有效地泛化。

相比之下,基于 DL 的方法在復(fù)雜和動(dòng)態(tài)環(huán)境中表現(xiàn)出了出色的適應(yīng)性和魯棒性。深度學(xué)習(xí)增強(qiáng)型SLAM(DXSLAM)圖 6(c)集成了 DL 增強(qiáng)功能,有效地結(jié)合了幾何和語義信息,以解決動(dòng)態(tài)和非結(jié)構(gòu)化場(chǎng)景帶來的挑戰(zhàn)。幾何對(duì)應(yīng)網(wǎng)絡(luò) v2(GCNv2)圖 6(d)作為一種基于圖的神經(jīng)網(wǎng)絡(luò),擅長捕捉復(fù)雜的空間關(guān)系,即使在高度非結(jié)構(gòu)化的環(huán)境中也能實(shí)現(xiàn)密集而魯棒的特征提取。例如,在圖像的右上角(鍵盤區(qū)域),這兩個(gè)圖表明 DL 產(chǎn)生了更密集、更豐富的特征集,突顯了其捕捉復(fù)雜空間關(guān)系和提取詳細(xì)圖像信息的卓越能力。這種增強(qiáng)的特征提取能力對(duì)于在具有挑戰(zhàn)性的室內(nèi)環(huán)境中實(shí)現(xiàn)準(zhǔn)確可靠的定位至關(guān)重要。

圖 6。AM中使用的特征提取方法的說明性示例。(a)使用 ORB-SLAM2的特征提取結(jié)果,(b)來自 ORB-SLAM3的結(jié)果,(c)由 DXSLAM提取的特征,以及(d)來自 GCNv2的特征。這些圖像突出顯示了從幾何方法到基于 DL 的方法的進(jìn)展,證明了基于 DL 的技術(shù)在提取密集和魯棒特征方面的卓越性能。

3.3.1 .卷積神經(jīng)網(wǎng)絡(luò)(CNN)

CNN是一種深度學(xué)習(xí)模型,它通過卷積運(yùn)算直接從原始數(shù)據(jù)中提取特征,廣泛應(yīng)用于機(jī)器人領(lǐng)域的圖像分類、目標(biāo)檢測(cè)和圖像分割任務(wù)。它會(huì)分析輸入圖像或數(shù)據(jù)集,識(shí)別圖像的關(guān)鍵特征,并區(qū)分各個(gè)元素。CNN 在機(jī)器人定位能力方面取得了顯著進(jìn)步,尤其是在 SLAM 特征提取方面,其匹配精度優(yōu)于 Oriented FAST 和 Rotated BRIEF (ORB) 等傳統(tǒng)方法。雖然 ORB 在某些情況下表現(xiàn)良好,但對(duì)于復(fù)雜場(chǎng)景、光照變化和視點(diǎn)變化較大的情況,其匹配精度和魯棒性可能不足。

最近的研究證明了其顯著的性能優(yōu)勢(shì)。例如,SuperPoint 通過學(xué)習(xí)圖像中的特征點(diǎn)和描述符,顯著提高了匹配準(zhǔn)確率,比傳統(tǒng)方法提高了 10% 到 30%。通過從海量數(shù)據(jù)中學(xué)習(xí)更復(fù)雜、更抽象的特征表示,CNN 有助于提高機(jī)器人定位的準(zhǔn)確性和可靠性。

CNN 也已用于各種機(jī)器人系統(tǒng)中基于視覺的定位等功能。研究人員展示了CNN 架構(gòu)如何將低成本 MR 傳感器與單目攝像機(jī)圖像和擴(kuò)展卡爾曼濾波器(EKF) 數(shù)據(jù)相結(jié)合以實(shí)現(xiàn)精確定位。CNN 可應(yīng)用于分類、避障、視覺里程計(jì) (VO) 和其他定位過程等任務(wù)。然而,CNN 的缺點(diǎn)之一是其計(jì)算成本高,這對(duì)機(jī)器人技術(shù)提出了重大挑戰(zhàn),因?yàn)闄C(jī)器人通常在高度動(dòng)態(tài)的環(huán)境中操作。緩慢的定位框架會(huì)在控制回路中引入延遲,使機(jī)器人難以快速響應(yīng)環(huán)境變化。

3.3.2 .生成對(duì)抗網(wǎng)絡(luò)(GAN)

GAN 是一類深度學(xué)習(xí)模型,旨在生成與給定訓(xùn)練數(shù)據(jù)集高度相似的新數(shù)據(jù)實(shí)例。例如,基于圖像訓(xùn)練的 GAN 可以生成捕捉多種自然特征的新圖像,使其在視覺上令人信服。在機(jī)器人和定位應(yīng)用中,GAN 已被用于減少復(fù)雜行為學(xué)習(xí)過程中對(duì)大量人工反饋的依賴。

在機(jī)器人定位和控制策略開發(fā)的背景下,GAN 通過生成真實(shí)的模擬環(huán)境和行為數(shù)據(jù)提供了一種有效的工具。這種能力使機(jī)器人能夠更好地了解周圍環(huán)境并制定精確的定位和導(dǎo)航策略,特別是在復(fù)雜的室內(nèi)環(huán)境中。此外,GAN 在確保面臨定位攻擊的移動(dòng)機(jī)器人的穩(wěn)健運(yùn)動(dòng)規(guī)劃方面發(fā)揮了至關(guān)重要的作用。通過生成潛在的機(jī)器人位置,GAN 可以糾正受損的數(shù)據(jù),使機(jī)器人能夠在對(duì)抗環(huán)境中保持準(zhǔn)確的定位和導(dǎo)航,從而實(shí)現(xiàn)安全、無碰撞的運(yùn)動(dòng)規(guī)劃。這種方法顯著增強(qiáng)了機(jī)器人運(yùn)動(dòng)規(guī)劃在惡劣條件下的穩(wěn)健性,強(qiáng)調(diào)了 GAN 在改善移動(dòng)機(jī)器人定位和確保操作安全方面的重要性。

近年來,人工智能在移動(dòng)機(jī)器人室內(nèi)定位與導(dǎo)航領(lǐng)域取得了顯著進(jìn)展。研究人員探索了各種基于人工智能的方法,包括深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、機(jī)器學(xué)習(xí)和多傳感器融合,旨在提高定位精度和導(dǎo)航性能,同時(shí)減少對(duì)高精度傳感器和特定硬件的依賴。

3.4 .基于人工智能的進(jìn)化方法

基于人工智能的進(jìn)化方法 (EM) 在提升AMR定位性能方面展現(xiàn)出巨大潛力。這些方法利用仿生優(yōu)化技術(shù)來解決室內(nèi)導(dǎo)航和定位中固有的復(fù)雜、非線性和多目標(biāo)挑戰(zhàn)。定位和路徑規(guī)劃本質(zhì)上是相互關(guān)聯(lián)的過程:精確的定位提供有效路徑規(guī)劃所需的空間數(shù)據(jù),而優(yōu)化的路徑可以減輕不必要的操作、傳感器噪聲或動(dòng)態(tài)環(huán)境變化造成的定位誤差。通過將進(jìn)化算法集成到定位框架中,AMR 可以在具有挑戰(zhàn)性的環(huán)境中實(shí)現(xiàn)更高的精度、穩(wěn)健性和適應(yīng)性。路徑規(guī)劃方法大致可分為兩類:

?基于人工智能的進(jìn)化算法,包括蟻群優(yōu)化算法(ACO)、遺傳算法(GA)、粒子群優(yōu)化算法(PSO)、布谷鳥搜索算法(CSA)、灰狼優(yōu)化算法(GWO)和鯨魚優(yōu)化算法(WOA),已被證明能有效解決各種路徑規(guī)劃難題。這些算法在非線性和多目標(biāo)優(yōu)化任務(wù)中表現(xiàn)出色,例如最小化能耗或避開動(dòng)態(tài)障礙物。例如,PSO 已成功應(yīng)用于靜態(tài)環(huán)境路徑規(guī)劃,并取得了顯著的效果。通過修改信息素?cái)U(kuò)散梯度公式和回溯策略,ACO 可以在復(fù)雜環(huán)境中得到增強(qiáng)。CSA 已用于未知集群環(huán)境中的移動(dòng)機(jī)器人導(dǎo)航,重點(diǎn)是訓(xùn)練前提部分。在無人機(jī)的三維路徑規(guī)劃場(chǎng)景中,GWO 表現(xiàn)出了優(yōu)于 PSO 的性能。此外,一項(xiàng)比較研究表明,WOA 在二維路徑規(guī)劃任務(wù)中的表現(xiàn)優(yōu)于 CSA 和 PSO。

?傳統(tǒng)的基于圖的搜索算法,例如 Dijkstra 算法(DA)和 A* 算法,廣泛應(yīng)用于具有預(yù)定義圖表示的結(jié)構(gòu)化環(huán)境,例如倉庫或自動(dòng)導(dǎo)引車(AGV)。

綜上所述,基于人工智能的進(jìn)化路徑規(guī)劃方法和傳統(tǒng)的路徑規(guī)劃方法都通過提高導(dǎo)航效率和最小化誤差來補(bǔ)充定位。雖然路徑規(guī)劃間接影響定位精度,但其在確保無縫導(dǎo)航方面發(fā)揮著至關(guān)重要的作用。有關(guān)路徑優(yōu)化技術(shù)的全面討論,請(qǐng)參閱專門的綜述。

4.基于AI的地面AMR定位方法

4.1 .基于AI的AMR無里程計(jì)和SLAM定位

Sun 等利用 CNN 從單目圖像預(yù)測(cè)深度信息,實(shí)現(xiàn)了適用于 GPS 信號(hào)不可靠區(qū)域的三維 LiDAR 地圖內(nèi)的攝像機(jī)定位。然而,該方法在光照變化和圖像質(zhì)量較差的情況下表現(xiàn)出局限性。為了減少對(duì)高精度傳感器的依賴,F(xiàn)oroughi 等在小型數(shù)據(jù)集上使用 CNN,設(shè)計(jì)了一種新的損失函數(shù)來增強(qiáng)模型泛化能力,但有限的數(shù)據(jù)集大小限制了模型的魯棒性。Ballesta 等將全景圖像與 CNN 相結(jié)合,實(shí)現(xiàn)了分層定位,提高了房間級(jí)精度,但仍然對(duì)圖像質(zhì)量較為敏感。

為了提高定位精度,李等采用YOLOv5和多層感知器(MLP),實(shí)現(xiàn)了誤差小于 10 cm 的高精度定位,但在復(fù)雜環(huán)境下仍存在局限性。隨后,李等融合分層語義信息,提出一種基于上下文向量和知識(shí)圖譜的視覺導(dǎo)航方法,增強(qiáng)模型在未知環(huán)境中的泛化能力。趙等提出了智能室內(nèi)超表面機(jī)器人 (I2MR),通過集中式微波感知增強(qiáng)定位能力并降低計(jì)算需求。俞等提出了 Relo-Net 來解決“機(jī)器人被綁架問題”,利用 2D LiDAR 進(jìn)行高精度室內(nèi)場(chǎng)景分類和重定位,但仍然對(duì)環(huán)境變化較為敏感。

在視覺導(dǎo)航領(lǐng)域,Ran 等利用淺層 CNN 和自適應(yīng)加權(quán)控制算法來提升導(dǎo)航性能,但在動(dòng)態(tài)環(huán)境中性能有限。Wu 等提出了生成模仿學(xué)習(xí) (GIL),通過預(yù)測(cè)下一個(gè)預(yù)期觀測(cè)值來提高導(dǎo)航成功率和路徑效率。盡管計(jì)算需求增加,但這種方法顯著提高了目標(biāo)驅(qū)動(dòng)導(dǎo)航的決策魯棒性。Kulhánek 等提出了一個(gè)端到端深度強(qiáng)化學(xué)習(xí)框架,實(shí)現(xiàn)了實(shí)時(shí)導(dǎo)航和對(duì)非結(jié)構(gòu)化環(huán)境的適應(yīng)性。

在強(qiáng)化學(xué)習(xí)領(lǐng)域,Sleaman 和 Yavuz采用深度 CNN 實(shí)現(xiàn)自主導(dǎo)航,但在動(dòng)態(tài)環(huán)境中性能有限。Fang 等將深度 RL 與模仿學(xué)習(xí)相結(jié)合,以提高導(dǎo)航性能。Lee 和 Yusuf應(yīng)用DQN和雙深度 Q 網(wǎng)絡(luò) (DDQN) 算法實(shí)現(xiàn)自主導(dǎo)航和避障,其中 DDQN 提高了穩(wěn)定性。Bezerra 等將EKF與 DQN相結(jié)合,以提高導(dǎo)航效率。Li 等提出了一種基于PPO和門控循環(huán)單元(GRU) 的主動(dòng)嗅覺定位方法,提高了復(fù)雜環(huán)境下的定位效率。

在機(jī)器學(xué)習(xí)方法中,Klein 等人使用隨機(jī)森林回歸器進(jìn)行毫米級(jí)定位,但受到標(biāo)記精度的限制。Wang 等人利用弱監(jiān)督學(xué)習(xí)進(jìn)行相對(duì)定位,減少了對(duì)精確地理信息的依賴,但在較大空間中性能有限。Ye 等人提出了一種針對(duì)家庭服務(wù)機(jī)器人的算法,該算法集成了圖像去模糊和物體檢測(cè)技術(shù),以提高目標(biāo)識(shí)別的精度和速度。

其他研究,例如 Chiang 等人,將磁場(chǎng)特征與深度神經(jīng)網(wǎng)絡(luò)相結(jié)合,用于室內(nèi)物體定位,適用于富含金屬的環(huán)境。Zou 等人使用 GAN 重建 WiFi 信號(hào),提高了定位自動(dòng)化程度。Capra 等人將超寬帶定位系統(tǒng)與家用機(jī)器人相結(jié)合,用于老年人跌倒檢測(cè),提高了定位精度,但成本也更高。

在多傳感器融合方面,李等融合了 2D LiDAR 和 IMU 數(shù)據(jù),以增強(qiáng)定位的魯棒性。蔡等采用卡爾曼濾波融合各種傳感器數(shù)據(jù),實(shí)現(xiàn)多機(jī)器人協(xié)作定位。曾等提出了一種受神經(jīng)生物學(xué)啟發(fā)的貝葉斯吸引子網(wǎng)絡(luò) (BAN) 模型,以降低計(jì)算復(fù)雜度。李等提出了一種基于語義角點(diǎn)特征的自適應(yīng)蒙特卡洛定位方法,提高了重定位速度和魯棒性。Papadaki 和 Pateraki利用深度學(xué)習(xí)在汽車裝配中進(jìn)行 6D 物體定位,有效地處理了反光和遮擋。陳等提出了一種仰視視覺室內(nèi)定位方法,使用 YOLO V7 來提高地標(biāo)檢測(cè)精度并減少隱私問題。

Jia 等提出了一種上下文感知的多層信息融合系統(tǒng)來提高障礙物檢測(cè)的準(zhǔn)確性,但在快速變化的環(huán)境中性能有限。Popovic 等提出了一種基于 RGB-D 圖像的深度完成算法,改進(jìn)了占用圖和導(dǎo)航地圖的完整性,但對(duì) RGB-D 攝像機(jī)的依賴限制了其適用性。Miranda-Vega 等提出了一種基于去模糊化算法 (DFA) 的光學(xué)掃描系統(tǒng)(OSS) 定位方法,顯著提高了工業(yè)機(jī)器人室內(nèi)定位的準(zhǔn)確性和魯棒性。實(shí)驗(yàn)結(jié)果表明,該方法效果最佳,實(shí)現(xiàn)了 0.021° 的最小定位誤差,證實(shí)了去模糊化算法在室內(nèi)定位中的有效性。

綜上所述,人工智能在移動(dòng)機(jī)器人室內(nèi)定位與導(dǎo)航方面取得了顯著進(jìn)展。早期研究在提高定位精度和導(dǎo)航性能方面取得了突破,但面臨著依賴高精度傳感器、計(jì)算成本高、對(duì)環(huán)境敏感等挑戰(zhàn)。后續(xù)研究引入了新方法和改進(jìn)算法,如將RL與模仿學(xué)習(xí)、多視圖信息融合、弱監(jiān)督學(xué)習(xí)相結(jié)合,逐漸克服了這些限制,提高了模型泛化能力和計(jì)算效率。然而,還需要進(jìn)一步研究以實(shí)現(xiàn)更高的魯棒性、減少對(duì)硬件的依賴、增強(qiáng)系統(tǒng)的靈活性和可擴(kuò)展性。表4總結(jié)了不依賴?yán)锍逃?jì)和SLAM的基于AI的方法。

表 4.基于AI 的無里程計(jì)和 SLAM 定位技術(shù)總結(jié)。

4.2 .用于AMR的AI增強(qiáng)SLAM

SLAM 結(jié)合了定位(確定機(jī)器人的位置和方向)和建圖(構(gòu)建環(huán)境地圖)兩項(xiàng)任務(wù)。這種雙重能力使得 SLAM 成為未知或動(dòng)態(tài)環(huán)境中導(dǎo)航不可或缺的一部分。雖然定位是 SLAM 的核心組成部分,但它對(duì)建圖的額外關(guān)注使其有別于那些僅僅致力于在預(yù)先繪制地圖的環(huán)境中實(shí)現(xiàn)精確定位的獨(dú)立定位技術(shù)。

基于人工智能的 SLAM 技術(shù)利用 DL、RL 和計(jì)算機(jī)視覺等先進(jìn)的計(jì)算方法,徹底改變了傳統(tǒng)方法。這些基于人工智能的技術(shù)顯著增強(qiáng)了 SLAM 系統(tǒng)感知、解釋和與復(fù)雜環(huán)境交互的能力。與幾何或基于特征的 SLAM 不同,基于人工智能的 SLAM 擅長處理動(dòng)態(tài)障礙物、環(huán)境噪聲和模糊視覺特征等挑戰(zhàn)?;谌斯ぶ悄艿?SLAM 的核心是對(duì)象跟蹤、語義映射和傳感器數(shù)據(jù)增強(qiáng)等技術(shù),這些技術(shù)使系統(tǒng)能夠自適應(yīng)地響應(yīng)環(huán)境變化并支持廣泛的應(yīng)用,包括 AMR、工廠自動(dòng)化、智能農(nóng)業(yè)和自動(dòng)駕駛。如圖 7所示,這些能力使基于人工智能的 SLAM 成為下一代自主系統(tǒng)。

在AMR領(lǐng)域,基于AI的SLAM在提升定位精度和魯棒性方面具有顯著優(yōu)勢(shì)。通過集成語義地圖,AMR可以區(qū)分靜態(tài)和動(dòng)態(tài)物體,從而提高導(dǎo)航效率和避障能力?;贏I的多傳感器融合技術(shù)通過整合來自激光雷達(dá)、攝像頭和慣性測(cè)量單元(IMU)的數(shù)據(jù),進(jìn)一步提升性能,并有效應(yīng)對(duì)傳感器噪聲、遮擋和視野受限等挑戰(zhàn)。這些創(chuàng)新技術(shù)即使在傳統(tǒng)SLAM系統(tǒng)經(jīng)常失效的動(dòng)態(tài)、雜亂或低能見度環(huán)境中也能確??煽康亩ㄎ?。

雖然地圖繪制本質(zhì)上是 SLAM 的一部分,但本研究主要關(guān)注 SLAM 的定位能力,地圖繪制則被視為次要目標(biāo)。基于 AI 的 SLAM 與多傳感器融合的結(jié)合,使 AMR 能夠在復(fù)雜的室內(nèi)環(huán)境中實(shí)現(xiàn)高精度定位。以下小節(jié)將探討具體的 AI 增強(qiáng) SLAM 方法,包括 VSLAM、LiDAR SLAM 以及多傳感器融合集成,以應(yīng)對(duì) AMR 定位的挑戰(zhàn)。

圖7.基于AI的SLAM的應(yīng)用和核心組件。

4.2.1 .AMR 的視覺 SLAM(VSLAM)

VSLAM 是 AMR 的基礎(chǔ)技術(shù),使其能夠構(gòu)建環(huán)境地圖并利用視覺數(shù)據(jù)進(jìn)行自我定位。傳統(tǒng)的 VSLAM 方法依賴于從圖像中提取的幾何特征,在光照變化、動(dòng)態(tài)障礙物或缺乏獨(dú)特特征的環(huán)境中,這些特征可能會(huì)丟失并導(dǎo)致定位不穩(wěn)定。為了克服這些局限性,VSLAM 中已經(jīng)集成了多種技術(shù),以增強(qiáng)特征提取和環(huán)境適應(yīng)性。深度學(xué)習(xí)模型(尤其是 CNN)擅長從圖像中提取豐富的高級(jí)特征,從而克服了傳統(tǒng)幾何特征的限制。這種集成使 VSLAM 系統(tǒng)即使在動(dòng)態(tài)環(huán)境以及光照和天氣等變化條件下也能保持穩(wěn)定的定位。結(jié)合回環(huán)檢測(cè)和動(dòng)態(tài)障礙物識(shí)別算法,可以實(shí)現(xiàn)實(shí)時(shí)地圖更新,從而增強(qiáng) VSLAM 系統(tǒng)在復(fù)雜環(huán)境中的可靠性。

許多研究利用深度學(xué)習(xí)來提升 VSLAM 性能。Li 等人提出了一種 DXSLAM,Jin 等人開發(fā)了一種新穎的 VSLAM 框架,該框架利用對(duì)抗性遷移學(xué)習(xí)(ATL) 來提高動(dòng)態(tài)環(huán)境中的定位精度。該框架集成了基于 ATL 的無監(jiān)督語義分割來過濾動(dòng)態(tài)特征并減少領(lǐng)域差異,與傳統(tǒng)方法相比,顯著提高了 VSLAM 系統(tǒng)的性能;Li 等人提出了 DeepSLAM。這些工作采用深度學(xué)習(xí)模型進(jìn)行特征提取和回環(huán)檢測(cè),顯著增強(qiáng)了動(dòng)態(tài)場(chǎng)景下的魯棒性和適應(yīng)性。通過解決傳統(tǒng) SLAM 方法在光照變化和動(dòng)態(tài)物體干擾下的不足,這些研究為復(fù)雜室內(nèi)環(huán)境下的自主定位提供了技術(shù)支持。DynaSLAM 系列,包括 DynaSLAM和 DynaSLAM II,充當(dāng) SLAM 領(lǐng)域的深度學(xué)習(xí)。它結(jié)合了動(dòng)態(tài)物體檢測(cè)和背景恢復(fù)技術(shù),進(jìn)一步提高了動(dòng)態(tài)場(chǎng)景下的性能。此外,Cui 等人提出了一種基于改進(jìn)的 ORB-SLAM2 的3D 語義地圖系統(tǒng),實(shí)現(xiàn)了適用于服務(wù)機(jī)器人的低資源環(huán)境下高效的三維語義地圖構(gòu)建。Teed 和 Deng提出了 DROID-SLAM,這是一個(gè)用于單目、立體和 RGB-D 相機(jī)的深度視覺 SLAM 系統(tǒng),它集成了用于迭代姿態(tài)和深度優(yōu)化的卷積門控循環(huán)單元 (CGRU) 以及用于特征提取的 CNN。該系統(tǒng)結(jié)合了密集的捆綁調(diào)整來優(yōu)化相機(jī)姿態(tài)和深度,與 ORB-SLAM3 相比,在魯棒性和準(zhǔn)確性方面取得了顯著的提升,尤其是在動(dòng)態(tài)場(chǎng)景和使用 RGB-D 等多模態(tài)數(shù)據(jù)的情況下。盡管取得了這些進(jìn)步,但該方法的高計(jì)算開銷對(duì)實(shí)時(shí)應(yīng)用提出了挑戰(zhàn)。

將深度學(xué)習(xí)與多模態(tài)數(shù)據(jù)相結(jié)合,使 SLAM 系統(tǒng)能夠增強(qiáng)對(duì)環(huán)境的語義理解。Tao 等人提出了一種基于掩模評(píng)分區(qū)域的 CNN (R-CNN)的 3D 語義 VSLAM 方法,該方法將語義分割與改進(jìn)的 ORB-SLAM2 相結(jié)合,以提高在復(fù)雜室內(nèi)環(huán)境中的建圖精度。同樣地,Yang 等人開發(fā)了 SDF-SLAM,融合深度和語義信息,為家庭和服務(wù)機(jī)器人提供強(qiáng)大的環(huán)境理解。動(dòng)態(tài)環(huán)境對(duì) SLAM 系統(tǒng)提出了重大挑戰(zhàn)。Sun 等人提出了一種基于深度學(xué)習(xí)和 VSLAM 的多目標(biāo)定位與建圖方法,有效地處理動(dòng)態(tài)場(chǎng)景。An 等人引入了一種涉及深度特征和鄰域圖的增量式回環(huán)檢測(cè)方法,以提高大規(guī)模環(huán)境中的回環(huán)效率和精度。

對(duì)于低功耗和資源受限設(shè)備上的 SLAM 應(yīng)用,Tang 等人提出了GCNv2 模型,該模型支持在嵌入式設(shè)備上運(yùn)行,可實(shí)現(xiàn)室內(nèi)環(huán)境中無人機(jī)和輕型機(jī)器人的高效自主導(dǎo)航。Masuda 等人開發(fā)了一種神經(jīng)隱式事件生成器來解決低光和高速場(chǎng)景下的動(dòng)態(tài)跟蹤問題,擴(kuò)展了 SLAM 系統(tǒng)在極端環(huán)境下的適應(yīng)性。為了增強(qiáng) SLAM 系統(tǒng)在復(fù)雜室內(nèi)環(huán)境中的結(jié)構(gòu)映射能力,Liao 等人提出了 SO-SLAM,結(jié)合了尺度和對(duì)稱紋理約束。Chen 等人提出了精確物體關(guān)聯(lián)和姿態(tài)更新的方法,集成了公平多物體跟蹤 (FairMOT) 進(jìn)行實(shí)時(shí)多物體跟蹤。通過增強(qiáng)物體關(guān)聯(lián)和姿態(tài)細(xì)化,該系統(tǒng)顯著提高了室內(nèi)環(huán)境中的定位精度和魯棒性,特別是對(duì)于服務(wù)機(jī)器人應(yīng)用。提出了一種基于深度學(xué)習(xí)特征的單目視覺SLAM方法(LIFT-SLAM),將DL與VSLAM相結(jié)合,在嘈雜環(huán)境和動(dòng)態(tài)場(chǎng)景中表現(xiàn)出優(yōu)異的性能。

Li 等人提出了一種基于 AI 基礎(chǔ)模型的 VSLAM 回環(huán)消歧方法,解決了重復(fù)環(huán)境中的混淆問題,提高了 SLAM 系統(tǒng)的可靠性。這些進(jìn)步有助于提高 SLAM 系統(tǒng)在實(shí)際應(yīng)用中的魯棒性,因?yàn)閷?shí)際應(yīng)用中的條件可能差別很大。提出了一種創(chuàng)新的基于 AI 的室內(nèi)定位方法,特別是一種基于深度學(xué)習(xí)的視覺 SLAM 系統(tǒng),該系統(tǒng)利用多任務(wù)特征提取網(wǎng)絡(luò)和自監(jiān)督特征點(diǎn),以提高在復(fù)雜環(huán)境中的準(zhǔn)確性和穩(wěn)定性。提出了一種基于 AI 的 SLAM 室內(nèi)定位方法,利用 DeconvNet 和局部連接的自動(dòng)編碼器(LCA) 提取低維特征表示,從而提高機(jī)器人應(yīng)用中回環(huán)檢測(cè)的準(zhǔn)確性和速度。

基于人工智能的方法利用激光雷達(dá)數(shù)據(jù)解決了動(dòng)態(tài)環(huán)境適應(yīng)、傳感器融合和軌跡優(yōu)化等難題,顯著推進(jìn)了室內(nèi) SLAM 的發(fā)展。Bian 等采用粒子群優(yōu)化 (PSO)和多目標(biāo)粒子群優(yōu)化(MO-PSO) 來增強(qiáng) FastSLAM,在復(fù)雜的室內(nèi)環(huán)境中實(shí)現(xiàn)了卓越的實(shí)時(shí)性能和定位精度。Zeng 等利用遺傳算法 (GA)優(yōu)化自適應(yīng)蒙特卡洛定位 (AMCL),并將其與人工地標(biāo)相結(jié)合,以提高使用 2D 激光雷達(dá)在特征稀疏場(chǎng)景下的定位魯棒性。同樣,F(xiàn)usic 等將自適應(yīng)粒子群優(yōu)化 (PSO) 與 Hector SLAM 相結(jié)合,顯著提高了動(dòng)態(tài)條件下的實(shí)時(shí)建圖和導(dǎo)航能力。Nedjah 等應(yīng)用群體智能和混合遺傳算法 (GA) 方法來優(yōu)化 SLAM,依靠激光雷達(dá)數(shù)據(jù)在高度動(dòng)態(tài)的環(huán)境中實(shí)現(xiàn)精確、高效的定位。

總而言之,基于人工智能的定位方法將深度學(xué)習(xí)、對(duì)抗性遷移學(xué)習(xí)和自監(jiān)督學(xué)習(xí)與多模態(tài)數(shù)據(jù)相結(jié)合,顯著推動(dòng)了 VSLAM 領(lǐng)域的發(fā)展。這些技術(shù)彌補(bǔ)了傳統(tǒng) SLAM 在動(dòng)態(tài)復(fù)雜環(huán)境中的不足,提高了系統(tǒng)的實(shí)時(shí)性、適應(yīng)性和魯棒性。這些研究為 AMR 在室內(nèi)環(huán)境下的精準(zhǔn)導(dǎo)航和環(huán)境感知奠定了堅(jiān)實(shí)的基礎(chǔ),推動(dòng)了 AMR 在服務(wù)機(jī)器人和智能家居領(lǐng)域的應(yīng)用。

4.2.2 .用于AMR的LiDAR SLAM

基于激光雷達(dá)的 SLAM 利用激光雷達(dá)傳感器獲取點(diǎn)云數(shù)據(jù),實(shí)現(xiàn)環(huán)境建圖和姿態(tài)估計(jì)。然而,在復(fù)雜的光照條件和動(dòng)態(tài)環(huán)境下,激光雷達(dá) SLAM 可能會(huì)面臨數(shù)據(jù)丟失等挑戰(zhàn)。在近期的 SLAM 研究中,基于人工智能的深度學(xué)習(xí)方法已被廣泛應(yīng)用,以提升激光雷達(dá) SLAM 系統(tǒng)的魯棒性和準(zhǔn)確性。

Chen 等人開發(fā)了一種用于室內(nèi) LiDAR SLAM 的結(jié)構(gòu)語義引導(dǎo) LiDAR 超分辨率網(wǎng)絡(luò) (SGSR-Net),可生成高密度、結(jié)構(gòu)感知的點(diǎn)云。這顯著提高了復(fù)雜室內(nèi)場(chǎng)景下 SLAM 的精度和穩(wěn)定性。然而,SGSR-Net 對(duì)高性能硬件的依賴限制了其在資源受限環(huán)境中的適用性。

綜上所述,基于AI的深度學(xué)習(xí)方法不斷發(fā)展,以應(yīng)對(duì)LiDAR SLAM中的各種挑戰(zhàn),從增強(qiáng)點(diǎn)云分割和回環(huán)檢測(cè),到多源數(shù)據(jù)融合和超分辨率增強(qiáng)。這些進(jìn)步展現(xiàn)了LiDAR SLAM在復(fù)雜環(huán)境中的巨大潛力。表5總結(jié)了各種基于AI的SLAM算法及其相關(guān)細(xì)節(jié)。

表5.各種基于AI的SLAM算法及相關(guān)細(xì)節(jié)的總結(jié)。

H = 高,M = 中,L = 低。

4.2.3多傳感器融合增強(qiáng)AMR的SLAM定位

集成多種傳感器(例如視覺攝像頭、激光雷達(dá)和慣性測(cè)量單元)的 SLAM 系統(tǒng),通過充分利用每個(gè)傳感器的優(yōu)勢(shì)來提升穩(wěn)健性和準(zhǔn)確性,顯著提升了室內(nèi)定位技術(shù)。人工智能技術(shù)(尤其是機(jī)器學(xué)習(xí)和深度學(xué)習(xí))的結(jié)合,在有效融合數(shù)據(jù)、糾正錯(cuò)誤和適應(yīng)動(dòng)態(tài)環(huán)境方面發(fā)揮著至關(guān)重要的作用。

Chen 和 Hong開發(fā)了一種融合激光雷達(dá)和視覺數(shù)據(jù)的四足機(jī)器人系統(tǒng),增強(qiáng)了復(fù)雜室內(nèi)地形的環(huán)境感知。同樣,Singh 等人在主動(dòng) SLAM 框架內(nèi)集成了立體視覺攝像頭和超聲波傳感器,利用人工智能進(jìn)行障礙物檢測(cè)和深度感知,改善了社交環(huán)境中的導(dǎo)航和地圖繪制。Uganya 等人通過將激光雷達(dá)數(shù)據(jù)與機(jī)器學(xué)習(xí)方法相結(jié)合,進(jìn)一步推進(jìn)了多傳感器融合,通過基于人工智能的數(shù)據(jù)集成,在各種室內(nèi)環(huán)境中實(shí)現(xiàn)了更高的精度和適應(yīng)性。

Saputra 等人提出了一種熱慣性 SLAM 系統(tǒng),該系統(tǒng)利用概率神經(jīng)網(wǎng)絡(luò)(PNN) 進(jìn)行特征提取,并利用混合密度網(wǎng)絡(luò) (MDN) 進(jìn)行不確定性感知的姿態(tài)估計(jì)。這種方法顯著提高了低光照和低特征環(huán)境下的定位精度。Liu 等人通過整合 IMU 數(shù)據(jù)并使用 YOLOv5 進(jìn)行動(dòng)態(tài)物體檢測(cè),增強(qiáng)了視覺 SLAM 的性能,從而通過基于深度學(xué)習(xí)的運(yùn)動(dòng)補(bǔ)償提高了動(dòng)態(tài)和模糊室內(nèi)環(huán)境中的定位精度。

Zhou 等提出了融合 SLAM (FSLAM),這是一種緊密耦合的視覺-激光雷達(dá)系統(tǒng),它集成了分層特征網(wǎng)絡(luò) (HF-Net),用于分層特征提取和回環(huán)檢測(cè)。通過利用 HF-Net 提取局部和全局特征的能力,該系統(tǒng)顯著提高了地圖建圖的可靠性和定位精度,尤其是在特征稀缺的環(huán)境中。Ramezani 等提出了一種激光雷達(dá)-慣性 SLAM 系統(tǒng),它集成了高效段匹配 (ESM),這是一種基于深度學(xué)習(xí)的回環(huán)檢測(cè)方法,利用深度學(xué)習(xí)的點(diǎn)云描述符。通過學(xué)習(xí)復(fù)雜模式并識(shí)別先前訪問過的位置,ESM 顯著提高了工業(yè)室內(nèi)環(huán)境中的定位精度和地圖建圖的可靠性。

利用多傳感器融合的基于人工智能的方法,通過提高動(dòng)態(tài)和復(fù)雜環(huán)境中的準(zhǔn)確性、魯棒性和適應(yīng)性,顯著提高了 SLAM 性能。Nam 等人提出了室內(nèi)導(dǎo)航深度強(qiáng)化學(xué)習(xí) SLAM (iNAV-drlSLAM),這是一個(gè)結(jié)合 DRL 和ACO 的框架,利用激光雷達(dá)和攝像頭數(shù)據(jù)增強(qiáng)動(dòng)態(tài)障礙物密集環(huán)境中的 SLAM。Xie 等人開發(fā)了一個(gè)多機(jī)器人 SLAM 框架,利用 GA 進(jìn)行全局路徑優(yōu)化,利用 DRL 進(jìn)行實(shí)時(shí)避障,通過融合激光雷達(dá)和 IMU 數(shù)據(jù)有效地協(xié)調(diào)多個(gè)機(jī)器人。Tang 等人進(jìn)一步證明了基于人工智能的方法在利用多傳感器輸入優(yōu)化 SLAM 方面的潛力,確保在部分已知的環(huán)境中實(shí)現(xiàn)精確高效的定位。

總體而言,這些研究強(qiáng)調(diào)了人工智能在室內(nèi) SLAM 多傳感器融合中的關(guān)鍵作用,展現(xiàn)出其增強(qiáng)的魯棒性、準(zhǔn)確性和適應(yīng)性。通過有效整合各種傳感器數(shù)據(jù)并利用先進(jìn)的人工智能技術(shù),這些基于人工智能的 SLAM 系統(tǒng)能夠應(yīng)對(duì)動(dòng)態(tài)復(fù)雜室內(nèi)環(huán)境的挑戰(zhàn),為更可靠、更高效的自主導(dǎo)航和地圖繪制解決方案鋪平道路。

4.3 .基于AI增強(qiáng)里程計(jì)的AMR定位

4.3.1 .AMR的航位推算方法(DR)

傳統(tǒng)里程計(jì)中的DR方法主要依靠IMU、車輪編碼器等傳感器數(shù)據(jù),通過積分運(yùn)動(dòng)參數(shù)進(jìn)行位置估計(jì)。然而,這些方法在復(fù)雜動(dòng)態(tài)環(huán)境中往往面臨精度下降、魯棒性不足等挑戰(zhàn)。這主要是由于IMU數(shù)據(jù)中固有的噪聲和偏差,導(dǎo)致長期定位過程中累積誤差較大。基于AI的DR利用ML和DL技術(shù),實(shí)現(xiàn)多源傳感器數(shù)據(jù)的高級(jí)融合與分析,提升定位精度和對(duì)復(fù)雜環(huán)境的適應(yīng)性。例如,利用CNN處理IMU和車輪編碼器數(shù)據(jù)可以更有效地濾除噪聲和誤差,提供更穩(wěn)定的位置信息。此外,基于AI的方法可以學(xué)習(xí)和適應(yīng)不同的運(yùn)動(dòng)模式和環(huán)境變化,從而減少對(duì)高精度傳感器的依賴。然而,這些方法也面臨著需要大量訓(xùn)練數(shù)據(jù)和高計(jì)算資源等挑戰(zhàn)。因此,在保證實(shí)時(shí)性的同時(shí)優(yōu)化模型性能成為當(dāng)前的研究重點(diǎn)。

近年來,人工智能增強(qiáng)型DR方法的研究主要集中在幾個(gè)關(guān)鍵領(lǐng)域。首先,在INS的增強(qiáng)方面,Hurwitz等人研究了如何使用人工智能輔助INS在GNSS信號(hào)中斷期間實(shí)現(xiàn)精確定位。他們引入了一種混合DL-慣性融合濾波器,利用CNN來提高IMU在周期性運(yùn)動(dòng)期間的定位精度。他們的方法被稱為慣性加權(quán)航位推算(DR-IW),驗(yàn)證了人工智能增強(qiáng)型DR在沒有外部參考的情況下的有效性,并提高了傳感器融合能力。

其次,針對(duì)低成本IMU在DR中的應(yīng)用挑戰(zhàn),Guo等將模型驅(qū)動(dòng)方法與深度學(xué)習(xí)方法相結(jié)合,利用不變擴(kuò)展卡爾曼濾波器(InEKF)和深度學(xué)習(xí)模型來提高IMU的精度。這種方法在降低成本的同時(shí)提高了定位性能,從而拓寬了人工智能增強(qiáng)型DR的應(yīng)用范圍。同時(shí),Brossard等提出了一種基于深度學(xué)習(xí)的IMU陀螺儀去噪方法。他們利用CNN消除IMU數(shù)據(jù)中的噪聲和偏差,實(shí)現(xiàn)了精確的姿態(tài)估計(jì),其性能優(yōu)于一些主流慣性導(dǎo)航系統(tǒng)。這進(jìn)一步證明了深度學(xué)習(xí)在DR方法中處理IMU數(shù)據(jù)的能力。

最后,Li 等人使用全連接神經(jīng)網(wǎng)絡(luò) (FCNN) 將里程計(jì)數(shù)據(jù)與激光雷達(dá)數(shù)據(jù)融合,提高了室內(nèi) AMR 定位精度。他們利用 DR 獲取初步里程計(jì)信息,并將其與 FCNN 中的激光雷達(dá)數(shù)據(jù)相結(jié)合,有效利用網(wǎng)絡(luò)的非線性映射和自適應(yīng)學(xué)習(xí)能力來補(bǔ)償傳感器誤差。這種方法實(shí)現(xiàn)了厘米級(jí)的定位精度,顯著優(yōu)于傳統(tǒng)的概率方法。該研究凸顯了基于人工智能的 FCNN 在推進(jìn)基于 DR 的室內(nèi)移動(dòng)機(jī)器人定位方法方面的潛力。

綜上所述,AI增強(qiáng)型DR方法通過深度學(xué)習(xí)方法有效解決了IMU和車輪編碼器數(shù)據(jù)中的噪聲和漂移問題,從而實(shí)現(xiàn)了多傳感器融合和經(jīng)濟(jì)高效的應(yīng)用。這些研究表明,AI方法不僅提高了傳感器數(shù)據(jù)的利用效率,而且顯著增強(qiáng)了系統(tǒng)整體的定位精度和魯棒性。然而,基于AI的DR方法也面臨著需要大量訓(xùn)練數(shù)據(jù)和高計(jì)算資源等挑戰(zhàn)。因此,未來的研究應(yīng)側(cè)重于探索AI與其他濾波器或定位方法的深度融合,在保證實(shí)時(shí)性的同時(shí)優(yōu)化模型性能,從而不斷提升DR方法的定位能力。

4.3.2基于視覺的AMR里程計(jì)

視覺里程計(jì)(VO)通過追蹤圖像特征來估算機(jī)器人的運(yùn)動(dòng)軌跡,但它容易出現(xiàn)累積誤差,并且在長期運(yùn)行中面臨著動(dòng)態(tài)環(huán)境的挑戰(zhàn)。為了突破這些局限性,近期的研究進(jìn)展主要集中在改進(jìn)特征提取、通過穩(wěn)健的優(yōu)化技術(shù)減少漂移,以及集成特定領(lǐng)域的增強(qiáng)功能,以使視覺里程計(jì)能夠適應(yīng)復(fù)雜場(chǎng)景。

近年來,視覺里程計(jì) (VO) 在室內(nèi)機(jī)器人導(dǎo)航領(lǐng)域取得了顯著進(jìn)展,尤其是在深度學(xué)習(xí) (DL) 的推動(dòng)下。這些發(fā)展有助于克服傳統(tǒng)幾何方法在復(fù)雜動(dòng)態(tài)環(huán)境中的一些局限性。深度學(xué)習(xí)模型可以學(xué)習(xí)穩(wěn)健的特征表示和運(yùn)動(dòng)模式。這種集成提升了里程計(jì)估計(jì)的性能,使機(jī)器人能夠在具有挑戰(zhàn)性的條件下更有效地導(dǎo)航。

自 2019 年起,Liang 等人提出了 SalientDSO,首次將視覺顯著性與直接稀疏視覺里程計(jì) (VO) 相結(jié)合,通過移除信息量較低的特征點(diǎn)來提高視覺里程計(jì)的魯棒性和準(zhǔn)確性。這項(xiàng)工作為深度學(xué)習(xí)應(yīng)用于特征選擇奠定了基礎(chǔ),顯著提升了視覺里程計(jì)的性能;然而,它仍然局限于直接方法,缺乏對(duì)深度信息等多模態(tài)數(shù)據(jù)的有效利用。

為了進(jìn)一步增強(qiáng)環(huán)境感知,Zhang 等將 RGB-D 攝像機(jī)與深度學(xué)習(xí)相結(jié)合,以提高動(dòng)態(tài)環(huán)境中的視覺里程計(jì) (VO) 性能。RGB-D 攝像機(jī)提供豐富的深度信息,能夠在特征匹配過程中更有效地處理環(huán)境動(dòng)態(tài)。雖然該方法提高了視覺里程計(jì)的魯棒性,但它高度依賴于傳感器質(zhì)量,限制了其在深度信息不完整或噪聲環(huán)境中的性能。

為了應(yīng)對(duì)視覺里程計(jì)在復(fù)雜現(xiàn)實(shí)環(huán)境中的泛化挑戰(zhàn),Wang 等人提出了 TartanVO,通過在多樣化數(shù)據(jù)集上進(jìn)行訓(xùn)練,顯著提升了視覺里程計(jì)的泛化能力。這一突破使 TartanVO 能夠在不同數(shù)據(jù)集上保持穩(wěn)健的性能,為視覺里程計(jì)的普遍適用性奠定了基礎(chǔ)。然而,該模型的有效性依賴于大量的標(biāo)記數(shù)據(jù),并且在完全未知的環(huán)境中泛化能力仍然有限。

在此基礎(chǔ)上,Kim 等人在同步視覺里程計(jì)、目標(biāo)檢測(cè)和實(shí)例分割(SimVODIS++) 網(wǎng)絡(luò)的基礎(chǔ)上,引入了一種新穎的神經(jīng)語義視覺里程計(jì)架構(gòu),將多任務(wù)學(xué)習(xí)與注意力機(jī)制相結(jié)合,使系統(tǒng)能夠識(shí)別和處理動(dòng)態(tài)場(chǎng)景中的關(guān)鍵目標(biāo)。SimVODIS++ 不僅提高了系統(tǒng)準(zhǔn)確率,還展現(xiàn)了在動(dòng)態(tài)環(huán)境中聚焦顯著區(qū)域的能力,從而在復(fù)雜場(chǎng)景中表現(xiàn)出色。然而,計(jì)算需求的增加使得在資源受限的設(shè)備上部署它變得具有挑戰(zhàn)性。

為了進(jìn)一步優(yōu)化動(dòng)態(tài)場(chǎng)景中的視覺里程計(jì)性能,Shen 等提出了基于學(xué)習(xí)的動(dòng)態(tài)視覺里程計(jì) (DytanVO),該方法聯(lián)合優(yōu)化了攝像機(jī)自運(yùn)動(dòng)和運(yùn)動(dòng)分割,以應(yīng)對(duì)動(dòng)態(tài)物體的干擾。該方法通過優(yōu)化攝像機(jī)運(yùn)動(dòng)與分割結(jié)果之間的相互依賴性,顯著提高了動(dòng)態(tài)環(huán)境下的軌跡估計(jì)精度。盡管訓(xùn)練和優(yōu)化過程需要大量資源,但聯(lián)合優(yōu)化有效地解決了先前研究中動(dòng)態(tài)物體處理能力不足的問題。

為了減少對(duì)標(biāo)記數(shù)據(jù)的依賴,曹等提出了一種集成動(dòng)作的無監(jiān)督視覺里程計(jì) (VO) 用于導(dǎo)航。該系統(tǒng)結(jié)合了路徑積分,減少了對(duì) GPS 等外部定位系統(tǒng)的依賴,從而能夠高效地執(zhí)行室內(nèi)導(dǎo)航任務(wù)。無監(jiān)督方法為視覺里程計(jì)訓(xùn)練提供了新的方向,但其路徑積分方法在長期運(yùn)行過程中容易出現(xiàn)累積誤差,從而可能導(dǎo)致精度下降。

為了進(jìn)一步探索如何降低數(shù)據(jù)需求,Ghafourian 等人提出了一種少樣本學(xué)習(xí)視覺導(dǎo)航系統(tǒng)。該方法使用少量的視覺地標(biāo)樣本來引導(dǎo)導(dǎo)航,即使沒有大量標(biāo)記數(shù)據(jù)也能實(shí)現(xiàn)有效的性能。雖然該方法在降低訓(xùn)練數(shù)據(jù)需求方面表現(xiàn)出色,但其靈活性和對(duì)復(fù)雜場(chǎng)景變化的適應(yīng)性仍需進(jìn)一步改進(jìn)。

Kostusiak 等利用深度學(xué)習(xí)增強(qiáng) RGB-D 視覺里程計(jì) (VO) 中的深度信息,解決了深度傳感器數(shù)據(jù)質(zhì)量低的問題,使低成本傳感器能夠?qū)崿F(xiàn)高精度軌跡估計(jì)。這項(xiàng)工作使得廉價(jià)傳感器應(yīng)用于視覺里程計(jì)成為可能,但仍需進(jìn)一步改進(jìn),以增強(qiáng)系統(tǒng)在深度信息缺失或噪聲情況下的魯棒性。

Prasad 等人提出了基于運(yùn)動(dòng)結(jié)構(gòu)學(xué)習(xí)器 (SfMLearner++),這是一種基于人工智能的室內(nèi)機(jī)器人定位方法。該方法采用深度學(xué)習(xí)進(jìn)行單目深度和自運(yùn)動(dòng)估計(jì),并結(jié)合幾何約束來提高準(zhǔn)確性,使其適用于室內(nèi)環(huán)境。

GANVO和堆疊生成對(duì)抗網(wǎng)絡(luò) (SGANVO)分別利用 GAN 進(jìn)行無監(jiān)督單目深度和六自由度相機(jī)運(yùn)動(dòng)預(yù)測(cè),以此為例展示了這種方法。GANVO 可以有效地處理RGB 圖像序列;然而,由于難以捕捉隨時(shí)間變化的特征,其在動(dòng)態(tài)場(chǎng)景中性能會(huì)下降。SGANVO 通過堆疊 GAN 層來緩解這一限制,從而改進(jìn)了對(duì)時(shí)間動(dòng)態(tài)的捕捉,并提升了在運(yùn)動(dòng)劇烈的環(huán)境中的性能。

最后,Eirale 等人開發(fā)了 Marvin,這是一款模塊化的全向輔助機(jī)器人,旨在在復(fù)雜的家庭環(huán)境中實(shí)現(xiàn)靈活導(dǎo)航。Marvin 集成了輕量級(jí)人工智能算法,并在狹窄空間內(nèi)展現(xiàn)出高效的導(dǎo)航能力。然而,它主要面向家庭應(yīng)用,其對(duì)更復(fù)雜環(huán)境的適應(yīng)性和可擴(kuò)展性需要進(jìn)一步驗(yàn)證。

4.3.3 .基于里程計(jì)的多傳感器融合AMR定位

近年來,基于融合的里程計(jì)取得了重大進(jìn)展,這主要得益于深度學(xué)習(xí)的發(fā)展。這些現(xiàn)代方法采用端到端深度神經(jīng)網(wǎng)絡(luò),無需傳統(tǒng)方法中固有的手工特征提取。因此,它們表現(xiàn)出增強(qiáng)的準(zhǔn)確性和魯棒性,特別是在復(fù)雜環(huán)境中。如圖 8所示,通用多傳感器里程計(jì)框架結(jié)合了來自各種傳感器的數(shù)據(jù),以增強(qiáng)運(yùn)動(dòng)估計(jì)的魯棒性和準(zhǔn)確性。盡管如此,在實(shí)際應(yīng)用中仍然存在某些局限性。為了便于全面理解,我們根據(jù)核心方法和技術(shù)的相似性對(duì)相關(guān)研究進(jìn)行了分類。通過整合和總結(jié)類似的研究,我們系統(tǒng)地闡明了每種方法的缺點(diǎn)和后續(xù)改進(jìn)。

視覺-慣性里程計(jì) (VIO) 融合的最新進(jìn)展利用 GAN 和其他深度學(xué)習(xí)方法來增強(qiáng)深度和自我運(yùn)動(dòng)估計(jì),同時(shí)減少對(duì)標(biāo)記數(shù)據(jù)集的依賴。值得注意的是,SelfVIO將 GAN 與自監(jiān)督學(xué)習(xí)相結(jié)合,無需標(biāo)記數(shù)據(jù)即可進(jìn)行單目 VIO 和深度估計(jì)。盡管 SelfVIO 擁有創(chuàng)新的框架,但在復(fù)雜場(chǎng)景下魯棒性有限,這促使人們探索堆疊GAN 架構(gòu),以在挑戰(zhàn)性條件下提升性能。作為基于 GAN 方法的補(bǔ)充,DeepVIO和魯棒神經(jīng)慣性導(dǎo)航輔助 VIO (RNIN-VIO)等方法結(jié)合了視覺和慣性傳感器數(shù)據(jù),以提高里程計(jì)精度。DeepVIO 利用 CNN 和LSTM網(wǎng)絡(luò)從立體序列中學(xué)習(xí)三維幾何約束;然而,它在低紋理環(huán)境下面臨魯棒性問題。

圖8.基于人工智能的通用多傳感器里程計(jì)框架。

DR = 航位推算。

為了解決這些限制,RNIN-VIO 集成了 IMU 數(shù)據(jù),從而提高了在低紋理和動(dòng)態(tài)環(huán)境中的性能。基于這些進(jìn)步,(ATVIO) 注意力引導(dǎo)的視覺-慣性里程計(jì)引入了一種注意力機(jī)制來改進(jìn)視覺和慣性數(shù)據(jù)的融合過程,有效地克服了傳統(tǒng)融合方法在異構(gòu)環(huán)境中的限制,提高了里程計(jì)的準(zhǔn)確性和可靠性。VIOLearner進(jìn)一步提高了系統(tǒng)魯棒性,它包含一個(gè)在線糾錯(cuò)模塊。雖然這一新增功能增強(qiáng)了魯棒性,但 VIOLearner 在長時(shí)間跟蹤過程中仍然面臨誤差累積的問題,這表明在長期應(yīng)用中需要進(jìn)一步改進(jìn)。

為了應(yīng)對(duì)計(jì)算挑戰(zhàn),CodeVIO采用條件變分自編碼器 (CVAE) 進(jìn)行密集深度推理,并結(jié)合 VIO 系統(tǒng)生成詳細(xì)的深度圖。盡管該方法有效,但需要大量的計(jì)算資源;后續(xù)的輕量級(jí)變體有助于實(shí)現(xiàn)實(shí)時(shí)深度和運(yùn)動(dòng)估計(jì),同時(shí)降低計(jì)算開銷?;趯W(xué)習(xí)的方法的進(jìn)步進(jìn)一步促進(jìn)了該領(lǐng)域的發(fā)展?;趯W(xué)習(xí)的單目 VIO結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò),通過濾波器融合實(shí)現(xiàn)高精度軌跡估計(jì)。該方法最初的特點(diǎn)是訓(xùn)練復(fù)雜度較高,后續(xù)的優(yōu)化簡化了訓(xùn)練過程,從而增強(qiáng)了其在實(shí)際應(yīng)用中的實(shí)用性。

此外,自舉單目視覺輸入輸出 (BooM-VIO)將傳統(tǒng)的視覺輸入輸出尺度估計(jì)與端到端深度學(xué)習(xí)訓(xùn)練相結(jié)合。盡管傳統(tǒng)的尺度信息在惡劣環(huán)境下可能不可靠,但深度學(xué)習(xí)模型對(duì)尺度理解的改進(jìn)顯著提升了 BooM-VIO 在挑戰(zhàn)性條件下的性能。此外,提出了一種基于人工智能的室內(nèi)機(jī)器人定位解決方案,引入了一個(gè)集成卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的無監(jiān)督框架,將單目視覺數(shù)據(jù)與慣性測(cè)量單元 (IMU) 測(cè)量數(shù)據(jù)融合。該方法創(chuàng)新地估計(jì)了深度圖和自運(yùn)動(dòng),同時(shí)解決了誤差累積和數(shù)據(jù)污染等難題,從而有效地增強(qiáng)了室內(nèi)定位能力,而無需依賴標(biāo)記的地面實(shí)況數(shù)據(jù)。

總的來說,這些進(jìn)展凸顯了VIO融合技術(shù)的重大進(jìn)展,每項(xiàng)技術(shù)都通過創(chuàng)新的神經(jīng)網(wǎng)絡(luò)架構(gòu)和數(shù)據(jù)融合策略解決了特定的局限性。未來的研究有望進(jìn)一步增強(qiáng)魯棒性,降低計(jì)算復(fù)雜度,并提高長期跟蹤精度,從而滿足日益復(fù)雜和動(dòng)態(tài)的環(huán)境需求。

在LIO融合下,LO-Net將CNN與自監(jiān)督學(xué)習(xí)相結(jié)合,用于LiDAR姿態(tài)估計(jì),適用于稀疏特征和動(dòng)態(tài)環(huán)境。然而,在稀疏特征場(chǎng)景下,其準(zhǔn)確率仍然會(huì)下降。通過優(yōu)化網(wǎng)絡(luò)架構(gòu),可以更好地捕捉稀疏特征,從而取得了一些改進(jìn)。

為了擴(kuò)展多傳感器融合方法,緊學(xué)習(xí)慣性里程計(jì) (TLIO)采用緊耦合的擴(kuò)展卡爾曼濾波器框架進(jìn)行行人狀態(tài)估計(jì),利用 IMU 數(shù)據(jù)段實(shí)現(xiàn)高效的無攝像頭狀態(tài)估計(jì)。然而,TLIO 對(duì) IMU 數(shù)據(jù)質(zhì)量較為敏感。引入濾波器優(yōu)化策略提高了對(duì)低質(zhì)量 IMU 數(shù)據(jù)的魯棒性。5G/地磁/VIO 融合定位集成了 5G 信號(hào)、地磁信號(hào)和 VIO,實(shí)現(xiàn)高精度室內(nèi)定位。通過結(jié)合反向傳播神經(jīng)網(wǎng)絡(luò) (BPNN) 進(jìn)行非線性數(shù)據(jù)融合,該系統(tǒng)有效地組合了多源信號(hào),解決了異質(zhì)性和非線性難題。此外,優(yōu)化數(shù)據(jù)融合算法顯著增強(qiáng)了實(shí)時(shí)多源數(shù)據(jù)處理能力,提高了定位精度和系統(tǒng)效率。

基于人工智能的進(jìn)化方法在改進(jìn)室內(nèi)定位里程計(jì)方面顯示出巨大的潛力。Arbabmir 等利用多目標(biāo)遺傳算法 (MO-GA) 優(yōu)化VINS 中的濾波器參數(shù)和傳感器校準(zhǔn)。該方法通過最小化位置和速度的 RMSE 來提高軌跡精度和魯棒性,尤其是在動(dòng)態(tài)室內(nèi)和室外環(huán)境中。同樣,Sehgal 等引入了 GA 框架來優(yōu)化 VO 中 LiDAR 和單目攝像機(jī)數(shù)據(jù)融合的參數(shù)設(shè)置。該方法有效地減少了定位誤差,并改善了靜態(tài)室內(nèi)環(huán)境中的軌跡估計(jì)。Palacín 等進(jìn)一步利用 GA 對(duì)里程計(jì)系統(tǒng)中的逆運(yùn)動(dòng)矩陣進(jìn)行非參數(shù)校準(zhǔn),從而顯著提高了定位精度和軌跡估計(jì)。

綜上所述,以上研究凸顯了基于人工智能(AI)的方法(包括進(jìn)化算法、深度學(xué)習(xí)和機(jī)器學(xué)習(xí))在解決里程定位關(guān)鍵挑戰(zhàn)方面的多功能性。這些方法有效地解決了傳感器融合、軌跡優(yōu)化和動(dòng)態(tài)環(huán)境適應(yīng)等問題,顯著提高了里程計(jì)系統(tǒng)的精度和魯棒性。通過不斷改進(jìn),這些方法逐步提高了系統(tǒng)在復(fù)雜動(dòng)態(tài)室內(nèi)環(huán)境中的適應(yīng)性和應(yīng)用潛力。表6全面總結(jié)了基于人工智能的AMR里程計(jì)算法及其相關(guān)細(xì)節(jié)。

5.基于人工智能的無人機(jī)定位

在室內(nèi)定位場(chǎng)景中,無人機(jī)的自主導(dǎo)航尤為重要?;谌斯ぶ悄艿氖覂?nèi)定位為無人機(jī)提供了精確、實(shí)時(shí)的環(huán)境感知和路徑規(guī)劃能力,對(duì)于確保無人機(jī)在密閉空間內(nèi)安全高效地運(yùn)行至關(guān)重要。鑒于室內(nèi)環(huán)境通常具有復(fù)雜的結(jié)構(gòu)和障礙物,傳統(tǒng)的GPS信號(hào)難以穿透,因此室內(nèi)定位是無人機(jī)應(yīng)用中的一項(xiàng)重大技術(shù)挑戰(zhàn)。通過人工智能算法,無人機(jī)可以融合傳感器數(shù)據(jù)實(shí)現(xiàn)自主定位和導(dǎo)航,提高任務(wù)精度并提高在動(dòng)態(tài)環(huán)境中的適應(yīng)性。基于人工智能的無人機(jī)室內(nèi)定位對(duì)于從精準(zhǔn)農(nóng)業(yè)和建筑任務(wù)到室內(nèi)監(jiān)視任務(wù)等各種應(yīng)用領(lǐng)域的任務(wù)完成至關(guān)重要。人工智能的集成使無人機(jī)能夠在不斷變化的環(huán)境中自主運(yùn)行,這標(biāo)志著人工智能成為當(dāng)前無人機(jī)研發(fā)的核心方向。

此外,Aslan 等人提出了雙向長短期記憶(PSO)和基于目標(biāo)距離的快速探索隨機(jī)樹星(BiLSTM-PSO-GDRRT)框架,該框架集成了BiLSTM、PSO 和 GDRRT,以增強(qiáng)無人機(jī)在復(fù)雜三維環(huán)境中的路徑規(guī)劃與定位。該框架利用 GDRRT 改進(jìn)采樣策略以加速路徑收斂,通過 PSO 優(yōu)化路徑以逼近最短軌跡,并利用 BiLSTM 進(jìn)行實(shí)時(shí)路徑預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,該框架顯著提高了動(dòng)態(tài)環(huán)境下的路徑規(guī)劃效率和定位精度,滿足無人機(jī)的實(shí)時(shí)應(yīng)用需求。

以下章節(jié)將回顧各種無人機(jī)室內(nèi)定位技術(shù),包括基于人工智能的方法,例如視覺輸入輸出 (VIO)、深度學(xué)習(xí) (DL) 和強(qiáng)化學(xué)習(xí) (RL)。我們將通過研究這些方法在不同應(yīng)用場(chǎng)景中的創(chuàng)新之處,展示該領(lǐng)域的進(jìn)展。

5.1 .基于里程計(jì)的無人機(jī)定位

基于里程計(jì)的定位是無人機(jī)導(dǎo)航的基礎(chǔ),它利用傳感器數(shù)據(jù)來估算位置和方向隨時(shí)間的變化。基于人工智能的方法顯著推動(dòng)了這一領(lǐng)域的發(fā)展,增強(qiáng)了里程計(jì)在傳統(tǒng)方法難以應(yīng)對(duì)的挑戰(zhàn)性環(huán)境中的能力。這些基于人工智能的方法在缺乏GPS信號(hào)的情況下至關(guān)重要,使無人機(jī)能夠依靠慣性測(cè)量單元(IMU)和攝像頭等機(jī)載傳感器進(jìn)行精確的狀態(tài)估計(jì)。盡管傳統(tǒng)里程計(jì)方法潛力巨大,但在動(dòng)態(tài)或視覺效果較差的環(huán)境中仍面臨挑戰(zhàn),因此需要提高算法的魯棒性和精度。

最近的研究集中于通過基于人工智能的方法增強(qiáng)DR,以改進(jìn)無人機(jī)定位。Bajwa等人提出了集成CNN的深度慣性速度輔助估計(jì)(DIVE)算法。通過直接從IMU測(cè)量值推斷速度來校正EKF狀態(tài)估計(jì),DIVE與傳統(tǒng)DR相比顯著減少了漂移,尤其是在VIO失效的情況下。

類似地,Yang 等提出了學(xué)習(xí)型慣性航位推算 (IDR) 算法,將左不變擴(kuò)展卡爾曼濾波 (EKF) 與統(tǒng)計(jì)神經(jīng)網(wǎng)絡(luò)相結(jié)合,以增強(qiáng)在突發(fā)光照變化下的 DR 性能。在光照充足的條件下,LIDR 的精度與 VIO 相當(dāng),并且在模擬和實(shí)際測(cè)試中優(yōu)于其他基于 IMU 的方法。將 LIDR 與 VIO 相結(jié)合,進(jìn)一步提高了動(dòng)態(tài)光照環(huán)境下的定位魯棒性。

除了這些基于人工智能的DR增強(qiáng)技術(shù)外,基于里程計(jì)的定位方法也得到了廣泛的探索。Aslan等人提出了VIONet系統(tǒng),將高斯過程回歸(GPR)與深度學(xué)習(xí)模型Inception-v3相結(jié)合,將慣性數(shù)據(jù)轉(zhuǎn)換為圖像,并將其與光流(OF)幀融合。Inception-v3高效的特征提取顯著增強(qiáng)了無人機(jī)姿態(tài)估計(jì)的穩(wěn)定性,尤其是在具有挑戰(zhàn)性的環(huán)境中。然而,VIIONet在處理低光或低紋理場(chǎng)景方面存在局限性,并且難以部署在需要更高計(jì)算效率的嵌入式設(shè)備上。

為了解決上述特征提取效率的局限性,Yu 等人開發(fā)了一種更高效的視覺里程計(jì)系統(tǒng),該系統(tǒng)采用輕量級(jí) CNN,包括可變形卷積(DFConv) 和深度可分離卷積(DWConv),顯著提高了特征提取效率和系統(tǒng)在嵌入式平臺(tái)上的適用性。此外,Yu 等人設(shè)計(jì)了有效的卷積網(wǎng)絡(luò),在低光和低紋理的室內(nèi)環(huán)境中取得了優(yōu)異的性能。然而,該方法仍然存在尺度恢復(fù)問題,而尺度恢復(fù)對(duì)于無人機(jī)精確定位尤為重要。

針對(duì)前人研究中尺度恢復(fù)問題,張等人提出了一種自監(jiān)督的VIO方法,利用自注意力機(jī)制和解耦姿態(tài)網(wǎng)絡(luò)(D-PoseNet)增強(qiáng)IMU數(shù)據(jù)處理能力,提高尺度恢復(fù)精度。該方法通過建立IMU與視覺融合姿態(tài)之間的約束關(guān)系,有效解決了傳統(tǒng)方法中尺度信息缺失的問題,使得無人機(jī)在復(fù)雜環(huán)境中實(shí)現(xiàn)更精確的定位。然而,張等人的方法仍然依賴于視覺信息,在完全缺乏視覺數(shù)據(jù)的場(chǎng)景下性能受限。

為了解決上述適應(yīng)性問題,Pan 等提出了自適應(yīng) VIO,將神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)的視覺慣性束調(diào)整相結(jié)合,構(gòu)建了一個(gè)學(xué)習(xí)-優(yōu)化集成框架。該方法引入了在線持續(xù)學(xué)習(xí)機(jī)制,使系統(tǒng)能夠自適應(yīng)地適應(yīng)環(huán)境變化,從而顯著提升了 VIO 系統(tǒng)在不同場(chǎng)景下的泛化能力和定位精度。自適應(yīng) VIO 有效地克服了以往研究中觀察到的適應(yīng)性不足的問題,使無人機(jī)具有更強(qiáng)的動(dòng)態(tài)適應(yīng)性和更強(qiáng)的魯棒性。

總而言之,這些論文展現(xiàn)了一條持續(xù)改進(jìn)的道路,從增強(qiáng)視覺-慣性數(shù)據(jù)融合、提升嵌入式系統(tǒng)效率,到解決規(guī)?;謴?fù)、應(yīng)對(duì)視覺故障場(chǎng)景以及提升系統(tǒng)適應(yīng)性。每一步研究都在前人研究的基礎(chǔ)上解決了新的挑戰(zhàn),使基于人工智能的無人機(jī)視覺輸入輸出系統(tǒng)更加精確、穩(wěn)健和智能。

表7.基于人工智能的無人機(jī)定位方法及相關(guān)細(xì)節(jié)的總結(jié)。

LZ = 定位,NV = 導(dǎo)航,PP = 路徑規(guī)劃,Q = 四旋翼飛行器,Mr = 多旋翼飛行器。

SR = 搜索和救援,IDR = 慣性導(dǎo)航。

5.2基于多傳感器融合的無人機(jī)定位

近年來,基于人工智能的無人機(jī)在室內(nèi)定位和導(dǎo)航方面取得了顯著進(jìn)展。當(dāng)前的研究主要集中于應(yīng)用深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和傳感器融合技術(shù)來應(yīng)對(duì)復(fù)雜環(huán)境中的目標(biāo)識(shí)別、路徑規(guī)劃和避障等挑戰(zhàn)。本節(jié)基于關(guān)鍵研究成果,對(duì)這些基于人工智能的無人機(jī)導(dǎo)航和定位方法進(jìn)行了分類綜述。

深度學(xué)習(xí)方法在各種環(huán)境中都表現(xiàn)出了很高的魯棒性,這使其特別適合于視覺復(fù)雜場(chǎng)景中的目標(biāo)識(shí)別和路徑規(guī)劃。Hsieh 等提出了一種計(jì)算復(fù)雜度較低的視覺導(dǎo)航方法,專為資源受限的無人機(jī)平臺(tái)而設(shè)計(jì)。Kim 等利用閉路電視 (CCTV) 系統(tǒng)結(jié)合深度學(xué)習(xí)實(shí)現(xiàn)了動(dòng)態(tài)人群感知,這在擁擠的室內(nèi)環(huán)境中非常有效。Oh 等利用集成 CNN 的 PTZ 攝像機(jī)進(jìn)行標(biāo)記檢測(cè),顯著降低了室內(nèi)定位的部署成本。同樣,Ekici 等開發(fā)了一種倉庫無人機(jī)系統(tǒng),該系統(tǒng)在標(biāo)記特征上采用自適應(yīng)增強(qiáng)(AdaBoost) 模型,實(shí)現(xiàn)了倉庫環(huán)境中的高精度室內(nèi)定位和庫存跟蹤。

Chhikara 等提出了一種深度卷積神經(jīng)網(wǎng)絡(luò) - 遺傳算法 (DCNN-GA),這是一種將深度卷積神經(jīng)網(wǎng)絡(luò)與遺傳算法相結(jié)合的混合方法,有效增強(qiáng)了室內(nèi)導(dǎo)航和避障能力。Li 等 提出了一種基于深度學(xué)習(xí)的目標(biāo)點(diǎn)定位技術(shù),集成了點(diǎn)云輸電塔分割 (PCTTS) 模型,用于在復(fù)雜結(jié)構(gòu)化環(huán)境中實(shí)現(xiàn)精確的目標(biāo)識(shí)別和分割。PCTTS 利用改進(jìn)的 PointNet 架構(gòu)和偏移注意機(jī)制來增強(qiáng)特征提取和定位精度。Yi 等開發(fā)了 SA-MLP-mixer 模型,這是一種緊湊的MLP架構(gòu),非常適合硬件資源有限的無人機(jī),為室內(nèi)導(dǎo)航提供了有效的解決方案。Yusefi 等采用 LSTM 網(wǎng)絡(luò)和濾波器融合 IMU 傳感器數(shù)據(jù),以實(shí)現(xiàn)高效的姿態(tài)估計(jì),尤其是在快速變化的環(huán)境中。Ollachica 等將深度學(xué)習(xí)與面部識(shí)別和跟蹤相結(jié)合,使無人機(jī)能夠在沒有 GPS 的環(huán)境中實(shí)現(xiàn)自主定位和跟蹤。 Ashour 等人提出了一種利用環(huán)境語義輔助無人機(jī)在未知環(huán)境中進(jìn)行物體探索和建圖的方法。該方法集成了基于深度學(xué)習(xí)的語義分割模型金字塔場(chǎng)景解析網(wǎng)絡(luò) (PSPNet),從二維圖像中提取物體類別和空間信息。這些語義數(shù)據(jù)被投影到三維點(diǎn)云上,顯著提高了室內(nèi)定位和建圖的精度。

雖然這些深度學(xué)習(xí)方法在路徑規(guī)劃和動(dòng)態(tài)避障方面表現(xiàn)良好,但它們通常需要大量計(jì)算資源,并且會(huì)受到不良光照條件的顯著影響。另一方面,強(qiáng)化學(xué)習(xí)方法在管理動(dòng)態(tài)環(huán)境和優(yōu)化導(dǎo)航路徑方面表現(xiàn)出顯著優(yōu)勢(shì)。Singla 等提出了一種基于記憶的深度強(qiáng)化學(xué)習(xí)方法,通過捕捉和回憶復(fù)雜的環(huán)境細(xì)節(jié)來提高無人機(jī)避障能力,增強(qiáng)其在復(fù)雜環(huán)境中的操作可靠性。Lin 等應(yīng)用強(qiáng)化學(xué)習(xí)開發(fā)了一個(gè)基于無人機(jī)的倉庫系統(tǒng),該系統(tǒng)通過優(yōu)化路徑規(guī)劃有效地管理庫存。Walker 等集成了馬爾可夫決策過程(MDP) 和部分可觀測(cè)馬爾可夫決策過程(POMDP) 模型,實(shí)現(xiàn)了魯棒的路徑規(guī)劃和避障,解決了復(fù)雜室內(nèi)環(huán)境中固有的不確定性。

這些強(qiáng)化學(xué)習(xí)方法使無人機(jī)能夠在動(dòng)態(tài)環(huán)境中自主學(xué)習(xí)和執(zhí)行最佳導(dǎo)航策略,盡管它們?cè)谟?xùn)練時(shí)間和計(jì)算要求方面有相當(dāng)大的需求。多傳感器融合技術(shù)集成了來自不同傳感器的數(shù)據(jù),以增強(qiáng)無人機(jī)在挑戰(zhàn)性環(huán)境中的魯棒性和適應(yīng)性。Kao 等提出了 VIUNet,它結(jié)合了視覺、慣性和 UWB 傳感器,可提供魯棒的室內(nèi)定位,從而減輕了單傳感器方法固有的局限性。該框架集成了基于 CNN 的光流估計(jì)模型光流網(wǎng)絡(luò)簡單 (FlowNetS) ,以增強(qiáng)視覺特征提取并提高定位精度。Bigazzi 等利用多層架構(gòu)融合異構(gòu)傳感器數(shù)據(jù),增強(qiáng)了自主導(dǎo)航的魯棒性。Iaboni 等開發(fā)了一個(gè)事件驅(qū)動(dòng)的多無人機(jī)系統(tǒng),結(jié)合YOLOv5進(jìn)行檢測(cè),在復(fù)雜的動(dòng)態(tài)環(huán)境中提供了高效的多無人機(jī)跟蹤能力。

此外,Brommer 等人 提出了 INSANE 數(shù)據(jù)集,這是一個(gè)大規(guī)模多傳感器數(shù)據(jù)集,支持無人機(jī)在不同環(huán)境中的定位,包括具有挑戰(zhàn)性的室內(nèi)外過渡和火星模擬地形。該數(shù)據(jù)集促進(jìn)了基于人工智能的定位算法的開發(fā),集成了 PointNet,可實(shí)現(xiàn)精確的 3D 點(diǎn)云特征提取和環(huán)境理解。雖然這些技術(shù)可以實(shí)現(xiàn)高精度的姿態(tài)估計(jì),但它們需要精確的傳感器校準(zhǔn),并且涉及復(fù)雜的部署過程。

信號(hào)強(qiáng)度和基于Wi-Fi的定位方法在未知或動(dòng)態(tài)變化的環(huán)境中表現(xiàn)出良好的性能,因此特別適用于搜索和救援行動(dòng)。Chowdhury等采用了基于RSS的Q學(xué)習(xí)技術(shù)進(jìn)行無人機(jī)定位,無需事先了解環(huán)境知識(shí),因此非常適合搜索和救援任務(wù)。

綜上所述,利用深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和傳感器融合技術(shù)的無人機(jī)定位與導(dǎo)航研究,逐步提升了無人機(jī)系統(tǒng)的智能化、自主性和適應(yīng)性。通過組合和優(yōu)化不同的技術(shù),這些研究為室內(nèi)無人機(jī)導(dǎo)航與定位提供了多樣化且有效的解決方案,為未來的智能搜索、環(huán)境感知和復(fù)雜任務(wù)的執(zhí)行奠定了重要基礎(chǔ)。表7總結(jié)了基于人工智能的無人機(jī)定位方法及相關(guān)細(xì)節(jié)。

6.出版物分析與討論

人工智能定位技術(shù)的快速發(fā)展催生了越來越多的文獻(xiàn),涵蓋了為應(yīng)對(duì)室內(nèi)環(huán)境挑戰(zhàn)而開發(fā)的各種方法、人工智能模型和傳感器技術(shù)。為了系統(tǒng)地分析該領(lǐng)域的研究趨勢(shì)和重點(diǎn)領(lǐng)域,我們考察了三個(gè)關(guān)鍵維度的出版物分布:定位方法、人工智能模型類型和傳感器使用情況。本分析全面概述了地面AMR和無人機(jī)定位技術(shù)進(jìn)步背后的技術(shù)進(jìn)步。

圖 9、圖 10、圖 11共同展示了基于 AI 的定位研究的主要趨勢(shì)。這些圖分別突出顯示了出版物在定位方法、AI 模型類型和傳感器使用方面的分布。它們共同提供了該領(lǐng)域的技術(shù)進(jìn)步和研究重點(diǎn)的全面概述,強(qiáng)調(diào)了基于 SLAM 的方法、深度學(xué)習(xí)模型和多傳感器融合在提升地面 AMR 和無人機(jī)定位能力方面的關(guān)鍵作用。

圖 9展示了地面 AMR 和無人機(jī)定位方法的出版物分布情況。對(duì)于地面 AMR,“基于 SLAM”的方法占主導(dǎo)地位,反映了它們?cè)谑箼C(jī)器人能夠在動(dòng)態(tài)室內(nèi)環(huán)境中同時(shí)進(jìn)行地圖繪制和定位方面發(fā)揮著基礎(chǔ)性作用?!盁o里程計(jì)和 SLAM”和“基于里程計(jì)”的方法也顯示出顯著的出版物數(shù)量,凸顯了正在進(jìn)行的替代或補(bǔ)充方法的研究。對(duì)于無人機(jī),“多傳感器融合”方法占主導(dǎo)地位,解決了空中導(dǎo)航的獨(dú)特挑戰(zhàn),其中傳感器集成對(duì)于在復(fù)雜的室內(nèi)空間中實(shí)現(xiàn)可靠定位至關(guān)重要。

圖 10突出顯示了用于定位研究的 AI 模型類型的出版物分布情況。“深度學(xué)習(xí) (DL)”模型的出版物數(shù)量最多,凸顯了其在提取復(fù)雜特征、環(huán)境理解和自適應(yīng)學(xué)習(xí)方面的適應(yīng)性和有效性?!皺C(jī)器學(xué)習(xí) (ML)”也占有重要地位,尤其是在基于視覺的定位任務(wù)中,其中空間感知至關(guān)重要。雖然“視覺模型 (EM)”和“學(xué)習(xí)模型 (TL)”的代表性較低,但它們對(duì)于高效訓(xùn)練流程和利用預(yù)訓(xùn)練模型等專業(yè)應(yīng)用仍然至關(guān)重要。這些貢獻(xiàn)共同證明了 AI 模型在解決室內(nèi)定位復(fù)雜性方面日益占據(jù)主導(dǎo)地位。

圖 11側(cè)重于傳感器級(jí)分析,強(qiáng)調(diào)了“多傳感器融合”在已綜述的出版物中的主導(dǎo)地位。這反映出人們?cè)絹碓揭蕾囉谌诤蟻碜圆煌瑐鞲衅鞯臄?shù)據(jù)來增強(qiáng)定位的魯棒性和準(zhǔn)確性。基于“攝像頭”的方法也占據(jù)了相當(dāng)大的份額,它們利用基于視覺的方法的能力來實(shí)現(xiàn)精確的空間理解。同時(shí),“激光雷達(dá)”和“慣性測(cè)量單元”的使用率適中,表明它們?cè)谶\(yùn)動(dòng)跟蹤和空間數(shù)據(jù)采集方面發(fā)揮著重要作用?!肮鈧鞲衅鳌焙汀熬幋a器”的數(shù)量較少,表明它們具有專門或有限的應(yīng)用,通常用于補(bǔ)充更廣泛的多傳感器系統(tǒng)。

圖9.AMR和UAV定位方法的出版物。

圖 10.按AI 模型類型劃分的出版物數(shù)量。

圖 11.按傳感器類型劃分的出版物數(shù)量。

總而言之,以上三幅圖共同揭示了基于 SLAM 的方法、深度學(xué)習(xí)模型和多傳感器融合在推進(jìn) AI 定位方面的關(guān)鍵貢獻(xiàn)。這些趨勢(shì)凸顯了研究界致力于開發(fā)穩(wěn)健且適應(yīng)性強(qiáng)的解決方案,以應(yīng)對(duì)地面 AMR 和無人機(jī)在動(dòng)態(tài)復(fù)雜室內(nèi)環(huán)境中面臨的挑戰(zhàn)。

7.基于AI的AMR定位實(shí)時(shí)性能評(píng)估

隨著深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和傳感器融合方法的快速發(fā)展,基于人工智能的室內(nèi)機(jī)器人定位在實(shí)時(shí)性能方面取得了顯著進(jìn)步。這些先進(jìn)技術(shù)能夠?qū)崟r(shí)處理來自各種傳感器(包括Wi-Fi、藍(lán)牙、UWB、攝像頭和IMU)的數(shù)據(jù),從而實(shí)現(xiàn)高精度定位。然而,實(shí)現(xiàn)高實(shí)時(shí)性能仍然面臨諸多挑戰(zhàn),例如計(jì)算復(fù)雜度、數(shù)據(jù)處理速度以及環(huán)境的動(dòng)態(tài)特性。

7.1人工智能模型的計(jì)算復(fù)雜性

基于人工智能模型定位的實(shí)時(shí)性很大程度上取決于其計(jì)算復(fù)雜度。盡管深度學(xué)習(xí)模型具有強(qiáng)大的特征提取能力,但其高計(jì)算復(fù)雜度往往導(dǎo)致處理延遲,尤其是在資源受限的嵌入式系統(tǒng)中。為了解決這個(gè)問題,人們提出了各種優(yōu)化方法,包括模型壓縮、剪枝和量化,以降低模型復(fù)雜度和計(jì)算要求。此外, MobileNet和SqueezeNet等輕量級(jí)網(wǎng)絡(luò)架構(gòu)已廣泛應(yīng)用于嵌入式設(shè)備,在保持高精度的同時(shí),顯著降低了計(jì)算資源消耗。例如,一項(xiàng)研究將MobileNet部署在機(jī)器人上,實(shí)現(xiàn)了實(shí)時(shí)圖像處理,顯著提高了導(dǎo)航效率。

7.2 .硬件限制

硬件性能是影響基于人工智能的AMR定位方法實(shí)時(shí)性的關(guān)鍵因素。高性能硬件可以加速算法執(zhí)行,提高能效,并支持更復(fù)雜的實(shí)時(shí)計(jì)算任務(wù)。為了優(yōu)化實(shí)時(shí)性能,NVIDIA Jetson系列、Google Edge TPU和AMD的Kria KV260等專用人工智能加速芯片已在AMR中得到廣泛應(yīng)用。

表 8展示了使用常見深度學(xué)習(xí)模型(包括 ResNet-50、YOLO 和MobileNetV2)的各種硬件平臺(tái)的性能。該表涵蓋了處理速度、功耗、工作溫度和效率等指標(biāo),深入了解了不同硬件配置如何影響實(shí)時(shí)定位任務(wù)。

不同的硬件平臺(tái)在處理速度、功耗和工作溫度方面各有優(yōu)缺點(diǎn)。像 RTX 3060 這樣的高性能GPU擁有卓越的處理能力,非常適合對(duì)實(shí)時(shí)性要求嚴(yán)格的應(yīng)用。然而,它們較高的功耗和散熱需求可能會(huì)限制其在能源受限環(huán)境中的使用。相比之下,Edge TPU 和 Jetson Nano 在能效方面表現(xiàn)出色,非常適合電池供電的 AMR 應(yīng)用,而 Kria KV260 則在性能和熱穩(wěn)定性之間實(shí)現(xiàn)了良好的平衡。

綜上所述,選擇合適的硬件平臺(tái)需要仔細(xì)考慮具體的定位算法需求和部署環(huán)境,并權(quán)衡處理速度、功耗、溫度管理等因素,以確保基于AI的定位方法在實(shí)際應(yīng)用中達(dá)到最佳的實(shí)時(shí)性能。

表8.不同硬件平臺(tái)的性能比較。

硬件平臺(tái)模型處理速度(FPS)功耗(瓦)工作溫度功效
杰森納米ResNet-50十三9/1.9最高 109 °C(GPU:93 °C)緩和
空單元格YOLO十三9/1.9不受調(diào)節(jié)的熱量緩和
空單元格MobileNetV2158/2高溫緩和
克里婭 KV260ResNet-503310.7/5.5測(cè)試中最酷的高的
空單元格YOLO3310.7/5.5穩(wěn)定的高的
空單元格MobileNetV2三十五10.3/6穩(wěn)定的高的
RTX 3060ResNet-5024045/10穩(wěn)定的最好的
空單元格YOLO24045/10穩(wěn)定的最好的
空單元格MobileNetV228046/12穩(wěn)定的出色的
Edge TPUResNet-50不適用不適用不適用不適用
空單元格YOLO82穩(wěn)定的緩和
空單元格MobileNetV24002穩(wěn)定的出色的

7.3 .延遲和吞吐量

系統(tǒng)延遲和吞吐量直接影響機(jī)器人在動(dòng)態(tài)環(huán)境中的響應(yīng)能力和導(dǎo)航精度。高延遲可能導(dǎo)致機(jī)器人無法及時(shí)響應(yīng)環(huán)境變化,從而影響避障和路徑規(guī)劃的準(zhǔn)確性。為了平衡精度和實(shí)時(shí)性,引入了邊緣計(jì)算和霧計(jì)算等分布式計(jì)算架構(gòu)。邊緣計(jì)算將計(jì)算資源和數(shù)據(jù)存儲(chǔ)靠近最終用戶或基站,支持在傳感器處進(jìn)行數(shù)據(jù)處理并實(shí)現(xiàn)實(shí)時(shí)響應(yīng)定位,從而在加速數(shù)據(jù)處理的同時(shí)增強(qiáng)系統(tǒng)的實(shí)時(shí)輸出。霧計(jì)算在傳感設(shè)備和云之間增加了一層用于數(shù)據(jù)預(yù)處理、處理和分析,提供更好的計(jì)算性能和數(shù)據(jù)管理能力。例如,一項(xiàng)研究提出了一種基于深度強(qiáng)化學(xué)習(xí)的物聯(lián)網(wǎng)應(yīng)用程序調(diào)度算法(DRLIS),以自適應(yīng)、有效地優(yōu)化異構(gòu)物聯(lián)網(wǎng)應(yīng)用程序的響應(yīng)時(shí)間,同時(shí)平衡邊緣和霧服務(wù)器上的負(fù)載。

實(shí)際應(yīng)用案例展現(xiàn)了不同技術(shù)在實(shí)時(shí)性方面的優(yōu)缺點(diǎn)。例如,利用FPGA進(jìn)行神經(jīng)網(wǎng)絡(luò)加速的研究顯著提高了處理速度,滿足了復(fù)雜環(huán)境下的實(shí)時(shí)定位要求。另一項(xiàng)研究通過在機(jī)器人上部署輕量級(jí)網(wǎng)絡(luò)MobileNet實(shí)現(xiàn)了實(shí)時(shí)圖像處理,提高了機(jī)器人在動(dòng)態(tài)環(huán)境下的導(dǎo)航效率。此外,基于邊緣計(jì)算和霧計(jì)算架構(gòu)的系統(tǒng)在多傳感器數(shù)據(jù)融合和實(shí)時(shí)響應(yīng)方面表現(xiàn)出色,顯著增強(qiáng)了機(jī)器人在復(fù)雜環(huán)境下的自主導(dǎo)航能力。

8.基于AI的定位方法與傳統(tǒng)定位方法的比較

在AMR室內(nèi)定位中,基于AI的方法和傳統(tǒng)的非AI方法各有優(yōu)缺點(diǎn)。

傳統(tǒng)方法包括基于 RSSI 的指紋定位,它根據(jù)來自不同接入點(diǎn)的信號(hào)強(qiáng)度確定位置,以及基于 CSI 的定位,其中信道狀態(tài)信息 (CSI通過捕獲詳細(xì)的信道特性提供比 RSSI 更豐富的數(shù)據(jù),從而提高定位精度。

基于距離和角度的定位方法也很常用,例如三邊測(cè)量(根據(jù)信號(hào)傳輸時(shí)間或到達(dá)時(shí)間差計(jì)算位置)和三角測(cè)量(根據(jù)與已知參考點(diǎn)的角度確定位置)。

此外,基于幾何的定位涉及使用帶有卡爾曼濾波或粒子濾波的傳感器數(shù)據(jù),其特點(diǎn)是簡單、能耗低、實(shí)時(shí)性好,適用于資源受限的環(huán)境。

然而這些傳統(tǒng)方法在復(fù)雜、動(dòng)態(tài)變化的環(huán)境中往往表現(xiàn)出較低的定位精度和魯棒性,并且容易受到信號(hào)干擾和環(huán)境變化的影響。

為了更清楚地說明基于AI的方法與傳統(tǒng)方法之間的差異,設(shè)計(jì)了如下的對(duì)比表(表9)。下面討論每種方法的詳細(xì)評(píng)估標(biāo)準(zhǔn)。

表9.基于AI的方法與傳統(tǒng)方法的比較。

評(píng)估標(biāo)準(zhǔn)基于人工智能的方法傳統(tǒng)方法
準(zhǔn)確性在復(fù)雜環(huán)境中表現(xiàn)優(yōu)異中等,依賴于環(huán)境
即時(shí)的需要高性能硬件低硬件要求
復(fù)雜高的低級(jí)、簡單的算法
能源使用高,依賴于硬件低的
魯棒性強(qiáng)大,適應(yīng)變化虛弱,對(duì)變化敏感
成本需要高端專用硬件低的
維護(hù)復(fù)雜、持續(xù)的訓(xùn)練簡單、易于維護(hù)
可擴(kuò)展性隨著復(fù)雜性的增加,擴(kuò)展性更好在有限的硬件上更容易擴(kuò)展

8.1準(zhǔn)確性

基于人工智能的方法實(shí)現(xiàn)了顯著更高的精度,這使其特別適合在動(dòng)態(tài)和混亂環(huán)境中運(yùn)行的室內(nèi) AMR。它們能夠從大型數(shù)據(jù)集中學(xué)習(xí)復(fù)雜的模式,即使在具有挑戰(zhàn)性的室內(nèi)場(chǎng)景中也能實(shí)現(xiàn)精確定位。例如,基于 CNN 的模型在受控環(huán)境中可以實(shí)現(xiàn)低至 0.2 米的定位誤差,而傳統(tǒng)方法在類似條件下的定位誤差通常會(huì)超過 1 米。這種精度優(yōu)勢(shì)在物體密集的倉庫或信號(hào)干擾嚴(yán)重的區(qū)域等環(huán)境中尤為明顯,而傳統(tǒng)的基于幾何的方法在這些環(huán)境中經(jīng)常失效。此外,人工智能模型可以利用端到端學(xué)習(xí)同時(shí)優(yōu)化特征提取和決策,減少通常會(huì)影響傳統(tǒng)分步過程的錯(cuò)誤累積。然而,在簡單、靜態(tài)的室內(nèi)環(huán)境中,傳統(tǒng)方法可以在沒有計(jì)算開銷的情況下實(shí)現(xiàn)相當(dāng)?shù)木取?/p>

8.2 .實(shí)時(shí)性能

由于深度學(xué)習(xí)模型的計(jì)算需求,基于人工智能的方法還需要高性能硬件(如GPU或 TPU)來實(shí)時(shí)處理數(shù)據(jù)。例如,用于實(shí)時(shí)定位的 ResNet-50 架構(gòu)可能需要超過 4 GFLOPS。盡管有這樣的硬件要求,基于人工智能的方法在實(shí)時(shí)處理大規(guī)模、高維傳感器數(shù)據(jù)(如激光雷達(dá)點(diǎn)云或高分辨率相機(jī)圖像)方面表現(xiàn)出色。對(duì)于自動(dòng)倉庫導(dǎo)航或機(jī)器人路徑規(guī)劃等應(yīng)用,這種能力是必不可少的。傳統(tǒng)方法雖然能夠以較低的硬件要求(如 CPU)實(shí)現(xiàn)實(shí)時(shí)性能,但在動(dòng)態(tài)和嘈雜的環(huán)境中往往難以保持相同的精度和魯棒性。然而,在簡單靜態(tài)的室內(nèi)環(huán)境中,傳統(tǒng)方法可以在沒有計(jì)算開銷的情況下實(shí)現(xiàn)相當(dāng)?shù)木取?/p>

8.3 .復(fù)雜性

人工智能方法的復(fù)雜性源于其深層架構(gòu),通常涉及數(shù)百萬個(gè)參數(shù)。一個(gè)典型的用于定位的最先進(jìn)的 CNN 可能擁有超過 5000 萬個(gè)可訓(xùn)練參數(shù),而像 Transformers 這樣的高級(jí)模型則可能超過數(shù)億個(gè)。這種復(fù)雜性使這些模型能夠捕捉傳感器數(shù)據(jù)中復(fù)雜的空間和時(shí)間關(guān)系,這對(duì)于精確定位至關(guān)重要。雖然傳統(tǒng)方法算法更簡單、參數(shù)更少,更容易實(shí)現(xiàn)和調(diào)試,但它們?nèi)狈m應(yīng)不同環(huán)境或數(shù)據(jù)源的靈活性,這使得它們?cè)趯?shí)際應(yīng)用中的通用性較差。

8.4 .能源使用情況

由于訓(xùn)練和推理的計(jì)算強(qiáng)度,基于人工智能的方法能耗顯著增加。例如,訓(xùn)練深度學(xué)習(xí)模型(如 CNN 或 RNN)可能消耗數(shù)十到數(shù)百千瓦時(shí)(kWh)的電能,具體取決于模型復(fù)雜度和數(shù)據(jù)集大小。這一挑戰(zhàn)在模型訓(xùn)練過程中尤為明顯,因?yàn)榇笠?guī)模數(shù)據(jù)集和多次訓(xùn)練周期需要大量的計(jì)算資源。在推理過程中,人工智能模型還需要 GPU 或?qū)S糜布@比傳統(tǒng)的基于 CPU 的方法消耗更多電能。然而,硬件效率的提升(例如能耗優(yōu)化的 GPU 和邊緣人工智能設(shè)備)正在逐步緩解這一問題。在室內(nèi)自主移動(dòng)學(xué)習(xí) (AMR) 領(lǐng)域,實(shí)時(shí)處理和自適應(yīng)性至關(guān)重要,因此必須在能耗需求與顯著的性能優(yōu)勢(shì)之間取得平衡。相比之下,傳統(tǒng)方法輕量級(jí)且計(jì)算要求較低,因此能耗效率更高,非常適合資源受限的場(chǎng)景。

8.5 .魯棒性

基于人工智能的方法表現(xiàn)出卓越的魯棒性,非常適合室內(nèi) AMR 定位。通過利用遷移學(xué)習(xí)或微調(diào),預(yù)先訓(xùn)練的深度學(xué)習(xí)模型可以適應(yīng)新的室內(nèi)環(huán)境,例如辦公空間、倉庫或購物中心,即使在傳感器噪聲或環(huán)境變化等具有挑戰(zhàn)性的條件下也能保持一致的性能和可靠性。這種適應(yīng)性使機(jī)器人能夠在動(dòng)態(tài)和混亂的室內(nèi)環(huán)境中始終如一地工作,而傳統(tǒng)方法通常需要進(jìn)行大量的手動(dòng)重新配置。此外,基于人工智能的方法可以集成多模態(tài)傳感器數(shù)據(jù),例如攝像頭、激光雷達(dá)、UWB 和 IMU 輸入,從而增強(qiáng)對(duì)傳感器故障或噪聲的魯棒性。這種多模態(tài)融合能力即使在復(fù)雜的真實(shí)室內(nèi)環(huán)境中也能確??煽康亩ㄎ缓蛯?dǎo)航。

8.6 .成本

由于需要專用硬件(例如 GPU)、大量數(shù)據(jù)收集和頻繁重新訓(xùn)練,基于 AI 的室內(nèi) AMR 方法的實(shí)施成本通常較高。例如,使用云端 GPU 訓(xùn)練深度學(xué)習(xí)模型來處理定位和導(dǎo)航等任務(wù)可能要花費(fèi)數(shù)百美元。然而,這項(xiàng)前期投資通??梢酝ㄟ^長期效益來證明,例如減少對(duì)手動(dòng)重新校準(zhǔn)的依賴,增強(qiáng)對(duì)動(dòng)態(tài)室內(nèi)環(huán)境的適應(yīng)性,以及在倉庫、購物中心和辦公空間等不同環(huán)境中更高的可擴(kuò)展性。相比之下,傳統(tǒng)方法對(duì)于小規(guī)模或靜態(tài)室內(nèi)應(yīng)用更具成本效益,但它們需要頻繁的人工干預(yù),并且缺乏應(yīng)對(duì)復(fù)雜多變場(chǎng)景所需的靈活性。

8.7 .維護(hù)

基于人工智能的室內(nèi)AMR方法需要持續(xù)維護(hù),包括定期更新模型、數(shù)據(jù)管道以及檢查與不斷發(fā)展的硬件的兼容性。例如,已部署的用于定位和導(dǎo)航的神經(jīng)網(wǎng)絡(luò)可能需要頻繁更新,以適應(yīng)室內(nèi)環(huán)境的變化,例如家具的重新布置、動(dòng)態(tài)障礙物或新傳感器類型的添加。這種復(fù)雜性與人工智能模型的適應(yīng)性相平衡,人工智能模型可以根據(jù)更新后的數(shù)據(jù)集進(jìn)行重新訓(xùn)練,從而在不斷變化的室內(nèi)場(chǎng)景中保持穩(wěn)健的性能。相比之下,傳統(tǒng)方法雖然更簡單、更易于維護(hù),但缺乏處理此類變化的靈活性,并且在動(dòng)態(tài)室內(nèi)環(huán)境中面臨新挑戰(zhàn)時(shí),通常需要徹底重新設(shè)計(jì)。

8.8 .可擴(kuò)展性

隨著數(shù)據(jù)和環(huán)境復(fù)雜性的增加,基于人工智能的方法能夠有效擴(kuò)展,這使其特別適合室內(nèi) AMR 定位。通過利用龐大而多樣化的數(shù)據(jù)集,這些方法可以在動(dòng)態(tài)室內(nèi)環(huán)境中學(xué)習(xí)復(fù)雜的空間和時(shí)間模式。例如,隨著更豐富的空間和語義數(shù)據(jù)的可用性增加,基于圖的神經(jīng)網(wǎng)絡(luò)通過提高定位精度展示了其可擴(kuò)展性。這些數(shù)據(jù)(包括詳細(xì)的房間布局或動(dòng)態(tài)物體分布)使這些模型能夠?qū)W習(xí)和適應(yīng)更復(fù)雜的室內(nèi)環(huán)境,從而有效地處理更大的數(shù)據(jù)集和更高維的信息。在智能工廠、大型倉庫或多層辦公樓等應(yīng)用中,這種可擴(kuò)展性對(duì)于管理高密度數(shù)據(jù)和滿足多樣化的定位要求至關(guān)重要。相比之下,傳統(tǒng)方法難以推廣和擴(kuò)展,尤其是在高維或大規(guī)模室內(nèi)環(huán)境中,這限制了它們?cè)诂F(xiàn)代機(jī)器人應(yīng)用中的有效性。

盡管存在一些弊端,例如更高的復(fù)雜性、能耗和實(shí)施成本,但基于人工智能的方法憑借其在處理復(fù)雜動(dòng)態(tài)環(huán)境方面無與倫比的優(yōu)勢(shì),仍然是室內(nèi)定位的首選。它們?cè)趥鹘y(tǒng)方法常常失效的地方表現(xiàn)出色,能夠從多傳感器數(shù)據(jù)中提取分層特征,并通過再訓(xùn)練和微調(diào)適應(yīng)各種場(chǎng)景?;谌斯ぶ悄艿姆椒ㄟ€能通過從額外數(shù)據(jù)中學(xué)習(xí)來持續(xù)提升性能,即使在存在動(dòng)態(tài)障礙物或遮擋的復(fù)雜條件下也能實(shí)現(xiàn)穩(wěn)健的定位。此外,其可擴(kuò)展性確保了其在大規(guī)模和高維環(huán)境中的有效運(yùn)行,而這些環(huán)境在現(xiàn)代應(yīng)用中越來越常見。隨著時(shí)間的推移,雖然硬件和模型開發(fā)的前期投資較高,但基于人工智能的方法通過減少手動(dòng)重新校準(zhǔn)和維護(hù)的需求,證明了其在長期部署中更為高效。這些特性使得基于人工智能的方法對(duì)于在室內(nèi)定位任務(wù)中需要高精度、穩(wěn)健性和可擴(kuò)展性的應(yīng)用而言不可或缺。

9.未解決的問題和未來展望

通過對(duì)基于AI的AMR室內(nèi)定位方法的廣泛文獻(xiàn)綜述,我們認(rèn)識(shí)到該領(lǐng)域涵蓋了廣泛的問題和已提出的解決方案。與該主題相關(guān)的主要挑戰(zhàn)和未解決的問題如下。

9.1 .未解決的問題

一個(gè)尚未解決的重要問題是,許多基于人工智能的模型需要大量的數(shù)據(jù)才能達(dá)到令人滿意的性能。獲取大量有價(jià)值的數(shù)據(jù)進(jìn)行模型訓(xùn)練通常是一項(xiàng)艱巨的任務(wù)。開發(fā)能夠從有限或未標(biāo)記的數(shù)據(jù)中學(xué)習(xí)的高效算法仍然是一個(gè)懸而未決的研究課題。

另一個(gè)關(guān)鍵挑戰(zhàn)是確保移動(dòng)機(jī)器人的穩(wěn)健性和可靠性,因?yàn)檫@些方面對(duì)于在不同環(huán)境中的可靠運(yùn)行越來越重要 。盡管機(jī)器人技術(shù)和人工智能取得了重大進(jìn)步,但確保自主系統(tǒng)(尤其是那些采用自學(xué)習(xí)算法的系統(tǒng))的安全性和可靠性至關(guān)重要,尤其是在涉及人機(jī)交互的場(chǎng)景中。開發(fā)通用的AMR異常檢測(cè)系統(tǒng)有助于比較和集成各種異常檢測(cè)技術(shù),從而促進(jìn)更安全、更可靠的自主系統(tǒng)。

此外,我們的綜述強(qiáng)調(diào)了探索特定人工智能方法與其對(duì)應(yīng)的移動(dòng)機(jī)器人任務(wù)之間關(guān)系的必要性。例如,雖然深度學(xué)習(xí)方法經(jīng)常應(yīng)用于移動(dòng)機(jī)器人路徑規(guī)劃,但在各種方法中確定最優(yōu)方法仍然是一個(gè)懸而未決的問題。

神經(jīng)機(jī)器人技術(shù)是一個(gè)新興的研究領(lǐng)域,它將生物學(xué)原理應(yīng)用于機(jī)器人系統(tǒng)。受神經(jīng)行為學(xué)(研究自然動(dòng)物行為的神經(jīng)基礎(chǔ))的啟發(fā),研究人員正在探索神經(jīng)網(wǎng)絡(luò)擾動(dòng)對(duì)機(jī)器人行為的影響,力求提高機(jī)器人系統(tǒng)的性能和適應(yīng)性。

9.2 .挑戰(zhàn)

將復(fù)雜的人工智能方法與移動(dòng)機(jī)器人機(jī)載控制系統(tǒng)有限的計(jì)算資源相結(jié)合,是一項(xiàng)巨大的挑戰(zhàn)。讓移動(dòng)機(jī)器人能夠使用基于人工智能的方法進(jìn)行實(shí)時(shí)決策和運(yùn)動(dòng)控制也極具挑戰(zhàn)性。此外,增強(qiáng)算法對(duì)動(dòng)態(tài)變化環(huán)境的適應(yīng)性仍然是一項(xiàng)尤為艱巨的挑戰(zhàn)。

處理動(dòng)態(tài)物體和環(huán)境是移動(dòng)機(jī)器人面臨的主要挑戰(zhàn)之一。大多數(shù)研究未能充分考慮動(dòng)態(tài)障礙物和環(huán)境。移動(dòng)機(jī)器人要適應(yīng)環(huán)境變化,需要有效地繞過動(dòng)態(tài)障礙物。

移動(dòng)機(jī)器人的功耗、分配和管理是經(jīng)常被忽視的關(guān)鍵因素。同樣,針對(duì)功耗和性能的算法優(yōu)化在移動(dòng)機(jī)器人研究中也很少得到重視。解決這些挑戰(zhàn)對(duì)于延長機(jī)器人運(yùn)行時(shí)間和提高整體效率至關(guān)重要。

設(shè)計(jì)新的、可擴(kuò)展的方法,有效地訓(xùn)練協(xié)作機(jī)器人執(zhí)行各種任務(wù),也是一個(gè)緊迫的挑戰(zhàn)。例如,無人機(jī)與地面機(jī)器人之間的協(xié)作可以增強(qiáng)機(jī)器人的適應(yīng)性,并擴(kuò)展其能力。

隱私問題是設(shè)計(jì)機(jī)器人輔助系統(tǒng)時(shí)面臨的另一個(gè)重大挑戰(zhàn)。機(jī)器人監(jiān)視人類可能會(huì)引發(fā)影響人類行為的隱私問題;通過直接觀察個(gè)人并增加獲取個(gè)人信息的渠道,它們可能會(huì)危及隱私。AMR還面臨物理攻擊(例如,傳感器干擾)和數(shù)字攻擊(例如,篡改導(dǎo)航和控制系統(tǒng))。此類攻擊可能導(dǎo)致系統(tǒng)誤解環(huán)境,對(duì)路徑規(guī)劃和控制產(chǎn)生不利影響,例如,導(dǎo)致機(jī)器人走錯(cuò)誤的路徑或使其在緊急情況下無法停止。此外,在AI模型訓(xùn)練和推理階段遭受攻擊可能導(dǎo)致數(shù)據(jù)泄露和模型誤導(dǎo)等隱患。降低安全風(fēng)險(xiǎn)和加強(qiáng)數(shù)據(jù)保護(hù)是AI機(jī)器人未來面臨的關(guān)鍵挑戰(zhàn)。

我們預(yù)見,未來的研究將側(cè)重于確保值得信賴的人工智能機(jī)器人系統(tǒng)能夠抵御各種攻擊場(chǎng)景,遵守其部署領(lǐng)域的倫理和法律原則,并確保與這些系統(tǒng)的交互保持私密。為了在推理攻擊期間保護(hù)隱私,未來的機(jī)器人應(yīng)用中可以實(shí)施各種安全策略??梢钥紤]諸如差異隱私和數(shù)據(jù)混淆等概念。

10.結(jié)論

本文全面回顧了過去五年基于人工智能的AMR定位方法的文獻(xiàn)。我們系統(tǒng)地總結(jié)了人工智能方法的基本原理及其在AMR定位中的算法應(yīng)用,特別關(guān)注了基于SLAM、里程計(jì)和多傳感器融合的人工智能方法,這些方法適用于地面AMR和無人機(jī)。我們對(duì)基于人工智能的方法與傳統(tǒng)方法進(jìn)行了比較分析,以突出它們各自的優(yōu)勢(shì)和局限性。盡管人工智能模型展現(xiàn)出顯著的技術(shù)優(yōu)勢(shì),但在實(shí)現(xiàn)最佳實(shí)時(shí)性能方面仍然存在挑戰(zhàn)。

此外,我們還評(píng)估了各種 AI 模型在主流硬件平臺(tái)上的性能,強(qiáng)調(diào)了 AMR 實(shí)時(shí)定位所必需的關(guān)鍵權(quán)衡。

通過對(duì)現(xiàn)有文獻(xiàn)的詳細(xì)分析和對(duì)未來研究方向的探索,我們強(qiáng)調(diào)了基于人工智能的方法在增強(qiáng)室內(nèi)機(jī)器人對(duì)復(fù)雜動(dòng)態(tài)環(huán)境的適應(yīng)性方面的重要性。

展望未來,AMR 的進(jìn)步取決于彌合當(dāng)前的技術(shù)差距、促進(jìn)創(chuàng)新、提高系統(tǒng)可靠性和效率,以及增強(qiáng)人機(jī)交互,從而徹底改變其在不同領(lǐng)域的應(yīng)用??偠灾?,我們討論了基于人工智能的定位面臨的尚未解決的問題和挑戰(zhàn),并強(qiáng)調(diào)先進(jìn)技術(shù)的廣泛應(yīng)用將為未來的研究提供寶貴的指導(dǎo),最終促進(jìn)制定新的戰(zhàn)略來提升 AMR 能力。

3、ATI Motors 發(fā)布 雙臂移動(dòng)操作機(jī)器人(中叉網(wǎng)、agv網(wǎng)、無人系統(tǒng)網(wǎng))

在自動(dòng)化與智能制造浪潮之下,具有操作臂的移動(dòng)機(jī)器人(mobile manipulator)正成為連接“搬運(yùn)”與“作業(yè)”能力的關(guān)鍵。近日,印度機(jī)器人公司ATI Motors 正式發(fā)布其最新研發(fā)成果——Sherpa Mecha,一款配備雙臂的移動(dòng)操作機(jī)器人,該產(chǎn)品的亮相意味著公司從傳統(tǒng)自主移動(dòng)機(jī)器人進(jìn)一步擴(kuò)展至具備靈巧操作能力的工業(yè)人形機(jī)器人領(lǐng)域。

ATI Motors 成立于印度班加羅爾,其主營業(yè)務(wù)是開發(fā)和銷售自主移動(dòng)機(jī)器人,并提供其軟件平臺(tái)與集成服務(wù)。該公司已有的 Sherpa 系列產(chǎn)品在工廠、倉儲(chǔ)等環(huán)境中應(yīng)用廣泛,包括牽引型、托盤搬運(yùn)型、升降型等機(jī)器人。根據(jù)公開資料,其 AMR 產(chǎn)品已在印度、東南亞、美國、墨西哥等地的工廠部署,累計(jì)執(zhí)行任務(wù)量正快速增長。

在 Product Day 2025 的新品發(fā)布會(huì)上,ATI Motors 除了推出重載牽引機(jī)器人 Sherpa 10K,也重點(diǎn)展示 Sherpa Mecha。該機(jī)器人采用“類人靈感”(humanoid-inspired)設(shè)計(jì),但不追求生物仿真,而是聚焦工業(yè)實(shí)用性。Sherpa Mecha 配備兩條機(jī)械臂、一個(gè)“頭部”模組和輪式底盤,用以在工業(yè)環(huán)境中完成搬運(yùn)、檢測(cè)、揀選等任務(wù)。

據(jù) ATI Motors 的聯(lián)合創(chuàng)始人兼 CEO Saurabh Chandra 表示,Sherpa Mecha 是“受人類啟發(fā)但并不刻意模仿人類”的機(jī)器人,其目標(biāo)是利用機(jī)器本身的優(yōu)勢(shì)完成任務(wù)。在設(shè)計(jì)上,Sherpa Mecha 放棄了機(jī)械腿的復(fù)雜結(jié)構(gòu),而采用輪式底盤以提升行駛穩(wěn)定性與效率;其碳纖維結(jié)構(gòu)高度輕量,對(duì)臂部負(fù)載能力目前可達(dá)約 12 kg(在約 1 米臂展位置),未來版本則瞄準(zhǔn) 35 kg 的能力。其機(jī)械手并非傳統(tǒng)仿生手指,而是支持可更換工具模塊,使機(jī)器人在執(zhí)行如分揀、檢測(cè)、搬運(yùn)等多種任務(wù)間切換時(shí)具靈活性。視覺感知方面,其手部還內(nèi)置攝像頭,以支持精密識(shí)別與測(cè)量。

Sherpa Mecha 的推出,實(shí)際上是 ATI 在其 Sherpa 平臺(tái)基礎(chǔ)上的一次“能力向上擴(kuò)展”。此前,ATI 的 AMR 產(chǎn)品線包括 Sherpa Monofork、Sherpa Lifter 500、Sherpa Pallet Mover 1.5T 等型號(hào),覆蓋搬運(yùn)、托盤、推拉、提升等功能。此前已有報(bào)道指出 Sherpa Monofork 的額定載荷為 500 kg,續(xù)航時(shí)間約 8 小時(shí);Sherpa Lifter 500 支持多種頂端模塊(剪叉、回轉(zhuǎn)臺(tái)、滾筒等),載重 500 kg,續(xù)航可達(dá) 16 小時(shí);Sherpa Pallet Mover 1.5T 的載荷能力已提升至 1.5 噸(1,500 kg)水平。 而 Sherpa 10K 則是一款重載牽引機(jī)器人,其最大牽引能力為 5 噸(約 11,000 磅),具備 3D LiDAR + 攝像頭融合導(dǎo)航能力,并支持原地轉(zhuǎn)向功能,適應(yīng)狹窄車間環(huán)境。

在新產(chǎn)品發(fā)布會(huì)上,ATI 同時(shí)公布其 Sherpa 系列在全球部署的任務(wù)量已達(dá)每年超過百萬級(jí)的水平(即其機(jī)器人系統(tǒng)每年執(zhí)行超過 1,000,000 次自主任務(wù))。該數(shù)字反映了公司在自主導(dǎo)航、路徑規(guī)劃、場(chǎng)景適配與調(diào)度能力上的積累。ATI 也指出,將開放 Sherpa Mecha 給高校、研究機(jī)構(gòu)和產(chǎn)業(yè)伙伴進(jìn)行聯(lián)合開發(fā),以推動(dòng)人機(jī)協(xié)作研究與工業(yè)落地。

Sherpa Mecha 的面世意味著 ATI Motors 正試圖打破傳統(tǒng) AMR 只能“搬運(yùn)”的局限,向具備“操作能力”的機(jī)器人平臺(tái)邁進(jìn)。若能在可靠性、控制精度、感知能力、軟件生態(tài)與成本控制層面取得平衡,其有望成為制造業(yè)中的柔性作業(yè)力量。而從行業(yè)視角看,Sherpa Mecha 的推出也呼應(yīng)全球范圍內(nèi)越來越多廠商將“操控臂 + 移動(dòng)平臺(tái)”融合為一體的趨勢(shì),以實(shí)現(xiàn)更高層級(jí)的自動(dòng)化與柔性制造。

關(guān)注官方微信

手機(jī)掃碼看新聞

柳林县| 璧山县| 木里| 额尔古纳市| 盐山县| 崇文区| 铜川市| 洛南县| 遂宁市| 栾川县| 青田县| 阿拉善盟| 灵石县| 哈密市| 剑阁县| 泰安市| 林口县| 策勒县| 渑池县| 和林格尔县| 油尖旺区| 曲靖市| 莱州市| 左云县| 古蔺县| 萝北县| 绿春县| 巢湖市| 深水埗区| 项城市| 女性| 当阳市| 搜索| 亳州市| 西贡区| 信阳市| 金秀| 红安县| 交城县| 安乡县| 陕西省|