《sciencedirect》：基于人工智能的室內(nèi)環(huán)境中自主移動(dòng)機(jī)器人定位改進(jìn)方法

2025-10-10 09:52 性質(zhì)：轉(zhuǎn)載作者：王守德，努爾·賽茲林?·艾哈邁德來源：王守德，努爾·賽茲林?·艾哈邁德

免責(zé)聲明：AGV網(wǎng)（m.wnmc.org.cn)尊重合法版權(quán)，反對(duì)侵權(quán)盜版。（凡是我網(wǎng)所轉(zhuǎn)載之文章，文中所有文字內(nèi)容和圖片視頻之知識(shí)產(chǎn)權(quán)均系原作者和機(jī)構(gòu)所有。文章內(nèi)容觀點(diǎn)，與本網(wǎng)無關(guān)。如有需要?jiǎng)h除，敬請(qǐng)來電商榷?。?/div>

概述室內(nèi)自主移動(dòng)機(jī)器人(AMR)的應(yīng)用大幅增長，因?yàn)樗鼈兡軌蚣筛鞣N傳感器、保持較低的運(yùn)營成本、易于部署，并表現(xiàn)出卓越的機(jī)動(dòng)性。盡管如此，在復(fù)雜的室內(nèi)環(huán)境中導(dǎo)航仍存在巨大挑戰(zhàn)，可能會(huì)阻礙 ...

概述

室內(nèi)自主移動(dòng)機(jī)器人(AMR)的應(yīng)用大幅增長，因?yàn)樗鼈兡軌蚣筛鞣N傳感器、保持較低的運(yùn)營成本、易于部署，并表現(xiàn)出卓越的機(jī)動(dòng)性。盡管如此，在復(fù)雜的室內(nèi)環(huán)境中導(dǎo)航仍存在巨大挑戰(zhàn)，可能會(huì)阻礙 AMR 性能并降低整體系統(tǒng)效率。為了克服這些障礙，研究人員專注于開發(fā)自主定位技術(shù)，使 AMR 能夠在復(fù)雜的環(huán)境中有效地導(dǎo)航和執(zhí)行任務(wù)。人工智能 (AI) 應(yīng)用的最新進(jìn)展深刻地影響了這一領(lǐng)域，增強(qiáng)了 AMR 的控制和決策能力。

本文全面回顧了旨在改善室內(nèi) AMR（包括飛行器）定位的基于 AI 的策略。我們系統(tǒng)地分類和批判性地分析了基于同步定位和地圖構(gòu)建(SLAM) 的方法、基于里程計(jì)的方法和多傳感器融合技術(shù)此外，我們還討論了基于人工智能的方法所面臨的實(shí)時(shí)性能挑戰(zhàn)，并闡述了人工智能增強(qiáng)型定位方法與傳統(tǒng)定位技術(shù)之間的區(qū)別，強(qiáng)調(diào)了采用基于人工智能的解決方案的必要性和優(yōu)勢(shì)。通過闡明這些方法，我們的目標(biāo)是加深對(duì)它們的理解，并促進(jìn)其在該領(lǐng)域的廣泛應(yīng)用。最后，我們討論了新興的研究方向和持續(xù)的挑戰(zhàn)，為室內(nèi)AMR領(lǐng)域的未來研究和發(fā)展提供指導(dǎo)。

（1）引言

自主移動(dòng)機(jī)器人(AMR) 已成為現(xiàn)代工業(yè)、服務(wù)業(yè)和智能家居中不可或缺的自動(dòng)化工具。這些機(jī)器人涵蓋各種平臺(tái)，包括輪式、腿式、空中、醫(yī)療、搜索救援、物流、制造和水下機(jī)器人，均專為自主導(dǎo)航和任務(wù)執(zhí)行而設(shè)計(jì)。然而，在室內(nèi)環(huán)境中，由于無法依賴GPS進(jìn)行定位， AMR 在精確導(dǎo)航和定位方面面臨挑戰(zhàn)。

AMR 的定位方法通常分為兩類：一類依賴于外部射頻 (RF) 傳感器或信標(biāo)，例如 Wi-Fi、超寬帶 (UWB) 或低功耗藍(lán)牙(BLE)，另一類利用板載傳感器，例如激光雷達(dá)、慣性測(cè)量單元(IMU)、編碼器和攝像頭。表 1對(duì)這兩種方法進(jìn)行了詳細(xì)比較。外部傳感器在受控環(huán)境中提供可靠的定位，但通常需要對(duì)基礎(chǔ)設(shè)施進(jìn)行大量改造，例如安裝信標(biāo)或接入點(diǎn)。此外，這些系統(tǒng)可能面臨信號(hào)干擾、范圍有限以及在動(dòng)態(tài)或混亂環(huán)境中適應(yīng)性降低等問題。相比之下，板載傳感器提供了更靈活、獨(dú)立的定位解決方案，而無需改變現(xiàn)有的基礎(chǔ)設(shè)施。

然而，傳統(tǒng)的基于機(jī)載傳感器的定位技術(shù)，例如同步定位與地圖構(gòu)建SLAM和基于里程計(jì)的方法，在實(shí)際應(yīng)用中面臨諸多限制。這些方法通常依賴于幾何特征或原始傳感器數(shù)據(jù)，在動(dòng)態(tài)或雜亂的環(huán)境中可能會(huì)遇到困難。它們?cè)趹?yīng)對(duì)光照變化、動(dòng)態(tài)障礙物或具有多個(gè)形狀相似的物體的環(huán)境中表現(xiàn)不佳，這使得 AMR 在實(shí)際部署中難以實(shí)現(xiàn)高效穩(wěn)定的自主移動(dòng)和任務(wù)執(zhí)行。

表1. AMR定位中機(jī)載和外部傳感器的比較。

比較標(biāo)準(zhǔn)	板載傳感器	外部傳感器
示例	激光雷達(dá)、攝像頭、IMU、編碼器、光電傳感器	Wi-Fi、UWB、BLE
基礎(chǔ)設(shè)施要求	無需額外的基礎(chǔ)設(shè)施	需要專用基礎(chǔ)設(shè)施
環(huán)境適應(yīng)性	適應(yīng)動(dòng)態(tài)環(huán)境	最適合受控環(huán)境
抗干擾性	抗射頻干擾	易受射頻干擾
成本	降低成本	成本更高
定位精度	取決于環(huán)境復(fù)雜性	信號(hào)強(qiáng)，穩(wěn)定
可擴(kuò)展性	易于擴(kuò)展	容量受限
部署時(shí)間	快速設(shè)置	冗長的設(shè)置

計(jì)算技術(shù)和硬件的最新進(jìn)展使人工智能(AI) 成為幾乎所有工程相關(guān)研究領(lǐng)域的基礎(chǔ)組成部分。對(duì)于缺乏具體解決方案或傳統(tǒng)方法需要大量手動(dòng)調(diào)整的復(fù)雜問題，人工智能是解決這些問題的理想工具。自動(dòng)特征提取消除了對(duì)昂貴的手動(dòng)特征工程的需求，這是人工智能與傳統(tǒng)認(rèn)知算法之間的顯著區(qū)別。通常，人工智能可以檢測(cè)異常，預(yù)測(cè)潛在情景，應(yīng)對(duì)不斷變化的情況，深入了解涉及大型數(shù)據(jù)集的復(fù)雜問題，并識(shí)別可能被人類忽視的模式。它可以利用大數(shù)據(jù)并從中學(xué)習(xí)，以增強(qiáng) AMR 的移動(dòng)性和決策能力。此外，與傳統(tǒng)的優(yōu)化方法相比，人工智能可以智能地管理機(jī)載資源。

基于人工智能的 SLAM 和里程計(jì)方法為 AMR 的室內(nèi)定位帶來了顯著的改進(jìn)。傳統(tǒng)方法雖然在靜態(tài)環(huán)境中表現(xiàn)良好，但在動(dòng)態(tài)復(fù)雜環(huán)境中性能往往會(huì)下降。人工智能方法的集成，尤其是深度學(xué)習(xí)(DL) 和機(jī)器學(xué)習(xí)(ML)，增強(qiáng)了環(huán)境感知和特征提取能力。人工智能使 AMR 能夠智能地識(shí)別動(dòng)態(tài)障礙物、過濾環(huán)境噪聲并實(shí)時(shí)區(qū)分可移動(dòng)和不可移動(dòng)物體。這大大提高了地圖繪制的準(zhǔn)確性和更新速度，使機(jī)器人即使在不斷變化的環(huán)境中也能保持高效的導(dǎo)航。

此外，人工智能方法有助于優(yōu)化和增強(qiáng)車載傳感器的多模態(tài)數(shù)據(jù)融合，從而提高AMR定位系統(tǒng)的魯棒性。借助人工智能模型，多模態(tài)數(shù)據(jù)融合可以優(yōu)化數(shù)據(jù)冗余，使機(jī)器人在激光傳感器發(fā)生故障或其精度下降時(shí)，能夠依靠視覺或IMU數(shù)據(jù)進(jìn)行補(bǔ)充定位。這能夠保持對(duì)環(huán)境的全面感知和理解。這種多模態(tài)融合在動(dòng)態(tài)或復(fù)雜環(huán)境中尤為重要，可確保AMR在不斷變化的條件下保持高精度導(dǎo)航和避障能力。

綜上所述，研究基于人工智能的AMR定位技術(shù)對(duì)未來機(jī)器人系統(tǒng)的發(fā)展具有重要意義?；谌斯ぶ悄艿亩ㄎ幌到y(tǒng)能夠顯著增強(qiáng)AMR在各種室內(nèi)場(chǎng)景下的適應(yīng)性，從而實(shí)現(xiàn)更深入的環(huán)境理解和更高效的決策。因此，本文系統(tǒng)地探討了人工智能在AMR室內(nèi)定位中的應(yīng)用，分析了其在提升定位精度、適應(yīng)性和計(jì)算效率方面的優(yōu)勢(shì)與挑戰(zhàn)。

盡管AMR技術(shù)在過去幾十年中取得了長足的進(jìn)步，但近期的綜述研究主要集中于SLAM、路徑規(guī)劃和傳感器數(shù)據(jù)融合等單個(gè)技術(shù)方面。如表2所示，自2019年以來的現(xiàn)有調(diào)查為這些領(lǐng)域提供了寶貴的見解，探討了AMR中使用的傳感器和機(jī)器人的類型。然而，對(duì)于如何將基于人工智能的方法應(yīng)用于AMR的室內(nèi)定位，目前還缺乏系統(tǒng)的分析和全面的評(píng)估。特別是，尚未對(duì)如何通過基于SLAM的方法、基于里程計(jì)的方法和車載傳感器融合來增強(qiáng)室內(nèi)定位的基于人工智能的集成方法進(jìn)行徹底的綜述。

為了彌補(bǔ)這一差距，本文對(duì)基于人工智能的室內(nèi)AMR定位方法進(jìn)行了全面回顧。我們將內(nèi)容分為三個(gè)層次：車載傳感器、定位技術(shù)和人工智能模型/方法。整體系統(tǒng)架構(gòu)如圖1所示。

（2）調(diào)查方法

（2.1）.研究設(shè)計(jì)

本研究采用了系統(tǒng)綜述方法，該方法經(jīng)過精心設(shè)計(jì)，旨在識(shí)別與抗菌藥物耐藥性（AMR）局部發(fā)展最相關(guān)的文獻(xiàn)。根據(jù)芬克（Fink）的定義，系統(tǒng)綜述是一種發(fā)現(xiàn)、分析和綜合現(xiàn)有知識(shí)的方法。它要求系統(tǒng)嚴(yán)謹(jǐn)性、明確性、完整性和可重復(fù)性。本研究的研究框架以PRISMA（系統(tǒng)綜述和薈萃分析的首選報(bào)告項(xiàng)目）指南為指導(dǎo)。PRISMA是一種廣受認(rèn)可的循證方法，可確保系統(tǒng)綜述和薈萃分析的全面性和透明度。

研究程序分為四個(gè)主要階段：識(shí)別、篩選、資格評(píng)估和最終納入。每個(gè)階段都經(jīng)過嚴(yán)格執(zhí)行，以確保審查過程的完整性和質(zhì)量。此外，本研究還采用了包含27個(gè)條目的PRISMA清單，以增強(qiáng)研究的結(jié)構(gòu)和形式。該清單確保審查遵循清晰度、可重復(fù)性和系統(tǒng)性評(píng)估的高標(biāo)準(zhǔn)，并對(duì)文獻(xiàn)的優(yōu)缺點(diǎn)進(jìn)行透明的評(píng)估。

（2.2）資格標(biāo)準(zhǔn)

本研究重點(diǎn)關(guān)注基于人工智能的AMR室內(nèi)定位方法，強(qiáng)調(diào)集成先進(jìn)的機(jī)器學(xué)習(xí)算法以提高定位精度和魯棒性。這些算法包括但不限于深度學(xué)習(xí)模型、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN) 和生成對(duì)抗網(wǎng)絡(luò)(GAN)。目標(biāo)應(yīng)用涉及在復(fù)雜室內(nèi)環(huán)境中運(yùn)行的機(jī)器人。

基于人工智能的方法旨在通過處理和解讀來自各種傳感器的數(shù)據(jù)來提高室內(nèi)定位的準(zhǔn)確性和可靠性。這些傳感器可能包括激光雷達(dá)、攝像頭、慣性測(cè)量單元 (IMU)和車輪編碼器。通過利用人工智能算法，機(jī)器人可以更好地理解和導(dǎo)航其環(huán)境，從而實(shí)現(xiàn)更高效、更安全的運(yùn)行。

本綜述全面探討了這些基于人工智能的定位技術(shù)的實(shí)施策略、優(yōu)勢(shì)和局限性。它評(píng)估了如何訓(xùn)練和部署不同的機(jī)器學(xué)習(xí)模型，以便在動(dòng)態(tài)且雜亂的室內(nèi)環(huán)境中有效實(shí)現(xiàn)精確定位。通過對(duì)各種基于人工智能的方法進(jìn)行比較分析，本研究探索了它們?cè)诓煌珹MR場(chǎng)景中的適應(yīng)性及其潛在應(yīng)用。

此外，為了系統(tǒng)地評(píng)估人工智能技術(shù)在室內(nèi)定位中的應(yīng)用，本綜述定義了納入研究的具體資格標(biāo)準(zhǔn)。入選研究需提出或利用基于人工智能的AMR室內(nèi)定位方法，并將機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)與傳感器數(shù)據(jù)相結(jié)合，以提高定位精度，同時(shí)展示基于人工智能的定位方法的實(shí)際有效性，且為過去五年內(nèi)發(fā)表的論文，以確保與當(dāng)前技術(shù)進(jìn)步保持相關(guān)性。

通過遵循這些資格標(biāo)準(zhǔn)，本綜述確保全面深入地探索基于人工智能的室內(nèi)定位方法在實(shí)際應(yīng)用中的挑戰(zhàn)和潛力。這種系統(tǒng)性方法有助于全面審視最先進(jìn)的方法，從而確定AMR定位領(lǐng)域的當(dāng)前趨勢(shì)、研究差距和未來發(fā)展方向。

（2.3）搜索策略

我們采用 PRISMA 2020 框架系統(tǒng)地回顧了基于人工智能的方法在 GPS 受限環(huán)境 (GDE) 中改進(jìn)自主移動(dòng)機(jī)器人定位的文獻(xiàn)?；仡櫟闹攸c(diǎn)是理解和分析這些方法在解決動(dòng)態(tài)目標(biāo)定位相關(guān)的復(fù)雜性和挑戰(zhàn)方面的有效性。為了確保研究的全面性和高質(zhì)量，我們選擇了 Web of Science 和 Scopus 作為主要信息來源。選擇這些數(shù)據(jù)庫是因?yàn)樗鼈儚V泛且高質(zhì)量地涵蓋了科學(xué)技術(shù)領(lǐng)域的文獻(xiàn)。

（3.）基于AI的室內(nèi)定位方法概述

人工智能在移動(dòng)機(jī)器人領(lǐng)域得到了廣泛的應(yīng)用，尤其是在定位領(lǐng)域，它使機(jī)器人能夠理解周圍環(huán)境并準(zhǔn)確確定其在環(huán)境中的位置。雖然在可見、靜態(tài)或密閉空間中定位相對(duì)簡單，但在動(dòng)態(tài)環(huán)境中卻面臨著巨大的挑戰(zhàn)?；谌斯ぶ悄艿亩ㄎ患夹g(shù)利用先進(jìn)的數(shù)據(jù)驅(qū)動(dòng)方法，增強(qiáng)了移動(dòng)機(jī)器人有效克服這些挑戰(zhàn)的能力。

為了說明基于人工智能的方法在室內(nèi)定位中的應(yīng)用，算法 1 提出了一個(gè)通用的人工智能定位框架。該框架支持多種人工智能方法，包括機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和混合方法。通過利用這些方法的優(yōu)勢(shì)，該框架顯著提升了 AMR 在動(dòng)態(tài)復(fù)雜室內(nèi)環(huán)境中的定位精度、魯棒性和適應(yīng)性。以下章節(jié)將討論幾種主要的基于人工智能的室內(nèi)定位方法。

（3.1）機(jī)器學(xué)習(xí)（ML）

機(jī)器學(xué)習(xí)是跨學(xué)科執(zhí)行各種任務(wù)的重要框架，在基于人工智能的室內(nèi)機(jī)器人定位中具有重要價(jià)值。定位涉及估計(jì)機(jī)器人在特定環(huán)境中的位置，這對(duì)于機(jī)器人理解環(huán)境和做出導(dǎo)航?jīng)Q策至關(guān)重要。機(jī)器學(xué)習(xí)的最新進(jìn)展極大地推動(dòng)了機(jī)器人技術(shù)的發(fā)展，在運(yùn)動(dòng)控制、抓取、人機(jī)交互、感知、建圖、規(guī)劃和定位等應(yīng)用方面取得了實(shí)質(zhì)性的改進(jìn)。通過機(jī)器學(xué)習(xí)，機(jī)器人可以掌握路徑規(guī)劃和軌跡跟蹤等技能，而無需手動(dòng)編碼路點(diǎn)，從圖像和激光雷達(dá)等感知輸入生成導(dǎo)航模型，以便在環(huán)境中進(jìn)行實(shí)時(shí)定位和移動(dòng)。

圖 3全面展示了基于機(jī)器學(xué)習(xí) (ML) 的方法在增強(qiáng) AMR 定位方面的優(yōu)勢(shì)。圖 3(a)展示了機(jī)器學(xué)習(xí)模型通過最小化不穩(wěn)定偏差來平滑軌跡的能力，從而確保路徑更穩(wěn)定、更準(zhǔn)確?；跈C(jī)器學(xué)習(xí)的方法有效地糾正了傳統(tǒng)方法中常見的軌跡突變，凸顯了其在管理噪聲傳感器數(shù)據(jù)方面的穩(wěn)健性。

圖 3(b)展示了機(jī)器學(xué)習(xí)在未知環(huán)境中高效探索的能力。在基于機(jī)器學(xué)習(xí)的框架的引導(dǎo)下，機(jī)器人能夠生成一條在探索和目標(biāo)導(dǎo)向?qū)Ш街g取得平衡的軌跡。這在地圖不完整或動(dòng)態(tài)變化的環(huán)境中尤其有利，而傳統(tǒng)的啟發(fā)式方法則難以適應(yīng)這些環(huán)境。

圖 3(c)強(qiáng)調(diào)了機(jī)器學(xué)習(xí)在校準(zhǔn)視覺信號(hào)誤差方面的作用，從而提高了定位精度。通過利用多模態(tài)傳感器融合和誤差校正算法，機(jī)器學(xué)習(xí)模型可以減輕由傳感器噪聲或環(huán)境變化引起的差異，確保預(yù)測(cè)軌跡與地面實(shí)況緊密一致。

最后，圖 3(d)突出顯示了一個(gè)失敗案例，其中機(jī)器學(xué)習(xí)方法由于視覺里程計(jì)中的累積誤差而遭遇挑戰(zhàn)。這一失敗凸顯了機(jī)器學(xué)習(xí)在處理極端輸入失真或與訓(xùn)練數(shù)據(jù)明顯不同的場(chǎng)景時(shí)的局限性。然而，此類案例也表明，通過領(lǐng)域自適應(yīng)和遷移學(xué)習(xí)等技術(shù)可以進(jìn)一步改進(jìn)機(jī)器學(xué)習(xí)模型。

總體而言，基于機(jī)器學(xué)習(xí)的方法優(yōu)于傳統(tǒng)方法，后者通常依賴于預(yù)定義的啟發(fā)式方法，并且不太適應(yīng)動(dòng)態(tài)和嘈雜的環(huán)境。通過利用數(shù)據(jù)驅(qū)動(dòng)的洞察力，機(jī)器學(xué)習(xí)技術(shù)能夠有效地泛化各種條件，適應(yīng)新環(huán)境，并提升在復(fù)雜場(chǎng)景下的性能。這些特性使得基于機(jī)器學(xué)習(xí)的方法對(duì)于推進(jìn)AMR定位至關(guān)重要，尤其是在具有挑戰(zhàn)性的室內(nèi)環(huán)境中。

圖 3.四種室內(nèi)場(chǎng)景中機(jī)器學(xué)習(xí)增強(qiáng)的機(jī)器人定位軌跡性能。紅色圓圈表示起點(diǎn)，綠線表示地面真實(shí)軌跡，藍(lán)線表示使用基于機(jī)器學(xué)習(xí)的模塊預(yù)測(cè)的軌跡。藍(lán)色箭頭表示機(jī)器人的最終位置和方向。子圖分別說明了機(jī)器學(xué)習(xí)對(duì) (a) 軌跡平滑、(b) 探索、(c) 誤差校準(zhǔn)和 (d) 故障情況的影響。

（3.2 .）強(qiáng)化學(xué)習(xí)（RL）

強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)基本范式，與監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)并列，致力于使代理能夠通過與環(huán)境的交互來學(xué)習(xí)最優(yōu)行為，從而最大化累積獎(jiǎng)勵(lì)。通過探索可能的控制行動(dòng)空間，代理可以獲得反饋，例如對(duì)良好表現(xiàn)的獎(jiǎng)勵(lì)和對(duì)不良表現(xiàn)的懲罰。這種反復(fù)試驗(yàn)的方法使代理能夠迭代地改進(jìn)其決策策略。

深度強(qiáng)化學(xué)習(xí)(DRL) 結(jié)合了 DL 強(qiáng)大的函數(shù)逼近能力和RL 的最優(yōu)策略學(xué)習(xí)框架，近年來獲得了廣泛關(guān)注，尤其是在 AlphaGo等應(yīng)用中。圖 4展示了一個(gè)專為改善復(fù)雜動(dòng)態(tài)條件下室內(nèi)移動(dòng)機(jī)器人定位而定制的 DRL 框架。該系統(tǒng)首先從 IMU、LiDAR、攝像頭和編碼器等設(shè)備收集多傳感器測(cè)量數(shù)據(jù)。這些測(cè)量數(shù)據(jù)既能捕捉靜態(tài)環(huán)境特征（如墻壁、門），也能捕捉動(dòng)態(tài)因素（如移動(dòng)障礙物、NLOS 條件）。具有多個(gè)隱藏層的深度神經(jīng)網(wǎng)絡(luò)(DNN) 處理這些高維輸入，以學(xué)習(xí)對(duì)決策至關(guān)重要的潛在表示。

基于此表示，DRL 策略通過最先進(jìn)的算法進(jìn)行訓(xùn)練，涵蓋在線策略方法（例如，Actor-Critic、近端策略優(yōu)化(PPO)、異步優(yōu)勢(shì) Actor-Critic (A3C)）和離線策略方法（例如，Q-Learning、深度 Q 網(wǎng)絡(luò) (DQN)、深度確定性策略梯度 (DDPG)、軟 Actor-Critic (SAC)）。該策略輸出位置更新或速度命令，使代理能夠?qū)崟r(shí)優(yōu)化其姿勢(shì)。

獎(jiǎng)勵(lì)信號(hào)源自定位誤差指標(biāo)、精度反饋和時(shí)間平滑度，從而驅(qū)動(dòng)持續(xù)的策略更新。這種閉環(huán)學(xué)習(xí)機(jī)制使機(jī)器人能夠快速適應(yīng)環(huán)境不確定性，同時(shí)保持較高的定位精度。通過利用深度強(qiáng)化學(xué)習(xí) (DRL) 自適應(yīng)探索和利用傳感器數(shù)據(jù)的能力，該框架顯著提升了室內(nèi)移動(dòng)機(jī)器人在挑戰(zhàn)性場(chǎng)景下的定位魯棒性和精度。

在室內(nèi)定位和路徑規(guī)劃領(lǐng)域，強(qiáng)化學(xué)習(xí)已成功應(yīng)用于改進(jìn)導(dǎo)航策略，以實(shí)現(xiàn)在動(dòng)態(tài)和未知環(huán)境中的高效移動(dòng)。強(qiáng)化學(xué)習(xí)的仿生學(xué)習(xí)系統(tǒng)模擬了在生物體中觀察到的反復(fù)試驗(yàn)學(xué)習(xí)過程，使機(jī)器人能夠迭代地增強(qiáng)其行為，并提高導(dǎo)航和定位的效率。

然而，強(qiáng)化學(xué)習(xí)在室內(nèi) AMR 中的應(yīng)用也面臨著挑戰(zhàn)，尤其是隨機(jī)探索相關(guān)的計(jì)算時(shí)間和成本，這會(huì)限制實(shí)際的效率和可靠性。為了應(yīng)對(duì)這些挑戰(zhàn)，研究人員提出了一些優(yōu)化技術(shù)，例如有信息偏差的 softmax 回歸，它使用啟發(fā)式成本函數(shù)來減少無效的探索時(shí)間，從而加速收斂。此外，A2C 算法與經(jīng)驗(yàn)回放相結(jié)合，可以更好地捕捉機(jī)器人與障礙物之間復(fù)雜的相互作用。這些優(yōu)化使 RL 對(duì)于室內(nèi) AMR 更加可行和高效，使它們能夠不斷優(yōu)化定位策略，有效避開障礙物，并根據(jù)環(huán)境變化實(shí)時(shí)調(diào)整路徑規(guī)劃。

圖 4.基于DRL 的室內(nèi)定位結(jié)構(gòu)圖?；?DRL 的室內(nèi)定位框架示意圖，突出顯示了靜態(tài)和動(dòng)態(tài)環(huán)境條件下傳感器觀測(cè)、神經(jīng)網(wǎng)絡(luò)推理、策略學(xué)習(xí)和獎(jiǎng)勵(lì)機(jī)制之間的相互作用。

（3.3 .）深度學(xué)習(xí)

深度學(xué)習(xí)在室內(nèi)自主移動(dòng)機(jī)器人 (AMR) 中扮演著不可或缺的角色，它為感知、特征提取以及集成學(xué)習(xí)和決策系統(tǒng)提供強(qiáng)有力的支持，使其能夠更好地適應(yīng)動(dòng)態(tài)復(fù)雜的環(huán)境。深度學(xué)習(xí)通過遷移學(xué)習(xí)，有效地將從模擬中獲得的知識(shí)應(yīng)用到現(xiàn)實(shí)場(chǎng)景中，彌合“現(xiàn)實(shí)差距”。如圖 5所示，用于室內(nèi)機(jī)器人定位的深度學(xué)習(xí)框架展示了深度學(xué)習(xí)技術(shù)與定位過程的集成。該框架分為兩個(gè)部分：模擬和現(xiàn)實(shí)，分別針對(duì)任務(wù)的不同方面。

在模擬組件中，幾何特征（）從輸入數(shù)據(jù)中提取，以捕捉環(huán)境的空間結(jié)構(gòu)。這些特征通過特征學(xué)習(xí)模塊（）生成高級(jí)表示，輸出（）提供機(jī)器人位置的初步估計(jì)。

在現(xiàn)實(shí)組件中，通過特征提取來處理實(shí)時(shí)數(shù)據(jù)（) 和優(yōu)化模塊 (）來使學(xué)習(xí)到的特征適應(yīng)真實(shí)環(huán)境。這個(gè)過程產(chǎn)生了精細(xì)的輸出（和）來提高定位精度。模擬與現(xiàn)實(shí)之間的反饋確?？蚣苣軌蜻m應(yīng)模擬數(shù)據(jù)和真實(shí)世界數(shù)據(jù)之間的差異，從而提高魯棒性。

該框架展示了如何結(jié)合基于模擬的訓(xùn)練和現(xiàn)實(shí)世界的適應(yīng)來解決室內(nèi)機(jī)器人定位中的挑戰(zhàn)，利用 DL 的分層特征提取和迭代學(xué)習(xí)能力。

文獻(xiàn)表明，深度學(xué)習(xí)在解決機(jī)器人定位中的感知不確定性方面展現(xiàn)出巨大潛力。例如，CNN能夠高效處理來自環(huán)境的傳感器數(shù)據(jù)，提供精確的物體識(shí)別和語義理解，這對(duì)于室內(nèi)定位至關(guān)重要。深度學(xué)習(xí)利用深度神經(jīng)網(wǎng)絡(luò)的特征提取能力，幫助機(jī)器人探索最優(yōu)路徑規(guī)劃和決策策略，在動(dòng)態(tài)和未知的室內(nèi)環(huán)境中表現(xiàn)出色。

GAN通過生成逼真的模擬環(huán)境和數(shù)據(jù)來支持大規(guī)模虛擬訓(xùn)練，從而降低在現(xiàn)實(shí)環(huán)境中進(jìn)行訓(xùn)練的成本和風(fēng)險(xiǎn)。此外，將深度學(xué)習(xí)與不確定性估計(jì)方法（例如貝葉斯方法）相結(jié)合，可以增強(qiáng)機(jī)器人在復(fù)雜室內(nèi)環(huán)境中的決策信心，從而更好地平衡感知信息和環(huán)境交互，最終提高導(dǎo)航和路徑規(guī)劃的可靠性。

圖 5.室內(nèi)AMR 定位的深度學(xué)習(xí)框架。該圖展示了一個(gè)用于室內(nèi)機(jī)器人定位的仿真-現(xiàn)實(shí)集成深度學(xué)習(xí)框架。該框架結(jié)合了基于仿真的特征學(xué)習(xí)和實(shí)時(shí)自適應(yīng)技術(shù)，以解決模擬數(shù)據(jù)與真實(shí)世界數(shù)據(jù)之間的差異。反饋機(jī)制通過迭代改進(jìn)來提高定位精度和魯棒性。

如圖 6所示，結(jié)果凸顯了各種特征提取方法在室內(nèi)環(huán)境中的性能。幾何方法（例如 ORB-SLAM2（圖 6(a)）依賴于手工制作的特征，在結(jié)構(gòu)化環(huán)境中提供了可靠的性能。ORB-SLAM3（圖 6(b)）在此方法的基礎(chǔ)上，通過逐步改進(jìn)特征匹配，在特定條件下增強(qiáng)了魯棒性。然而，這些幾何方法在動(dòng)態(tài)且混亂的室內(nèi)環(huán)境中往往表現(xiàn)不佳，手工制作的特征可能無法有效地泛化。

相比之下，基于 DL 的方法在復(fù)雜和動(dòng)態(tài)環(huán)境中表現(xiàn)出了出色的適應(yīng)性和魯棒性。深度學(xué)習(xí)增強(qiáng)型SLAM（DXSLAM）圖 6（c）集成了 DL 增強(qiáng)功能，有效地結(jié)合了幾何和語義信息，以解決動(dòng)態(tài)和非結(jié)構(gòu)化場(chǎng)景帶來的挑戰(zhàn)。幾何對(duì)應(yīng)網(wǎng)絡(luò) v2（GCNv2）圖 6（d）作為一種基于圖的神經(jīng)網(wǎng)絡(luò)，擅長捕捉復(fù)雜的空間關(guān)系，即使在高度非結(jié)構(gòu)化的環(huán)境中也能實(shí)現(xiàn)密集而魯棒的特征提取。例如，在圖像的右上角（鍵盤區(qū)域），這兩個(gè)圖表明 DL 產(chǎn)生了更密集、更豐富的特征集，突顯了其捕捉復(fù)雜空間關(guān)系和提取詳細(xì)圖像信息的卓越能力。這種增強(qiáng)的特征提取能力對(duì)于在具有挑戰(zhàn)性的室內(nèi)環(huán)境中實(shí)現(xiàn)準(zhǔn)確可靠的定位至關(guān)重要。

圖 6。AM中使用的特征提取方法的說明性示例。（a）使用 ORB-SLAM2的特征提取結(jié)果，（b）來自 ORB-SLAM3的結(jié)果，（c）由 DXSLAM提取的特征，以及（d）來自 GCNv2的特征。這些圖像突出顯示了從幾何方法到基于 DL 的方法的進(jìn)展，證明了基于 DL 的技術(shù)在提取密集和魯棒特征方面的卓越性能。

（3.3.1 .）卷積神經(jīng)網(wǎng)絡(luò)（CNN）

CNN是一種深度學(xué)習(xí)模型，它通過卷積運(yùn)算直接從原始數(shù)據(jù)中提取特征，廣泛應(yīng)用于機(jī)器人領(lǐng)域的圖像分類、目標(biāo)檢測(cè)和圖像分割任務(wù)。它會(huì)分析輸入圖像或數(shù)據(jù)集，識(shí)別圖像的關(guān)鍵特征，并區(qū)分各個(gè)元素。CNN 在機(jī)器人定位能力方面取得了顯著進(jìn)步，尤其是在 SLAM 特征提取方面，其匹配精度優(yōu)于 Oriented FAST 和 Rotated BRIEF (ORB) 等傳統(tǒng)方法。雖然 ORB 在某些情況下表現(xiàn)良好，但對(duì)于復(fù)雜場(chǎng)景、光照變化和視點(diǎn)變化較大的情況，其匹配精度和魯棒性可能不足。

最近的研究證明了其顯著的性能優(yōu)勢(shì)。例如，SuperPoint 通過學(xué)習(xí)圖像中的特征點(diǎn)和描述符，顯著提高了匹配準(zhǔn)確率，比傳統(tǒng)方法提高了 10% 到 30%。通過從海量數(shù)據(jù)中學(xué)習(xí)更復(fù)雜、更抽象的特征表示，CNN 有助于提高機(jī)器人定位的準(zhǔn)確性和可靠性。

CNN 也已用于各種機(jī)器人系統(tǒng)中基于視覺的定位等功能。研究人員展示了CNN 架構(gòu)如何將低成本 MR 傳感器與單目攝像機(jī)圖像和擴(kuò)展卡爾曼濾波器(EKF) 數(shù)據(jù)相結(jié)合以實(shí)現(xiàn)精確定位。CNN 可應(yīng)用于分類、避障、視覺里程計(jì) (VO) 和其他定位過程等任務(wù)。然而，CNN 的缺點(diǎn)之一是其計(jì)算成本高，這對(duì)機(jī)器人技術(shù)提出了重大挑戰(zhàn)，因?yàn)闄C(jī)器人通常在高度動(dòng)態(tài)的環(huán)境中操作。緩慢的定位框架會(huì)在控制回路中引入延遲，使機(jī)器人難以快速響應(yīng)環(huán)境變化。

（3.3.2 .）生成對(duì)抗網(wǎng)絡(luò)（GAN）

GAN 是一類深度學(xué)習(xí)模型，旨在生成與給定訓(xùn)練數(shù)據(jù)集高度相似的新數(shù)據(jù)實(shí)例。例如，基于圖像訓(xùn)練的 GAN 可以生成捕捉多種自然特征的新圖像，使其在視覺上令人信服。在機(jī)器人和定位應(yīng)用中，GAN 已被用于減少復(fù)雜行為學(xué)習(xí)過程中對(duì)大量人工反饋的依賴。

在機(jī)器人定位和控制策略開發(fā)的背景下，GAN 通過生成真實(shí)的模擬環(huán)境和行為數(shù)據(jù)提供了一種有效的工具。這種能力使機(jī)器人能夠更好地了解周圍環(huán)境并制定精確的定位和導(dǎo)航策略，特別是在復(fù)雜的室內(nèi)環(huán)境中。此外，GAN 在確保面臨定位攻擊的移動(dòng)機(jī)器人的穩(wěn)健運(yùn)動(dòng)規(guī)劃方面發(fā)揮了至關(guān)重要的作用。通過生成潛在的機(jī)器人位置，GAN 可以糾正受損的數(shù)據(jù)，使機(jī)器人能夠在對(duì)抗環(huán)境中保持準(zhǔn)確的定位和導(dǎo)航，從而實(shí)現(xiàn)安全、無碰撞的運(yùn)動(dòng)規(guī)劃。這種方法顯著增強(qiáng)了機(jī)器人運(yùn)動(dòng)規(guī)劃在惡劣條件下的穩(wěn)健性，強(qiáng)調(diào)了 GAN 在改善移動(dòng)機(jī)器人定位和確保操作安全方面的重要性。

近年來，人工智能在移動(dòng)機(jī)器人室內(nèi)定位與導(dǎo)航領(lǐng)域取得了顯著進(jìn)展。研究人員探索了各種基于人工智能的方法，包括深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、機(jī)器學(xué)習(xí)和多傳感器融合，旨在提高定位精度和導(dǎo)航性能，同時(shí)減少對(duì)高精度傳感器和特定硬件的依賴。

（3.4 .）基于人工智能的進(jìn)化方法

基于人工智能的進(jìn)化方法 (EM) 在提升AMR定位性能方面展現(xiàn)出巨大潛力。這些方法利用仿生優(yōu)化技術(shù)來解決室內(nèi)導(dǎo)航和定位中固有的復(fù)雜、非線性和多目標(biāo)挑戰(zhàn)。定位和路徑規(guī)劃本質(zhì)上是相互關(guān)聯(lián)的過程：精確的定位提供有效路徑規(guī)劃所需的空間數(shù)據(jù)，而優(yōu)化的路徑可以減輕不必要的操作、傳感器噪聲或動(dòng)態(tài)環(huán)境變化造成的定位誤差。通過將進(jìn)化算法集成到定位框架中，AMR 可以在具有挑戰(zhàn)性的環(huán)境中實(shí)現(xiàn)更高的精度、穩(wěn)健性和適應(yīng)性。路徑規(guī)劃方法大致可分為兩類：

?基于人工智能的進(jìn)化算法，包括蟻群優(yōu)化算法(ACO)、遺傳算法(GA)、粒子群優(yōu)化算法(PSO)、布谷鳥搜索算法(CSA)、灰狼優(yōu)化算法(GWO)和鯨魚優(yōu)化算法(WOA)，已被證明能有效解決各種路徑規(guī)劃難題。這些算法在非線性和多目標(biāo)優(yōu)化任務(wù)中表現(xiàn)出色，例如最小化能耗或避開動(dòng)態(tài)障礙物。例如，PSO 已成功應(yīng)用于靜態(tài)環(huán)境路徑規(guī)劃，并取得了顯著的效果。通過修改信息素?cái)U(kuò)散梯度公式和回溯策略，ACO 可以在復(fù)雜環(huán)境中得到增強(qiáng)。CSA 已用于未知集群環(huán)境中的移動(dòng)機(jī)器人導(dǎo)航，重點(diǎn)是訓(xùn)練前提部分。在無人機(jī)的三維路徑規(guī)劃場(chǎng)景中，GWO 表現(xiàn)出了優(yōu)于 PSO 的性能。此外，一項(xiàng)比較研究表明，WOA 在二維路徑規(guī)劃任務(wù)中的表現(xiàn)優(yōu)于 CSA 和 PSO。

?傳統(tǒng)的基于圖的搜索算法，例如 Dijkstra 算法（DA）和 A* 算法，廣泛應(yīng)用于具有預(yù)定義圖表示的結(jié)構(gòu)化環(huán)境，例如倉庫或自動(dòng)導(dǎo)引車（AGV）。

綜上所述，基于人工智能的進(jìn)化路徑規(guī)劃方法和傳統(tǒng)的路徑規(guī)劃方法都通過提高導(dǎo)航效率和最小化誤差來補(bǔ)充定位。雖然路徑規(guī)劃間接影響定位精度，但其在確保無縫導(dǎo)航方面發(fā)揮著至關(guān)重要的作用。有關(guān)路徑優(yōu)化技術(shù)的全面討論，請(qǐng)參閱專門的綜述。

（4.）基于AI的地面AMR定位方法

（4.1 .）基于AI的AMR無里程計(jì)和SLAM定位

Sun 等利用 CNN 從單目圖像預(yù)測(cè)深度信息，實(shí)現(xiàn)了適用于 GPS 信號(hào)不可靠區(qū)域的三維 LiDAR 地圖內(nèi)的攝像機(jī)定位。然而，該方法在光照變化和圖像質(zhì)量較差的情況下表現(xiàn)出局限性。為了減少對(duì)高精度傳感器的依賴，F(xiàn)oroughi 等在小型數(shù)據(jù)集上使用 CNN，設(shè)計(jì)了一種新的損失函數(shù)來增強(qiáng)模型泛化能力，但有限的數(shù)據(jù)集大小限制了模型的魯棒性。Ballesta 等將全景圖像與 CNN 相結(jié)合，實(shí)現(xiàn)了分層定位，提高了房間級(jí)精度，但仍然對(duì)圖像質(zhì)量較為敏感。

為了提高定位精度，李等采用YOLOv5和多層感知器(MLP)，實(shí)現(xiàn)了誤差小于 10 cm 的高精度定位，但在復(fù)雜環(huán)境下仍存在局限性。隨后，李等融合分層語義信息，提出一種基于上下文向量和知識(shí)圖譜的視覺導(dǎo)航方法，增強(qiáng)模型在未知環(huán)境中的泛化能力。趙等提出了智能室內(nèi)超表面機(jī)器人 (I2MR)，通過集中式微波感知增強(qiáng)定位能力并降低計(jì)算需求。俞等提出了 Relo-Net 來解決“機(jī)器人被綁架問題”，利用 2D LiDAR 進(jìn)行高精度室內(nèi)場(chǎng)景分類和重定位，但仍然對(duì)環(huán)境變化較為敏感。

在視覺導(dǎo)航領(lǐng)域，Ran 等利用淺層 CNN 和自適應(yīng)加權(quán)控制算法來提升導(dǎo)航性能，但在動(dòng)態(tài)環(huán)境中性能有限。Wu 等提出了生成模仿學(xué)習(xí) (GIL)，通過預(yù)測(cè)下一個(gè)預(yù)期觀測(cè)值來提高導(dǎo)航成功率和路徑效率。盡管計(jì)算需求增加，但這種方法顯著提高了目標(biāo)驅(qū)動(dòng)導(dǎo)航的決策魯棒性。Kulhánek 等提出了一個(gè)端到端深度強(qiáng)化學(xué)習(xí)框架，實(shí)現(xiàn)了實(shí)時(shí)導(dǎo)航和對(duì)非結(jié)構(gòu)化環(huán)境的適應(yīng)性。

在強(qiáng)化學(xué)習(xí)領(lǐng)域，Sleaman 和 Yavuz采用深度 CNN 實(shí)現(xiàn)自主導(dǎo)航，但在動(dòng)態(tài)環(huán)境中性能有限。Fang 等將深度 RL 與模仿學(xué)習(xí)相結(jié)合，以提高導(dǎo)航性能。Lee 和 Yusuf應(yīng)用DQN和雙深度 Q 網(wǎng)絡(luò) (DDQN) 算法實(shí)現(xiàn)自主導(dǎo)航和避障，其中 DDQN 提高了穩(wěn)定性。Bezerra 等將EKF與 DQN相結(jié)合，以提高導(dǎo)航效率。Li 等提出了一種基于PPO和門控循環(huán)單元(GRU) 的主動(dòng)嗅覺定位方法，提高了復(fù)雜環(huán)境下的定位效率。

在機(jī)器學(xué)習(xí)方法中，Klein 等人使用隨機(jī)森林回歸器進(jìn)行毫米級(jí)定位，但受到標(biāo)記精度的限制。Wang 等人利用弱監(jiān)督學(xué)習(xí)進(jìn)行相對(duì)定位，減少了對(duì)精確地理信息的依賴，但在較大空間中性能有限。Ye 等人提出了一種針對(duì)家庭服務(wù)機(jī)器人的算法，該算法集成了圖像去模糊和物體檢測(cè)技術(shù)，以提高目標(biāo)識(shí)別的精度和速度。

其他研究，例如 Chiang 等人，將磁場(chǎng)特征與深度神經(jīng)網(wǎng)絡(luò)相結(jié)合，用于室內(nèi)物體定位，適用于富含金屬的環(huán)境。Zou 等人使用 GAN 重建 WiFi 信號(hào)，提高了定位自動(dòng)化程度。Capra 等人將超寬帶定位系統(tǒng)與家用機(jī)器人相結(jié)合，用于老年人跌倒檢測(cè)，提高了定位精度，但成本也更高。

在多傳感器融合方面，李等融合了 2D LiDAR 和 IMU 數(shù)據(jù)，以增強(qiáng)定位的魯棒性。蔡等采用卡爾曼濾波融合各種傳感器數(shù)據(jù)，實(shí)現(xiàn)多機(jī)器人協(xié)作定位。曾等提出了一種受神經(jīng)生物學(xué)啟發(fā)的貝葉斯吸引子網(wǎng)絡(luò) (BAN) 模型，以降低計(jì)算復(fù)雜度。李等提出了一種基于語義角點(diǎn)特征的自適應(yīng)蒙特卡洛定位方法，提高了重定位速度和魯棒性。Papadaki 和 Pateraki利用深度學(xué)習(xí)在汽車裝配中進(jìn)行 6D 物體定位，有效地處理了反光和遮擋。陳等提出了一種仰視視覺室內(nèi)定位方法，使用 YOLO V7 來提高地標(biāo)檢測(cè)精度并減少隱私問題。

Jia 等提出了一種上下文感知的多層信息融合系統(tǒng)來提高障礙物檢測(cè)的準(zhǔn)確性，但在快速變化的環(huán)境中性能有限。Popovic 等提出了一種基于 RGB-D 圖像的深度完成算法，改進(jìn)了占用圖和導(dǎo)航地圖的完整性，但對(duì) RGB-D 攝像機(jī)的依賴限制了其適用性。Miranda-Vega 等提出了一種基于去模糊化算法 (DFA) 的光學(xué)掃描系統(tǒng)(OSS) 定位方法，顯著提高了工業(yè)機(jī)器人室內(nèi)定位的準(zhǔn)確性和魯棒性。實(shí)驗(yàn)結(jié)果表明，該方法效果最佳，實(shí)現(xiàn)了 0.021° 的最小定位誤差，證實(shí)了去模糊化算法在室內(nèi)定位中的有效性。

綜上所述，人工智能在移動(dòng)機(jī)器人室內(nèi)定位與導(dǎo)航方面取得了顯著進(jìn)展。早期研究在提高定位精度和導(dǎo)航性能方面取得了突破，但面臨著依賴高精度傳感器、計(jì)算成本高、對(duì)環(huán)境敏感等挑戰(zhàn)。后續(xù)研究引入了新方法和改進(jìn)算法，如將RL與模仿學(xué)習(xí)、多視圖信息融合、弱監(jiān)督學(xué)習(xí)相結(jié)合，逐漸克服了這些限制，提高了模型泛化能力和計(jì)算效率。然而，還需要進(jìn)一步研究以實(shí)現(xiàn)更高的魯棒性、減少對(duì)硬件的依賴、增強(qiáng)系統(tǒng)的靈活性和可擴(kuò)展性。表4總結(jié)了不依賴?yán)锍逃?jì)和SLAM的基于AI的方法。

表 4.基于AI 的無里程計(jì)和 SLAM 定位技術(shù)總結(jié)。

（4.2 .）用于AMR的AI增強(qiáng)SLAM

SLAM 結(jié)合了定位（確定機(jī)器人的位置和方向）和建圖（構(gòu)建環(huán)境地圖）兩項(xiàng)任務(wù)。這種雙重能力使得 SLAM 成為未知或動(dòng)態(tài)環(huán)境中導(dǎo)航不可或缺的一部分。雖然定位是 SLAM 的核心組成部分，但它對(duì)建圖的額外關(guān)注使其有別于那些僅僅致力于在預(yù)先繪制地圖的環(huán)境中實(shí)現(xiàn)精確定位的獨(dú)立定位技術(shù)。

基于人工智能的 SLAM 技術(shù)利用 DL、RL 和計(jì)算機(jī)視覺等先進(jìn)的計(jì)算方法，徹底改變了傳統(tǒng)方法。這些基于人工智能的技術(shù)顯著增強(qiáng)了 SLAM 系統(tǒng)感知、解釋和與復(fù)雜環(huán)境交互的能力。與幾何或基于特征的 SLAM 不同，基于人工智能的 SLAM 擅長處理動(dòng)態(tài)障礙物、環(huán)境噪聲和模糊視覺特征等挑戰(zhàn)?；谌斯ぶ悄艿?SLAM 的核心是對(duì)象跟蹤、語義映射和傳感器數(shù)據(jù)增強(qiáng)等技術(shù)，這些技術(shù)使系統(tǒng)能夠自適應(yīng)地響應(yīng)環(huán)境變化并支持廣泛的應(yīng)用，包括 AMR、工廠自動(dòng)化、智能農(nóng)業(yè)和自動(dòng)駕駛。如圖 7所示，這些能力使基于人工智能的 SLAM 成為下一代自主系統(tǒng)。

在AMR領(lǐng)域，基于AI的SLAM在提升定位精度和魯棒性方面具有顯著優(yōu)勢(shì)。通過集成語義地圖，AMR可以區(qū)分靜態(tài)和動(dòng)態(tài)物體，從而提高導(dǎo)航效率和避障能力?；贏I的多傳感器融合技術(shù)通過整合來自激光雷達(dá)、攝像頭和慣性測(cè)量單元（IMU）的數(shù)據(jù)，進(jìn)一步提升性能，并有效應(yīng)對(duì)傳感器噪聲、遮擋和視野受限等挑戰(zhàn)。這些創(chuàng)新技術(shù)即使在傳統(tǒng)SLAM系統(tǒng)經(jīng)常失效的動(dòng)態(tài)、雜亂或低能見度環(huán)境中也能確?？煽康亩ㄎ?。

雖然地圖繪制本質(zhì)上是 SLAM 的一部分，但本研究主要關(guān)注 SLAM 的定位能力，地圖繪制則被視為次要目標(biāo)。基于 AI 的 SLAM 與多傳感器融合的結(jié)合，使 AMR 能夠在復(fù)雜的室內(nèi)環(huán)境中實(shí)現(xiàn)高精度定位。以下小節(jié)將探討具體的 AI 增強(qiáng) SLAM 方法，包括 VSLAM、LiDAR SLAM 以及多傳感器融合集成，以應(yīng)對(duì) AMR 定位的挑戰(zhàn)。

圖7.基于AI的SLAM的應(yīng)用和核心組件。

（4.2.1 .）AMR 的視覺 SLAM（VSLAM）

VSLAM 是 AMR 的基礎(chǔ)技術(shù)，使其能夠構(gòu)建環(huán)境地圖并利用視覺數(shù)據(jù)進(jìn)行自我定位。傳統(tǒng)的 VSLAM 方法依賴于從圖像中提取的幾何特征，在光照變化、動(dòng)態(tài)障礙物或缺乏獨(dú)特特征的環(huán)境中，這些特征可能會(huì)丟失并導(dǎo)致定位不穩(wěn)定。為了克服這些局限性，VSLAM 中已經(jīng)集成了多種技術(shù)，以增強(qiáng)特征提取和環(huán)境適應(yīng)性。深度學(xué)習(xí)模型（尤其是 CNN）擅長從圖像中提取豐富的高級(jí)特征，從而克服了傳統(tǒng)幾何特征的限制。這種集成使 VSLAM 系統(tǒng)即使在動(dòng)態(tài)環(huán)境以及光照和天氣等變化條件下也能保持穩(wěn)定的定位。結(jié)合回環(huán)檢測(cè)和動(dòng)態(tài)障礙物識(shí)別算法，可以實(shí)現(xiàn)實(shí)時(shí)地圖更新，從而增強(qiáng) VSLAM 系統(tǒng)在復(fù)雜環(huán)境中的可靠性。

許多研究利用深度學(xué)習(xí)來提升 VSLAM 性能。Li 等人提出了一種 DXSLAM，Jin 等人開發(fā)了一種新穎的 VSLAM 框架，該框架利用對(duì)抗性遷移學(xué)習(xí)(ATL) 來提高動(dòng)態(tài)環(huán)境中的定位精度。該框架集成了基于 ATL 的無監(jiān)督語義分割來過濾動(dòng)態(tài)特征并減少領(lǐng)域差異，與傳統(tǒng)方法相比，顯著提高了 VSLAM 系統(tǒng)的性能；Li 等人提出了 DeepSLAM。這些工作采用深度學(xué)習(xí)模型進(jìn)行特征提取和回環(huán)檢測(cè)，顯著增強(qiáng)了動(dòng)態(tài)場(chǎng)景下的魯棒性和適應(yīng)性。通過解決傳統(tǒng) SLAM 方法在光照變化和動(dòng)態(tài)物體干擾下的不足，這些研究為復(fù)雜室內(nèi)環(huán)境下的自主定位提供了技術(shù)支持。DynaSLAM 系列，包括 DynaSLAM和 DynaSLAM II，充當(dāng) SLAM 領(lǐng)域的深度學(xué)習(xí)。它結(jié)合了動(dòng)態(tài)物體檢測(cè)和背景恢復(fù)技術(shù)，進(jìn)一步提高了動(dòng)態(tài)場(chǎng)景下的性能。此外，Cui 等人提出了一種基于改進(jìn)的 ORB-SLAM2 的3D 語義地圖系統(tǒng)，實(shí)現(xiàn)了適用于服務(wù)機(jī)器人的低資源環(huán)境下高效的三維語義地圖構(gòu)建。Teed 和 Deng提出了 DROID-SLAM，這是一個(gè)用于單目、立體和 RGB-D 相機(jī)的深度視覺 SLAM 系統(tǒng)，它集成了用于迭代姿態(tài)和深度優(yōu)化的卷積門控循環(huán)單元 (CGRU) 以及用于特征提取的 CNN。該系統(tǒng)結(jié)合了密集的捆綁調(diào)整來優(yōu)化相機(jī)姿態(tài)和深度，與 ORB-SLAM3 相比，在魯棒性和準(zhǔn)確性方面取得了顯著的提升，尤其是在動(dòng)態(tài)場(chǎng)景和使用 RGB-D 等多模態(tài)數(shù)據(jù)的情況下。盡管取得了這些進(jìn)步，但該方法的高計(jì)算開銷對(duì)實(shí)時(shí)應(yīng)用提出了挑戰(zhàn)。

將深度學(xué)習(xí)與多模態(tài)數(shù)據(jù)相結(jié)合，使 SLAM 系統(tǒng)能夠增強(qiáng)對(duì)環(huán)境的語義理解。Tao 等人提出了一種基于掩模評(píng)分區(qū)域的 CNN (R-CNN)的 3D 語義 VSLAM 方法，該方法將語義分割與改進(jìn)的 ORB-SLAM2 相結(jié)合，以提高在復(fù)雜室內(nèi)環(huán)境中的建圖精度。同樣地，Yang 等人開發(fā)了 SDF-SLAM，融合深度和語義信息，為家庭和服務(wù)機(jī)器人提供強(qiáng)大的環(huán)境理解。動(dòng)態(tài)環(huán)境對(duì) SLAM 系統(tǒng)提出了重大挑戰(zhàn)。Sun 等人提出了一種基于深度學(xué)習(xí)和 VSLAM 的多目標(biāo)定位與建圖方法，有效地處理動(dòng)態(tài)場(chǎng)景。An 等人引入了一種涉及深度特征和鄰域圖的增量式回環(huán)檢測(cè)方法，以提高大規(guī)模環(huán)境中的回環(huán)效率和精度。

對(duì)于低功耗和資源受限設(shè)備上的 SLAM 應(yīng)用，Tang 等人提出了GCNv2 模型，該模型支持在嵌入式設(shè)備上運(yùn)行，可實(shí)現(xiàn)室內(nèi)環(huán)境中無人機(jī)和輕型機(jī)器人的高效自主導(dǎo)航。Masuda 等人開發(fā)了一種神經(jīng)隱式事件生成器來解決低光和高速場(chǎng)景下的動(dòng)態(tài)跟蹤問題，擴(kuò)展了 SLAM 系統(tǒng)在極端環(huán)境下的適應(yīng)性。為了增強(qiáng) SLAM 系統(tǒng)在復(fù)雜室內(nèi)環(huán)境中的結(jié)構(gòu)映射能力，Liao 等人提出了 SO-SLAM，結(jié)合了尺度和對(duì)稱紋理約束。Chen 等人提出了精確物體關(guān)聯(lián)和姿態(tài)更新的方法，集成了公平多物體跟蹤 (FairMOT) 進(jìn)行實(shí)時(shí)多物體跟蹤。通過增強(qiáng)物體關(guān)聯(lián)和姿態(tài)細(xì)化，該系統(tǒng)顯著提高了室內(nèi)環(huán)境中的定位精度和魯棒性，特別是對(duì)于服務(wù)機(jī)器人應(yīng)用。提出了一種基于深度學(xué)習(xí)特征的單目視覺SLAM方法（LIFT-SLAM），將DL與VSLAM相結(jié)合，在嘈雜環(huán)境和動(dòng)態(tài)場(chǎng)景中表現(xiàn)出優(yōu)異的性能。

Li 等人提出了一種基于 AI 基礎(chǔ)模型的 VSLAM 回環(huán)消歧方法，解決了重復(fù)環(huán)境中的混淆問題，提高了 SLAM 系統(tǒng)的可靠性。這些進(jìn)步有助于提高 SLAM 系統(tǒng)在實(shí)際應(yīng)用中的魯棒性，因?yàn)閷?shí)際應(yīng)用中的條件可能差別很大。提出了一種創(chuàng)新的基于 AI 的室內(nèi)定位方法，特別是一種基于深度學(xué)習(xí)的視覺 SLAM 系統(tǒng)，該系統(tǒng)利用多任務(wù)特征提取網(wǎng)絡(luò)和自監(jiān)督特征點(diǎn)，以提高在復(fù)雜環(huán)境中的準(zhǔn)確性和穩(wěn)定性。提出了一種基于 AI 的 SLAM 室內(nèi)定位方法，利用 DeconvNet 和局部連接的自動(dòng)編碼器(LCA) 提取低維特征表示，從而提高機(jī)器人應(yīng)用中回環(huán)檢測(cè)的準(zhǔn)確性和速度。

基于人工智能的方法利用激光雷達(dá)數(shù)據(jù)解決了動(dòng)態(tài)環(huán)境適應(yīng)、傳感器融合和軌跡優(yōu)化等難題，顯著推進(jìn)了室內(nèi) SLAM 的發(fā)展。Bian 等采用粒子群優(yōu)化 (PSO)和多目標(biāo)粒子群優(yōu)化(MO-PSO) 來增強(qiáng) FastSLAM，在復(fù)雜的室內(nèi)環(huán)境中實(shí)現(xiàn)了卓越的實(shí)時(shí)性能和定位精度。Zeng 等利用遺傳算法 (GA)優(yōu)化自適應(yīng)蒙特卡洛定位 (AMCL)，并將其與人工地標(biāo)相結(jié)合，以提高使用 2D 激光雷達(dá)在特征稀疏場(chǎng)景下的定位魯棒性。同樣，F(xiàn)usic 等將自適應(yīng)粒子群優(yōu)化 (PSO) 與 Hector SLAM 相結(jié)合，顯著提高了動(dòng)態(tài)條件下的實(shí)時(shí)建圖和導(dǎo)航能力。Nedjah 等應(yīng)用群體智能和混合遺傳算法 (GA) 方法來優(yōu)化 SLAM，依靠激光雷達(dá)數(shù)據(jù)在高度動(dòng)態(tài)的環(huán)境中實(shí)現(xiàn)精確、高效的定位。

總而言之，基于人工智能的定位方法將深度學(xué)習(xí)、對(duì)抗性遷移學(xué)習(xí)和自監(jiān)督學(xué)習(xí)與多模態(tài)數(shù)據(jù)相結(jié)合，顯著推動(dòng)了 VSLAM 領(lǐng)域的發(fā)展。這些技術(shù)彌補(bǔ)了傳統(tǒng) SLAM 在動(dòng)態(tài)復(fù)雜環(huán)境中的不足，提高了系統(tǒng)的實(shí)時(shí)性、適應(yīng)性和魯棒性。這些研究為 AMR 在室內(nèi)環(huán)境下的精準(zhǔn)導(dǎo)航和環(huán)境感知奠定了堅(jiān)實(shí)的基礎(chǔ)，推動(dòng)了 AMR 在服務(wù)機(jī)器人和智能家居領(lǐng)域的應(yīng)用。

4.2.2 .用于AMR的LiDAR SLAM

基于激光雷達(dá)的 SLAM 利用激光雷達(dá)傳感器獲取點(diǎn)云數(shù)據(jù)，實(shí)現(xiàn)環(huán)境建圖和姿態(tài)估計(jì)。然而，在復(fù)雜的光照條件和動(dòng)態(tài)環(huán)境下，激光雷達(dá) SLAM 可能會(huì)面臨數(shù)據(jù)丟失等挑戰(zhàn)。在近期的 SLAM 研究中，基于人工智能的深度學(xué)習(xí)方法已被廣泛應(yīng)用，以提升激光雷達(dá) SLAM 系統(tǒng)的魯棒性和準(zhǔn)確性。

Chen 等人開發(fā)了一種用于室內(nèi) LiDAR SLAM 的結(jié)構(gòu)語義引導(dǎo) LiDAR 超分辨率網(wǎng)絡(luò) (SGSR-Net)，可生成高密度、結(jié)構(gòu)感知的點(diǎn)云。這顯著提高了復(fù)雜室內(nèi)場(chǎng)景下 SLAM 的精度和穩(wěn)定性。然而，SGSR-Net 對(duì)高性能硬件的依賴限制了其在資源受限環(huán)境中的適用性。

綜上所述，基于AI的深度學(xué)習(xí)方法不斷發(fā)展，以應(yīng)對(duì)LiDAR SLAM中的各種挑戰(zhàn)，從增強(qiáng)點(diǎn)云分割和回環(huán)檢測(cè)，到多源數(shù)據(jù)融合和超分辨率增強(qiáng)。這些進(jìn)步展現(xiàn)了LiDAR SLAM在復(fù)雜環(huán)境中的巨大潛力。表5總結(jié)了各種基于AI的SLAM算法及其相關(guān)細(xì)節(jié)。

表5.各種基于AI的SLAM算法及相關(guān)細(xì)節(jié)的總結(jié)。

H = 高，M = 中，L = 低。

4.2.3多傳感器融合增強(qiáng)AMR的SLAM定位

集成多種傳感器（例如視覺攝像頭、激光雷達(dá)和慣性測(cè)量單元）的 SLAM 系統(tǒng)，通過充分利用每個(gè)傳感器的優(yōu)勢(shì)來提升穩(wěn)健性和準(zhǔn)確性，顯著提升了室內(nèi)定位技術(shù)。人工智能技術(shù)（尤其是機(jī)器學(xué)習(xí)和深度學(xué)習(xí)）的結(jié)合，在有效融合數(shù)據(jù)、糾正錯(cuò)誤和適應(yīng)動(dòng)態(tài)環(huán)境方面發(fā)揮著至關(guān)重要的作用。

Chen 和 Hong開發(fā)了一種融合激光雷達(dá)和視覺數(shù)據(jù)的四足機(jī)器人系統(tǒng)，增強(qiáng)了復(fù)雜室內(nèi)地形的環(huán)境感知。同樣，Singh 等人在主動(dòng) SLAM 框架內(nèi)集成了立體視覺攝像頭和超聲波傳感器，利用人工智能進(jìn)行障礙物檢測(cè)和深度感知，改善了社交環(huán)境中的導(dǎo)航和地圖繪制。Uganya 等人通過將激光雷達(dá)數(shù)據(jù)與機(jī)器學(xué)習(xí)方法相結(jié)合，進(jìn)一步推進(jìn)了多傳感器融合，通過基于人工智能的數(shù)據(jù)集成，在各種室內(nèi)環(huán)境中實(shí)現(xiàn)了更高的精度和適應(yīng)性。

Saputra 等人提出了一種熱慣性 SLAM 系統(tǒng)，該系統(tǒng)利用概率神經(jīng)網(wǎng)絡(luò)(PNN) 進(jìn)行特征提取，并利用混合密度網(wǎng)絡(luò) (MDN) 進(jìn)行不確定性感知的姿態(tài)估計(jì)。這種方法顯著提高了低光照和低特征環(huán)境下的定位精度。Liu 等人通過整合 IMU 數(shù)據(jù)并使用 YOLOv5 進(jìn)行動(dòng)態(tài)物體檢測(cè)，增強(qiáng)了視覺 SLAM 的性能，從而通過基于深度學(xué)習(xí)的運(yùn)動(dòng)補(bǔ)償提高了動(dòng)態(tài)和模糊室內(nèi)環(huán)境中的定位精度。

Zhou 等提出了融合 SLAM (FSLAM)，這是一種緊密耦合的視覺-激光雷達(dá)系統(tǒng)，它集成了分層特征網(wǎng)絡(luò) (HF-Net)，用于分層特征提取和回環(huán)檢測(cè)。通過利用 HF-Net 提取局部和全局特征的能力，該系統(tǒng)顯著提高了地圖建圖的可靠性和定位精度，尤其是在特征稀缺的環(huán)境中。Ramezani 等提出了一種激光雷達(dá)-慣性 SLAM 系統(tǒng)，它集成了高效段匹配 (ESM)，這是一種基于深度學(xué)習(xí)的回環(huán)檢測(cè)方法，利用深度學(xué)習(xí)的點(diǎn)云描述符。通過學(xué)習(xí)復(fù)雜模式并識(shí)別先前訪問過的位置，ESM 顯著提高了工業(yè)室內(nèi)環(huán)境中的定位精度和地圖建圖的可靠性。

利用多傳感器融合的基于人工智能的方法，通過提高動(dòng)態(tài)和復(fù)雜環(huán)境中的準(zhǔn)確性、魯棒性和適應(yīng)性，顯著提高了 SLAM 性能。Nam 等人提出了室內(nèi)導(dǎo)航深度強(qiáng)化學(xué)習(xí) SLAM (iNAV-drlSLAM)，這是一個(gè)結(jié)合 DRL 和ACO 的框架，利用激光雷達(dá)和攝像頭數(shù)據(jù)增強(qiáng)動(dòng)態(tài)障礙物密集環(huán)境中的 SLAM。Xie 等人開發(fā)了一個(gè)多機(jī)器人 SLAM 框架，利用 GA 進(jìn)行全局路徑優(yōu)化，利用 DRL 進(jìn)行實(shí)時(shí)避障，通過融合激光雷達(dá)和 IMU 數(shù)據(jù)有效地協(xié)調(diào)多個(gè)機(jī)器人。Tang 等人進(jìn)一步證明了基于人工智能的方法在利用多傳感器輸入優(yōu)化 SLAM 方面的潛力，確保在部分已知的環(huán)境中實(shí)現(xiàn)精確高效的定位。

總體而言，這些研究強(qiáng)調(diào)了人工智能在室內(nèi) SLAM 多傳感器融合中的關(guān)鍵作用，展現(xiàn)出其增強(qiáng)的魯棒性、準(zhǔn)確性和適應(yīng)性。通過有效整合各種傳感器數(shù)據(jù)并利用先進(jìn)的人工智能技術(shù)，這些基于人工智能的 SLAM 系統(tǒng)能夠應(yīng)對(duì)動(dòng)態(tài)復(fù)雜室內(nèi)環(huán)境的挑戰(zhàn)，為更可靠、更高效的自主導(dǎo)航和地圖繪制解決方案鋪平道路。

（4.3 .）基于AI增強(qiáng)里程計(jì)的AMR定位

（4.3.1 .）AMR的航位推算方法（DR）

傳統(tǒng)里程計(jì)中的DR方法主要依靠IMU、車輪編碼器等傳感器數(shù)據(jù)，通過積分運(yùn)動(dòng)參數(shù)進(jìn)行位置估計(jì)。然而，這些方法在復(fù)雜動(dòng)態(tài)環(huán)境中往往面臨精度下降、魯棒性不足等挑戰(zhàn)。這主要是由于IMU數(shù)據(jù)中固有的噪聲和偏差，導(dǎo)致長期定位過程中累積誤差較大。基于AI的DR利用ML和DL技術(shù)，實(shí)現(xiàn)多源傳感器數(shù)據(jù)的高級(jí)融合與分析，提升定位精度和對(duì)復(fù)雜環(huán)境的適應(yīng)性。例如，利用CNN處理IMU和車輪編碼器數(shù)據(jù)可以更有效地濾除噪聲和誤差，提供更穩(wěn)定的位置信息。此外，基于AI的方法可以學(xué)習(xí)和適應(yīng)不同的運(yùn)動(dòng)模式和環(huán)境變化，從而減少對(duì)高精度傳感器的依賴。然而，這些方法也面臨著需要大量訓(xùn)練數(shù)據(jù)和高計(jì)算資源等挑戰(zhàn)。因此，在保證實(shí)時(shí)性的同時(shí)優(yōu)化模型性能成為當(dāng)前的研究重點(diǎn)。

近年來，人工智能增強(qiáng)型DR方法的研究主要集中在幾個(gè)關(guān)鍵領(lǐng)域。首先，在INS的增強(qiáng)方面，Hurwitz等人研究了如何使用人工智能輔助INS在GNSS信號(hào)中斷期間實(shí)現(xiàn)精確定位。他們引入了一種混合DL-慣性融合濾波器，利用CNN來提高IMU在周期性運(yùn)動(dòng)期間的定位精度。他們的方法被稱為慣性加權(quán)航位推算(DR-IW)，驗(yàn)證了人工智能增強(qiáng)型DR在沒有外部參考的情況下的有效性，并提高了傳感器融合能力。

其次，針對(duì)低成本IMU在DR中的應(yīng)用挑戰(zhàn)，Guo等將模型驅(qū)動(dòng)方法與深度學(xué)習(xí)方法相結(jié)合，利用不變擴(kuò)展卡爾曼濾波器（InEKF）和深度學(xué)習(xí)模型來提高IMU的精度。這種方法在降低成本的同時(shí)提高了定位性能，從而拓寬了人工智能增強(qiáng)型DR的應(yīng)用范圍。同時(shí)，Brossard等提出了一種基于深度學(xué)習(xí)的IMU陀螺儀去噪方法。他們利用CNN消除IMU數(shù)據(jù)中的噪聲和偏差，實(shí)現(xiàn)了精確的姿態(tài)估計(jì)，其性能優(yōu)于一些主流慣性導(dǎo)航系統(tǒng)。這進(jìn)一步證明了深度學(xué)習(xí)在DR方法中處理IMU數(shù)據(jù)的能力。

最后，Li 等人使用全連接神經(jīng)網(wǎng)絡(luò) (FCNN) 將里程計(jì)數(shù)據(jù)與激光雷達(dá)數(shù)據(jù)融合，提高了室內(nèi) AMR 定位精度。他們利用 DR 獲取初步里程計(jì)信息，并將其與 FCNN 中的激光雷達(dá)數(shù)據(jù)相結(jié)合，有效利用網(wǎng)絡(luò)的非線性映射和自適應(yīng)學(xué)習(xí)能力來補(bǔ)償傳感器誤差。這種方法實(shí)現(xiàn)了厘米級(jí)的定位精度，顯著優(yōu)于傳統(tǒng)的概率方法。該研究凸顯了基于人工智能的 FCNN 在推進(jìn)基于 DR 的室內(nèi)移動(dòng)機(jī)器人定位方法方面的潛力。

綜上所述，AI增強(qiáng)型DR方法通過深度學(xué)習(xí)方法有效解決了IMU和車輪編碼器數(shù)據(jù)中的噪聲和漂移問題，從而實(shí)現(xiàn)了多傳感器融合和經(jīng)濟(jì)高效的應(yīng)用。這些研究表明，AI方法不僅提高了傳感器數(shù)據(jù)的利用效率，而且顯著增強(qiáng)了系統(tǒng)整體的定位精度和魯棒性。然而，基于AI的DR方法也面臨著需要大量訓(xùn)練數(shù)據(jù)和高計(jì)算資源等挑戰(zhàn)。因此，未來的研究應(yīng)側(cè)重于探索AI與其他濾波器或定位方法的深度融合，在保證實(shí)時(shí)性的同時(shí)優(yōu)化模型性能，從而不斷提升DR方法的定位能力。

（4.3.2）基于視覺的AMR里程計(jì)

視覺里程計(jì)(VO)通過追蹤圖像特征來估算機(jī)器人的運(yùn)動(dòng)軌跡，但它容易出現(xiàn)累積誤差，并且在長期運(yùn)行中面臨著動(dòng)態(tài)環(huán)境的挑戰(zhàn)。為了突破這些局限性，近期的研究進(jìn)展主要集中在改進(jìn)特征提取、通過穩(wěn)健的優(yōu)化技術(shù)減少漂移，以及集成特定領(lǐng)域的增強(qiáng)功能，以使視覺里程計(jì)能夠適應(yīng)復(fù)雜場(chǎng)景。

近年來，視覺里程計(jì) (VO) 在室內(nèi)機(jī)器人導(dǎo)航領(lǐng)域取得了顯著進(jìn)展，尤其是在深度學(xué)習(xí) (DL) 的推動(dòng)下。這些發(fā)展有助于克服傳統(tǒng)幾何方法在復(fù)雜動(dòng)態(tài)環(huán)境中的一些局限性。深度學(xué)習(xí)模型可以學(xué)習(xí)穩(wěn)健的特征表示和運(yùn)動(dòng)模式。這種集成提升了里程計(jì)估計(jì)的性能，使機(jī)器人能夠在具有挑戰(zhàn)性的條件下更有效地導(dǎo)航。

自 2019 年起，Liang 等人提出了 SalientDSO，首次將視覺顯著性與直接稀疏視覺里程計(jì) (VO) 相結(jié)合，通過移除信息量較低的特征點(diǎn)來提高視覺里程計(jì)的魯棒性和準(zhǔn)確性。這項(xiàng)工作為深度學(xué)習(xí)應(yīng)用于特征選擇奠定了基礎(chǔ)，顯著提升了視覺里程計(jì)的性能；然而，它仍然局限于直接方法，缺乏對(duì)深度信息等多模態(tài)數(shù)據(jù)的有效利用。

為了進(jìn)一步增強(qiáng)環(huán)境感知，Zhang 等將 RGB-D 攝像機(jī)與深度學(xué)習(xí)相結(jié)合，以提高動(dòng)態(tài)環(huán)境中的視覺里程計(jì) (VO) 性能。RGB-D 攝像機(jī)提供豐富的深度信息，能夠在特征匹配過程中更有效地處理環(huán)境動(dòng)態(tài)。雖然該方法提高了視覺里程計(jì)的魯棒性，但它高度依賴于傳感器質(zhì)量，限制了其在深度信息不完整或噪聲環(huán)境中的性能。

為了應(yīng)對(duì)視覺里程計(jì)在復(fù)雜現(xiàn)實(shí)環(huán)境中的泛化挑戰(zhàn)，Wang 等人提出了 TartanVO，通過在多樣化數(shù)據(jù)集上進(jìn)行訓(xùn)練，顯著提升了視覺里程計(jì)的泛化能力。這一突破使 TartanVO 能夠在不同數(shù)據(jù)集上保持穩(wěn)健的性能，為視覺里程計(jì)的普遍適用性奠定了基礎(chǔ)。然而，該模型的有效性依賴于大量的標(biāo)記數(shù)據(jù)，并且在完全未知的環(huán)境中泛化能力仍然有限。

在此基礎(chǔ)上，Kim 等人在同步視覺里程計(jì)、目標(biāo)檢測(cè)和實(shí)例分割(SimVODIS++) 網(wǎng)絡(luò)的基礎(chǔ)上，引入了一種新穎的神經(jīng)語義視覺里程計(jì)架構(gòu)，將多任務(wù)學(xué)習(xí)與注意力機(jī)制相結(jié)合，使系統(tǒng)能夠識(shí)別和處理動(dòng)態(tài)場(chǎng)景中的關(guān)鍵目標(biāo)。SimVODIS++ 不僅提高了系統(tǒng)準(zhǔn)確率，還展現(xiàn)了在動(dòng)態(tài)環(huán)境中聚焦顯著區(qū)域的能力，從而在復(fù)雜場(chǎng)景中表現(xiàn)出色。然而，計(jì)算需求的增加使得在資源受限的設(shè)備上部署它變得具有挑戰(zhàn)性。

為了進(jìn)一步優(yōu)化動(dòng)態(tài)場(chǎng)景中的視覺里程計(jì)性能，Shen 等提出了基于學(xué)習(xí)的動(dòng)態(tài)視覺里程計(jì) (DytanVO)，該方法聯(lián)合優(yōu)化了攝像機(jī)自運(yùn)動(dòng)和運(yùn)動(dòng)分割，以應(yīng)對(duì)動(dòng)態(tài)物體的干擾。該方法通過優(yōu)化攝像機(jī)運(yùn)動(dòng)與分割結(jié)果之間的相互依賴性，顯著提高了動(dòng)態(tài)環(huán)境下的軌跡估計(jì)精度。盡管訓(xùn)練和優(yōu)化過程需要大量資源，但聯(lián)合優(yōu)化有效地解決了先前研究中動(dòng)態(tài)物體處理能力不足的問題。

為了減少對(duì)標(biāo)記數(shù)據(jù)的依賴，曹等提出了一種集成動(dòng)作的無監(jiān)督視覺里程計(jì) (VO) 用于導(dǎo)航。該系統(tǒng)結(jié)合了路徑積分，減少了對(duì) GPS 等外部定位系統(tǒng)的依賴，從而能夠高效地執(zhí)行室內(nèi)導(dǎo)航任務(wù)。無監(jiān)督方法為視覺里程計(jì)訓(xùn)練提供了新的方向，但其路徑積分方法在長期運(yùn)行過程中容易出現(xiàn)累積誤差，從而可能導(dǎo)致精度下降。

為了進(jìn)一步探索如何降低數(shù)據(jù)需求，Ghafourian 等人提出了一種少樣本學(xué)習(xí)視覺導(dǎo)航系統(tǒng)。該方法使用少量的視覺地標(biāo)樣本來引導(dǎo)導(dǎo)航，即使沒有大量標(biāo)記數(shù)據(jù)也能實(shí)現(xiàn)有效的性能。雖然該方法在降低訓(xùn)練數(shù)據(jù)需求方面表現(xiàn)出色，但其靈活性和對(duì)復(fù)雜場(chǎng)景變化的適應(yīng)性仍需進(jìn)一步改進(jìn)。

Kostusiak 等利用深度學(xué)習(xí)增強(qiáng) RGB-D 視覺里程計(jì) (VO) 中的深度信息，解決了深度傳感器數(shù)據(jù)質(zhì)量低的問題，使低成本傳感器能夠?qū)崿F(xiàn)高精度軌跡估計(jì)。這項(xiàng)工作使得廉價(jià)傳感器應(yīng)用于視覺里程計(jì)成為可能，但仍需進(jìn)一步改進(jìn)，以增強(qiáng)系統(tǒng)在深度信息缺失或噪聲情況下的魯棒性。

Prasad 等人提出了基于運(yùn)動(dòng)結(jié)構(gòu)學(xué)習(xí)器 (SfMLearner++)，這是一種基于人工智能的室內(nèi)機(jī)器人定位方法。該方法采用深度學(xué)習(xí)進(jìn)行單目深度和自運(yùn)動(dòng)估計(jì)，并結(jié)合幾何約束來提高準(zhǔn)確性，使其適用于室內(nèi)環(huán)境。

GANVO和堆疊生成對(duì)抗網(wǎng)絡(luò) (SGANVO)分別利用 GAN 進(jìn)行無監(jiān)督單目深度和六自由度相機(jī)運(yùn)動(dòng)預(yù)測(cè)，以此為例展示了這種方法。GANVO 可以有效地處理RGB 圖像序列；然而，由于難以捕捉隨時(shí)間變化的特征，其在動(dòng)態(tài)場(chǎng)景中性能會(huì)下降。SGANVO 通過堆疊 GAN 層來緩解這一限制，從而改進(jìn)了對(duì)時(shí)間動(dòng)態(tài)的捕捉，并提升了在運(yùn)動(dòng)劇烈的環(huán)境中的性能。

最后，Eirale 等人開發(fā)了 Marvin，這是一款模塊化的全向輔助機(jī)器人，旨在在復(fù)雜的家庭環(huán)境中實(shí)現(xiàn)靈活導(dǎo)航。Marvin 集成了輕量級(jí)人工智能算法，并在狹窄空間內(nèi)展現(xiàn)出高效的導(dǎo)航能力。然而，它主要面向家庭應(yīng)用，其對(duì)更復(fù)雜環(huán)境的適應(yīng)性和可擴(kuò)展性需要進(jìn)一步驗(yàn)證。

（4.3.3 .）基于里程計(jì)的多傳感器融合AMR定位

近年來，基于融合的里程計(jì)取得了重大進(jìn)展，這主要得益于深度學(xué)習(xí)的發(fā)展。這些現(xiàn)代方法采用端到端深度神經(jīng)網(wǎng)絡(luò)，無需傳統(tǒng)方法中固有的手工特征提取。因此，它們表現(xiàn)出增強(qiáng)的準(zhǔn)確性和魯棒性，特別是在復(fù)雜環(huán)境中。如圖 8所示，通用多傳感器里程計(jì)框架結(jié)合了來自各種傳感器的數(shù)據(jù)，以增強(qiáng)運(yùn)動(dòng)估計(jì)的魯棒性和準(zhǔn)確性。盡管如此，在實(shí)際應(yīng)用中仍然存在某些局限性。為了便于全面理解，我們根據(jù)核心方法和技術(shù)的相似性對(duì)相關(guān)研究進(jìn)行了分類。通過整合和總結(jié)類似的研究，我們系統(tǒng)地闡明了每種方法的缺點(diǎn)和后續(xù)改進(jìn)。

視覺-慣性里程計(jì) (VIO) 融合的最新進(jìn)展利用 GAN 和其他深度學(xué)習(xí)方法來增強(qiáng)深度和自我運(yùn)動(dòng)估計(jì)，同時(shí)減少對(duì)標(biāo)記數(shù)據(jù)集的依賴。值得注意的是，SelfVIO將 GAN 與自監(jiān)督學(xué)習(xí)相結(jié)合，無需標(biāo)記數(shù)據(jù)即可進(jìn)行單目 VIO 和深度估計(jì)。盡管 SelfVIO 擁有創(chuàng)新的框架，但在復(fù)雜場(chǎng)景下魯棒性有限，這促使人們探索堆疊GAN 架構(gòu)，以在挑戰(zhàn)性條件下提升性能。作為基于 GAN 方法的補(bǔ)充，DeepVIO和魯棒神經(jīng)慣性導(dǎo)航輔助 VIO (RNIN-VIO)等方法結(jié)合了視覺和慣性傳感器數(shù)據(jù)，以提高里程計(jì)精度。DeepVIO 利用 CNN 和LSTM網(wǎng)絡(luò)從立體序列中學(xué)習(xí)三維幾何約束；然而，它在低紋理環(huán)境下面臨魯棒性問題。

圖8.基于人工智能的通用多傳感器里程計(jì)框架。

DR = 航位推算。

為了解決這些限制，RNIN-VIO 集成了 IMU 數(shù)據(jù)，從而提高了在低紋理和動(dòng)態(tài)環(huán)境中的性能。基于這些進(jìn)步，(ATVIO) 注意力引導(dǎo)的視覺-慣性里程計(jì)引入了一種注意力機(jī)制來改進(jìn)視覺和慣性數(shù)據(jù)的融合過程，有效地克服了傳統(tǒng)融合方法在異構(gòu)環(huán)境中的限制，提高了里程計(jì)的準(zhǔn)確性和可靠性。VIOLearner進(jìn)一步提高了系統(tǒng)魯棒性，它包含一個(gè)在線糾錯(cuò)模塊。雖然這一新增功能增強(qiáng)了魯棒性，但 VIOLearner 在長時(shí)間跟蹤過程中仍然面臨誤差累積的問題，這表明在長期應(yīng)用中需要進(jìn)一步改進(jìn)。

為了應(yīng)對(duì)計(jì)算挑戰(zhàn)，CodeVIO采用條件變分自編碼器 (CVAE) 進(jìn)行密集深度推理，并結(jié)合 VIO 系統(tǒng)生成詳細(xì)的深度圖。盡管該方法有效，但需要大量的計(jì)算資源；后續(xù)的輕量級(jí)變體有助于實(shí)現(xiàn)實(shí)時(shí)深度和運(yùn)動(dòng)估計(jì)，同時(shí)降低計(jì)算開銷?；趯W(xué)習(xí)的方法的進(jìn)步進(jìn)一步促進(jìn)了該領(lǐng)域的發(fā)展?；趯W(xué)習(xí)的單目 VIO結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)，通過濾波器融合實(shí)現(xiàn)高精度軌跡估計(jì)。該方法最初的特點(diǎn)是訓(xùn)練復(fù)雜度較高，后續(xù)的優(yōu)化簡化了訓(xùn)練過程，從而增強(qiáng)了其在實(shí)際應(yīng)用中的實(shí)用性。

此外，自舉單目視覺輸入輸出 (BooM-VIO)將傳統(tǒng)的視覺輸入輸出尺度估計(jì)與端到端深度學(xué)習(xí)訓(xùn)練相結(jié)合。盡管傳統(tǒng)的尺度信息在惡劣環(huán)境下可能不可靠，但深度學(xué)習(xí)模型對(duì)尺度理解的改進(jìn)顯著提升了 BooM-VIO 在挑戰(zhàn)性條件下的性能。此外，提出了一種基于人工智能的室內(nèi)機(jī)器人定位解決方案，引入了一個(gè)集成卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的無監(jiān)督框架，將單目視覺數(shù)據(jù)與慣性測(cè)量單元 (IMU) 測(cè)量數(shù)據(jù)融合。該方法創(chuàng)新地估計(jì)了深度圖和自運(yùn)動(dòng)，同時(shí)解決了誤差累積和數(shù)據(jù)污染等難題，從而有效地增強(qiáng)了室內(nèi)定位能力，而無需依賴標(biāo)記的地面實(shí)況數(shù)據(jù)。

總的來說，這些進(jìn)展凸顯了VIO融合技術(shù)的重大進(jìn)展，每項(xiàng)技術(shù)都通過創(chuàng)新的神經(jīng)網(wǎng)絡(luò)架構(gòu)和數(shù)據(jù)融合策略解決了特定的局限性。未來的研究有望進(jìn)一步增強(qiáng)魯棒性，降低計(jì)算復(fù)雜度，并提高長期跟蹤精度，從而滿足日益復(fù)雜和動(dòng)態(tài)的環(huán)境需求。

在LIO融合下，LO-Net將CNN與自監(jiān)督學(xué)習(xí)相結(jié)合，用于LiDAR姿態(tài)估計(jì)，適用于稀疏特征和動(dòng)態(tài)環(huán)境。然而，在稀疏特征場(chǎng)景下，其準(zhǔn)確率仍然會(huì)下降。通過優(yōu)化網(wǎng)絡(luò)架構(gòu)，可以更好地捕捉稀疏特征，從而取得了一些改進(jìn)。

為了擴(kuò)展多傳感器融合方法，緊學(xué)習(xí)慣性里程計(jì) (TLIO)采用緊耦合的擴(kuò)展卡爾曼濾波器框架進(jìn)行行人狀態(tài)估計(jì)，利用 IMU 數(shù)據(jù)段實(shí)現(xiàn)高效的無攝像頭狀態(tài)估計(jì)。然而，TLIO 對(duì) IMU 數(shù)據(jù)質(zhì)量較為敏感。引入濾波器優(yōu)化策略提高了對(duì)低質(zhì)量 IMU 數(shù)據(jù)的魯棒性。5G/地磁/VIO 融合定位集成了 5G 信號(hào)、地磁信號(hào)和 VIO，實(shí)現(xiàn)高精度室內(nèi)定位。通過結(jié)合反向傳播神經(jīng)網(wǎng)絡(luò) (BPNN) 進(jìn)行非線性數(shù)據(jù)融合，該系統(tǒng)有效地組合了多源信號(hào)，解決了異質(zhì)性和非線性難題。此外，優(yōu)化數(shù)據(jù)融合算法顯著增強(qiáng)了實(shí)時(shí)多源數(shù)據(jù)處理能力，提高了定位精度和系統(tǒng)效率。

基于人工智能的進(jìn)化方法在改進(jìn)室內(nèi)定位里程計(jì)方面顯示出巨大的潛力。Arbabmir 等利用多目標(biāo)遺傳算法 (MO-GA) 優(yōu)化VINS 中的濾波器參數(shù)和傳感器校準(zhǔn)。該方法通過最小化位置和速度的 RMSE 來提高軌跡精度和魯棒性，尤其是在動(dòng)態(tài)室內(nèi)和室外環(huán)境中。同樣，Sehgal 等引入了 GA 框架來優(yōu)化 VO 中 LiDAR 和單目攝像機(jī)數(shù)據(jù)融合的參數(shù)設(shè)置。該方法有效地減少了定位誤差，并改善了靜態(tài)室內(nèi)環(huán)境中的軌跡估計(jì)。Palacín 等進(jìn)一步利用 GA 對(duì)里程計(jì)系統(tǒng)中的逆運(yùn)動(dòng)矩陣進(jìn)行非參數(shù)校準(zhǔn)，從而顯著提高了定位精度和軌跡估計(jì)。

綜上所述，以上研究凸顯了基于人工智能（AI）的方法（包括進(jìn)化算法、深度學(xué)習(xí)和機(jī)器學(xué)習(xí)）在解決里程定位關(guān)鍵挑戰(zhàn)方面的多功能性。這些方法有效地解決了傳感器融合、軌跡優(yōu)化和動(dòng)態(tài)環(huán)境適應(yīng)等問題，顯著提高了里程計(jì)系統(tǒng)的精度和魯棒性。通過不斷改進(jìn)，這些方法逐步提高了系統(tǒng)在復(fù)雜動(dòng)態(tài)室內(nèi)環(huán)境中的適應(yīng)性和應(yīng)用潛力。表6全面總結(jié)了基于人工智能的AMR里程計(jì)算法及其相關(guān)細(xì)節(jié)。

（5.）基于人工智能的無人機(jī)定位

在室內(nèi)定位場(chǎng)景中，無人機(jī)的自主導(dǎo)航尤為重要?；谌斯ぶ悄艿氖覂?nèi)定位為無人機(jī)提供了精確、實(shí)時(shí)的環(huán)境感知和路徑規(guī)劃能力，對(duì)于確保無人機(jī)在密閉空間內(nèi)安全高效地運(yùn)行至關(guān)重要。鑒于室內(nèi)環(huán)境通常具有復(fù)雜的結(jié)構(gòu)和障礙物，傳統(tǒng)的GPS信號(hào)難以穿透，因此室內(nèi)定位是無人機(jī)應(yīng)用中的一項(xiàng)重大技術(shù)挑戰(zhàn)。通過人工智能算法，無人機(jī)可以融合傳感器數(shù)據(jù)實(shí)現(xiàn)自主定位和導(dǎo)航，提高任務(wù)精度并提高在動(dòng)態(tài)環(huán)境中的適應(yīng)性。基于人工智能的無人機(jī)室內(nèi)定位對(duì)于從精準(zhǔn)農(nóng)業(yè)和建筑任務(wù)到室內(nèi)監(jiān)視任務(wù)等各種應(yīng)用領(lǐng)域的任務(wù)完成至關(guān)重要。人工智能的集成使無人機(jī)能夠在不斷變化的環(huán)境中自主運(yùn)行，這標(biāo)志著人工智能成為當(dāng)前無人機(jī)研發(fā)的核心方向。

此外，Aslan 等人提出了雙向長短期記憶（PSO）和基于目標(biāo)距離的快速探索隨機(jī)樹星（BiLSTM-PSO-GDRRT）框架，該框架集成了BiLSTM、PSO 和 GDRRT，以增強(qiáng)無人機(jī)在復(fù)雜三維環(huán)境中的路徑規(guī)劃與定位。該框架利用 GDRRT 改進(jìn)采樣策略以加速路徑收斂，通過 PSO 優(yōu)化路徑以逼近最短軌跡，并利用 BiLSTM 進(jìn)行實(shí)時(shí)路徑預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明，該框架顯著提高了動(dòng)態(tài)環(huán)境下的路徑規(guī)劃效率和定位精度，滿足無人機(jī)的實(shí)時(shí)應(yīng)用需求。

以下章節(jié)將回顧各種無人機(jī)室內(nèi)定位技術(shù)，包括基于人工智能的方法，例如視覺輸入輸出 (VIO)、深度學(xué)習(xí) (DL) 和強(qiáng)化學(xué)習(xí) (RL)。我們將通過研究這些方法在不同應(yīng)用場(chǎng)景中的創(chuàng)新之處，展示該領(lǐng)域的進(jìn)展。

（5.1 .）基于里程計(jì)的無人機(jī)定位

基于里程計(jì)的定位是無人機(jī)導(dǎo)航的基礎(chǔ)，它利用傳感器數(shù)據(jù)來估算位置和方向隨時(shí)間的變化。基于人工智能的方法顯著推動(dòng)了這一領(lǐng)域的發(fā)展，增強(qiáng)了里程計(jì)在傳統(tǒng)方法難以應(yīng)對(duì)的挑戰(zhàn)性環(huán)境中的能力。這些基于人工智能的方法在缺乏GPS信號(hào)的情況下至關(guān)重要，使無人機(jī)能夠依靠慣性測(cè)量單元（IMU）和攝像頭等機(jī)載傳感器進(jìn)行精確的狀態(tài)估計(jì)。盡管傳統(tǒng)里程計(jì)方法潛力巨大，但在動(dòng)態(tài)或視覺效果較差的環(huán)境中仍面臨挑戰(zhàn)，因此需要提高算法的魯棒性和精度。

最近的研究集中于通過基于人工智能的方法增強(qiáng)DR，以改進(jìn)無人機(jī)定位。Bajwa等人提出了集成CNN的深度慣性速度輔助估計(jì)（DIVE）算法。通過直接從IMU測(cè)量值推斷速度來校正EKF狀態(tài)估計(jì)，DIVE與傳統(tǒng)DR相比顯著減少了漂移，尤其是在VIO失效的情況下。

類似地，Yang 等提出了學(xué)習(xí)型慣性航位推算 (IDR) 算法，將左不變擴(kuò)展卡爾曼濾波 (EKF) 與統(tǒng)計(jì)神經(jīng)網(wǎng)絡(luò)相結(jié)合，以增強(qiáng)在突發(fā)光照變化下的 DR 性能。在光照充足的條件下，LIDR 的精度與 VIO 相當(dāng)，并且在模擬和實(shí)際測(cè)試中優(yōu)于其他基于 IMU 的方法。將 LIDR 與 VIO 相結(jié)合，進(jìn)一步提高了動(dòng)態(tài)光照環(huán)境下的定位魯棒性。

除了這些基于人工智能的DR增強(qiáng)技術(shù)外，基于里程計(jì)的定位方法也得到了廣泛的探索。Aslan等人提出了VIONet系統(tǒng)，將高斯過程回歸(GPR)與深度學(xué)習(xí)模型Inception-v3相結(jié)合，將慣性數(shù)據(jù)轉(zhuǎn)換為圖像，并將其與光流(OF)幀融合。Inception-v3高效的特征提取顯著增強(qiáng)了無人機(jī)姿態(tài)估計(jì)的穩(wěn)定性，尤其是在具有挑戰(zhàn)性的環(huán)境中。然而，VIIONet在處理低光或低紋理場(chǎng)景方面存在局限性，并且難以部署在需要更高計(jì)算效率的嵌入式設(shè)備上。

為了解決上述特征提取效率的局限性，Yu 等人開發(fā)了一種更高效的視覺里程計(jì)系統(tǒng)，該系統(tǒng)采用輕量級(jí) CNN，包括可變形卷積(DFConv) 和深度可分離卷積(DWConv)，顯著提高了特征提取效率和系統(tǒng)在嵌入式平臺(tái)上的適用性。此外，Yu 等人設(shè)計(jì)了有效的卷積網(wǎng)絡(luò)，在低光和低紋理的室內(nèi)環(huán)境中取得了優(yōu)異的性能。然而，該方法仍然存在尺度恢復(fù)問題，而尺度恢復(fù)對(duì)于無人機(jī)精確定位尤為重要。

針對(duì)前人研究中尺度恢復(fù)問題，張等人提出了一種自監(jiān)督的VIO方法，利用自注意力機(jī)制和解耦姿態(tài)網(wǎng)絡(luò)（D-PoseNet）增強(qiáng)IMU數(shù)據(jù)處理能力，提高尺度恢復(fù)精度。該方法通過建立IMU與視覺融合姿態(tài)之間的約束關(guān)系，有效解決了傳統(tǒng)方法中尺度信息缺失的問題，使得無人機(jī)在復(fù)雜環(huán)境中實(shí)現(xiàn)更精確的定位。然而，張等人的方法仍然依賴于視覺信息，在完全缺乏視覺數(shù)據(jù)的場(chǎng)景下性能受限。

為了解決上述適應(yīng)性問題，Pan 等提出了自適應(yīng) VIO，將神經(jīng)網(wǎng)絡(luò)與傳統(tǒng)的視覺慣性束調(diào)整相結(jié)合，構(gòu)建了一個(gè)學(xué)習(xí)-優(yōu)化集成框架。該方法引入了在線持續(xù)學(xué)習(xí)機(jī)制，使系統(tǒng)能夠自適應(yīng)地適應(yīng)環(huán)境變化，從而顯著提升了 VIO 系統(tǒng)在不同場(chǎng)景下的泛化能力和定位精度。自適應(yīng) VIO 有效地克服了以往研究中觀察到的適應(yīng)性不足的問題，使無人機(jī)具有更強(qiáng)的動(dòng)態(tài)適應(yīng)性和更強(qiáng)的魯棒性。

總而言之，這些論文展現(xiàn)了一條持續(xù)改進(jìn)的道路，從增強(qiáng)視覺-慣性數(shù)據(jù)融合、提升嵌入式系統(tǒng)效率，到解決規(guī)?；謴?fù)、應(yīng)對(duì)視覺故障場(chǎng)景以及提升系統(tǒng)適應(yīng)性。每一步研究都在前人研究的基礎(chǔ)上解決了新的挑戰(zhàn)，使基于人工智能的無人機(jī)視覺輸入輸出系統(tǒng)更加精確、穩(wěn)健和智能。

表7.基于人工智能的無人機(jī)定位方法及相關(guān)細(xì)節(jié)的總結(jié)。

LZ = 定位，NV = 導(dǎo)航，PP = 路徑規(guī)劃，Q = 四旋翼飛行器，Mr = 多旋翼飛行器。

SR = 搜索和救援，IDR = 慣性導(dǎo)航。

5.2基于多傳感器融合的無人機(jī)定位

近年來，基于人工智能的無人機(jī)在室內(nèi)定位和導(dǎo)航方面取得了顯著進(jìn)展。當(dāng)前的研究主要集中于應(yīng)用深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和傳感器融合技術(shù)來應(yīng)對(duì)復(fù)雜環(huán)境中的目標(biāo)識(shí)別、路徑規(guī)劃和避障等挑戰(zhàn)。本節(jié)基于關(guān)鍵研究成果，對(duì)這些基于人工智能的無人機(jī)導(dǎo)航和定位方法進(jìn)行了分類綜述。

深度學(xué)習(xí)方法在各種環(huán)境中都表現(xiàn)出了很高的魯棒性，這使其特別適合于視覺復(fù)雜場(chǎng)景中的目標(biāo)識(shí)別和路徑規(guī)劃。Hsieh 等提出了一種計(jì)算復(fù)雜度較低的視覺導(dǎo)航方法，專為資源受限的無人機(jī)平臺(tái)而設(shè)計(jì)。Kim 等利用閉路電視 (CCTV) 系統(tǒng)結(jié)合深度學(xué)習(xí)實(shí)現(xiàn)了動(dòng)態(tài)人群感知，這在擁擠的室內(nèi)環(huán)境中非常有效。Oh 等利用集成 CNN 的 PTZ 攝像機(jī)進(jìn)行標(biāo)記檢測(cè)，顯著降低了室內(nèi)定位的部署成本。同樣，Ekici 等開發(fā)了一種倉庫無人機(jī)系統(tǒng)，該系統(tǒng)在標(biāo)記特征上采用自適應(yīng)增強(qiáng)(AdaBoost) 模型，實(shí)現(xiàn)了倉庫環(huán)境中的高精度室內(nèi)定位和庫存跟蹤。

Chhikara 等提出了一種深度卷積神經(jīng)網(wǎng)絡(luò) - 遺傳算法 (DCNN-GA)，這是一種將深度卷積神經(jīng)網(wǎng)絡(luò)與遺傳算法相結(jié)合的混合方法，有效增強(qiáng)了室內(nèi)導(dǎo)航和避障能力。Li 等提出了一種基于深度學(xué)習(xí)的目標(biāo)點(diǎn)定位技術(shù)，集成了點(diǎn)云輸電塔分割 (PCTTS) 模型，用于在復(fù)雜結(jié)構(gòu)化環(huán)境中實(shí)現(xiàn)精確的目標(biāo)識(shí)別和分割。PCTTS 利用改進(jìn)的 PointNet 架構(gòu)和偏移注意機(jī)制來增強(qiáng)特征提取和定位精度。Yi 等開發(fā)了 SA-MLP-mixer 模型，這是一種緊湊的MLP架構(gòu)，非常適合硬件資源有限的無人機(jī)，為室內(nèi)導(dǎo)航提供了有效的解決方案。Yusefi 等采用 LSTM 網(wǎng)絡(luò)和濾波器融合 IMU 傳感器數(shù)據(jù)，以實(shí)現(xiàn)高效的姿態(tài)估計(jì)，尤其是在快速變化的環(huán)境中。Ollachica 等將深度學(xué)習(xí)與面部識(shí)別和跟蹤相結(jié)合，使無人機(jī)能夠在沒有 GPS 的環(huán)境中實(shí)現(xiàn)自主定位和跟蹤。 Ashour 等人提出了一種利用環(huán)境語義輔助無人機(jī)在未知環(huán)境中進(jìn)行物體探索和建圖的方法。該方法集成了基于深度學(xué)習(xí)的語義分割模型金字塔場(chǎng)景解析網(wǎng)絡(luò) (PSPNet)，從二維圖像中提取物體類別和空間信息。這些語義數(shù)據(jù)被投影到三維點(diǎn)云上，顯著提高了室內(nèi)定位和建圖的精度。

雖然這些深度學(xué)習(xí)方法在路徑規(guī)劃和動(dòng)態(tài)避障方面表現(xiàn)良好，但它們通常需要大量計(jì)算資源，并且會(huì)受到不良光照條件的顯著影響。另一方面，強(qiáng)化學(xué)習(xí)方法在管理動(dòng)態(tài)環(huán)境和優(yōu)化導(dǎo)航路徑方面表現(xiàn)出顯著優(yōu)勢(shì)。Singla 等提出了一種基于記憶的深度強(qiáng)化學(xué)習(xí)方法，通過捕捉和回憶復(fù)雜的環(huán)境細(xì)節(jié)來提高無人機(jī)避障能力，增強(qiáng)其在復(fù)雜環(huán)境中的操作可靠性。Lin 等應(yīng)用強(qiáng)化學(xué)習(xí)開發(fā)了一個(gè)基于無人機(jī)的倉庫系統(tǒng)，該系統(tǒng)通過優(yōu)化路徑規(guī)劃有效地管理庫存。Walker 等集成了馬爾可夫決策過程(MDP) 和部分可觀測(cè)馬爾可夫決策過程(POMDP) 模型，實(shí)現(xiàn)了魯棒的路徑規(guī)劃和避障，解決了復(fù)雜室內(nèi)環(huán)境中固有的不確定性。

這些強(qiáng)化學(xué)習(xí)方法使無人機(jī)能夠在動(dòng)態(tài)環(huán)境中自主學(xué)習(xí)和執(zhí)行最佳導(dǎo)航策略，盡管它們?cè)谟?xùn)練時(shí)間和計(jì)算要求方面有相當(dāng)大的需求。多傳感器融合技術(shù)集成了來自不同傳感器的數(shù)據(jù)，以增強(qiáng)無人機(jī)在挑戰(zhàn)性環(huán)境中的魯棒性和適應(yīng)性。Kao 等提出了 VIUNet，它結(jié)合了視覺、慣性和 UWB 傳感器，可提供魯棒的室內(nèi)定位，從而減輕了單傳感器方法固有的局限性。該框架集成了基于 CNN 的光流估計(jì)模型光流網(wǎng)絡(luò)簡單 (FlowNetS) ，以增強(qiáng)視覺特征提取并提高定位精度。Bigazzi 等利用多層架構(gòu)融合異構(gòu)傳感器數(shù)據(jù)，增強(qiáng)了自主導(dǎo)航的魯棒性。Iaboni 等開發(fā)了一個(gè)事件驅(qū)動(dòng)的多無人機(jī)系統(tǒng)，結(jié)合YOLOv5進(jìn)行檢測(cè)，在復(fù)雜的動(dòng)態(tài)環(huán)境中提供了高效的多無人機(jī)跟蹤能力。

此外，Brommer 等人提出了 INSANE 數(shù)據(jù)集，這是一個(gè)大規(guī)模多傳感器數(shù)據(jù)集，支持無人機(jī)在不同環(huán)境中的定位，包括具有挑戰(zhàn)性的室內(nèi)外過渡和火星模擬地形。該數(shù)據(jù)集促進(jìn)了基于人工智能的定位算法的開發(fā)，集成了 PointNet，可實(shí)現(xiàn)精確的 3D 點(diǎn)云特征提取和環(huán)境理解。雖然這些技術(shù)可以實(shí)現(xiàn)高精度的姿態(tài)估計(jì)，但它們需要精確的傳感器校準(zhǔn)，并且涉及復(fù)雜的部署過程。

信號(hào)強(qiáng)度和基于Wi-Fi的定位方法在未知或動(dòng)態(tài)變化的環(huán)境中表現(xiàn)出良好的性能，因此特別適用于搜索和救援行動(dòng)。Chowdhury等采用了基于RSS的Q學(xué)習(xí)技術(shù)進(jìn)行無人機(jī)定位，無需事先了解環(huán)境知識(shí)，因此非常適合搜索和救援任務(wù)。

綜上所述，利用深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)和傳感器融合技術(shù)的無人機(jī)定位與導(dǎo)航研究，逐步提升了無人機(jī)系統(tǒng)的智能化、自主性和適應(yīng)性。通過組合和優(yōu)化不同的技術(shù)，這些研究為室內(nèi)無人機(jī)導(dǎo)航與定位提供了多樣化且有效的解決方案，為未來的智能搜索、環(huán)境感知和復(fù)雜任務(wù)的執(zhí)行奠定了重要基礎(chǔ)。表7總結(jié)了基于人工智能的無人機(jī)定位方法及相關(guān)細(xì)節(jié)。

（6.）出版物分析與討論

人工智能定位技術(shù)的快速發(fā)展催生了越來越多的文獻(xiàn)，涵蓋了為應(yīng)對(duì)室內(nèi)環(huán)境挑戰(zhàn)而開發(fā)的各種方法、人工智能模型和傳感器技術(shù)。為了系統(tǒng)地分析該領(lǐng)域的研究趨勢(shì)和重點(diǎn)領(lǐng)域，我們考察了三個(gè)關(guān)鍵維度的出版物分布：定位方法、人工智能模型類型和傳感器使用情況。本分析全面概述了地面AMR和無人機(jī)定位技術(shù)進(jìn)步背后的技術(shù)進(jìn)步。

圖 9、圖 10、圖 11共同展示了基于 AI 的定位研究的主要趨勢(shì)。這些圖分別突出顯示了出版物在定位方法、AI 模型類型和傳感器使用方面的分布。它們共同提供了該領(lǐng)域的技術(shù)進(jìn)步和研究重點(diǎn)的全面概述，強(qiáng)調(diào)了基于 SLAM 的方法、深度學(xué)習(xí)模型和多傳感器融合在提升地面 AMR 和無人機(jī)定位能力方面的關(guān)鍵作用。

圖 9展示了地面 AMR 和無人機(jī)定位方法的出版物分布情況。對(duì)于地面 AMR，“基于 SLAM”的方法占主導(dǎo)地位，反映了它們?cè)谑箼C(jī)器人能夠在動(dòng)態(tài)室內(nèi)環(huán)境中同時(shí)進(jìn)行地圖繪制和定位方面發(fā)揮著基礎(chǔ)性作用?！盁o里程計(jì)和 SLAM”和“基于里程計(jì)”的方法也顯示出顯著的出版物數(shù)量，凸顯了正在進(jìn)行的替代或補(bǔ)充方法的研究。對(duì)于無人機(jī)，“多傳感器融合”方法占主導(dǎo)地位，解決了空中導(dǎo)航的獨(dú)特挑戰(zhàn)，其中傳感器集成對(duì)于在復(fù)雜的室內(nèi)空間中實(shí)現(xiàn)可靠定位至關(guān)重要。

圖 10突出顯示了用于定位研究的 AI 模型類型的出版物分布情況。“深度學(xué)習(xí) (DL)”模型的出版物數(shù)量最多，凸顯了其在提取復(fù)雜特征、環(huán)境理解和自適應(yīng)學(xué)習(xí)方面的適應(yīng)性和有效性?！皺C(jī)器學(xué)習(xí) (ML)”也占有重要地位，尤其是在基于視覺的定位任務(wù)中，其中空間感知至關(guān)重要。雖然“視覺模型 (EM)”和“學(xué)習(xí)模型 (TL)”的代表性較低，但它們對(duì)于高效訓(xùn)練流程和利用預(yù)訓(xùn)練模型等專業(yè)應(yīng)用仍然至關(guān)重要。這些貢獻(xiàn)共同證明了 AI 模型在解決室內(nèi)定位復(fù)雜性方面日益占據(jù)主導(dǎo)地位。

圖 11側(cè)重于傳感器級(jí)分析，強(qiáng)調(diào)了“多傳感器融合”在已綜述的出版物中的主導(dǎo)地位。這反映出人們?cè)絹碓揭蕾囉谌诤蟻碜圆煌瑐鞲衅鞯臄?shù)據(jù)來增強(qiáng)定位的魯棒性和準(zhǔn)確性。基于“攝像頭”的方法也占據(jù)了相當(dāng)大的份額，它們利用基于視覺的方法的能力來實(shí)現(xiàn)精確的空間理解。同時(shí)，“激光雷達(dá)”和“慣性測(cè)量單元”的使用率適中，表明它們?cè)谶\(yùn)動(dòng)跟蹤和空間數(shù)據(jù)采集方面發(fā)揮著重要作用?！肮鈧鞲衅鳌焙汀熬幋a器”的數(shù)量較少，表明它們具有專門或有限的應(yīng)用，通常用于補(bǔ)充更廣泛的多傳感器系統(tǒng)。

圖9.AMR和UAV定位方法的出版物。

圖 10.按AI 模型類型劃分的出版物數(shù)量。

圖 11.按傳感器類型劃分的出版物數(shù)量。

總而言之，以上三幅圖共同揭示了基于 SLAM 的方法、深度學(xué)習(xí)模型和多傳感器融合在推進(jìn) AI 定位方面的關(guān)鍵貢獻(xiàn)。這些趨勢(shì)凸顯了研究界致力于開發(fā)穩(wěn)健且適應(yīng)性強(qiáng)的解決方案，以應(yīng)對(duì)地面 AMR 和無人機(jī)在動(dòng)態(tài)復(fù)雜室內(nèi)環(huán)境中面臨的挑戰(zhàn)。

（7.）基于AI的AMR定位實(shí)時(shí)性能評(píng)估

隨著深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和傳感器融合方法的快速發(fā)展，基于人工智能的室內(nèi)機(jī)器人定位在實(shí)時(shí)性能方面取得了顯著進(jìn)步。這些先進(jìn)技術(shù)能夠?qū)崟r(shí)處理來自各種傳感器（包括Wi-Fi、藍(lán)牙、UWB、攝像頭和IMU）的數(shù)據(jù)，從而實(shí)現(xiàn)高精度定位。然而，實(shí)現(xiàn)高實(shí)時(shí)性能仍然面臨諸多挑戰(zhàn)，例如計(jì)算復(fù)雜度、數(shù)據(jù)處理速度以及環(huán)境的動(dòng)態(tài)特性。

（7.1）人工智能模型的計(jì)算復(fù)雜性

基于人工智能模型定位的實(shí)時(shí)性很大程度上取決于其計(jì)算復(fù)雜度。盡管深度學(xué)習(xí)模型具有強(qiáng)大的特征提取能力，但其高計(jì)算復(fù)雜度往往導(dǎo)致處理延遲，尤其是在資源受限的嵌入式系統(tǒng)中。為了解決這個(gè)問題，人們提出了各種優(yōu)化方法，包括模型壓縮、剪枝和量化，以降低模型復(fù)雜度和計(jì)算要求。此外， MobileNet和SqueezeNet等輕量級(jí)網(wǎng)絡(luò)架構(gòu)已廣泛應(yīng)用于嵌入式設(shè)備，在保持高精度的同時(shí)，顯著降低了計(jì)算資源消耗。例如，一項(xiàng)研究將MobileNet部署在機(jī)器人上，實(shí)現(xiàn)了實(shí)時(shí)圖像處理，顯著提高了導(dǎo)航效率。

（7.2 .）硬件限制

硬件性能是影響基于人工智能的AMR定位方法實(shí)時(shí)性的關(guān)鍵因素。高性能硬件可以加速算法執(zhí)行，提高能效，并支持更復(fù)雜的實(shí)時(shí)計(jì)算任務(wù)。為了優(yōu)化實(shí)時(shí)性能，NVIDIA Jetson系列、Google Edge TPU和AMD的Kria KV260等專用人工智能加速芯片已在AMR中得到廣泛應(yīng)用。

表 8展示了使用常見深度學(xué)習(xí)模型（包括 ResNet-50、YOLO 和MobileNetV2）的各種硬件平臺(tái)的性能。該表涵蓋了處理速度、功耗、工作溫度和效率等指標(biāo)，深入了解了不同硬件配置如何影響實(shí)時(shí)定位任務(wù)。

不同的硬件平臺(tái)在處理速度、功耗和工作溫度方面各有優(yōu)缺點(diǎn)。像 RTX 3060 這樣的高性能GPU擁有卓越的處理能力，非常適合對(duì)實(shí)時(shí)性要求嚴(yán)格的應(yīng)用。然而，它們較高的功耗和散熱需求可能會(huì)限制其在能源受限環(huán)境中的使用。相比之下，Edge TPU 和 Jetson Nano 在能效方面表現(xiàn)出色，非常適合電池供電的 AMR 應(yīng)用，而 Kria KV260 則在性能和熱穩(wěn)定性之間實(shí)現(xiàn)了良好的平衡。

綜上所述，選擇合適的硬件平臺(tái)需要仔細(xì)考慮具體的定位算法需求和部署環(huán)境，并權(quán)衡處理速度、功耗、溫度管理等因素，以確保基于AI的定位方法在實(shí)際應(yīng)用中達(dá)到最佳的實(shí)時(shí)性能。

表8.不同硬件平臺(tái)的性能比較。

硬件平臺(tái)	模型	處理速度（FPS）	功耗（瓦）	工作溫度	功效
杰森納米	ResNet-50	十三	9/1.9	最高 109 °C（GPU：93 °C）	緩和
空單元格	YOLO	十三	9/1.9	不受調(diào)節(jié)的熱量	緩和
空單元格	MobileNetV2	15	8/2	高溫	緩和
克里婭 KV260	ResNet-50	33	10.7/5.5	測(cè)試中最酷的	高的
空單元格	YOLO	33	10.7/5.5	穩(wěn)定的	高的
空單元格	MobileNetV2	三十五	10.3/6	穩(wěn)定的	高的
RTX 3060	ResNet-50	240	45/10	穩(wěn)定的	最好的
空單元格	YOLO	240	45/10	穩(wěn)定的	最好的
空單元格	MobileNetV2	280	46/12	穩(wěn)定的	出色的
Edge TPU	ResNet-50	不適用	不適用	不適用	不適用
空單元格	YOLO	8	2	穩(wěn)定的	緩和
空單元格	MobileNetV2	400	2	穩(wěn)定的	出色的

（7.3 .）延遲和吞吐量

系統(tǒng)延遲和吞吐量直接影響機(jī)器人在動(dòng)態(tài)環(huán)境中的響應(yīng)能力和導(dǎo)航精度。高延遲可能導(dǎo)致機(jī)器人無法及時(shí)響應(yīng)環(huán)境變化，從而影響避障和路徑規(guī)劃的準(zhǔn)確性。為了平衡精度和實(shí)時(shí)性，引入了邊緣計(jì)算和霧計(jì)算等分布式計(jì)算架構(gòu)。邊緣計(jì)算將計(jì)算資源和數(shù)據(jù)存儲(chǔ)靠近最終用戶或基站，支持在傳感器處進(jìn)行數(shù)據(jù)處理并實(shí)現(xiàn)實(shí)時(shí)響應(yīng)定位，從而在加速數(shù)據(jù)處理的同時(shí)增強(qiáng)系統(tǒng)的實(shí)時(shí)輸出。霧計(jì)算在傳感設(shè)備和云之間增加了一層用于數(shù)據(jù)預(yù)處理、處理和分析，提供更好的計(jì)算性能和數(shù)據(jù)管理能力。例如，一項(xiàng)研究提出了一種基于深度強(qiáng)化學(xué)習(xí)的物聯(lián)網(wǎng)應(yīng)用程序調(diào)度算法（DRLIS），以自適應(yīng)、有效地優(yōu)化異構(gòu)物聯(lián)網(wǎng)應(yīng)用程序的響應(yīng)時(shí)間，同時(shí)平衡邊緣和霧服務(wù)器上的負(fù)載。

實(shí)際應(yīng)用案例展現(xiàn)了不同技術(shù)在實(shí)時(shí)性方面的優(yōu)缺點(diǎn)。例如，利用FPGA進(jìn)行神經(jīng)網(wǎng)絡(luò)加速的研究顯著提高了處理速度，滿足了復(fù)雜環(huán)境下的實(shí)時(shí)定位要求。另一項(xiàng)研究通過在機(jī)器人上部署輕量級(jí)網(wǎng)絡(luò)MobileNet實(shí)現(xiàn)了實(shí)時(shí)圖像處理，提高了機(jī)器人在動(dòng)態(tài)環(huán)境下的導(dǎo)航效率。此外，基于邊緣計(jì)算和霧計(jì)算架構(gòu)的系統(tǒng)在多傳感器數(shù)據(jù)融合和實(shí)時(shí)響應(yīng)方面表現(xiàn)出色，顯著增強(qiáng)了機(jī)器人在復(fù)雜環(huán)境下的自主導(dǎo)航能力。

（8.）基于AI的定位方法與傳統(tǒng)定位方法的比較

在AMR室內(nèi)定位中，基于AI的方法和傳統(tǒng)的非AI方法各有優(yōu)缺點(diǎn)。

傳統(tǒng)方法包括基于 RSSI 的指紋定位，它根據(jù)來自不同接入點(diǎn)的信號(hào)強(qiáng)度確定位置，以及基于 CSI 的定位，其中信道狀態(tài)信息 (CSI通過捕獲詳細(xì)的信道特性提供比 RSSI 更豐富的數(shù)據(jù)，從而提高定位精度。

基于距離和角度的定位方法也很常用，例如三邊測(cè)量（根據(jù)信號(hào)傳輸時(shí)間或到達(dá)時(shí)間差計(jì)算位置）和三角測(cè)量（根據(jù)與已知參考點(diǎn)的角度確定位置）。

此外，基于幾何的定位涉及使用帶有卡爾曼濾波或粒子濾波的傳感器數(shù)據(jù)，其特點(diǎn)是簡單、能耗低、實(shí)時(shí)性好，適用于資源受限的環(huán)境。

然而這些傳統(tǒng)方法在復(fù)雜、動(dòng)態(tài)變化的環(huán)境中往往表現(xiàn)出較低的定位精度和魯棒性，并且容易受到信號(hào)干擾和環(huán)境變化的影響。

為了更清楚地說明基于AI的方法與傳統(tǒng)方法之間的差異，設(shè)計(jì)了如下的對(duì)比表（表9）。下面討論每種方法的詳細(xì)評(píng)估標(biāo)準(zhǔn)。

表9.基于AI的方法與傳統(tǒng)方法的比較。

評(píng)估標(biāo)準(zhǔn)	基于人工智能的方法	傳統(tǒng)方法
準(zhǔn)確性	在復(fù)雜環(huán)境中表現(xiàn)優(yōu)異	中等，依賴于環(huán)境
即時(shí)的	需要高性能硬件	低硬件要求
復(fù)雜	高的	低級(jí)、簡單的算法
能源使用	高，依賴于硬件	低的
魯棒性	強(qiáng)大，適應(yīng)變化	虛弱，對(duì)變化敏感
成本	需要高端專用硬件	低的
維護(hù)	復(fù)雜、持續(xù)的訓(xùn)練	簡單、易于維護(hù)
可擴(kuò)展性	隨著復(fù)雜性的增加，擴(kuò)展性更好	在有限的硬件上更容易擴(kuò)展

（8.1）準(zhǔn)確性

基于人工智能的方法實(shí)現(xiàn)了顯著更高的精度，這使其特別適合在動(dòng)態(tài)和混亂環(huán)境中運(yùn)行的室內(nèi) AMR。它們能夠從大型數(shù)據(jù)集中學(xué)習(xí)復(fù)雜的模式，即使在具有挑戰(zhàn)性的室內(nèi)場(chǎng)景中也能實(shí)現(xiàn)精確定位。例如，基于 CNN 的模型在受控環(huán)境中可以實(shí)現(xiàn)低至 0.2 米的定位誤差，而傳統(tǒng)方法在類似條件下的定位誤差通常會(huì)超過 1 米。這種精度優(yōu)勢(shì)在物體密集的倉庫或信號(hào)干擾嚴(yán)重的區(qū)域等環(huán)境中尤為明顯，而傳統(tǒng)的基于幾何的方法在這些環(huán)境中經(jīng)常失效。此外，人工智能模型可以利用端到端學(xué)習(xí)同時(shí)優(yōu)化特征提取和決策，減少通常會(huì)影響傳統(tǒng)分步過程的錯(cuò)誤累積。然而，在簡單、靜態(tài)的室內(nèi)環(huán)境中，傳統(tǒng)方法可以在沒有計(jì)算開銷的情況下實(shí)現(xiàn)相當(dāng)?shù)木取?/p>

（8.2 .）實(shí)時(shí)性能

由于深度學(xué)習(xí)模型的計(jì)算需求，基于人工智能的方法還需要高性能硬件（如GPU或 TPU）來實(shí)時(shí)處理數(shù)據(jù)。例如，用于實(shí)時(shí)定位的 ResNet-50 架構(gòu)可能需要超過 4 GFLOPS。盡管有這樣的硬件要求，基于人工智能的方法在實(shí)時(shí)處理大規(guī)模、高維傳感器數(shù)據(jù)（如激光雷達(dá)點(diǎn)云或高分辨率相機(jī)圖像）方面表現(xiàn)出色。對(duì)于自動(dòng)倉庫導(dǎo)航或機(jī)器人路徑規(guī)劃等應(yīng)用，這種能力是必不可少的。傳統(tǒng)方法雖然能夠以較低的硬件要求（如 CPU）實(shí)現(xiàn)實(shí)時(shí)性能，但在動(dòng)態(tài)和嘈雜的環(huán)境中往往難以保持相同的精度和魯棒性。然而，在簡單靜態(tài)的室內(nèi)環(huán)境中，傳統(tǒng)方法可以在沒有計(jì)算開銷的情況下實(shí)現(xiàn)相當(dāng)?shù)木取?/p>

（8.3 .）復(fù)雜性

人工智能方法的復(fù)雜性源于其深層架構(gòu)，通常涉及數(shù)百萬個(gè)參數(shù)。一個(gè)典型的用于定位的最先進(jìn)的 CNN 可能擁有超過 5000 萬個(gè)可訓(xùn)練參數(shù)，而像 Transformers 這樣的高級(jí)模型則可能超過數(shù)億個(gè)。這種復(fù)雜性使這些模型能夠捕捉傳感器數(shù)據(jù)中復(fù)雜的空間和時(shí)間關(guān)系，這對(duì)于精確定位至關(guān)重要。雖然傳統(tǒng)方法算法更簡單、參數(shù)更少，更容易實(shí)現(xiàn)和調(diào)試，但它們?nèi)狈m應(yīng)不同環(huán)境或數(shù)據(jù)源的靈活性，這使得它們?cè)趯?shí)際應(yīng)用中的通用性較差。

（8.4 .）能源使用情況

由于訓(xùn)練和推理的計(jì)算強(qiáng)度，基于人工智能的方法能耗顯著增加。例如，訓(xùn)練深度學(xué)習(xí)模型（如 CNN 或 RNN）可能消耗數(shù)十到數(shù)百千瓦時(shí)（kWh）的電能，具體取決于模型復(fù)雜度和數(shù)據(jù)集大小。這一挑戰(zhàn)在模型訓(xùn)練過程中尤為明顯，因?yàn)榇笠?guī)模數(shù)據(jù)集和多次訓(xùn)練周期需要大量的計(jì)算資源。在推理過程中，人工智能模型還需要 GPU 或?qū)Ｓ糜布@比傳統(tǒng)的基于 CPU 的方法消耗更多電能。然而，硬件效率的提升（例如能耗優(yōu)化的 GPU 和邊緣人工智能設(shè)備）正在逐步緩解這一問題。在室內(nèi)自主移動(dòng)學(xué)習(xí) (AMR) 領(lǐng)域，實(shí)時(shí)處理和自適應(yīng)性至關(guān)重要，因此必須在能耗需求與顯著的性能優(yōu)勢(shì)之間取得平衡。相比之下，傳統(tǒng)方法輕量級(jí)且計(jì)算要求較低，因此能耗效率更高，非常適合資源受限的場(chǎng)景。

（8.5 .）魯棒性

基于人工智能的方法表現(xiàn)出卓越的魯棒性，非常適合室內(nèi) AMR 定位。通過利用遷移學(xué)習(xí)或微調(diào)，預(yù)先訓(xùn)練的深度學(xué)習(xí)模型可以適應(yīng)新的室內(nèi)環(huán)境，例如辦公空間、倉庫或購物中心，即使在傳感器噪聲或環(huán)境變化等具有挑戰(zhàn)性的條件下也能保持一致的性能和可靠性。這種適應(yīng)性使機(jī)器人能夠在動(dòng)態(tài)和混亂的室內(nèi)環(huán)境中始終如一地工作，而傳統(tǒng)方法通常需要進(jìn)行大量的手動(dòng)重新配置。此外，基于人工智能的方法可以集成多模態(tài)傳感器數(shù)據(jù)，例如攝像頭、激光雷達(dá)、UWB 和 IMU 輸入，從而增強(qiáng)對(duì)傳感器故障或噪聲的魯棒性。這種多模態(tài)融合能力即使在復(fù)雜的真實(shí)室內(nèi)環(huán)境中也能確?？煽康亩ㄎ缓蛯?dǎo)航。

（8.6 .）成本

由于需要專用硬件（例如 GPU）、大量數(shù)據(jù)收集和頻繁重新訓(xùn)練，基于 AI 的室內(nèi) AMR 方法的實(shí)施成本通常較高。例如，使用云端 GPU 訓(xùn)練深度學(xué)習(xí)模型來處理定位和導(dǎo)航等任務(wù)可能要花費(fèi)數(shù)百美元。然而，這項(xiàng)前期投資通?？梢酝ㄟ^長期效益來證明，例如減少對(duì)手動(dòng)重新校準(zhǔn)的依賴，增強(qiáng)對(duì)動(dòng)態(tài)室內(nèi)環(huán)境的適應(yīng)性，以及在倉庫、購物中心和辦公空間等不同環(huán)境中更高的可擴(kuò)展性。相比之下，傳統(tǒng)方法對(duì)于小規(guī)模或靜態(tài)室內(nèi)應(yīng)用更具成本效益，但它們需要頻繁的人工干預(yù)，并且缺乏應(yīng)對(duì)復(fù)雜多變場(chǎng)景所需的靈活性。

（8.7 .）維護(hù)

基于人工智能的室內(nèi)AMR方法需要持續(xù)維護(hù)，包括定期更新模型、數(shù)據(jù)管道以及檢查與不斷發(fā)展的硬件的兼容性。例如，已部署的用于定位和導(dǎo)航的神經(jīng)網(wǎng)絡(luò)可能需要頻繁更新，以適應(yīng)室內(nèi)環(huán)境的變化，例如家具的重新布置、動(dòng)態(tài)障礙物或新傳感器類型的添加。這種復(fù)雜性與人工智能模型的適應(yīng)性相平衡，人工智能模型可以根據(jù)更新后的數(shù)據(jù)集進(jìn)行重新訓(xùn)練，從而在不斷變化的室內(nèi)場(chǎng)景中保持穩(wěn)健的性能。相比之下，傳統(tǒng)方法雖然更簡單、更易于維護(hù)，但缺乏處理此類變化的靈活性，并且在動(dòng)態(tài)室內(nèi)環(huán)境中面臨新挑戰(zhàn)時(shí)，通常需要徹底重新設(shè)計(jì)。

（8.8 .）可擴(kuò)展性

隨著數(shù)據(jù)和環(huán)境復(fù)雜性的增加，基于人工智能的方法能夠有效擴(kuò)展，這使其特別適合室內(nèi) AMR 定位。通過利用龐大而多樣化的數(shù)據(jù)集，這些方法可以在動(dòng)態(tài)室內(nèi)環(huán)境中學(xué)習(xí)復(fù)雜的空間和時(shí)間模式。例如，隨著更豐富的空間和語義數(shù)據(jù)的可用性增加，基于圖的神經(jīng)網(wǎng)絡(luò)通過提高定位精度展示了其可擴(kuò)展性。這些數(shù)據(jù)（包括詳細(xì)的房間布局或動(dòng)態(tài)物體分布）使這些模型能夠?qū)W習(xí)和適應(yīng)更復(fù)雜的室內(nèi)環(huán)境，從而有效地處理更大的數(shù)據(jù)集和更高維的信息。在智能工廠、大型倉庫或多層辦公樓等應(yīng)用中，這種可擴(kuò)展性對(duì)于管理高密度數(shù)據(jù)和滿足多樣化的定位要求至關(guān)重要。相比之下，傳統(tǒng)方法難以推廣和擴(kuò)展，尤其是在高維或大規(guī)模室內(nèi)環(huán)境中，這限制了它們?cè)诂F(xiàn)代機(jī)器人應(yīng)用中的有效性。

盡管存在一些弊端，例如更高的復(fù)雜性、能耗和實(shí)施成本，但基于人工智能的方法憑借其在處理復(fù)雜動(dòng)態(tài)環(huán)境方面無與倫比的優(yōu)勢(shì)，仍然是室內(nèi)定位的首選。它們?cè)趥鹘y(tǒng)方法常常失效的地方表現(xiàn)出色，能夠從多傳感器數(shù)據(jù)中提取分層特征，并通過再訓(xùn)練和微調(diào)適應(yīng)各種場(chǎng)景?；谌斯ぶ悄艿姆椒ㄟ€能通過從額外數(shù)據(jù)中學(xué)習(xí)來持續(xù)提升性能，即使在存在動(dòng)態(tài)障礙物或遮擋的復(fù)雜條件下也能實(shí)現(xiàn)穩(wěn)健的定位。此外，其可擴(kuò)展性確保了其在大規(guī)模和高維環(huán)境中的有效運(yùn)行，而這些環(huán)境在現(xiàn)代應(yīng)用中越來越常見。隨著時(shí)間的推移，雖然硬件和模型開發(fā)的前期投資較高，但基于人工智能的方法通過減少手動(dòng)重新校準(zhǔn)和維護(hù)的需求，證明了其在長期部署中更為高效。這些特性使得基于人工智能的方法對(duì)于在室內(nèi)定位任務(wù)中需要高精度、穩(wěn)健性和可擴(kuò)展性的應(yīng)用而言不可或缺。

（9.）未解決的問題和未來展望

通過對(duì)基于AI的AMR室內(nèi)定位方法的廣泛文獻(xiàn)綜述，我們認(rèn)識(shí)到該領(lǐng)域涵蓋了廣泛的問題和已提出的解決方案。與該主題相關(guān)的主要挑戰(zhàn)和未解決的問題如下。

（9.1 .）未解決的問題

一個(gè)尚未解決的重要問題是，許多基于人工智能的模型需要大量的數(shù)據(jù)才能達(dá)到令人滿意的性能。獲取大量有價(jià)值的數(shù)據(jù)進(jìn)行模型訓(xùn)練通常是一項(xiàng)艱巨的任務(wù)。開發(fā)能夠從有限或未標(biāo)記的數(shù)據(jù)中學(xué)習(xí)的高效算法仍然是一個(gè)懸而未決的研究課題。

另一個(gè)關(guān)鍵挑戰(zhàn)是確保移動(dòng)機(jī)器人的穩(wěn)健性和可靠性，因?yàn)檫@些方面對(duì)于在不同環(huán)境中的可靠運(yùn)行越來越重要。盡管機(jī)器人技術(shù)和人工智能取得了重大進(jìn)步，但確保自主系統(tǒng)（尤其是那些采用自學(xué)習(xí)算法的系統(tǒng)）的安全性和可靠性至關(guān)重要，尤其是在涉及人機(jī)交互的場(chǎng)景中。開發(fā)通用的AMR異常檢測(cè)系統(tǒng)有助于比較和集成各種異常檢測(cè)技術(shù)，從而促進(jìn)更安全、更可靠的自主系統(tǒng)。

此外，我們的綜述強(qiáng)調(diào)了探索特定人工智能方法與其對(duì)應(yīng)的移動(dòng)機(jī)器人任務(wù)之間關(guān)系的必要性。例如，雖然深度學(xué)習(xí)方法經(jīng)常應(yīng)用于移動(dòng)機(jī)器人路徑規(guī)劃，但在各種方法中確定最優(yōu)方法仍然是一個(gè)懸而未決的問題。

神經(jīng)機(jī)器人技術(shù)是一個(gè)新興的研究領(lǐng)域，它將生物學(xué)原理應(yīng)用于機(jī)器人系統(tǒng)。受神經(jīng)行為學(xué)（研究自然動(dòng)物行為的神經(jīng)基礎(chǔ)）的啟發(fā)，研究人員正在探索神經(jīng)網(wǎng)絡(luò)擾動(dòng)對(duì)機(jī)器人行為的影響，力求提高機(jī)器人系統(tǒng)的性能和適應(yīng)性。

（9.2 .）挑戰(zhàn)

將復(fù)雜的人工智能方法與移動(dòng)機(jī)器人機(jī)載控制系統(tǒng)有限的計(jì)算資源相結(jié)合，是一項(xiàng)巨大的挑戰(zhàn)。讓移動(dòng)機(jī)器人能夠使用基于人工智能的方法進(jìn)行實(shí)時(shí)決策和運(yùn)動(dòng)控制也極具挑戰(zhàn)性。此外，增強(qiáng)算法對(duì)動(dòng)態(tài)變化環(huán)境的適應(yīng)性仍然是一項(xiàng)尤為艱巨的挑戰(zhàn)。

處理動(dòng)態(tài)物體和環(huán)境是移動(dòng)機(jī)器人面臨的主要挑戰(zhàn)之一。大多數(shù)研究未能充分考慮動(dòng)態(tài)障礙物和環(huán)境。移動(dòng)機(jī)器人要適應(yīng)環(huán)境變化，需要有效地繞過動(dòng)態(tài)障礙物。

移動(dòng)機(jī)器人的功耗、分配和管理是經(jīng)常被忽視的關(guān)鍵因素。同樣，針對(duì)功耗和性能的算法優(yōu)化在移動(dòng)機(jī)器人研究中也很少得到重視。解決這些挑戰(zhàn)對(duì)于延長機(jī)器人運(yùn)行時(shí)間和提高整體效率至關(guān)重要。

設(shè)計(jì)新的、可擴(kuò)展的方法，有效地訓(xùn)練協(xié)作機(jī)器人執(zhí)行各種任務(wù)，也是一個(gè)緊迫的挑戰(zhàn)。例如，無人機(jī)與地面機(jī)器人之間的協(xié)作可以增強(qiáng)機(jī)器人的適應(yīng)性，并擴(kuò)展其能力。

隱私問題是設(shè)計(jì)機(jī)器人輔助系統(tǒng)時(shí)面臨的另一個(gè)重大挑戰(zhàn)。機(jī)器人監(jiān)視人類可能會(huì)引發(fā)影響人類行為的隱私問題；通過直接觀察個(gè)人并增加獲取個(gè)人信息的渠道，它們可能會(huì)危及隱私。AMR還面臨物理攻擊（例如，傳感器干擾）和數(shù)字攻擊（例如，篡改導(dǎo)航和控制系統(tǒng)）。此類攻擊可能導(dǎo)致系統(tǒng)誤解環(huán)境，對(duì)路徑規(guī)劃和控制產(chǎn)生不利影響，例如，導(dǎo)致機(jī)器人走錯(cuò)誤的路徑或使其在緊急情況下無法停止。此外，在AI模型訓(xùn)練和推理階段遭受攻擊可能導(dǎo)致數(shù)據(jù)泄露和模型誤導(dǎo)等隱患。降低安全風(fēng)險(xiǎn)和加強(qiáng)數(shù)據(jù)保護(hù)是AI機(jī)器人未來面臨的關(guān)鍵挑戰(zhàn)。

我們預(yù)見，未來的研究將側(cè)重于確保值得信賴的人工智能機(jī)器人系統(tǒng)能夠抵御各種攻擊場(chǎng)景，遵守其部署領(lǐng)域的倫理和法律原則，并確保與這些系統(tǒng)的交互保持私密。為了在推理攻擊期間保護(hù)隱私，未來的機(jī)器人應(yīng)用中可以實(shí)施各種安全策略?？梢钥紤]諸如差異隱私和數(shù)據(jù)混淆等概念。

（10.）結(jié)論

本文全面回顧了過去五年基于人工智能的AMR定位方法的文獻(xiàn)。我們系統(tǒng)地總結(jié)了人工智能方法的基本原理及其在AMR定位中的算法應(yīng)用，特別關(guān)注了基于SLAM、里程計(jì)和多傳感器融合的人工智能方法，這些方法適用于地面AMR和無人機(jī)。我們對(duì)基于人工智能的方法與傳統(tǒng)方法進(jìn)行了比較分析，以突出它們各自的優(yōu)勢(shì)和局限性。盡管人工智能模型展現(xiàn)出顯著的技術(shù)優(yōu)勢(shì)，但在實(shí)現(xiàn)最佳實(shí)時(shí)性能方面仍然存在挑戰(zhàn)。

此外，我們還評(píng)估了各種 AI 模型在主流硬件平臺(tái)上的性能，強(qiáng)調(diào)了 AMR 實(shí)時(shí)定位所必需的關(guān)鍵權(quán)衡。

通過對(duì)現(xiàn)有文獻(xiàn)的詳細(xì)分析和對(duì)未來研究方向的探索，我們強(qiáng)調(diào)了基于人工智能的方法在增強(qiáng)室內(nèi)機(jī)器人對(duì)復(fù)雜動(dòng)態(tài)環(huán)境的適應(yīng)性方面的重要性。

展望未來，AMR 的進(jìn)步取決于彌合當(dāng)前的技術(shù)差距、促進(jìn)創(chuàng)新、提高系統(tǒng)可靠性和效率，以及增強(qiáng)人機(jī)交互，從而徹底改變其在不同領(lǐng)域的應(yīng)用?？偠灾?，我們討論了基于人工智能的定位面臨的尚未解決的問題和挑戰(zhàn)，并強(qiáng)調(diào)先進(jìn)技術(shù)的廣泛應(yīng)用將為未來的研究提供寶貴的指導(dǎo)，最終促進(jìn)制定新的戰(zhàn)略來提升 AMR 能力。

3、ATI Motors 發(fā)布雙臂移動(dòng)操作機(jī)器人（中叉網(wǎng)、agv網(wǎng)、無人系統(tǒng)網(wǎng)）

在自動(dòng)化與智能制造浪潮之下，具有操作臂的移動(dòng)機(jī)器人（mobile manipulator）正成為連接“搬運(yùn)”與“作業(yè)”能力的關(guān)鍵。近日，印度機(jī)器人公司ATI Motors 正式發(fā)布其最新研發(fā)成果——Sherpa Mecha，一款配備雙臂的移動(dòng)操作機(jī)器人，該產(chǎn)品的亮相意味著公司從傳統(tǒng)自主移動(dòng)機(jī)器人進(jìn)一步擴(kuò)展至具備靈巧操作能力的工業(yè)人形機(jī)器人領(lǐng)域。

ATI Motors 成立于印度班加羅爾，其主營業(yè)務(wù)是開發(fā)和銷售自主移動(dòng)機(jī)器人，并提供其軟件平臺(tái)與集成服務(wù)。該公司已有的 Sherpa 系列產(chǎn)品在工廠、倉儲(chǔ)等環(huán)境中應(yīng)用廣泛，包括牽引型、托盤搬運(yùn)型、升降型等機(jī)器人。根據(jù)公開資料，其 AMR 產(chǎn)品已在印度、東南亞、美國、墨西哥等地的工廠部署，累計(jì)執(zhí)行任務(wù)量正快速增長。

在 Product Day 2025 的新品發(fā)布會(huì)上，ATI Motors 除了推出重載牽引機(jī)器人 Sherpa 10K，也重點(diǎn)展示 Sherpa Mecha。該機(jī)器人采用“類人靈感”（humanoid-inspired）設(shè)計(jì)，但不追求生物仿真，而是聚焦工業(yè)實(shí)用性。Sherpa Mecha 配備兩條機(jī)械臂、一個(gè)“頭部”模組和輪式底盤，用以在工業(yè)環(huán)境中完成搬運(yùn)、檢測(cè)、揀選等任務(wù)。

據(jù) ATI Motors 的聯(lián)合創(chuàng)始人兼 CEO Saurabh Chandra 表示，Sherpa Mecha 是“受人類啟發(fā)但并不刻意模仿人類”的機(jī)器人，其目標(biāo)是利用機(jī)器本身的優(yōu)勢(shì)完成任務(wù)。在設(shè)計(jì)上，Sherpa Mecha 放棄了機(jī)械腿的復(fù)雜結(jié)構(gòu)，而采用輪式底盤以提升行駛穩(wěn)定性與效率；其碳纖維結(jié)構(gòu)高度輕量，對(duì)臂部負(fù)載能力目前可達(dá)約 12 kg（在約 1 米臂展位置），未來版本則瞄準(zhǔn) 35 kg 的能力。其機(jī)械手并非傳統(tǒng)仿生手指，而是支持可更換工具模塊，使機(jī)器人在執(zhí)行如分揀、檢測(cè)、搬運(yùn)等多種任務(wù)間切換時(shí)具靈活性。視覺感知方面，其手部還內(nèi)置攝像頭，以支持精密識(shí)別與測(cè)量。

Sherpa Mecha 的推出，實(shí)際上是 ATI 在其 Sherpa 平臺(tái)基礎(chǔ)上的一次“能力向上擴(kuò)展”。此前，ATI 的 AMR 產(chǎn)品線包括 Sherpa Monofork、Sherpa Lifter 500、Sherpa Pallet Mover 1.5T 等型號(hào)，覆蓋搬運(yùn)、托盤、推拉、提升等功能。此前已有報(bào)道指出 Sherpa Monofork 的額定載荷為 500 kg，續(xù)航時(shí)間約 8 小時(shí)；Sherpa Lifter 500 支持多種頂端模塊（剪叉、回轉(zhuǎn)臺(tái)、滾筒等），載重 500 kg，續(xù)航可達(dá) 16 小時(shí)；Sherpa Pallet Mover 1.5T 的載荷能力已提升至 1.5 噸（1,500 kg）水平。而 Sherpa 10K 則是一款重載牽引機(jī)器人，其最大牽引能力為 5 噸（約 11,000 磅），具備 3D LiDAR + 攝像頭融合導(dǎo)航能力，并支持原地轉(zhuǎn)向功能，適應(yīng)狹窄車間環(huán)境。

在新產(chǎn)品發(fā)布會(huì)上，ATI 同時(shí)公布其 Sherpa 系列在全球部署的任務(wù)量已達(dá)每年超過百萬級(jí)的水平（即其機(jī)器人系統(tǒng)每年執(zhí)行超過 1,000,000 次自主任務(wù)）。該數(shù)字反映了公司在自主導(dǎo)航、路徑規(guī)劃、場(chǎng)景適配與調(diào)度能力上的積累。ATI 也指出，將開放 Sherpa Mecha 給高校、研究機(jī)構(gòu)和產(chǎn)業(yè)伙伴進(jìn)行聯(lián)合開發(fā)，以推動(dòng)人機(jī)協(xié)作研究與工業(yè)落地。

Sherpa Mecha 的面世意味著 ATI Motors 正試圖打破傳統(tǒng) AMR 只能“搬運(yùn)”的局限，向具備“操作能力”的機(jī)器人平臺(tái)邁進(jìn)。若能在可靠性、控制精度、感知能力、軟件生態(tài)與成本控制層面取得平衡，其有望成為制造業(yè)中的柔性作業(yè)力量。而從行業(yè)視角看，Sherpa Mecha 的推出也呼應(yīng)全球范圍內(nèi)越來越多廠商將“操控臂 + 移動(dòng)平臺(tái)”融合為一體的趨勢(shì)，以實(shí)現(xiàn)更高層級(jí)的自動(dòng)化與柔性制造。