一、引言 智能移動機器人是一類能夠通過傳感器感知環境和自身狀態,實現在有障礙物的環境中面向目標的自主運動,從而完成一定的作業功能的機器人系統。移動機器人導航技術的研究內容主要包括同步定位與地圖創建、路徑規劃等若干方面的內容。 導航技術主要解決以下幾個方面的問題:通過傳感器等技術手段來獲得機器人在工作空間中的位置、方向以及環境信息;用信息融合算法對所獲得信息進行處理,并建立環境模型;尋找一條最優或次最優的無碰路徑。 近年來,移動機器人技術在工業、航空航天,特別是空間探測等許多領域發揮著重要作用,因此,越來越成為學術界關注的熱點。本文對移動機器人導航技術進行了分類,并進行了較為詳細的分析介紹,最后,對其發展趨勢做了進一步的闡述。 二、移動機器人導航技術研究現狀 1.同步定位與地圖創建 移動機器人的同步定位和地圖創建(simultaneous localization and maping, SLAM)技術是移動機器人導航技術的關鍵技術。SLAM的相關理論與關鍵技術包括地圖的表示方法、定位、不確定性的信息處理方法、數據的關聯算法等方面。 地圖的表示方法有基于圖論的表示方法和基于網格的表示方法。基于圖論的表示方法包括可視圖法、切線圖法、Voronoi圖法、拓撲圖法等。其基本思想是將機器人、工作空間、目標等用鏈接圖表示,然后,尋找一條從起始點到目標點的路徑。基于網格的表示方法有柵格法、四叉樹及擴展算法等。柵格法用網格描述機器人的工作空間,根據柵格的可信度值來確定障礙物分布,通過避障規劃就可以得到無碰路徑。 移動機器人的定位方法主要有:相對定位、GPS技術、基于人工路標的定位和基于地圖的定位等。相對定位方法主要采用里程計、光電編碼器、航向陀螺儀、加速度計等傳感器,利用測量值的積累實現定位。全球定位系統(global positioning system, GPS) ,它是以空間衛星為基礎的高精度導航與定位系統。 機器人動力學、運動學模型的近似,各傳感器信息及融合信息的不確定性,對于系統中的不確定性問題,目前,使用的主要是模糊邏輯和概率的方法。在SLAM中使用的數據關聯算法有近鄰算法和聯合相容方法來進行環境探測,傳感器信息的豐富也對數據關聯算法的一致性、適應性提出了新的挑戰。 陳衛東等人采用基于概率論的SLAM算法處理未知且不確定的環境信息和傳感器噪聲。用擴展的Kalman濾波方法進行同步地圖創建和估計機器人的位置。提出了稀松擴展信息濾波算法和FastSLAM算法,很好地解決了計算量大和數據關聯問題,取得了很好的效果。 2.路徑規劃 移動機器人路徑規劃技術按其規劃方式不同可分為基于地圖的規劃方法、基于環境建模的規劃方法、基于行為的規劃方法3種類型。 (1)基于地圖的規劃方法 地圖更新法是機器人根據當前的地圖信息規劃路徑,沿路徑前進一段時間后,利用這段時間收集到的環境信息更新地圖,然后,利用更新過的全局地圖重新規劃和調整路徑。這種過程循環下去,直到到達目標為止。路徑匹配法是利用現有信息建立一個路徑庫。根據當前的規劃任務產生的路徑信息和環境信息與路徑庫中的路徑進行匹配,以尋找出一條近似最優路徑。然后,通過一定的算法對該路徑進行修正,最后,得到最優路徑。 (2)基于環境建模的方法 在環境已知的情況下,全局路徑規劃的設計標準是盡量使規劃的效果達到最優。在此領域已經有了許多成熟的方法,基于圖論的建模方法包括可視圖法、切線圖法、Voronoi圖法、拓撲法等。基于網格的建模方法有柵格法、四叉樹法及擴展算法等。 在環境部分已知或未知環境下的基于傳感器的局部路徑規劃中,人工勢場法、模糊邏輯算法、遺傳算法、人工神經網絡應用比較廣泛。模擬退火算法、蟻群算法、粒子群算法、混沌算法、人工免疫算法和啟發式搜索方法等在最近幾年比較流行。 遺傳算法模擬了自然界中的優勝劣汰的個體進化原則,對路徑進行編碼并作為操作對象,不要求目標函數連續、可導。具有全局收斂性、隱并型搜索、很好的魯棒性和適應性等特點。李枚毅等人將進化免疫算法應用于移動機器人的路徑規劃取得了很好的效果。首先,用節點、鏈接圖進行環境建模,以最短路徑條件設計適應度函數,采用免疫算子、克隆算子、粒群行為算子等對初始種群進行操作。然后,通過免疫選擇、評價群體適應度、輸出最優個體等步驟得到最優路徑。免疫算子有提高收斂速度的作用,因此,算法能有效而快速地形成性能優良、安全程度較高的全局(次)最優可行路徑。 機器人在沒有任何先驗信息的情況下,機器人以避障功能為主,側重于發現一條通往目標的可行路徑。Koeing等人提出了增量式D3L ite算法,該方法利用啟發式搜索策略搜索一條從目標點指向機器人當前位置的路徑,并在機器人運動過程中根據局部環境的更新信息進行實時重規劃路徑,來得出一條最優路徑。 (3)基于行為的路徑規劃 基于行為的方法模仿了動物進化的自下而上的原理,嘗試用一個簡單的智能體來建立一個復雜的系統。它把導航問題分解為許多相對獨立的行為單元,如,跟蹤、避障、回退、目標制導等。 基于行為的方法大體可分為反射式、反應式、慎思式行為3種。反射式行為是一種定時的應激式本能行為;基于反應式的行為規劃方法是通過傳感器來規劃動作行為;慎思行為是利用全局環境模型進行路徑規劃的,它通過信息融合和邏輯運算來進行路徑規劃,因此,對環境中不可預知的變化反應較慢。孟江華等人采用了兩層算法,底層采用改進的Bug算法,上層為監督模塊,用來發現和糾正繞行方向的錯誤。機器人通過信心函數和路徑回溯來進行路徑規劃。該算法結合了Bug算法、全局地圖技術和類人的路徑選擇策略,比傳統的基于行為的方法更具智能性和靈活性。 三、多傳感器信息融合技術 應用于移動機器人的傳感器可以分為內部傳感器和外部傳感器兩大類。內部傳感器用于檢測機器人系統內部參數,主要有里程計、陀螺儀、磁羅盤及光電編碼器等;外部傳感器用于感知外部環境信息,主要有視覺傳感器、激光測距傳感器、超聲波傳感器、紅外傳感器等,由于單一傳感器難以保證信息的準確性和可靠性,不足以充分反應外界環境信息,因此,采用多個傳感器可實現環境信息的充分理解,便于機器人做出正確的決策。 多傳感器信息融合技術常用的方法有:加權平均法、貝葉斯估計、多貝葉斯方法、卡爾曼濾波、D2S證據推理、模糊邏輯、產生式規則、人工神經網絡等。 加權平均法是將多個傳感器的冗余數據進行加權平均,是一種底層數據融合方法,其結果不是統計上的最優估計。貝葉斯方法是根據已知的事實對未發生的事件進行概率判斷,通過已知的先驗概率對未知的概率進行推斷。D2S證據推理是貝葉斯方法的擴展,它使用了一個不穩定區間,可通過未知前提的先驗概率來彌補貝葉斯方法的不足。它特別適應于處理多傳感器集成系統的信息融合問題。 Kalman濾波是用測量模型的統計特性遞推決定在統計意義下的最優融合數據估計。人工神經網通過一定的學習算法可將傳感器的信息進行融合,獲得網絡參數。選擇有代表性的樣本集是個關鍵難題,通過運用粗糙集理論的知識數據表格約簡方法可以很好地解決這個問題。 四、移動機器人導航技術的展望 目前,移動機器人導航技術已經取得了很好的研究成果。計算機技術、電子技術、通信技術、傳感器技術、控制技術、網絡技術地迅猛發展必將推動和促進移動機器人導航技術取得更多的研究成果。移動機器人導航技術的發展有以下幾方面的趨勢:(1)視覺導航具有信息量大、探測范圍廣等特點,仍然是移動機器人導航技術的主要發展方向;(2)導航系統結構將朝著分布式、模塊化、網絡化、多機器人協作的方向發展。分布式和模塊化的結構有利于減少機器人的體積和自重。通過互聯網實現機器人的遠程操作以及基于網絡的多機器人協作是導航技術的新的研究熱點;(3)路徑規劃將朝著多層規劃和多方法相結合的方向發展。采用基于反應式的行為規劃與基于慎思行為規劃相結合的方法。全局路徑規劃和局部路徑規劃相結合更有利于復雜環境的避障規劃;(4)新技術、新方法(如,虛擬現實技術、信息融合新方法、新型傳感器等)將促進移動機器人導航技術更快地發展。 五、結束語 綜上所述,移動機器人導航技術雖然取得了一些成果,但還沒有達到實用化的水平,仍有許多問題有待解決。如何提高系統的魯棒性、柔性、容錯性,增強系統的學習能力,信息融合的有效理論和方法,用仿生技術來提高系統的決策智能性等有待進一步研究,但這些問題并不是孤立的,各部分相互作用、相互影響,必須把各部分有機地結合為一個整體系統,研究開發面向全局性能優化的導航理論與方法。 |