隨著計算機科學和自動控制技術的發展,越來越多的不同種類的智能機器人出現在工廠、生活當中,機器人視覺系統作為智能機器人系統中一個重要的子系統,也越來越受到人們的重視。它涉及了圖像處理、模式識別和視覺跟蹤等領域。不同種類的機器人由于工作的重點不一樣,它的視覺系統在軟件或硬件上都有著細微的差別。本文研究基于服務機器人的單目視覺系統。它處理的是二維圖像,是基于對無遮擋物體顏色和形狀的識別以及3D目標物體的平動跟蹤。 視覺系統是一個非常復雜的系統,它既要做到圖像的準確采集還要做到對外界變化反應的實時性,同時還需要對外界運動的目標實時跟蹤。因此,視覺系統對硬件和軟件系統都提出了較高的要求。目前比較流行的足球機器人技術,它的視覺系統屬于比較典型的快速識別和反應類型。一般情況下,它是通過彩色標志定標的方法來達到對隊員和目標的識別,以及通過擴展卡爾曼濾波器的預測功能來實現對目標的跟蹤功能。在硬件上,采用一個現成的攝像機來實現一個機器人的圖像采集系統。 本系統在設計上采用CMOS圖像傳感器代替CCD類型傳感器進行采集圖像,DSP處理芯片TMS320VC5509A進行圖像處理以及作為CPU控制,在設計過程中,為了直觀顯現機器人視覺系統識別和跟蹤的效果,專門采用了一個TFT格式的液晶來直觀顯示。軟件上,采用了一部分足球機器人的視覺技術來達到對目標的快速識別,通過全局的特征矩構建的雅可比矩陣達到對目標的自適應跟蹤。 1 硬件部分設計 圖1為系統硬件電路的功能模塊框圖。 1.1 圖像采集 視覺鏡頭把外部的圖像信息成像在圖像傳感器的面陣單元上。目前流行的圖像傳感器有面陣CCD(Charged Coupled Device,電荷耦合器件)型和面陣CMOS兩種。相比較CCD型的圖像傳感器,CMOS圖像傳感器的有源像素單元為每一個像素提供了放大器,只需一個單供電低邏輯電平電壓,功耗只相當于CCD的十分之一。CMOS圖像傳感器內部集成了A/D轉換部分,直接輸出數字信號。基于這些因素,本系統采用了Omnivision公司推出的CMOS彩色圖像傳感器OV7635。 OV7635的分辨力為640X480,能輸出3種格式的8位數據:YCbCr4:2:2模式、RGB4:2:2模式和RGB原始數據模式。輸出VGA格式最大可達到30fps(fps:每秒幀數)。能工作在逐行掃描下和隔行掃描下。OV7635有主模式和從模式兩種工作模式。在主模式下,同步信號和時鐘不由外圍設備控制。在從模式下,OV7635的場同步信號VSYNC,行同步信號HREF以及系統的晶振頻率XCLK均由外部設備控制。本系統采用的是主模式。OV7635通過I2C總線配置片內寄存器,使其輸出原始數據。系統上電復位后,由DSP芯片的I2C總線信號對CMOS寄存器初始化。然后OV7635就按要求輸出圖像信號。包括行同步信號HREF,場同步信號VSYNC,像素時鐘信號PCLK,數字圖像信號。 1.2 液晶顯示 為了很直觀的看到視覺系統對人的識別和跟蹤效果,采用了一片INNOLUX公司的PT035TN01液晶顯示屏。為了不增加對DSP的負擔,同時也為了實時看到對外界目標物體的跟蹤效果,液晶顯示的數據不經由DSP,直接通過傳感器OV7635輸出的圖像數據信號和CPLD控制時序來進行顯示。PT035TN01是3.5英寸TFT格式的液晶,分辨力為320×3(RGB)×240,液晶IF1、IF2兩輸入控制腳對輸入的數據格式進行選擇:串行RGB格式、CCIR601格式、CCIR656格式。液晶的掃描模式有4種。本視覺系統采用的輸入數據格式是CCIR601格式,掃描模式為由上到下和左到右的掃描模式。 在CCIR601格式下,圖像傳感器輸出的像素時鐘PCLK通過CPLD二分頻作為液晶的工作時鐘,圖像傳感器輸出的行同步信號HREF經過CPLD的處理后作為液晶的行同步信號HIS,這樣,在CPLD控制下,圖像傳感器OV7635輸出的數據信號送入液晶中進行顯示。 1.3 時序控制 OV7635輸出的場同步信號VSYNC,行同步信號HREF以及像素時鐘信號PCLK接至CPLD芯片,產生控制信號把OV7635輸出的數據信號存入FIFO幀存儲器AL422B中,以及產生液晶的時鐘和行同步信號控制液晶的顯示。CPLD采用了ALTERA公司的EPM7064芯片。在CPLD中完成了對FIFO的寫控制、通知DSP讀信號、液晶的時鐘信號的產生等功能。 CPLD接收場同步信號VSYNC,此信號的下降沿表示圖像傳感器輸出一幀的開始,此時CPLD產生WRST負脈沖復位FIFO的寫指針。場同步信號VSYNC下降沿后,判斷行同步信號HREF的上升沿到來,接著利用像素時鐘信號PCLK作為寫時鐘WCK將圖像數據直接存儲到FIFO中,當存到一定的數后,就及時發信號給DSP,以便DSP讀取數據,本系統采用的是一個中斷INT0來通知DSP。此時DSP可以讀數據也可以不讀,視處理的速度來定。讀數據時,可利用RD和片選,產生RCK信號。DSP讀取的速度不能太快,以讀取速度小于寫速度為原則。 在對液晶的邏輯時序控制上,由于圖像輸出的信號是640×480的像素,而液晶的顯示為320×240的格式。所以利用CPLD把圖像傳感器輸入的像素時鐘信號PCLK進行二分頻產生液晶的時鐘信號控制液晶的顯示,同時對行同步信號進行隔行有效從而達到液晶對圖像的顯示。CPLD中的程序編寫用的采用了硬件描述語言VHDL,在QUARTUSⅡ軟件平臺上進行編寫的。由于在選用芯片時采用的是EPM7064S系列的44腳PLCC封裝的,只能工作在5V電壓情況下,其輸出的高電平信號是5V,必須通過處理才能接入系統中工作在3。3V狀態下的芯片器件。 1.4 幀存儲器選擇 幀存儲器有需要外部提供地址線的RAM和不需要外部提供地址線的FIFO,為了簡化CPLD的設計。采用了FIFO的幀存儲器。FIFO又可以分為基于動態存儲的DRAM和基于靜態的SRAM。基于靜態SRAM的優點是不需要刷新電路,但容量小,需要多片才能存儲一幀數據;基于DRAM的優點是容量大,只需一片就能存儲一幀數據,缺點是必須有刷新電路。本設計中采用的是Averlogic公司的大容量FIFO動態存儲芯片AL422B。其刷新電路比較簡單,僅需WCK或RCK提供大于1M的不間斷脈沖即可。AL422B的存儲容量為3MB,由于系統一幀的信息通常包含640×480個彩色像素,每個像素占用2個字節,可存儲1幀圖像的完整信息,其工作頻率可達50MHz。 1.5 視頻處理DSP 在選用DSP時,在兼顧處理速度,存儲容量,現有條件下的加工工藝水平,以及性價比方面,選用了TI公司的144腳封裝的TMS320VC5509A,此芯片的最高工作頻率可達到200MHz,具有很高的處理速度。 DSP收到來自CPLD的讀通知信號后開始讀取AL422B中的視頻數據。為了方便處理數據,在DSP外圍擴展了一個的SDRAM。芯片采用的是HYNIX公司的HY57V161610E,此芯片的存儲容量為1M×16bits。 當DSP上電復位后,通過采樣GPIO0~GPIO3的狀態,根據采樣的狀態來進行什么樣方式的程序裝載。本系統的采用外接的flash存儲芯片的SPI口對DSP進行程序裝載,接著通過DSP的I2C口對圖像傳感器進行寄存器初始化。圖像傳感器開始輸出信號。整個系統開始進入工作。 DSP作為高速的處理器,主要用于圖像的處理。由于本視覺系統要完成識別和跟蹤功能,數據的處理量是很大的。在完成圖像處理的同時,DSP也作為控制器使用完成對控制器的控制,從而構成視覺跟蹤系統。 軟件部分設計和實驗結果已經上傳至附件
|