機器視覺 從科學上講,人眼可以感知390到770nm的電磁波長范圍。機器視覺是將圖像轉換成數字信號進行分析處理的技術,并讓機器擁有了人眼無法企及的視覺功能,非常適用于那些不適合人工作的危險任務或是人眼難以滿足要求的場合。 什么是機器視覺? 理解機器視覺系統最簡單的方法之一是把它看作機器的眼睛。從專業角度看,機器視覺是一種通過圖像處理實現自動檢測和分析應用的技術。可以說,機器視覺是一種技術能力,它以新的方式與現有技術集成,并將其應用于解決現實問題。 機器視覺是一門系統工程學科,有時也會被人拿來與計算機視覺進行比較。其實,計算機視覺和機器視覺是相互重疊的技術。機器視覺系統需要計算機和特定的軟硬件才能工作,而計算機視覺不需要借助有形的硬件來完成,比如連接到機器人上的視覺箱或攝像機等,這是二者最顯著的區別。機器視覺可以看作是計算機視覺的一個子類,計算機視覺是其大腦,沒有計算機視覺,機器視覺就無法工作。 具體來看,計算機視覺可以在線分析圖像或視頻,以及來自運動探測器、紅外傳感器或其他來源的圖像。隨著邊緣AI的發展,計算機視覺開始從云端移到邊緣,更加靠近收集數據的傳感器。 機器視覺系統始于20世紀50年代。從1980年到1990年,這項技術才真正開始起步并日益普及。值得注意的是,隨著計算機視覺技術的發展,機器視覺潛在應用的可能性也相應增加,并從主要的應用領域——工業自動化環境——向著安全、自動駕駛車輛、食品生產、包裝和物流,甚至包括機器人和無人機等行業擴展。現在,機器視覺系統可以檢查和分類各個行業的各種物體和物品,包括汽車、電子和半導體、食品和飲料、道路和車輛交通或智能運輸系統(ITS)、醫療成像、包裝、標簽和印刷、制藥等。 圖1:機器視覺市場增長情況(圖源:MarketsandMarkets) Markets and Markets報告稱,機器視覺的市場規模預計將從2020年的107億美元增長到2025年的147億美元,復合年增長率為6.5%。對質量檢測和自動化的需求不斷增長、非傳統和新興應用對機器視覺系統需求的不斷增長,以及對視覺引導機器人需求的不斷增長,這些都是推動機器視覺市場增長的關鍵因素。 哪些行業從中受益? 機器視覺應用的優勢主要體現在五個方面: 一是在檢驗、測量、計量和裝配驗證方面具有更高性能和質量。 二是能提高重復性任務的生產率,還能有效減少機器停機時間并縮短安裝時間。 三是在測量和計量上有較大的靈活性,還可保證更嚴格的過程控制。 四是能降低生產成本,及早發現缺陷,降低廢品率。 五是占地面積小,降低了生產成本。 當前,工業領域中的機器視覺應用比重很大,同時這一領域也從中收益頗多。通過與深度學習和機器學習等技術的深度結合,機器視覺能幫助使用該技術的企業更好地理解數據,并優化業務以獲得更高的效率,例如寶馬就將該技術與人工智能和機器學習結合使用以提高效率。 隨著各類技術的不斷完善,機器視覺應用領域也不斷拓寬,應用范圍包括對象辨識、產品檢測、外觀尺寸、甚至3D建模存貨清點。在實際中,機器視覺系統還能夠以定制的方式設計和實現到系統中,來滿足更多應用需求。 根據最終用途劃分,機器視覺市場分為汽車、醫藥和化學品、電子和半導體、紙漿和紙張、印刷和標簽、食品和飲料(包裝和裝瓶)、玻璃和金屬、郵政和物流等。目前,汽車行業是重要的機器視覺系統采用者。2020年,汽車行業的占比達到19.38%,預計從2021年到2028年將有可觀的增長。在汽車工業中,機器視覺被廣泛用于檢查目的,包括有無檢查、防錯、裝配驗證和最終檢查。此外,機器視覺系統用于尺寸測量、機器人引導和測試自動化,屬于測量和引導應用。因此,整個汽車行業對機械化成像的需求很大,預計未來幾年將繼續穩步增長。 機器視覺的“眼睛” 所有機器視覺方法都受到人類視覺系統的啟發,從二維圖像中提取概念信息——它們有基于2D圖像的捕獲系統和模擬人類視覺感知的計算機視覺算法。 人類通過3D感知周圍的世界。在機器視覺系統的三個分類中,1D視覺系統不是一次查看整張圖片,而是一次分析一行信號。它們通常檢測并分類連續過程中制造的產品的缺陷,如金屬、塑料、紙張、無紡布薄板或卷制品。 在標準照明條件下,機器視覺系統通常使用常規2D成像。有時物體需要特定照明來記錄缺陷——例如,機器視覺系統可以使用多光譜成像、高光譜成像、紅外波段、線掃描成像、3D成像和X射線成像。與更復雜的照明相比,通常的2D可見光照明圖像是單色的,而更復雜的照明考慮了顏色、幀速率、分辨率等因素,以及成像過程是否在整個圖像上同步,從而使其適用于需要技術跟蹤特定移動項目的系統。 目前,尚沒有典型的機器視覺系統可以作為其他設計的參考,因為機器視覺是一種能力,而不是一種產品或特定類型的設計。在實際應用中,它們是將不同的組件集成在一起來實現。 機器視覺系統的主要組成部分包括照明系統、鏡頭、圖像傳感器、視覺處理和通信系統。燈光照亮要檢查的零件,使其特征突出,以便攝像頭可以看到它們。鏡頭捕捉圖像,以光的形式呈現給傳感器。傳感器將該光線轉換為數字圖像,發送至視頻處理器進行分析。視覺處理包括檢查圖像和提取必要檢查和決策所需信息的算法。 如果說機器視覺讓機器增加了一雙眼睛,按字面和實際意義來理解,圖像傳感器就是機器視覺系統的那個“視”,相當于系統的“眼睛”,它的優劣直接關系到整個系統的“視力”能達到何種水平。隨著機器視覺的應用日益廣泛,圖像傳感器也迎來了發展的良機。根據安森美公司提供的數據,2018年至2022年期間,機器視覺傳感器市場將以14% CAGR的速度增長。 圖2:機器視覺傳感器的市場規模,單位:百萬美元(圖源:廣發證券) CMOS圖像傳感器是機器視覺中應用最普遍的一種傳感器。與CCD傳感器一樣,它可以是單色的,也可以是彩色的。安森美MT9P031I12STC-DR1是用于高分辨率機器視覺應用的彩色CMOS傳感器,它屬于CMOS數字圖像傳感器MT9P031家族。該產品系列具有2592 H x 1944 V的有源成像像素陣列,為可編程的、高集成度產品,具有低功耗特性,既有CCD的圖像質量,同時還保持了CMOS圖像傳感器在尺寸和成本上的優勢。MT9P031傳感器既能在默認模式下工作,也可以由用戶針對幀大小、曝光、增益設置和其他參數進行編程。默認模式是以每秒14幀(fps)的速度輸出全分辨率圖像。 圖3:MT9P031傳感器方框圖(圖源:貿澤官網) 當然,一些機器視覺應用也有特定的分辨率需求。與傳統的由顯示標準(16:9或4:3)驅動的RGB觀看應用程序不同,許多機器人和機器視覺方案可通過使用不同的分辨率進行優化。如安森美的200萬像素AR0234在X方向給出了更優的條形碼方案的額外像素。在XGS系列圖像傳感器中,800萬像素、900萬像素、1200萬像素產品分別提供了2:1、1:1、4:3的圖像比例,XGS的3000萬像素、32000萬像素產品分別提供了1:1和4:3的圖像比例——1:1可用在半導體檢測,而4:3可用在屏檢。 3D機器視覺解決方案 3D機器視覺的圖像檢測更接近于人類的眼睛。借助數字化3D掃描數據,可以提取一個物體的尺寸,包括表面積、體積和形體尺寸。3D視覺傳感技術是一種深度傳感技術,它增強了攝像機進行面部和目標識別的能力。目前市場上主流的3D光學視覺方案有三種,即:雙目立體視覺法(Stereo Vision)、結構光法(Structured Light)以及飛行時間法(Time of Flight, ToF)。 在這些方法中,結構光技術最成熟,已經在工業3D機器視覺中大規模應用。在結構光方法中,一系列圖形被投射到一個物體上,然后攝像頭或傳感器檢測這些圖形的扭曲與變形。接下來,圖像處理和三角剖分算法將這些扭曲與變形轉換為3D點云數據,這些點云數據可直接用來進行分析或導出為多種CAD建模格式。比如,Texas Instruments (TI) DLP系統可以實時產生非接觸、高精度的3D數據,使3D機器視覺更加容易實現。在這個方案中,DLP芯片組可提供不同的DMD(數字微鏡器件)尺寸、像素間距、分辨率以及波長范圍。 表1:針對3D機器視覺的DLP芯片組(圖源:TI官網) 隨著技術的發展,采用飛行時間技術重建3D信息已成為機器視覺最重要的方法。飛行時間技術使用激光掃描儀根據光線到達目標并返回所需的時間來估計光源和目標之間的距離。Analog Devices (ADI) 的ADSD3100是一款基于CMOS 3D飛行時間的3D深度和2D可視光成像器,可集成到3D傳感器系統中。其所需的功能模塊包括模數轉換器(ADC)、像素偏置電路和傳感器控制邏輯,這些都內置在芯片中以便在系統中實現簡單、經濟高效的方案。ADSD3100通過MIPI、攝像頭串行接口2(CSI-2)接口與主機系統進行電氣接口。 圖4:CMOS 3D ToF傳感器ADSD3100框圖(圖源:ADI官網) 結語 與自動化、機器學習、深度學習和神經網絡等其他能力一樣,機器視覺也是一種能力,而不是一個行業。它是一種可以集成到其他技術和流程中的能力,可以使行業受益并提高業務效率。邊緣智能或邊緣人工智能是機器視覺技術發展的下一個大趨勢,它們將機器學習從云端移到物理設備的邊緣。這一切與機器視覺的未來密切相關,邊緣計算的進步使得在傳統機器視覺任務中應用深度學習能力成為可能。 從研究機構的預測中可以看出,機器視覺市場正在快速增長,企業越來越希望通過引入機器視覺和機器人等自動化功能來實現業務流程的自動化,這個趨勢不會很快放緩。 來源:貿澤電子 作者:Doctor M |