人機接口或人機界面(HMI)是系統和人之間進行交互和信息交換的媒介。傳統的HMI主要借助RS232、RS422/RS485等串行通信接口,以及網口、USB等數據接口來實現設備的人機交互,而展現在我們面前的“觸摸屏”、導航按鈕等是HMI產品中非常重要的硬件部分,它替代了原有的鼠標和鍵盤的部分功能。 隨著技術的不斷演進,HMI的交互方式和體現形式都發生了很大的改變。現在的人機交互可能是有形的,也可能是無形的。比如,我們可以發出一個口頭命令或者通過手勢來控制智能手機,也可以用語音控制車輛的導航系統,選擇我們要去的目的地。 有關HMI的三大猜想 無論是在功能上還是概念上,如今的HMI都發生了翻天覆地的變化。從技術和應用角度,我們認為HMI將在如下三個方面進一步影響未來的人機交互方式。 屏幕的變化 在消費電子中,曲面屏、折疊屏開始大量使用,傳感器技術的進步帶動屏下指紋的應用。在汽車中,HMI的體現形式主要是屏幕和顯示器,乘客可以通過按下屏幕上的按鈕來操作音頻系統的輸出,比如選擇輸入設備、收音機調臺、瀏覽導航指令等。 未來,乘用車中的屏幕將被賦予更多功能,尺寸也會越來越大,一個完全可定制的全數字儀表盤顯示屏將獲得廣泛應用。現在,特斯拉的15英寸縱向觸摸屏已經將加熱、通風和空調(HVAC)控制等功能納入其中,接下來應該還會賦予大屏更多的功能。 語音有望優先成為HMI的下一個發展目標 專家預測,到2022年,80%的車載HMI將集成語音控制功能,這還不包括智能手機中使用的語音識別系統。隨著語音識別技術的進步,其應用也在不斷擴展。現在,大多數HMI使用語音命令來控制音頻系統和接聽電話等。 未來,自然語言命令還將用來執行更加復雜的功能,從車輛的自適應巡航控制,到智能手機和可穿戴設備的非接觸控制和操作。也可以說,將語音用戶界面(VUI)應用于電子設備中將成為人機交互發展的大趨勢。現在,基于人工智能(AI)的語音智能助理基本解決了VUI存在的“聽不清楚”這一弊端,語音控制 + AI + 機器學習,三者相結合的語音用戶界面,它們的應用前景,想想都會讓人無比激動。 手勢識別在非接觸HMI中開始走紅 與觸摸屏相比,手勢控制具有很多優點:例如,用戶不必觸摸設備就可以從遠處發出命令。另外,手勢控制還將HMI從二維用戶界面擴展至三維空間。全球著名的車企寶馬公司已將手勢技術應用在部分車型中,乘客做出的手勢動作被攝像頭“看到”后即可執行車內的功能。當然,我們也可以把手勢控制看作是語音控制的替代方案,尤其是在那些不適合大聲講話的公共區域。 VUI:HMI的未來之星 新冠肺炎的爆發,為了避免因接觸可能帶來的病毒傳播,在工作場所、零售店、醫院等環境中,非接觸HMI的需求量急劇上升。隨著全球經濟的重新開放,這一趨勢有進一步加速的可能。為此,我們大膽預測,未來10年,非接觸HMI尤其是VUI的發展將駛入發展的快車道。該市場的發展也為半導體公司、OEM/ODM、近距離傳感供應商和軟件公司提供了商機。 在一眾非接觸HMI技術中,為什么VUI這么被業界看好呢?其實,早在2014 年,微軟首席執行官 Satya Nadella就曾預言:“人聲就是新的接口”。根據普華永道(PwC)在2018年所作的一項消費者調查顯示,90%的受訪者熟悉語音助手,72%的受訪者對這項技術有第一手使用經驗。 圖1:語音助手在各種電子設備中的應用情況(圖源:PwC 2018年消費者調查問卷) VUI之所以獲得消費者的廣泛認可,一方面它能解放我們的雙手,提高通信的便利性;另一方面它有效增強了客戶體驗,畢竟我們說話的速度比打字快得多,通過對非接觸控制系統的口頭命令,人與機器的交流將變得更加自然和有效。隨著語音識別技術的不斷成熟,VUI在未來幾年內將惠及數十億用戶。專家預測,在未來5年內,幾乎每個應用程序都將以某種方式集成VUI技術。 AI使機器變得越來越智能化,因此,加入了AI和機器學習的VUI將極大地改善語音接口的個性化體驗。據研究公司Tractica的預測,基于AI的語音智能助理在HMI中的作用越來越重要,到2025年,全球市場價值有望達到46億美元。未來幾年內,80%的車載HMI將集成語音識別系統,這還不包括谷歌語音(Google voice)和蘋果Siri等智能手機助理應用。在汽車中,語音命令最常用于控制汽車中的媒體播放器,為導航系統設置目的地。隨著機器學習算法的發展,ADAS的功能中也將引入VUI。在智能手機中,高端機型幾乎都擁有語音控制手機操作的功能。 在智能家居中,語音控制系統將家居自動化提升到了一個新的水平,像Amazon Echo、Google Nest和Samsung SmartThings這樣的智能家居集線器允許用戶使用簡單的語音命令來管理連接的設備。與此同時,VUI也在逐步滲透到我們的工作場所,并使之朝著數字化方向發展。Gartner預測,到2023年25%的員工與應用程序的交互將通過語音進行。 深耕關鍵技術 總體來看,非接觸HMI主要涉及9大關鍵技術,即:基于攝像頭的手勢識別及認證、手勢超聲或雷達、眼球跟蹤、語音命令、基于手勢和位置的光電二極管傳感器、接近式觸摸屏、運動傳感器融合、短距無線電以及其他非接觸技術。根據研究機構Touch Display Research最新發布的《非接觸HMI 2020》報告,目前,非接觸HMI技術已經吸引了多達390余家公司的參與,他們重點深耕非接觸傳感器,以及軟件和系統集成等領域,其中,提供語音命令和基于攝像頭的手勢識別的公司最多。 針對HMI應用,多家技術供應商都采取了積極的行動,比如,TI公司以營造一個完整的生態系統為主,其HMI產品組合包括廣泛的I/O、圖形處理、語音識別等,提供開發各種接口所需的幾乎所有組件、軟件和支持。TI的方案還實現了以太網供電,以進一步降低布線的復雜性,甚至支持無線連接。 例如,TIDEP-01013是具有毫米波傳感器和Sitara處理器的手勢控制HMI參考設計;TIDEP0066語音識別參考設計則采用TI嵌入式語音識別 (TIesr) 庫,突出了C5535和C5545 DSP器件的語音識別能力。 圖2:語音識別參考設計原理框圖(圖源:TI) 由于背景噪音的干擾,語音識別的效果通常不是那么完美。優質MEMS麥克風和先進的音頻處理功能是促使語音控制設備真正適用于日常環境的關鍵因素。英飛凌的VUI市場策略則是通過逐步建立起來的合作伙伴生態系統,向行業提供一系列創新的參考平臺和即用型新一代VUI解決方案。目前可用的解決方案主要來自于Aaware、CEVA、Creoir、SoundAI、Sugr和XMOS等公司。2017年初,英飛凌與XMOS共同提出的全新語音控制方案采用的是智能麥克風,它使語音助手能在其他噪音當中準確識別定位人聲。其中,英飛凌的XENSIV雷達和硅麥克風傳感器組合能識別揚聲器與麥克風的位置和距離,同時利用XMOS的遠場語音處理技術來捕捉語音。 圖3:英飛凌聯合合作伙伴推出是部分VUI參考設計(圖源:根據英飛凌網站信息整理) 結語 時間回到20世紀50年代初,語音識別技術初現萌芽,只是彼時的系統只能理解數字。到了2017年,這項技術已經取得長足的進步,幾乎達到可以精確地理解人類語言的水平,因此奠定了VUI商用的基礎。 人機交互是實現自動化和智能化的前提。經過幾十年的發展,按鈕/按鍵這種HMI方式正在從我們的生活中退出,取而代之的觸摸屏在很多應用場合也會逐漸被全新一代的VUI替代。技術和創新永無止境,雖然今天的VUI尚不完美,但它的優點已被消費者廣泛認可。畢竟,人類最有效的溝通方法就是語言,未來的機器應該也不會例外。 來源:貿澤電子 作者:M博士 |