據國外媒體報道,英特爾在 最近召開的IDF大會(英特爾開發論壇)上正式推出了感知計算軟件開發工具包 2013(Perceptual Computing SDK 2013)測試版。這種SDK是幫助開發者開發應用程序,使用戶通過將語音和機器視覺與鍵盤、鼠標,直接觸摸屏結合起來的多模式界面,實現與計算設備的互 動。 這種技術不但可能從根本上改變用戶與手機、平板電腦和PC互動方式,而且是英特爾未來發展的關鍵,因為其需要耗費大量的計算資源,對英特爾的未來非常重要。今天,用戶通過無數方式如直接觸摸屏、鍵盤、鼠標和觸摸板,與計算設備如手機、平板電腦和PC互動。當我們看到微軟通過Kinect和蘋果通過Siri,對機器視覺和語音控制的早期投資,可以發現要改進用戶體驗還要做很多事情。 語 音識別、機器視覺被廣泛使用子軍事領域,從9/11后因政府的資助過去十年獲得顯著發展,但還沒有成為平常的主流應用。語音識別的出現已經有很長時間,很 多舊版和新版Windows都預裝了,但卻從未真正成功,因為其從來就不是真正的自然互動而且也不準確,尤其還需要使用耳機。 只有在蘋果iOS和谷歌Android 平臺上,語音識別才得以發展,但仍然不足以精確到可以不要鍵盤,而且還需要連接到互聯網才正常工作。XBOX Kinect語音交互的神奇在于其有限的詞典,即“說你看到什么”的方法、雙麥克風和“波束成形”。微軟的方法在游戲環境中使用不錯,但在需要跨不同設備 進行廣泛使用時還是不自然。 機器視覺是最近通過微軟的Kinect才流行起來。Kinect使用了兩個攝像頭,但不能準確地檢測特定手指和關節。雖然處理是在攝像頭和XBOX上完成,但用戶必須呆在房間里的某個地方,而游戲僅限于需要最少計算資源的不復雜游戲。 一些電腦制造商甚至谷歌的Nexus7提供了面部識別功能,但這些功能都很慢而容易被圖片、視頻或面具所愚弄。除了電視外,對于大多數計算環境這都是不可接受的。 怎 樣才能使界面更自然?首先,需要以非常低的功耗使用大量本地計算性能才能使用自然用戶界面。讓我們用保護用戶登錄安全的機器視覺為例。最好的方法是要有兩 個高分辨率攝像頭,繪制人臉的三維視圖。可以把這看作是3D游戲的逆向工程。3D機器視覺不是顯示游戲的像素和紋理,也是將這些多邊形和紋理輸入計算設 備。挑戰在于,這需要大量的處理性能和大量的電力,不僅是計算引擎而且還有高分辨率和立體攝像頭都需要。 然后,3D“圖”需要與本地數據庫的圖案匹配,這需要更多的計算性能和電力。這個步驟被叫做“對象識別”,設備需要判斷誰在看。雖然這種安全的、面部識別登錄只是一個例子,但這種自然用戶界面潛在用途還有很多: --在商務會議上主持人可使用手勢來移動幻燈片,而不需要“點擊”。他們只要搖動下手。 --手上沾有面粉的廚師在看食譜時,只要揮下手就能翻頁。 --服裝設計師可使用自己的雙手、手臂和軀干,穿戴電腦設計的一對墊肩。 --通過識別聲音的語調,家庭電腦就知道在你煩惱時避免讓你分心。你回家時就可享受柔和的音樂和暗淡的燈光。 --當聽到恐慌的聲音時,你汽車上的電腦就知道你有麻煩了,然后問是否要打911報警。 --你的家庭電腦感覺有其無法識別的人在用你的電腦,就會通過短信發送該人的照片。 --在療養院,租戶電腦能知道療養的人整天沒有起床,就會通知護士或家庭成員。 --通過結合語音、文本和唇讀,聽寫達到近100%的準確。 --在你告訴孩子只有2個客人后,如果房間里出現5個人,電視能識別并向你發出警告。 --“手鼠標”取代實物鼠標或觸摸板,手可以在屏幕的任何地方點擊和揮動。攝像頭可實時拍下你的手、關節和指尖。 --會議記錄可記錄會議上的所有東西,并按不同的人分開記錄。動作和“停頓”都是自動“感知”。 這種例子是...通過這些非常個性化的例子,需要隱私控制,英特爾在SDK加入了“隱私通知”。當指示器顯示當你正在被麥克風或攝像頭記錄時,這變得很簡單。 如 果說語音和機器視覺都不是直接觸摸觸摸板和顯示器,鍵盤和鼠標將很快消失,就錯了。我們將轉到“多模式”界面,設備將根據環境和用戶歷史選擇最好的控制方 式。這就是英特爾的“使用模式協調“,可選擇最好的互動模式。另外,在需要協調時可同時使用兩種不同的模式。唇讀可以與語音、文本結合,從根本上改善語音 互動。 我們什么時候可以實現?英特爾的感知計算計劃是一個長期的計劃,逐年看到性能和 可交付成果的進步。今天,攝像頭還太大,要一直使用需要太多電力。即使系統總線和USB都需要太多的電力,很可能被移動總線如MIPI取代。隨著時間的推 移所有這一切都可以解決。除了英特爾外,將會有很多不同公司爭奪領先地位,因為這是非常關鍵的領先優勢。 英特爾處于有利的位置,因為該公司具有很大的規模、影響力和力量,是英偉達之 外唯一跨越從智能手機到超級計算機芯片的公司。如果英特爾可以成功地領先行業,需要在一開始就有大量的高性能芯片,而這正是英特爾的優勢。對英特爾來說時 間是最關鍵的,因為該行業已經一次又一次看到該公司投入了大量的時間和精力,在移動芯片的視頻編解碼上,為縮短差距需要固定功能或半可編程芯片。 |