藉由來自人腦接收與處理刺激信號的靈感,音頻處理器制造商Audience開發出以神經科學為基礎的多感運算處理器技術,在微芯片中模擬人類聽覺處理流程,并提升自然的語音使用體驗,實現永不間斷(Always-On)的語音和動作感應。 Audience是一家將聽覺神經科學商業化的公司,主要技術著重于分析人類大腦如何處理信號的方式,并導入于先進的DSP音頻芯片方案中。Audience行銷副總裁Bart DeCanne介紹,從2008年年底推出首款產品至今,市場上已有超過220種移動設備采用Audience的語音處理器,出貨量累積超過4億顆。 在分析各種感官輸入時,Audience先從聽覺開始了解人耳如何接收信號以及大腦如何進行分析與處理。Bart DeCanne表示,“人類大腦在這方面的功能十分強大,例如在一個集會中,當有十個人同時交談時,你可以選擇性地只聽到其中一個人的聲音。” 除了處理聽覺以外,人腦也能處理動作感應、視覺等多種感官感覺。Audience模擬人類神經系統從多重感官接收信息并作出適當動作與回應的方式,開發出最新多感運算處理器引擎 eS700 系列與超低功耗動作處理器 MQ100 ,預計在今年下半年就可見到采用這些處理器的產品上市。Audience eS700多感運算處理器家族包括702、703、704、705、752與754,搭載進階語音、不間斷偵測(Always-On) VoiceQ與MotionQ,以及智慧型音頻編解碼器等功能。 VoiceQ是一項低功耗的持續性語音感應技術,能通過一個關鍵字喚醒后,提供毫無延遲且不間斷的語音偵測與指令。持續運作的VoiceQ處于隨時感知狀態,可讓裝置隨時聆聽周圍環境,并且對預先設定的語音指令做出反應。移動設備也只在需要時被喚醒,并可減少誤判減輕電力消耗,從而實現<1.5mA電流損耗的超低功耗不間斷語音偵測。 VoiceQ的差異化關鍵在于提供人聲辨識的能力,而不至于受到背景噪音的影響被錯誤啟動。此外,還可經由關鍵字預先編程實現多位使用者驗證,讓共用裝置的不同使用者以語音登入取代鍵盤輸入的PIN碼。 進階語音技術讓移動設備無論如何放置,甚至放在衣服口袋中,都能維持良好的語音品質;通過先進的噪聲(風切聲)抑制演算法,即使在風大的環境以及極端嚴苛的吵雜條件下也能清楚地撥打與接聽電話,大幅改善手機使用體驗。 eS700系列支援兩種擴音模式——指向式與360度語音。指向式針對移動設備最佳位置提供最佳效果;360度語音則不論任何角度都有最佳效果,適合放在桌上進行電話會議及放在杯架上。 Audience智慧型音頻編解碼器eS75X可實現最佳SNR與類比性能,內建所有必要的ADC/DAC以滿足業界對于喇叭、頭戴式耳機、耳內式耳機等驅動單元的需求,并內含兩條線路輸出,可搭配AP實現最佳化效能。此外,自動語音辨識(ASR)輔助演算法則可降低噪聲并保留語音。 MotionQ技術則支援不間斷偵測的環境感知應用程式,如安全監控、室內導航以及手勢辨識等,同時僅消耗不到5mW的功率,顯著低于其他運動處理器架構。 此外,Audience并推出超低功耗的MQ100動作感應處理器,這是一款專為管理和融合來自終端設備各種感測器資訊而設計的動作處理器。為了確保終端裝置不間斷偵測,目前的動作處理需要感測器與AP之間持續通訊,使得功耗高達60-200mW,但Bart DeCanne強調,高電源效率的MQ100功耗還不到5mW,而且還比任何感測器中樞MCU的尺寸更小,從而實現低成本。 Audience最近并宣布與聯發科(MediaTek)合作,為其最新MT6592八核心處理器搭配MT6290 LTE基頻處理器的智慧型手機平臺,提供具備進階語音功能的eS700系列智慧音頻編解碼器。Bart DeCanne表示:“通過Audience預先整合且經測試的音頻編解碼器全功能音頻子系統,可滿足聯發科客戶對于不同音頻功能選項的需求,協助其減少研發作業,實現最佳化音頻處理。” Audience的多感運算處理器器以運算聽覺場景分析(CASA)技術為基礎,為移動設備實現增強的語音通訊與噪聲抑制功能。 |