清晨6:30,智能手機(jī)的鬧鐘準(zhǔn)時響起,提醒您該起床了。在開始工作前,只需發(fā)出語音命令,手機(jī)即會為您讀出全天的會議和預(yù)約安排,同時啟動咖啡機(jī),為您準(zhǔn)備香氣四溢的咖啡。收到生日提醒后,您說“打電話給媽媽”,電話就會自動撥出,祝媽媽生日快樂。一切就是這么簡單,一早的例行公事完成得井然有序,而這個過程中,您完全無需觸碰手機(jī)!手機(jī)隨時隨地都在獲取您的語音命令,處理信息。 無論是每天早晨的例行公事,還是其他點(diǎn)點(diǎn)滴滴,永遠(yuǎn)在線(Always-On)蘊(yùn)含的無限潛力都能助您一臂之力,讓生活更加簡單便利。移動系統(tǒng)、可穿戴設(shè)備和許多其他物聯(lián)網(wǎng)(IoT)應(yīng)用都需要這項(xiàng)技術(shù)——系統(tǒng)中的一些計(jì)算資源永遠(yuǎn)在線,隨時處理音頻、視頻或其他傳感器數(shù)據(jù)。為了進(jìn)一步增強(qiáng)電池供電設(shè)備的可用性,專門用于Always-On任務(wù)的計(jì)算資源應(yīng)經(jīng)過專門優(yōu)化;而系統(tǒng)中的其他資源則可保持休眠,直到真正需要時再被喚醒。 毋庸置疑,新一代產(chǎn)品正在重新詮釋我們對人機(jī)界面的理解,對比短短5年前,現(xiàn)在的用戶體驗(yàn)已經(jīng)變得更加豐富多彩,引人入勝。但這也給設(shè)計(jì)師帶來了全新的挑戰(zhàn):如何在繼續(xù)為客戶營造愉悅體驗(yàn)的前提下,實(shí)現(xiàn)響應(yīng)速度、成本和功耗之間的平衡?本文中,我們將就此問題進(jìn)行探討,并介紹如何采用“認(rèn)知分層”的方法搭建Always-On架構(gòu),幫助設(shè)計(jì)師實(shí)現(xiàn)產(chǎn)品設(shè)計(jì)的最佳平衡。 設(shè)計(jì)高效節(jié)能的Always-On架構(gòu) 針對特定的IoT應(yīng)用,片上系統(tǒng)(SoC)由多種模擬器件(例如無線電、低噪聲放大器(RX)、電源管理單元和集成功率放大器)及數(shù)字器件(例如處理器、數(shù)字信號處理器、片上存儲器、數(shù)字基帶硬件組塊和豐富的傳感器I/O)構(gòu)成。 包括麥克風(fēng)、攝像頭、加速計(jì)、陀螺儀、溫度計(jì)和壓力計(jì)等在內(nèi)的傳感器是智能、互聯(lián),Always-On設(shè)備的核心。傳感器對收集到的數(shù)據(jù)進(jìn)行數(shù)字化處理,并將數(shù)字化信息發(fā)送到SoC進(jìn)行分析和解讀。 Always-On架構(gòu)的開發(fā)可同時采用多項(xiàng)技術(shù),降低IoT應(yīng)用的功耗: ●功耗、時鐘和數(shù)據(jù)門控 ●傳感器融合算法,用于確定設(shè)備上下文,并以此為基礎(chǔ)實(shí)現(xiàn)系統(tǒng)功耗的智能管理 ●針對開銷巨大的函數(shù)進(jìn)行優(yōu)化,例如: ●從指令集層面減少時鐘周期開銷數(shù)(cycle)從而降低對頻率的需求(MHz) ●在互聯(lián)級架設(shè)通用片上總線旁路 ●通過存儲分區(qū)使流量局部化 ●針對語音算法、加密等同類應(yīng)用,加快通信標(biāo)準(zhǔn)和性能 除上述技術(shù)外,認(rèn)知分層尤其是實(shí)現(xiàn)最佳功耗/性能平衡的理想方案。下面,我們將進(jìn)行更詳細(xì)的論述。 認(rèn)知分層:主處理器任務(wù)負(fù)載卸載 認(rèn)知分層將任務(wù)劃分成若干層或狀態(tài),分別使用經(jīng)過專門優(yōu)化的引擎處理。通過將一些任務(wù)轉(zhuǎn)移到經(jīng)過專門優(yōu)化的低功耗Always-On處理器,認(rèn)知分層即可實(shí)現(xiàn)主處理器任務(wù)分流。圖1描述了語音觸發(fā)應(yīng)用,每層的處理能力恰好足夠支持系統(tǒng)此刻所需的響應(yīng)速度,且不會浪費(fèi)資源。采用此方法,延遲、功耗和吞吐量性能都會得到提升。 圖1:認(rèn)知分層可以最大限度地降低功耗 圖1中最靠下的環(huán)節(jié)是低功耗噪聲檢測,耗能僅為毫微瓦級。從檢測觸發(fā)命令到識別短語,以及當(dāng)前應(yīng)用上下文環(huán)境下的解讀,噪聲檢測會沿處理鏈向上觸發(fā)一系列系統(tǒng)動作。這一系列動作中,后一個動作的功耗總是略高于前一個動作。使用云服務(wù)處理完整對話需要訪問遠(yuǎn)程服務(wù)器及數(shù)據(jù)庫,并進(jìn)行交互,因此能耗最高,可以達(dá)到數(shù)瓦。 在較低層,根據(jù)特定的計(jì)算和接口要求專門設(shè)計(jì)并優(yōu)化過的處理引擎,將取代低效率的通用處理器。相比通用處理器,經(jīng)過專門優(yōu)化的處理器在Always-On系統(tǒng)中的性能更高,響應(yīng)延遲更短,功耗更低。 通過盡可能關(guān)閉不必要的系統(tǒng),認(rèn)知分層使計(jì)算層與數(shù)據(jù)來源更加接近,系統(tǒng)可以調(diào)用最少的活動資源完成當(dāng)前任務(wù)。認(rèn)知分層可以優(yōu)化性能和功耗,適用于從慣性導(dǎo)航到計(jì)算機(jī)視覺,再到本地?zé)o線通信等多種IoT應(yīng)用領(lǐng)域。 優(yōu)秀Always-On處理器的要素 IoT應(yīng)用豐富多彩,對處理能力的要求也因應(yīng)用而異,“一刀切”的作法對Always-On處理器并不適用。基于上述對認(rèn)知分層的闡釋,小型、低功耗、高度專業(yè)化的處理器可以承擔(dān)對認(rèn)知功能要求較低的工作,減少占用主處理器資源,降低功耗。 例如,經(jīng)過低功耗語音觸發(fā)優(yōu)化的數(shù)字信號處理器(DSP)不會處理高耗能的音頻編解碼工作,而是將之移交專為該用途設(shè)計(jì)的DSP;與之類似,經(jīng)過音頻編解碼優(yōu)化的DSP,也會將用戶和網(wǎng)絡(luò)交互的任務(wù)移交給其他為該用途設(shè)計(jì)的應(yīng)用處理器。 圖2:低功耗處理器為日趨復(fù)雜的信號處理保駕護(hù)航 盡管主應(yīng)用處理器“可以”運(yùn)行所有算法,但使用經(jīng)過專門優(yōu)化的處理器能讓設(shè)計(jì)更加節(jié)能。在上述的語音觸發(fā)示例中,指定使用低功耗Always-On DSP運(yùn)行語音觸發(fā)器當(dāng)然也可以將之用于執(zhí)行其他低功耗要求的任務(wù),例如傳感器數(shù)據(jù)處理和低分辨率圖像處理。如圖2所示,可穿戴設(shè)備等IoT應(yīng)用需要具備超低功耗下處理復(fù)雜信號的能力。 支持Always-On應(yīng)用的處理器需要具備以下要素: ●針對關(guān)鍵算法的低指令執(zhí)行周期,高效的指令集 ●執(zhí)行DSP處理和控制任務(wù)的能力 ●低功耗設(shè)計(jì) ●尺寸小,理想情況下可以按需配置,并可以去除冗余的邏輯設(shè)計(jì) ●按所需的功能范圍擴(kuò)展性能 ●用于傳感器數(shù)據(jù)處理的高效浮點(diǎn)運(yùn)算 面向IoT、可穿戴設(shè)備和無線應(yīng)用的靈活DSP Cadence公司的Tensilica Fusion DSP就屬于單一可擴(kuò)展DSP,可以滿足低功耗及Always-On功能的各項(xiàng)需求。Cadence Tensilica Fusion DSP使用可選擇的指令集架構(gòu)(ISA)擴(kuò)展,加快多種無線協(xié)議和浮點(diǎn)運(yùn)算的速度;并將增強(qiáng)型32位Xtensa控制處理器與DSP功能及靈活的特定算法加速相結(jié)合。作為IoT設(shè)備設(shè)計(jì)師,您可以按需選擇個性化的配置,對比配置單一的“一刀切”處理器,Tensilica Fusion DSP的尺寸更小,性能更高,功耗也更低。 圖3:Cadence Tensilica Fusion DSP基于Xtensa處理器,由多項(xiàng)可配置元件構(gòu)成,適用于低功耗Always-On系統(tǒng)。 Tensilica Fusion DSP(圖3)的可配置元件包括: ●單精度浮點(diǎn)單元——浮點(diǎn)指令與64位數(shù)據(jù)讀取/寫回同時發(fā)射。這對使用MATLAB或標(biāo)準(zhǔn)C代碼創(chuàng)建算法的軟件來說,開發(fā)速度可以得到加快。 ●音頻/語音(AVS)——與TensilicaHiFi DSP共享軟件兼容性,由140余個HiFi音頻/語音軟件包構(gòu)成的生態(tài)系統(tǒng)為其提供支持。 ●16位Quad MAC——進(jìn)一步加速低功耗藍(lán)牙及Wi-Fi等通信標(biāo)準(zhǔn),同時配有語音編解碼器/識別算法。 ●為低功耗藍(lán)牙和Wi-Fi AES-128無線操作實(shí)現(xiàn)的加密提速 ●先進(jìn)的位處理——加快基帶MAC和PHY的設(shè)計(jì)實(shí)現(xiàn) ●適用于高速緩存和/或不同容量的本地內(nèi)存的、靈活的內(nèi)存架構(gòu) 總結(jié) Always-On技術(shù)在生活中的運(yùn)用越來越廣泛。設(shè)計(jì)出成功的Always-On產(chǎn)品充滿挑戰(zhàn),特別是如何找到響應(yīng)速度、成本和功耗的平衡點(diǎn)。 采用認(rèn)知分層,同時使用可配置的低功耗Always-On DSP,能助您找到這一平衡點(diǎn)。通過將Always-On功能分配給低功耗處理器,系統(tǒng)的主處理器則可以將資源用于處理更復(fù)雜的任務(wù),從而優(yōu)化設(shè)計(jì),在不犧牲性能及功能性的前提下,消耗最小的能源執(zhí)行任務(wù)處理。 |