恩智浦半導體白皮書 概述 作為成千上萬的智能物聯網產品的核心,嵌入式處理器的獨特之處在于其對功能和性能的精確定制。展望激動人心的未來互聯世界,我們發現傳統嵌入式處理器與千變萬化的物聯網需求之間存在的差距正在不斷增大,人們需要處理器提供更低功耗、更經濟的可擴展性,更強的計算性能、更高的安全性,以及更好的用戶體驗。為滿足這一需求,我們需要突破應用處理器和MCU之間的界限,打造一類新的“跨界”嵌入式處理器。這種新型應用處理器采用了MCU內核,但基于應用處理器的架構方式,既能實現應用處理器的高性能和豐富功能,同時又兼具傳統MCU的易用性和實時低功耗運行特性。本白皮書主要介紹這種跨界處理器的架 構方式,以及它們提供的重要優勢。 目錄 1 應用處理器與MCU 2 “跨界”處理器—從性能差距到新解決方案領域 3 降低成本—去除片內閃存 4 集高性能、低延遲、高能效和安全性于一體 5 相關行業和應用 6 i.MX RT跨界處理器 7 結論 應用處理器與MCU 多年以來,嵌入式處理領域一直根據設計的需求分為兩個不同的陣營。要求經濟實惠和靈活實用的應用場合會依賴于MCU。超出MCU功能范圍的設計會改為使用應用處理器。但是,對于嵌入式設計師而言,在MCU和應用處理器之間實現無縫擴展并非易事。在MCU和應用處理器之間做決定時,嵌入式設計師如今通常會遇到幾個痛點,包括: • 需要比MCU更多的功能(更高的性能、更多顯示、更多連接選項),但不能增加成本或復雜性 • 缺少經驗豐富的員工和/或預算資源,難以為基于Linux的應用處理器設計提供支持 • 既需要實時系統,也需要應用處理器級別的性能和集成度 • 必須為應用處理器的設計降低整體物料成本,同時保持性能水平不變 消費者對于提升智能,安全領域產品的用戶體驗以及功能的需求從未止步,這也推動了MCU和應用處理器的雙雙發展。但是,對于很多新興的使用案例,不管是應用處理器還是MCU,都無法完全滿足該情形的需求。這一問題的完美示例就是,一位設備設計師想要在其產品設計中添加物聯網 (IoT) 功能(例如,數據處理、無線連接、顯示支持),同時不能大幅增加單臺設備的成本,也不能因為大范圍的重新設計而大大延長其上市時間。 “跨界”處理器—從性能空白到新解決方案領域 我們相信,更智能的互聯世界的發展應當由創新推動,不應受限于MCU和應用處理器之間的選擇。嵌入式產品設計師應能夠自由選擇最能為其設計帶來創新的處理器,而不是讓處理器的選擇限制了其最終設計中可能實現的創新。在MCU和應用處理器之間靈活擴展是可行的,但需要采用一類新的跨界嵌入式處理器來打破高端MCU和低端應用處理器之間的技術鴻溝。這些跨界嵌入式處理器主要面向消費者、工業和不斷發展的物聯網應用,能夠為設計提供應用處理器的高性能和功能性,同時兼具MCU的易用性、低功耗、實時運行以及低中斷延遲特性。此外,跨界處理器的架構中無需使用嵌入式閃存、外部DDR存儲器和電源管理IC,因此降低了系統的總體成本。 圖1:跨界領域 跨界處理器使用應用處理器架構,提供高集成度、高速外設、更高的安全性以及可提升用戶體驗的引擎(例如,2D/3D顯卡),但僅通過運行實時操作系統(例如RTOS)的低功耗MCU內核為系統提供動力。因此,跨界處理在市場中界定了一塊全新的急需領域,能夠幫助MCU客戶升級到應用處理器級別的性能,同時沿用當前的工具鏈,而且可能不需要花時間和成本將復雜的Linux(或其他更高級別的操作系統)軟件開發納入其產品設計周期。 降低成本—無需片內閃存 在理想環境中,當可執行代碼和數據被存儲在片內SRAM中,并從此存儲中執行CPU內核操作時,嵌入式處理器的性能達到最高。即便在片內SRAM中,也只有“緊耦合內存”(TCM) 能夠為內核提供單周期訪問。對TCM以外任何存儲器的訪問都會增加所需的CPU時鐘周期,從2級緩存到片內閃存再到外部閃存的訪問損耗越來越大。因此,只有由高密度片內SRAM配置而成的TCM才能提供理論上最高的性能。 但在現實中,集成SRAM的每平方毫米成本非常高昂,對于在更加成熟的工藝技術節點上制造的MCU來說,更是如此。因此,嵌入式閃存成為了MCU的所需組件,作為片內SRAM的補充。MCU中的嵌入式閃存被用于存儲可執行程序和重要的用戶/系統數據,以便內核快速訪問這些內容,而無需從外部存儲器獲取。 但是,我們認為,在滿足MCU和應用處理器之間的客戶需求時,片上嵌入式閃存的技術限制和相關的成本成為了一個很大的負擔。嵌入式閃存價格昂貴且富有挑戰性,對于高級工藝技術節點而言尤其如此。嵌入閃存所需的額外處理會大幅提升芯片的成本。擺脫片上閃存的負擔不但能夠降低成本,還有助于實現更高頻率的運行,從而提升處理器性能,進而讓產品設計師能夠提升性能,提高效率并增加更多功能。 由于跨界處理器采用了應用處理器架構,它們能夠在高級技術節點(40nm和更高水平)上制造,具有大幅縮小的SRAM位單元,使得集成高密度SRAM比嵌入閃存更加經濟高效。在跨界設計架構中,SRAM可以配置為具有“零等待”單周期訪問的TCM,從而大幅提升系統性能。憑借這種關鍵設計特性,跨界處理器的有效性能將遠遠超出MCU同等產品。 集高性能、低延遲、高能效和安全性于一體 高性能 想象一下TCM和緩存(片內SRAM)極小,但嵌入式閃存密度極高的典型MCU。執行應用代碼期間,最近的指令和數據通常都被存儲在TCM/緩存中,以便后續從CPU內核快速訪問。但是,由于緩存密度低,大部分指令和數據都必須存儲在嵌入式閃存或者外部NOR或NAND閃存中。因此,CPU內核不得不訪問非TCM或非緩存存儲器(也稱為“緩存未命中率”),每次訪問都會大幅降低有效性能,因為CPU必須等待數十個周期以待數據抵達。因此,緩存未命中率越高,MCU的有效性能越低。 對于合理架構、具備高密度TCM和緩存的跨界嵌入式處理器而言,即使緩存未命中率高達5%,其有效性能也始終高于MCU。(緩存未命中率5%可以理解為,CPU內核在緩存存儲器中尋找所需指令或數據的嘗試中,平均每20次中失敗1次,需要訪問嵌入式閃存或外部閃存。)但是,對于最為常見的物聯網應用,具備高密度片內TCM或緩存的跨界處理器的緩存未命中率可低至1-2%,因此能夠提供明顯高于MCU的有效性能。 低中斷延遲 在協調對內部和外部硬件事件做出及時響應方面,中斷在嵌入式系統中發揮了重要作用。在與用戶交互的實時系統中,它們發揮的作用尤其重要,這是因為由用戶輸入觸發的外部事件需要CPU做出可靠的低延遲即時響應。試想一下,具備用戶輸入的視頻流物聯網應用或恒溫器設備,如果系統不能實時對用戶輸入做出響應,用戶體驗將大打折扣,甚至用戶可能會認為產品無響應。因此,中斷響應時間是跨界處理器應用的一個關鍵特性。 中斷延遲這個詞指的是CPU響應內部或外部事件的中斷請求時所需的時鐘周期數。對于大部分具有實時響應要求的物聯網應用,中斷延遲成為了衡量有效性能的一個非常重要的指標。 對于運行高級別操作系統(非實時操作系統)的通用應用處理器,服務外部中斷并非首要任務。在完成當前的任務之前,CPU通常不會響應中斷服務例程 (ISR) 請求。這就導致在提出中斷請求之后,需要經過多達數百個延遲周期,內核才會開始服務此請求。對于運行實時操作系統、內核優先響應中斷的MCU而言,就不會出現這種情況。即使在不同中斷之間,也可以通過合理安排優先級結構,確保最高優先級的中斷達到最低的中斷延遲。 跨界處理器采用MCU內核構建,因此即使它們采用應用處理器架構,也延續了低中斷延遲這一重要特性。跨界處理器的中斷延遲最低可達到10-20ns,而應用處理器的延遲通常長達1毫秒。因此,跨界處理器最適合物聯網應用。 高能效 跨界嵌入式處理器集成了高性能DC-DC轉換器,并采用行之有效的門控電源技術來優化能效。事實上,憑借目前嵌入式處理器廣泛使用的40nm處理平臺,跨界處理器的運行功率最低能夠達到100uA/MHz,不到目前處于市場領先地位的MCU的一半。對于如今市場上未集成DC-DC轉換器的很多MCU,或者當系統設計出于成本考慮未使用外部DC-DC轉換器或PMIC時,其電流消耗最高會達到300uA/MHz,導致它們不太適合采用電池供電的應用。 對于MCU,嵌入式閃存相比訪問外部存儲器的優勢之一是可以實現更低的動態功耗。這在意料之中,因為訪問外部存儲器時,數據必須通過電容I/O驅動,處理器因此需要耗費更多能量。但正如之前所述,在跨界處理器中,因為高密度片內SRAM的原因,對外部閃存的訪問很有限。此外,跨界處理器采用先進技術節點和低功率處理平臺構建,并與低功耗SRAM集成,因此與傳統MCU相比,能夠降低整體的動態功耗。 再者,存儲器制造商目前以極低的成本提供超低功耗的串行NOR閃存,從而降低了系統級別的功耗。如果將采用低功耗串行閃存的跨界嵌入式處理器封裝到SiP,能效可進一步得到提升,因為I/O引腳的電容負載較低。如果SiP成本對某些應用能夠合理化(考慮SiP提供的外形尺寸優勢),那么兼具跨界處理功能和額外存儲器的解決方案將非常具有吸引力。 安全性 存儲在嵌入式閃存中的數據可靠而安全,這通常被援引為在處理器設計中采用嵌入式閃存的原因。片內存儲的關鍵數據和敏感應用程序可即時獲取,無需通過外部引腳與芯片之間來回傳輸。只要與芯片之間來回傳輸數據,就會給黑客提供攻擊的機會(旁路攻擊),讓他們可以通過監控數據引腳中的電信號來攔截或破壞數據。如果數據未加密(以“明文”傳輸的數據),這一弱點尤其令人擔憂。 然而,使用跨界嵌入式處理器則沒有這種隱憂,因為它們采用了與應用處理器類似的數據保護架構。跨界處理器解決方案采用硬件加速加密模塊,使數據能夠以加密的格式存儲在外部存儲器中。需要時,加密數據被傳輸至芯片,在讀取時“即時”解密,無需經過等待解密的周期。跨界處理器中的這些高級加密加速器能夠大幅提高加密/解密吞吐量,從而無需使用片內非易失存儲器來滿足安全性的需求。 即使在硬件加密不適用的情況下,跨界處理器的高性能內核也可用來實施軟件加密。相比傳統MCU,這是一個明顯的優勢;MCU內核的性能較低,必須通過采用硬件加密模塊來提供物聯網應用所需的加密吞吐量。 基于半導體行業在開發先進存儲器方面取得的進展,我們預測在未來兩到三年內,非易失性存儲器(例如MRAM、RRAM等)似乎可用于與嵌入式處理器集成。它們易于單片集成,可功能多樣(包括替換片內2/3級緩存),具有即開即用的用戶體驗,可用于片內安全數據庫,或替代傳統嵌入式閃存。跨界處理器有望從同過集成這些新興存儲器,從而發揮更大優勢。 相關行業和應用程序 作為高性能與易用性特性的有效融合,跨界解決方案適合一系列特定的應用,在此之前,這些應用的某些功能通過應用處理器和MCU產品都無法得到滿足。跨界處理器能大展拳腳的一些應用包括(但不限于): • 用于高端、消費性音頻設備的音頻子系統設計,包括吉他音效踏板等專用設備。 • 面向大眾市場應用的通用嵌入式設計,例如測量系統、醫療設備、售貨機以及物聯網網關。 • 人機界面 (HMI) 圖形功能,適用于家居和樓宇自動化(例如HVAC溫度控制、安保、照明控制面板)、工業計算設計(例如EBS、PLC、工廠自動化、測試和測量、M2M、HMI控制、裝配線機器人)以及消費類產品(例如智能家電、攝像機、LCD及其他高端顯示屏)。 • 電動機控制和電源轉換,適用于3D打印機、熱敏打印機、無人機等專業設備,以及機器人真空吸塵器等消費類產品。 i.MX RT跨界處理器 憑借數十年來為消費者、工業和物聯網市場提供MCU和應用處理器的領導經驗,恩智浦開發出了全新嵌入式處理器系列—— i.MX RT跨界系列處理器。新型的i.MX RT跨界系列處理器基于ARM® Cortex®-M7內核,采用了i.MX 6ULL應用處理器架構,囊括了上文提到的跨界處理器的所有特性,提供了市場上首款真正能夠填補MCU和應用處理器之間空白的解決方案。它把應用處理器級別的性能帶到了MCU領域,能夠支持實時、高性能處理功能,例如攝像頭和顯示功能。 高性能、實時處理 i.MX RT系列的內核運行速度可達600 MHz(相比之下,現有MCU的最高速度只有400MHz)。這是目前具有最高性能水平的Cortex-M7解決方案,可提供3015 CoreMark®/1284 DMIPS (> 2 DMIPS/MHz)。 得益于高密度的512KB TCM SRAM,i.MX RT系列還能夠實現超快的實時響應。其中斷延遲低至20納秒,在全世界所有基于ARM Cortex的產品中,這是最短的中斷延遲,這都歸功于高性能和Cortex-M7內核的強強組合。總而言之,i.MX RT跨界處理器的性能可達競爭產品的2倍。 圖2:i.MX RT1050功能框圖 i.MX RT系列不僅具備應用處理器級別的性能,它們還提供基于MCU的產品設計空間里所具備的關鍵可用性特性:易用性、低成本以及與現有實時軟件基礎設施和工具鏈的兼容性。 豐富的集成 i.MX RT系列支持包含高級多媒體的產品設計,以實現GUI和增強型人機界面 (HMI) 體驗。其特性包括高級2D圖形加速引擎、LCD顯示屏控制器、攝像頭接口以及提供高性能、多通道音頻流的音頻接口。 正如上文所述,i.MX RT跨界處理器系列還通過廣泛的外部存儲器接口選項(包括NAND、eMMC、QuadSPI NOR閃存和并行NOR閃存)支持更大的設計靈活性。由于在外部存儲器之間使用高速接口,加之即時解密可實現安全的外部數據存儲,因此無需使用嵌入式閃存。 就連接性而言,i.MX RT跨界處理器支持有線(以太網、USB等)和無線標準,例如Wi-Fi®、Bluetooth®、BLE、Zigbee®、Thread™以及其他選項,讓互聯世界數以千計的應用成為可能。 使用簡便 i.MX RT系列旨在讓基于MCU的開發人員能夠輕松使用這些新型跨界處理器,而無需投入大量精力來開發新軟件實現工具或學習更高級別的操作系統,例如Linux或Android。現有的MCU客戶能夠利用i.MX RT系列大幅提升性能功能,同時繼續使用他們現有的工具鏈(例如MCUXpresso、IAR和Keil)。 i.MX RT還支持使用恩智浦的FreeRTOS、SDK、ARM® mbedTM以及提供軟件庫、在線工具和相應支持的全球ARM生態系統來實現快速原型制作和開發。使用與Arduino™硬件盾板兼容的低成本評估套件 (EVK),還可以進一步加快開發速度。 此外,i.MX RT解決方案還采用單電壓輸入來簡化電路設計。 低物料 (BOM) 成本 通過將最高的功能性與行業領先的性能和能效相結合,i.MX RT系列還可為基于Cortex-M7的嵌入式系統提供最低的成本。它采用經濟實惠的10x10 BGA封裝,間距為0.65mm,可實現低成本的四層PCB設計。 基于Cortex-M7內核構建也使其無需昂貴的配套器件。例如,有了具有DC-DC轉換器的全集成電源管理功能,無需再配備外部電源。512 MB片內SRAM意味著無需使用外部DRAM,從而進一步降低總物料成本。 圖3:BOM框圖 軟件支持 當前基于MCU的開發人員可以繼續使用現有的軟件基礎來開發基于i.MX RT的產品。但是,在轉變到采用不使用Linux代碼的處理解決方案來構建系統,應用處理器領域的開發人員將抱持一些疑問。但是在轉變到不使用Linux代碼的解決方案的開發過程當中,這也會給應用處理器領域的開發者帶來困惑。 i.MX RT處理器運行RTOS軟件,而應用處理器需要基于Linux的軟件。這要求基于應用處理器的開發人員學習更多與使用實時操作系統構建系統有關的知識,但這種付出是值得的,因為他們可以接觸到一個廣闊的市場領域,該領域的產品要求以更低的成本提供高性能和增強的用戶體驗。 結論 當今市場越來越需要高效、高性能的嵌入式處理技術來提供增強的用戶體驗和更高的數據處理能力,同時不增加成本和功耗,這就導致嵌入式處理器領域內出現了空白。為了填補這種空白,我們推出了一種新型嵌入式處理器,它們具備應用處理器典型的性能等級和安全功能,同時兼具MCU的易用性、實時運行和低功耗特性。我們借助這些跨界處理器來響應日益發展的市場需求,旨在為更加智能、安全且不斷發展的互聯市場提供具備最高性能且經濟高效的嵌入式解決方案。 文件編號:IMXCROSSXPROCWP REV 0 |