国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

基于ARM946E處理器的MP3解碼優化設計

發布時間:2010-11-4 20:45    發布者:techshare
關鍵詞: ARM946E , MP3 , 處理器 , 解碼 , 優化
MP3(MPEG I Audio Layer 3)格式是基于電影專家組系統(Motion Picture Expert Group,MPEG)壓縮標準的一種聲音文件格式,其壓縮比根據采樣頻率、壓縮位率和聲音模式的不同而有所變化。MP3具有很高的壓縮率,可以達到1:12。一分鐘左右的CD音樂經過MP3格式壓縮編碼后,可以壓縮到1兆左右的容量,其音色和音質還可以保持基本完整而不失真。隨著數字音樂的不斷普及,現在MP3音樂已經不僅局限于MPEG視頻應用中,而是以一種獨立的數字音樂壓縮技術出現在計算機、網絡和各種電子設備上。目前市場流行的MP3播放器是基于DSP和專用芯片的解決方案,通過硬件或專用算法實現解碼,具有良好的實時性。而消費類電子產品正朝著多功能、低成本的方向發展。隨著ARM9功能的不斷增強,利用系統本身處理器實現MP3軟解碼成為可能。另外,軟件實現更便于產品功能的升級和維護,可以預見,嵌入式MP3軟解碼器的應用將越來越廣泛。這里在分析MPEG I Audio Lay-er3解碼算法的基礎上,提出基于ARM946E處理器實現解碼算法的軟件優化方法。

1 MPEG Audio Layer3的解碼流程

MP3解碼算法流程如圖1所示。





主要過程包括:數據流解碼、Huffman解壓縮、反量化與重排序、立體聲解碼、IMDCT和子帶合成運算等。其中Huffman解碼與反量化、IMDCT和子帶合成等3個過程在MP3解碼過程中占用了最多的CPU和內存資源,是嵌入式系統實現軟件解碼的關鍵。

2 ARM946E處理器

ARM946E處理器屬于ARM9內核帶有E擴展的一個可綜合版本,執行v5TE架構指令。采用5級流水線,存儲器系統根據哈佛體系結構重新設計,獨立的數據和指令總線。帶有一套存儲器子系統,以提高系統性能和支持大型操作系統。

如圖2所示,存儲器子系統包含1個存儲器保護單元(MPU)、高速緩存(Cache)和寫緩沖(Write Buffer);CPU通過該子系統與系統存儲器相連。





相對于ARM7,ARM9E性能上的提高主要表現在工作頻率、改進的硬件特性及優化的指令執行效率。另外,ARM9E集成了輕量級的DSP處理能力,以很小的成本(CPU增加功能需要增加硬件)換來非常實用的DSP性能。充分利用好芯片資源是實現MP3解碼優化的關鍵。

3 算法優化

針對MP3中涉及較大運算的Huffman解碼與反量化、IMDCT和子帶合成,分別提出算法優化處理。3.1 定長查找冗余表Huffman解碼算法Huffman解碼器可以通過從頭至尾逐一檢測各符號,以查表比較的方式進行解碼。即從一維的bit流中分辨出各個長度不同的Huffman碼字,然后進行復雜的匹配。

由于LayeIⅢ中的Huffman碼表組長度不一,會增加碼字的搜索時間。定長查找冗余表法擴充Huff_man查找表,每次選取定長N bit碼流作為查找索引。查找表中包括跳轉指針和編碼值。若節點索引值為跳轉指針時,將通過擴充Huff-man查找表得知此Huffman編碼的后續bit數,并跳轉到另外一個節點;然后再根據后續bit數從碼流中取值;接著從上次跳轉節點開始查找,如此重復直到找出對應huffman編碼的內容。查找表利用Union數據結構實現,可減小Huffman表占用的空間。假設一Huff-man編碼長度為l,采用傳統算法需要1次移位操作和1次比較,使用定長查找法只需[z/N]次查找和[l/N]次比較操作。

表1,表2是Huffman解碼的舉例說明:













計算量可降低一半。

子帶合成濾波在解碼過程中包括了32點到64點的IMDCT處理,如式(3)所示:





由于N(i)(k)具有對稱特性,可以得出:





只要計算0≤i<n/4和n/2+1≤i<3n/4范圍的V(i)值即可。其減少了將近一半的計算量。

4 代碼優化

根據ARM946E處理器硬件特點,對實時性要求較高的關鍵程序進行C語言和ARM匯編級代碼優化。

4.1 減計數循環體

IMDCT和子帶合成濾波器組2個運算量最大部分中有多個循環體運算,為了提高執行效率,推薦使用減計數循環體。

如表3所示,對于固定次數的循環,減計數循環比增計數循環速度快。這是因為每次增計數循環體外加3條指令,而減計數循環體外只有2條指令,減循環終止條件為減計數到零,而不是計數增加到某個特定的限制值。由于減計數結果已存儲在指令條件標志里,省去與零比較指令。





4.2 內聯函數和內嵌匯編

MP3解碼算法中定點化乘法都是通過函數調用來實現,每次調用需要開銷23~28個時鐘周期,其中超過15個周期用于函數調用時PC指針以及寄存器壓棧保護上。采用內聯函數方式(使用關鍵字_inline聲明)或宏指令,在編譯階段代碼段將被直接展開。另外armcc編譯器允許在C源程序中使用內嵌匯編(但代碼可移植性差),使用包括匯編的內嵌函數,可以使編譯器支持通常不能有效使用的ARM指令和優化方法,例如C編譯器不支持的ARM v5E擴展指令。使用內聯函數結合內嵌匯編實現移位乘法,可使平均時鐘周期縮短為6~8個。


4.3 ARM DSP擴展指令的運用

ARM946E處理器支持ARMDSP擴展指令,主要包括3個類型:

(1)單周期的16×16和32×16 MAC操作;

(2)對原有的算術運算指令增加了飽和處理擴展;

(3)前導零(CLZ)運算指令,提高歸一化、浮點運算以及除法操作的性能。

ARM處理器不支持浮點運算,經過測試及分析,定點運算中數值的截斷誤差選擇為28 b,其可以達到較好的解碼音質,不會因為爆音過多而影響播放效果。

完成類似的乘法功能,ARM的SMULL(32×32)指令需要3個周期,而ARMDSP擴展指令SMULWT(32×16)只需要1個周期。從數據的準確性上分析,由于乘數的精度為16 b,最終結果有些差異,但由于MP3解碼運算都是基于28 b的定點數值的,所以通常的運算都是一個運算結果跟某一個固定定點表中的數據相乘的。若選擇固定定點表中數據的高16 b數據進行運算,運算的結果誤差在1 b以內。

為了驗證使用ARMDSP擴展指令的優化效果,在系統120 MHz主頻下,以128 Kb/s的壓縮速率進行編碼測試,采用的測試文件如表4所示。





上述3個MP3測試文件的比特率均為128 Kb/s,使用這三首MP3歌曲進行解碼分析結果如圖3所示。





實驗表明,使用ARMDSP擴展指令比使用ARM一般指令解碼性能平均提高17.5%,主觀聽覺上音質效果無差異。

5 結 語

這里充分利用ARM946E處理器的DSP擴展指令特點提高程序代碼的執行效率,對3個關鍵模塊:Huff-man解碼,IMDCT運算,合成子帶濾波進行算法優化及簡化處理,減少了各模塊的運算量,同時從C語言和ARM匯編層次來優化代碼,取得了較好的實時MP3解碼效果。
本文地址:http://m.qingdxww.cn/thread-36427-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • 使用SAM-IoT Wx v2開發板演示AWS IoT Core應用程序
  • 使用Harmony3加速TCP/IP應用的開發培訓教程
  • 集成高級模擬外設的PIC18F-Q71家族介紹培訓教程
  • 探索PIC16F13145 MCU系列——快速概覽
  • 貿澤電子(Mouser)專區

相關視頻

關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 中文字幕日本一区久久 | h成人动漫 | 日本免费在线观看视频 | 国产成人精品一区二区视频 | 黄色片免费在线看 | 亚洲国产成人最新精品资源 | 精品欧美一区二区vr在线观看 | 国内色综合精品视频在线 | 奇米精品一区二区三区在线观看 | 精品国产免费福利片 | h成人动漫 | 欧美国产亚洲精品高清不卡 | 国产国拍亚洲精品福利 | 亚洲日本中文字幕在线 | 欧美日韩精品一区二区在线播放 | chinese国语对白hd麻豆 | 性国产videofree另类 | 日韩a在线看免费观看视频 日韩a在线观看 | 一级女人18毛片免费 | 99久久久国产精品免费牛牛四川 | 在线观看视频一区二区三区 | 99视频在线精品免费 | 成品人app软件大全免费下载 | 午夜视频在线观看网站 | 91免费观看视频 | 天天操天天谢 | 女人张开腿让男人桶免费最新 | 麻豆mv传媒观看免费 | 97国内免费久久久久久久久久 | 成人5252色| 三级精品 | 一区二区三区亚洲 | 欧美精品在欧美一区二区 | 国产小视频在线看 | 手机看片1024久久 | 欧美成人精品三级网站 | 狠狠操夜夜操 | 免费人成a大片在线观看动漫 | 果冻传媒第一二专区天美传媒 | 牛牛视频在线观看 | 天堂男人www|