国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

可編程語音壓縮專用處理器設(shè)計

發(fā)布時間:2010-12-14 18:57    發(fā)布者:designer
關(guān)鍵詞: 可編程 , 語音壓縮
為了提高通信系統(tǒng)的保密性,降低制造成本,需要進(jìn)行專用處理器的設(shè)計。基于正弦激勵線性預(yù)測(SELP)算法模型,設(shè)計了一款多速率語音專用處理器。芯片使用可重構(gòu)體系結(jié)構(gòu)和超長指令字(VLIw),優(yōu)化了高復(fù)雜度函數(shù)。仿真結(jié)果表明:該處理器對O.6 kb/s速率SELP算法的執(zhí)行效率明顯優(yōu)于通用數(shù)字信號處理器(DSP)。處理器內(nèi)部程序數(shù)據(jù)外部不可見,指令并行度顯著提高,常用函數(shù)可被修改,從而達(dá)到高保密性、低復(fù)雜度、易開發(fā)性。

為了適應(yīng)多種通信應(yīng)用,需要使用不同的語音壓縮編碼算法。用數(shù)字信號處理器(DSP)實現(xiàn)存在編程難、保密性差、成本高等缺點。專用芯片(ASIC)只能實現(xiàn)單一算法,很難擴展,難以進(jìn)行二次開發(fā)。

可重構(gòu)體系結(jié)構(gòu),是指某一計算系統(tǒng)能夠利用可重用的硬件資源,根據(jù)不同的應(yīng)用需求,靈活地改變自身結(jié)構(gòu),以便提供與之相匹配的功能。已有可重構(gòu)體系實現(xiàn)了語音算法的某些特定部分,如自適應(yīng)多速率算法中的代數(shù)碼本搜索、原型編碼器中的小波變換以及有限脈沖響應(yīng)濾波器等,但使用協(xié)處理器使硬件規(guī)模仍然偏大,且只能對一類語音算法適用。

使用可重構(gòu)體系結(jié)構(gòu)設(shè)計了一種可編程專用語音編解碼芯片TRl00,指令系統(tǒng)使用超長指令字(VLIW),使語音編碼算法中常用的并行操作可以在該芯片上產(chǎn)生比通用DSP更高的執(zhí)行效率。高復(fù)雜度子程序能夠被多種類型的語音算法使用,避免引入?yún)f(xié)處理器,降低了二次開發(fā)編程的工作量。片內(nèi)存儲器在外部不能讀取,提高了系統(tǒng)的保密性。

1 SELP算法

算法采用自行開發(fā)的基于正弦激勵線性預(yù)測(SELP)模型的多幀聯(lián)合編碼算法,在線性預(yù)測正弦激勵模型的基礎(chǔ)上,引入多幀參數(shù)聯(lián)合矢量量化方法,進(jìn)一步壓縮幀間冗余,使語音譜包絡(luò)信息得到較好表示,在O.6 kb/s的極低速率下,可懂度達(dá)到90%以上。

O.6 kb/s速率采用多幀聯(lián)合量化編碼技術(shù),將相鄰3幀預(yù)測系數(shù)均轉(zhuǎn)為線譜對系數(shù)(LSP),采用基于模式的余量分裂多級矩陣量化(P-RS-MSMQ)算法。根據(jù)不同的信道狀況與質(zhì)量要求,算法還包括0.8 kb/s、 1.2 kb/s和2.4 kb/s另3種速率壓縮方式,流程與O.6 kb/s算法基本相同,僅增加對余量信號的編碼過程,其中需要進(jìn)行512點快速Fourier變換(FFT)運算。

2 TR100芯片體系結(jié)構(gòu)設(shè)計

芯片工作主頻為20 MHz,采用取指譯碼執(zhí)行3級流水線設(shè)汁,內(nèi)部結(jié)構(gòu)如圖1所示。







TRl00芯片采用粗粒度可重構(gòu)體系結(jié)構(gòu),基本的可重構(gòu)硬件單元包括存儲系統(tǒng)、運算單元、程序調(diào)度控制、寄存器、數(shù)據(jù)通路等。

存儲系統(tǒng)包括閃存存儲器(FLASH)和隨機存儲器(RAM)兩部分。芯片內(nèi)部包含2個32 kB數(shù)據(jù)FLASH、5個4 kB數(shù)據(jù)RAM。6個地址寄存器與3個地址運算單元可以分別獨立存儲器的地址控制與選擇。

運算單元包括2個32 b增強型算術(shù)邏輯單元,可完成以加減運算為中心、包括規(guī)格化、算術(shù)移位、四舍五入等輔助邏輯的復(fù)雜運算功能;1個32 b乘法器;1個40 b乘累加器;1個16 b除法器。

程序調(diào)度控制有2級硬循環(huán)、比較跳轉(zhuǎn)、比較設(shè)置、調(diào)用/返回等單元。兩個可被同時訪問的寄存器組各包含19個32 b寄存器,支持分層窗口式訪問;6個32 b選通器作為數(shù)據(jù)通路將存儲系統(tǒng)與運算部件進(jìn)行互聯(lián)。

3 超長指令字格式設(shè)計

在針對語音編碼算法的專用處理器設(shè)計中,VLIW指令設(shè)計方法是非常適用的,它能在低復(fù)雜度的控制邏輯水平上產(chǎn)生較高指令并行性,使芯片在低主頻下即可實現(xiàn)語音壓縮算法。由于對資源并行度要求較高的程序模塊數(shù)量不大,因此可以通過遍歷所有運算量較大的模塊,提取可用的指令并行模式,在硬件控制邏輯復(fù)雜度增加很小的前提下實現(xiàn)超長指令譯碼。

設(shè)計的VLIW指令系統(tǒng)包括基本指令形態(tài)和專用指令形態(tài)。基本指令形態(tài)包括1 6b、32b、48b、64 b等4種指令長度,并行程度低,用于設(shè)計對資源并行性要求不高的子程序。專用指令形態(tài)包括128 b、192 b、256 b等3種指令長度,并行程度高,用于設(shè)計算法中復(fù)雜度較高、要求資源高并行度的子程序。兩類指令形態(tài)格式相同,從而可以使用相同的譯碼器進(jìn)行譯碼,簡化了電路設(shè)計。基本指令模塊和專用指令模塊分別從程序FLASH與程序RAM中取指,均能做到單周期取指單周期譯碼一單周期執(zhí)行。指令格式包括4個字段:Length確定指令長度;SF確定本長度下選用的指令子格式;CF進(jìn)行算子選擇;OP進(jìn)行算子編碼。

4 算法程序向芯片的移植

使用軟硬件協(xié)同設(shè)計,利用現(xiàn)有硬件的支持,可以編出高效率的代碼。表1是在TRl00上實現(xiàn)常用程序模塊的執(zhí)行周期數(shù)與通用DSP對比結(jié)果,其中l(wèi)表示濾波長度,p表示內(nèi)積點數(shù)。




可以看到,壓縮算法中運算量較大的模塊,如濾波器、點積、矢量量化等,TR100的運行效率均明顯高于DSP,甚至達(dá)到兩倍以上。這是由于對于運算、存儲單元訪問密集的模塊,硬件體系結(jié)構(gòu)中各個獨立單元可以用相應(yīng)的指令格式并行訪問。而對線性預(yù)測系數(shù)(LPC)計算與轉(zhuǎn)換、數(shù)學(xué)函數(shù)等運算量不大、但各種語音算法都要使用的模塊,芯片的運行效率也與DSP基本相當(dāng)。這就保證了在移植其他算法時,受程序執(zhí)行效率的限制較小,而可以專注于算法功能的開發(fā)。注入功能可對基本指令與專用指令進(jìn)行修改,便于開發(fā)者對現(xiàn)有程序進(jìn)行擴充。

以加權(quán)矢量量化為例,說明芯片的運算效率。線譜對系數(shù)使用多幀聯(lián)合矢量量化,搜索運算量非常巨大。在SELP算法中,0.6 kb/s速率使用30維多級LSP碼本,容量為7.68 kB,搜索時需要計算每一碼本矢量bi與當(dāng)前系數(shù)矢量x的加權(quán)距離di,權(quán)重為對角矩陣W,之后再找到最小的加權(quán)距離所對應(yīng)的碼本矢量標(biāo)號進(jìn)行編碼。

使用一條256bit專用指令即可實現(xiàn)循環(huán)體內(nèi)部操作:

與通用DSP的實現(xiàn)相比,本芯片可以在循環(huán)體內(nèi)減少5次運算,本芯片對矢量搜索模塊的優(yōu)化可減少近4MI/s的運算量。其中I為指令數(shù)。

5 芯片性能

數(shù)據(jù)FLASH寬度為16 b,存儲4個速率的不同碼本,碼本容量為199g kB,最大臨時數(shù)據(jù)變量使用19.8 kB,與C54xDSP所需的存儲空間相當(dāng)。全部程序共5.7 k I,其中專用指令程序為2 kI。

0.6 kb/s速率算法各子模塊的運算量如表2。





在TRl00芯片上完成編解碼的運算復(fù)雜度為12.5 MI/s,明顯低于C54xDSP所需的40 MI/s。

表3對比了浮點C語言程序、定點C語言程序以及芯片仿真3種情況下各個參數(shù)的重建誤差,使用91280幀中國軍標(biāo)語音測試數(shù)據(jù)。

可以看出,海量數(shù)據(jù)測試出的定點C程序的各個重建參數(shù)誤差與芯片仿真的結(jié)果完全相同,由此可以說明芯片獲得的編碼碼流與重建語音與C程序的結(jié)果相同。

6 結(jié) 論

使用VLIW設(shè)計的可重構(gòu)處理器能夠在相同硬件結(jié)構(gòu)下實現(xiàn)不同的語音壓縮算法,由于針對算法中常用的運算密集模塊在體系結(jié)構(gòu)和指令形態(tài)上進(jìn)行了優(yōu)化,該處理器對語音算法中計算、存儲密集度高的函數(shù)具備更高的指令并行性,從而獲得了更高的運行效率與更低的主頻,使功耗降低。算法程序外部完全不可見,提高了保密性。常用函數(shù)可以通過注入方式進(jìn)行修改,避免了引入?yún)f(xié)處理器導(dǎo)致的難以擴充的缺點,并有效減小了芯片規(guī)模。
本文地址:http://m.qingdxww.cn/thread-46688-1-1.html     【打印本頁】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé);文章版權(quán)歸原作者及原出處所有,如涉及作品內(nèi)容、版權(quán)和其它問題,我們將根據(jù)著作權(quán)人的要求,第一時間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區(qū)
  • 使用SAM-IoT Wx v2開發(fā)板演示AWS IoT Core應(yīng)用程序
  • 使用Harmony3加速TCP/IP應(yīng)用的開發(fā)培訓(xùn)教程
  • 集成高級模擬外設(shè)的PIC18F-Q71家族介紹培訓(xùn)教程
  • 探索PIC16F13145 MCU系列——快速概覽
  • 貿(mào)澤電子(Mouser)專區(qū)

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權(quán)所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復(fù) 返回頂部 返回列表
主站蜘蛛池模板: 亚洲精品97福利在线| 亚洲网址在线| 四虎影视最新网站在线播放| 7777色鬼xxxx欧美色夫| 秘密教学93话恩爱久等了免费| 有码 亚洲 制服 国产 在线| 色婷婷伊人| 亚洲第99页| 依人在线观看| 久久综合老色鬼网站| 午夜a级毛片| 日本 欧美 国产| 四虎网站在线| www.色小姐| 午夜国产视频| 欧美呦呦| 亚洲不卡中文字幕| 一区二区三区久久精品| 久久精品国产亚洲AV蜜臀| 日韩一级欧美一级一级国产| 青青草国产| 四虎影视免费在线| WWW久久只有这里有精品| 视频一区国产| 奇米影视狠狠狠天天777| 亚洲国产毛片aaaaa无费看| 在线观看成人小视频| 麻豆精品一区二正一三区| 青草视频在线观看免费| 色噜噜狠狠色综合日日| 亚洲第一se情网站| 国产97碰免费视频| 一本道高清码v京东热| 欧美一卡二卡3卡4卡无卡六卡七卡科普| 中文天堂在线视频| 最新狼窝| 色情www日本欧美| 日本永久视频| 一本视频在线| 999资源站| 午夜看片网|