語言壓縮技術既節省了存儲時所占用的存儲空間,又減少了傳輸時所占用的帶寬,而快速發展的數字信號處理(DSP)技術使得實時實現各種復雜的語音壓縮算法成為可能。 國際電信聯盟(ITU)1972年制定出來的一套語音壓縮標準稱為G.7ll,主要用于公用電話網。它用脈沖編碼調制(PCM)對語音信號采樣,采樣率為8kHz,比特率為64kb/s。該標準下主要有兩種壓縮算法,一種是μ律,另一種是A律。其中歐洲和中國等國家采用A律壓縮算法,美國和日本等國家采用μ律壓縮算法。 1 A律壓縮算法簡介 A律編碼的數據對象是12位精度的二進制數,它保證了壓縮后的數據有5位的精度并存儲到一個字節(8位)中。A律符合下式的對數壓縮方程: 式中,x為歸一化的輸入語音信號,y為壓擴后的歸一化輸出信號,A為壓縮參數取值。由于該方程是一條連續的光滑曲線,物理上實現比較復雜。在實用中一般用13段折線近似該曲線,此時選擇AA=87.6。對PCM信號,一般地,輸入的模擬語音信號經過低通濾波、放大和限幅后,然后進入A/D轉換器編碼,常用的編碼方法有2的補碼和折疊二進制碼兩種。表l是A律壓縮編碼規律表,其中只給出了在抽樣值為正值時,A/D轉換器輸出的12位二進制數(補碼)是如何壓縮成8位二進制數的。 2 A律算法的硬件構成 采用合眾達電子的SEED-DEC5416嵌入式DSP開發板作為實現A律算法的硬件開發平臺,其系統結構原理如圖1所示。主處理器選擇的是1 6 bit定點DSP芯片TMS320vC5416,語音信號經過差分運算放大后送入ADC進行模數轉換,采樣率為8kHz,量化位數為12bit,轉換后的數據送入McBSP,然后對McBSP中的數據進行壓縮編碼,壓縮后的數據送入'C5416內部的DARAM保存,還可以直接解壓后經McBSP送DAC,數模轉換后再送入功放模塊驅動揚聲器發聲。其中,McBSP與ADC/DAC之間的數據交換是靠ADC/DAC提供的移位信號和幀同步信號實現的。 3 A律算法的軟件設計 在TI提供的開發工具CCS中進行源程序的編輯和調試,源程序采用'C54x系列的匯編語言編寫。首先完成對DSP芯片必要的初始化、McBSP的初始化及開放McBSP中斷,然后執行A律壓縮解壓算法。 一般地,用程序進行A律編碼解碼有兩種方法:一種是查表法,這種方法程序代碼小,執行速度快,但需要占用較多的內存以存儲查找表(表的大小為212=4096個字),另一種方法是直接計算法,這種程序代碼較多,執行速度慢一些,但可以節省內存空間。對照表l,可以畫出A律壓縮編碼直接計算方法的流程如圖2所示。待壓縮的數據來自voidin變量空間(見附錄1),該變量空間保存著McBSP中的數據,保存符號位就是將待壓縮數據的位11放入壓縮數據的位7,并通過測試位11決定是否對該數求補即對負數求絕對值(A/D轉換后的數據用二進制補碼表示),求絕對值的目的是為了減小直接對負值壓縮時帶來的量化誤差。另外,還將兩個8位的壓縮數據組成一個16位的字保存至compress變量空間。 解壓一般是壓縮的逆過程,但有時為了使得量化誤差不超過△i/2,可在解壓后的數據位增加一個最低有效位,該最低有效位為1時經過D/A轉換后對應△min/2電壓,即將8位的壓縮數據解壓成13位的數據。本文中解壓仍然按照解壓成12位的數據,其解壓流程如圖3所示。圖3中壓縮數據暫存單元com的位*的段碼值若大于l時,需將這4位段內碼的前后相鄰位都置1,然后將這6位送至解壓數據暫存單元dcom的位(段碼值+3)~位(段碼值-2)即可,代碼(見附錄2)中采用的方法是對這6位邏輯左移(段碼值-2)位。 4 實驗分析及結論 由于語音信號可以分解成許多正弦頻率的和,實驗中采用200Hz的正弦信號代替實際的語音信號。將匯編語言編寫的源程序和命令連接文件都添加到新建立的工程文件夾中,并編譯、鏈接及裝載程序運行,然后執行集成開發環境ccs的菜單命令View|Graph|Time Frenquency,打開Graph Property Dialog對話框,在此分兩次輸入標題名sine和decompress sine、起始地址0x0082和0x065E(命令連接文件.cmd中將.bss段定位到DARAM的org=0080h上),并選擇數據的長度為200及數據類型為16-bit signed integer,然后點擊ok按鈕即可生成圖4和圖5的曲線。 與圖4相比,圖5只有在幅值比較大時兩者的誤差才略為明顯,這是A律解壓算法特性造成的,對語音信號的影響并不大,因為語音信號出現大幅度值的概率小。 本文完成的語音信號的A律編解碼的DSP實現,經過實驗表明,可以達到實時的語音壓縮及解壓效果 附錄1壓縮代碼 |