LTE系統的CRC校驗算法研究及DSP實現

發布時間：2010-11-28 20:43 發布者：designer

關鍵詞： CRC , dsp , LTE , 校驗算法

循環冗余校驗碼CRC（Cyclic Redundancy Check）是數據通信領域中最常用的一種差錯校驗碼，其特征是信息字段和校驗字段的長度可以任意選定。

為了完成信號傳輸過程中誤碼檢測，獲得正確無誤的傳輸數據，LTE(Long Term Evolution)系統針對不同的數據傳輸采用了多種格式的循環冗余碼，以適應系統高速率高性能的需求。

1 LTE系統中的循環冗余碼

LTE作為準4G技術，以正交頻分復用OFDM(Orthogonal Frequency Division Multiplexing)和多輸入多輸出MIMO(Multiple-Input Multiple-Out-put)技術為基礎，下行采用正交頻分(OFDM)多址技術，上行采用單載波頻分(SC-FDMA)多址技術，在20 MHz頻譜帶寬下能夠提供下行100 Mb/s與上行50 Mb/s的峰值速率。

LTE TDD(亦稱TD-LTE)系統采用了4種格式的CRC：CRC24A、CRC24B、CRC16、CRC8。其生成多項式如下：

其中長度為24的CRC24A和CRC24B主要用于共享信道數據傳輸，長度為16的CRC16主要用于下行控制信道和廣播信道數據傳輸，長度為8的CRC8主要用于CQI（Control quality information）信息的傳輸。

2 CRC算法分析及選擇

CRC的校驗原理非常簡單，它要求發送方和接收方采用同一個生成多項式g(x)，且g(x)的首位和末位的系數必須為l。編碼時將待發送的數據t(x)除以g(x)，得到的余數作為CRC校驗碼添加到t(x)的后面；譯碼時將接收到的數據r(x)除以g(x)，如果余數為0，則說明校驗正確，否則校驗失敗，從而判斷數據幀是否出錯。在工程應用中，常用的CRC校驗算法主要有兩種：查表生成法和塊異或長除法。

這種算法的優點是運算量小、速度快、效率高；缺點是可移植性較差，且要事先計算出余式表，而不同長度的生成多項式的余式表不同，因此余式表會占用系統較大的存儲空間，增大系統資源開銷。

2.2 塊異或長除法

塊異或長除法是依據CRC校驗碼的產生原理實現的。算法描述如下：

(1)初始化，將寄存器初始化為0。
(2)在信息比特后添加CRC長度個0，最終作為CRC添加的空間。
(3)讀取一個數據塊（塊的大小由處理器的字的單位長度決定）。
(4)判斷塊的最高位是否為‘1’，若為‘1’則數據塊與生成多項式做一次異或操作。
(5)將數據左移一位，如果當前塊的剩余比特等于CRC生成多項式的長度，則轉入步驟(3)；否則轉入步驟(4)。
(6)如果所有數據都已經操作完畢，則計算結束，寄存器中的值為最終求得的CRC。

這種算法的優點是算法簡單、容易實現、修改靈活、可移植性好，對任意長度的生成多項式都適用；但因為它一次只能處理一位數據，因此計算效率低，運算量大。

如前所述，在TD-LTE系統中采用了4種格式的CRC，如果采用查表算法，則需要建立4張查找表，會占用系統較大的存儲空間，且程序移植性差；如果采用塊異或長除法，則又會出現計算效率低，運算量大的問題。

綜上分析，結合項目需求及系統硬件配置，考慮到系統所采用的高效DSP處理器——TMS320C64x（主頻最高可達到1.2 GHz）可以彌補塊異或長除法的低效性，系統最終采用塊異或長除法來實現。

3 CRC算法的DSP實現

3.1 硬件簡介

TMS320C6000系列DSP是TI公司1997年2月推向市場的高性能DSP，綜合了目前DSP性價比高、功耗低等優點。TMS320C64x系列在TMS320C6000 DSP芯片中處于領先水平，它不但提高了時鐘頻率，而且在體系結構上采用了VelociTI甚長指令集VLIW(Very Long Instruction Word）結構，片內有8個獨立功能單元的內核，每個周期可以并行執行8條32 bit指令，最大峰值速度4 800 MIPS，2組共64個32 bit 通用寄存器，32 bit 尋址范圍，支持8/16/32/40位的數據訪問，片內集成大容量SRAM，最大可達8 Mbit。由于其出色的運算能力、高效的指令集、大范圍的尋址能力，使其特別適用于無線基站、測試儀表等對運算能力和存儲量有高要求的應用場合。

3.2 CRC校驗的DSP實現

因為系統采用了4種格式的CRC，如果對每種格式進行單獨實現，不僅任務繁瑣，而且增加了系統的代碼量，更給代碼測試和維護增加了難度。因此本實現采用統一實現，即同一個程序，支持系統中的所有CRC格式，僅需在程序頭部增添一點格式判斷的代碼即可。

雖然TMS320C64x DSP處理器的字長為32 bit，但是為了兼容4種格式的CRC，最終決定數據的分塊長度為半字，即16 bit，這樣做的目的就是為了支持CRC24，因為TMS320C64x DSP的寄存器在用作邏輯移位寄存器使用時，其有效長度為40 bit。

根據LTE協議，輸入數據按大端模式輸入。為了處理方便，每次讀入半字都將其倒序，采用低端對齊的方式進行CRC除法，因此，CRC多項式也必須經過倒序。最后生成的CRC也是倒序的，需要再次倒序，然后進行加擾（如果必要的話），最后添加到輸入數據后面。倒序可使用指令“BITR”，簡單易行。

輸出數據仍為大端模式。由前面所述可知：CRC8的生成多項式倒序值為0x1b3；CRC16的生成多項式倒序值為0x10811；CRC24A的生成多項式倒序值為0x1be64c3；CRC24B的生成多項式倒序值為0x18c0003。

值得注意的是：輸入數據后面應該多寫入一個字的0，因為每次取半字處理，當剩余比特為最大15 bit且CRC為最長24 bit時，組合起來也不會超過40 bit，避免特殊性的出現，以便統一處理。同時完成CRC計算過后，可以直接將CRC添加到原數據之后，而不擔心其會覆蓋系統中的其他數據，引起不必要的錯誤。

圖1為CRC計算及添加的程序實現流程。當CRC格式為CRC16、CRC24A、CRC24B時，讀取的第一個數據塊（半字）在第一次內循環中將只作16次的移位，而沒有異或操作，表面上看在這里應該加一個判斷，如果是這種情況則直接將數據右移16 bit，然后接著處理第二個數據塊。但這樣會對后續的數據塊造成麻煩，因為每個數據塊到達此處都需判斷一次，當數據量比較大時，會帶來更大的開銷，因此在程序流程中可以忽略此問題。

在接收端，CRC的校驗與發送端的計算基本相同，只是由于LTE系統的特殊性，如果在發送端CRC曾被加擾過，則在接收端校驗之前，應先從接收到的數據末尾截取出CRC進行解擾，然后再將解擾后的CRC添加回去，最后對整個接收數據進行CRC校驗。如果CRC校驗正確，則接收數據正確；否則接收數據錯誤，在此程序流程不再贅述。

4 性能分析

在DSP軟件實現中，通過指令并行，盡量優化程序循環體，減少或消除程序中的“NOP”指令。對于不同格式的CRC，根據它們所用的環境以及數據的大致長度，通過程序仿真運行，可以得到統計結果如表1。

表1的數據長度僅為個別舉例，但不失一般性。從表中可以看出，雖然塊異或長除法的運算量較大，但是當運用TMS320C64x芯片實現時，由于處理器的超高主頻，其計算速率也非常快，完全可以忽略它的計算量。因此，本實現采用塊異或長除法不僅簡化了程序實現方法，還減少了模塊程序代碼，節約了系統存儲空間。

本文從理論分析出發，根據TD-LTE系統特性，選擇了一種最優的CRC校驗算法，并在TMS320C64x芯片上加以實現，詳細講述了塊異或長除法在DSP中的實現方法。程序運行結果表明，本實現能夠滿足LTE系統的需要，具有可行性和高效性。

本文地址：http://m.qingdxww.cn/thread-42502-1-1.html 【打印本頁】

本站部分文章為轉載或網友發布，目的在于傳遞和分享信息，并不代表本網贊同其觀點和對其真實性負責；文章版權歸原作者及原出處所有，如涉及作品內容、版權和其它問題，我們將根據著作權人的要求，第一時間更正或刪除。