正交頻分復用(OFDM)是一種正交多載波調(diào)制技術(shù),它將寬帶頻率選擇性衰落信道轉(zhuǎn)換成一系列窄帶平坦衰落信道,在克服信道多徑衰落所引起的碼間干擾,實現(xiàn)高數(shù)據(jù)傳輸?shù)确矫婢哂歇毺氐膬?yōu)勢。但是由于OFDM信號頻譜重疊,對信道變化很敏感,在高速移動下,信道的時變特性更加明顯,此時OFDM系統(tǒng)載波間的正交性會遭到破壞,出現(xiàn)載波間干擾(ICI),這會導致系統(tǒng)性能明顯降低。為了消除ICI,必須采用適當?shù)木饧夹g(shù)以補償ICI。國內(nèi)外許多學者對這些問題進行了大量的研究,提出了各種不同的方法,得到了一些階段性成果。文獻提出了一種低復雜度的迭代MMSE均衡器算法,在保證均衡效果的同時把運算量成功降低到o(N),為該均衡器算法的實際運用奠定了基礎(chǔ)。 現(xiàn)場可編程門陣列(Field Programmable Gate Array,FPGA)器件近年來取得了飛速的發(fā)展,已經(jīng)具有強大的計算性能和邏輯實現(xiàn)能力。特別是Xilinx公司的FPGA具有豐富的IP資源,容量大且具有強大的軟件支持,在各個領(lǐng)域得到了廣泛的應用。本文主要討論基于Xilinx公司Virtex-2 FPGA硬件平臺的均衡器算法中矩陣求逆的運算過程實現(xiàn)。將程序下載到FPGA,并通過RS 232將結(jié)果數(shù)據(jù)回送到主機查看和驗證。 1 時變信道中OFDM系統(tǒng)均衡器 1.1 時變信道中的OFDM系統(tǒng)結(jié)構(gòu) 考慮一個載波數(shù)為N的OFDM系統(tǒng)如圖1所示,假設(shè)完全同步,并且有足夠長(不小于信道階數(shù))的循環(huán)前綴(CP)。在去除了循環(huán)前綴CP以后第i個數(shù)據(jù)幀收到的數(shù)據(jù)矢量為: 式中: OFDM第i個數(shù)據(jù)幀的輸出數(shù)據(jù)矢量; 為N點快速傅里葉逆變換矩陣;,n(i)為信道噪聲矢量,定義方差是σ2的高斯白噪聲(AWGN);H(i)是一個N×N的時域轉(zhuǎn)移矩陣,其元素為 ,其中h(i)(k,n)是描述信道特性的沖擊響應。在接收端,對r(i)進行N點快速傅里葉變換,其輸出為: 式中: 由于在高速移動的環(huán)境下,接收信號會受到ICI的影響,故在整個系統(tǒng)中添加均衡模塊,假設(shè)均衡器用E(i)來表示,則均衡后的信號可以表示為: 1.2 MMSE均衡器算法 把上面式中的i去掉,根據(jù)最小均方誤差的規(guī)則,可以簡寫得到均衡矩陣為: 在時變信道中,G不是對角矩陣,則矩陣求逆的直接算法的運算量為o(N3),利用文獻給出的結(jié)論:ICI主要來自相鄰的幾個子載波,并且每個子載波的符號能量主要泄漏至鄰近的少數(shù)子載波上,也就是說,G中的很大一部分元素是可以忽略的。然后再采用迭代的方法對矩陣求逆,把運算量降為o(N2),但是在實際應用中,N是一個較大的數(shù)值,這個方法計算量仍然很大,所以很多算法在考慮均衡效果的同時也盡量減少運算量,以增強算法的可實現(xiàn)性和最終均衡的實時性。 根據(jù)Chen等驗證得到G可以被進一步簡化成如下Ak來描述: 式中:pn是一個由 構(gòu)成的1×(2Q+1)的矩陣,i=O,1,…,2Q。MMSE均衡器可以描述為 ;γ為該信道的信噪比,且 。Ak是一個(2Q+1)×(4Q+1)的矩陣,再利用文獻中迭代的方法來計算矩陣的逆。 2 均衡器算法的FPGA實現(xiàn) 當載波數(shù)比較大時,OFDM均衡算法所要計算的矩陣比較龐大,計算量大,很難保證實時性的要求。于是人們很自然地會想到用實時性很強的FPGA來實現(xiàn)均衡器的設(shè)計,但是均衡本身所需要處理的數(shù)據(jù)量和運算量都非常大,即使使用FPGA實現(xiàn)也很困難。 若采用文獻中的算法運算量是o(N2),假如當載波數(shù)N=128時,運算量還是很大的,無法保證實時性。從均衡效果和運算量兩方面考慮,采用了文獻中的算法。這是一種典型的迭代算法,效果與文獻算法相接近,但是在計算中避免了求一個很大的矩陣的逆運算,而是從頻域轉(zhuǎn)移矩陣G中提取出了不大的有效矩陣,這樣就減少了大量運算。 2.1 硬件設(shè)計思想 在對均衡器算法進行FPGA設(shè)計之前,先用Matlab仿真該均衡器浮點算法,通過分析程序可以發(fā)現(xiàn),該算法的核心部分是迭代求逆矩陣的過程。該算法的瓶頸主要是求解由復數(shù)元素組成的矩陣的逆的計算量巨大,而且是浮點數(shù)會占用很大的存儲空間。為盡量減少需要使用的邏輯資源,在進行ISE設(shè)計時,數(shù)據(jù)用16位定點數(shù)表示,其中高8位是整數(shù)部分,低8位是小數(shù)部分。 2.1.1 硬件設(shè)計框圖 實現(xiàn)該均衡器的硬件設(shè)計框圖如圖2所示,其中G為從Matlab中產(chǎn)生的頻域轉(zhuǎn)移矩陣,控制模塊完成從G中取出對應的有效值得到Ak,并且控制當一組運算完成后運用上一組產(chǎn)生的 。進行下一組運算,CIR是該算法的核心,即矩陣迭代求逆的運算,CPE模塊是一個簡單的矩陣運算模塊完成 的運算。 2.1.2 CIR模塊介紹 CIR模塊完成矩陣迭代運算過程,它從輸入端口讀入Ak以及對應的 ,采用迭代的方法計算出 ,用FPGA實現(xiàn)這個模塊的端口如圖3所示。 其中,CLK為時鐘;γ是模擬信道的信噪比;Ak是頻域轉(zhuǎn)移矩陣G中取出的有效矩陣;trag是控制信號,當一次運算結(jié)束產(chǎn)生一個有效的 后,只有trag被置為高電平才會進行下一次運算。取Q=2時, 是一個5×5的矩陣。整個求逆矩陣的迭代過程就是從前一個5×5的逆矩陣(即 )和從頻域轉(zhuǎn)移矩陣G中對應區(qū)域取得的5×9的矩陣Ak運算出下一個5×5逆矩陣(即 )的過程。 分析其矩陣求逆的迭代算法可以發(fā)現(xiàn),其中大部分完成的是復數(shù)矩陣的乘加運算,所有數(shù)據(jù)是復數(shù),雖然復雜很多,但是實際運算中有許多是多余的。Rk是共軛對稱矩陣,上三角部分和下三角部分的實部相同,虛部也只是正負相反,所以只需要算出上三角矩陣的數(shù)據(jù),下三角的部分直接對虛部取反就可以了。 Xilinx的FPGA芯片中集成了硬核的乘加器DSP48,可以方便、高速地進行乘加運算。但是本算法中涉及到的復數(shù)運算比較靈活,還包括一些減法運算,直接使用DSP48不是很方便的控制。故設(shè)計了一種乘加器,使用了乘法器的IP Core,按照要求設(shè)置輸入輸出數(shù)據(jù)位數(shù),其中的一個乘加運算中設(shè)置乘法器的兩路輸入為8位,輸出為16位,調(diào)用IP Core如下所示,算法中其他的矩陣運算也都與此類似。 a,b作為兩個寄存器儲存參與運算的數(shù)據(jù),outl是乘法器計算的結(jié)果,用fcl進行存放,相累加得到f1,再按照共軛復數(shù)運算的規(guī)律得到nfl。實現(xiàn)一個8位×8位的乘加器共消耗了56個Slice,32個LUT和49個IOB。該乘加器綜合后的RTL結(jié)構(gòu)圖如圖4所示。 為了能最大限度地提高運算速度,所有數(shù)據(jù)都用可編程邏輯單元構(gòu)成的分布式存儲器存儲并列存儲,并且根據(jù)算法的要求實現(xiàn)的是多個乘加器同時運算,這樣雖然使用了很多邏輯資源,但任何數(shù)據(jù)都可以即取即用,便于進行大量的并行運算,以提高運算速度。 2.2 系統(tǒng)驗證仿真 本系統(tǒng)采用Xilinx公司Virtex-2實驗板進行仿真驗證,該實驗板采用的是XC2VP30芯片,它有30 816個邏輯單元,136個18位乘法器,2 448 KbRAM,資源豐富。開發(fā)軟件為該公司的集成開發(fā)軟件平臺ISE 9.2,HDL語言采用Verilog,使用Matlab輔助ISE完成FPGA設(shè)計的方法。通過實驗板上的RS 232串口與PC機進行通信,用Matlab從計算機中傳輸數(shù)據(jù)到FPGA芯片中,運算后再通過串口回傳均衡后的信號數(shù)據(jù)到Matlab中仿真驗證星座圖,以判斷該均衡器的效果。 2.2.1 均衡過程 CIR中使用迭代算法避免了并行大向量和大矩陣的運算,而是分步運算。所以對輸入信號進行均衡,首先要進行并串變換,但是不需要變成真正的串行信號。當Q=2時,實際上對需要均衡的輸入信號Y(i)每次取出5個數(shù)據(jù),用yk表示,暫且將這樣的變換叫作分組并串變換(P/GS),然后均衡矩陣ek與yk分組完成乘法運算得到一個zk,zk是一個數(shù)據(jù)不是向量,最后進行串并變換就得到均衡后的信號向量Z(i)。整個均衡的過程如圖5所示。 2.2.2 仿真結(jié)果 實現(xiàn)該算法的重要一步是所設(shè)計的乘加器可以正常使用,并且實時性好。對其進行仿真如圖6所示,可以發(fā)現(xiàn)當clk發(fā)生上升沿跳變時進行計算,圖中信號(a,b)表示輸入的數(shù)據(jù)信號;fcl表示相乘的結(jié)果;c表示進行乘加以后的運算結(jié)果,其計算準確,基本上沒有延遲。 ISE中設(shè)計的傳輸模塊實現(xiàn)波特率為19 200 b/s的串口通信控制器,把數(shù)據(jù)通過RS 232完成FPGA與PC機的雙向通信。把均衡后的信號Z(i)傳回Matlab中,采用QPSK的星座圖進行分析,選擇子載波的數(shù)目N=128,循環(huán)前綴CP的長度為8,并且在認為信噪比被準確估計的情況下均衡的結(jié)果,如圖7所示。 由此星座圖可以看出,在均衡前接收到的信號因為多普勒頻移和噪聲的影響,偏離星座點向周圍發(fā)散,使用FPGA中均衡以后傳回的數(shù)據(jù)基本沒有發(fā)散現(xiàn)象。 3 結(jié)語 在ISE軟件平臺上使用Verilog語言實現(xiàn)了一種基于時變OFDM系統(tǒng)的低復雜度MMSE均衡器算法。在Xilinx公司Virtex-2實驗板(XC2V930芯片)上對其進行驗證,基本達到該算法在Matlab上仿真的均衡效果。但是由于浮點數(shù)計算量太大,選用定點數(shù)對其進行截取,還是有一定的局限性,在進行大量數(shù)據(jù)的運算中還是會有些數(shù)據(jù)不太準確,造成整體的誤碼率效果不是太好,故還需要進一步改進算法和FPGA的實現(xiàn)方法,以期達到更好的均衡效果。 |