互聯網的帶寬越來越大,基于互聯網的信息特別是聲音圖像實時數據的傳輸已經成為可能。視頻和音頻數據的傳輸正好充分利用了互聯網帶寬,并達到了實時交流以及進行遠程開會的可能。視頻會議系統相比傳統的電話會議更充分利用了互聯網資源,從而降低了運營成本。 視頻編碼器是視頻會議系統的主要構成部分。目前視頻壓縮標準有H.261、H.263、MPEG4和H.264等。新一代視頻編碼標準H.264與以往標準相比具有壓縮率高,網絡親和性好,視頻質量優越等優點。H.264引入了許多當前視頻編碼中的新技術,使得在相同的重建圖像質量下,編碼效率比H.263和MPEG-4高50%左右。因此,視頻編碼器設計中采用了H.264編碼標準,編碼器主要通過美國AD公司的BF561 DSP芯片實現。目前,視頻處理方案也已經由前幾年的ASIC方案轉向DSP平臺。在DSP平臺上進行視頻產品開發有以下幾方面的優勢:第一,用戶開發自由度更大,支持多種個性化開發,可以適應市場不斷提出的新要求,在第一時間提升產品性能,增強產品的競爭能力;第二,DSP處理能力強,可以在一個DSP上同時實現多路音、視頻信號的壓縮處理;第三,開發周期短,能實現快速技術更新和產品換代,各種新出現的快速及優化算法可靈活進行升級。 1 BF561介紹 BF561采用了對稱雙核的架構,在一顆BF561芯片內部集成了2個BF533 DSP內核,2個內核主頻都可以高達600 MHz,支持并行處理。BF561處理器的特性保證了其強大的數字信號處理能力,并且支持低電壓低電流供電,能夠滿足多功能的數字消費類產品對于性能、功耗方面的要求。 1.1 DMA介紹 Blackfin處理器用直接存儲器訪問(DMA)在存儲器之間或存儲器與外設之間傳送數據。DMA控制器可在存儲器和片上外設(外設DMA)之間進行數據傳送,以及在L1/L2/L3存儲器間進行數據傳送(存儲器DMA或MDMA)。DMA控制器是Blackfin處理器架構中的重要組件,完全獨立于內核,不會進行周期挪用,完全無需占用處理器內核周期。在理想的應用配置中,內核只需要設置DMA控制器,并在數據調用過程中響應中斷。 BF561有3個獨立的DMA控制器DMA1,DMA2和IMDMA。DMA1和DMA2控制器各有12個外設DMA通道和4個存儲器DMA通道。IMDMA控制器有4個存儲器DMA通道。 1.2 基于描述符的DMA 基于描述符的DMA傳送需要存儲于存儲器中的參數來初始化一個DMA隊列。描述符包括所有需對DMA控制寄存器正常編程的參數。描述符允許把多個DMA隊列鏈接在一起。在基于描述符的DMA操作中,可以對一個DMA通道編程,以便在當前傳送隊列完成后,自動設置和啟動其他DMA傳送過程。在管理一個系統的DMA傳送過程時,基于描述符的模型能提供最大的靈活性。 描述符列表模型分為描述符列表“小”模式和描述符列表“大”模式。在描述符列表“小”模式中,描述段包括一個16位字段,用以指向下一描述符入口地址的低16位,地址的高16位通過寄存器編程得到且保持不變,限制描述符在存儲器的一個特定64 KB大小的頁中。當描述符需要跨頁時,可用能提供32位入口地址的描述符列表“大”模式。 2 H.264視頻編碼器構成 H.264編碼器由視頻采集、數據格式轉換、H.264編碼3部分組成。視頻采集部分負責捕獲圖像,并且將捕獲到的圖像通過PPI接口填充到指定的視頻幀緩沖區中。數據格式轉換部分完成將輸入的4:2:2格式的圖像轉換成H-264編碼器能夠編碼的4:2:0格式的數據。H.264編碼部分負責對4:2:0格式圖像編碼。 在本視頻編碼器設計中,BF561 A核用于運行操作系統和協議棧,而H.264算法在B核實現。 2.1 視頻采集 視頻采集是由攝像頭OV7660完成,OV7660是美國OmniVision公司開發的一款CMOS彩色圖像傳感器芯片,支持VGA,QVGA,GIF等多種分辨率。視頻輸出格式有Raw RGB,GRB 4:2:2和YUV/YCb-Cr(4:2:2)。在本設計中,選擇CIF YVYU(4:2:2)格式,需要設置其相應寄存器COMl=0X00,CLKRC=OX80,COM7=0X30,TSLB=0X05。攝像頭配置完后,打開PPIO將視頻數據填充到Blackfin處理器的視頻幀緩沖區中。采用基于描述符的PPI DMA可以很容易的實現乒乓緩沖,從而確保不會覆蓋尚未處理完畢的輸入數據。 乒乓緩沖的原理如圖1所示。 設置兩個CIF 4:2:2幀大小的輸入緩沖區,首先輸入數據通過PPI接口填充到4:2:2視頻幀1中,當第一幀數據填充滿時,處理器對這幀數據進行MDMA搬移和壓縮編碼等操作,與此同時,PPI繼續填充第二個視頻幀。當第二個視頻幀填充滿時,處理器處理第二個視頻幀同時填充第一個視頻幀。利用乒乓緩沖,數據將源源不斷地填充到兩個視頻幀中。 2.2 數據格式轉換 視頻采集到的圖像是交織的4:2:2格式的YUV視頻數據,而H.264視頻編碼算法對4:2:O格式的視頻數據進行壓縮。4:2:O格式數據的亮度值緩沖區和色度值緩沖區是分離的,利用MDMA搬移,可以實現亮度緩沖區和色度緩沖區的分離。 CIF YVYU(4:2:2)格式數據如表1所示,CIF 4:2:O格式數據如表2所示。4:2:2格式圖像一個宏像素中有4個Y分量,2個U分量和2個V分量。4:2:0格式圖像一個宏像素中有4個Y分量,1個U分量和1個V分量。Y,U和V的存儲區是分開的,Y在前,然后是U,最后是V。 把4:2:2格式轉換成4:2:O格式,要保留所有的Y,并取第0,2,4,……行的U和第1,3,5……行的V。采用基于描述符列表“大”模式的MDMA,需要三對描述符source_y,dest_y,SOurce_u,dest_u,SOUrce_v,dest_v,形成源和目的兩個描述符鏈表,進行Y,U和V的從交織的4:2:2格式的源數據區到Y,U和V分離的目的數據區的搬移。 當一幀CIF 4:2:2格式數據通過PPI填充到一個Blackfin處理器的視頻幀緩沖區中,產生中斷,在中斷處理子程序中啟動MDMA,分離亮度值和色度值,然后交給H.264編碼器進行編碼。 2.3 H.264編碼 等待產生一幀4:2:O格式數據后,對這一幀數據執行H.264編碼,之后繼續等待4:2:0格式數據的產生,直至編碼結束。 3 實驗結果與分析 實驗中,H.264編碼器對攝像頭采集到的圖像編碼,并將壓縮碼流以文件的形式保存在本地存儲器中。編碼結束后,用H.264的解碼器對壓縮碼流解碼,用YUVviewerPlus.exe播放解碼后的視頻文件。 實驗中,編碼器可達到每秒鐘編碼15幀圖像的速度。解碼后的圖像清晰度與在VisualDsp++5.0中用Image Viewer查看的相比,圖像質量基本相同,圖像很清晰。OV7660采集圖像的速度是每秒鐘30幀,H.264編碼器沒有達到實時編碼。 實驗中,基于BF561的H.264編碼器沒有達到實時編碼的原因是沒有對H.264開源代碼優化。由于CIF格式圖像數據比較大,需要存儲在外部存儲器中,處理器訪問外部存儲器時間比較長;DCT和運動估計算法函數比較耗時,用C語言實現;程序中有一些輔助函數和打印信息等,從而影響了編碼器的速度口。 4 結 語 基于BF561的H.264編碼器沒有達到實時編碼。未來的工作重點是利用VisualDSP++開發環境的C編譯器,進行代碼優化;充分利用內部存儲空間資源和盡可能通過DMA、高速緩存等減少存儲分配帶來的片內外數據調度對系統性能的影響;對一些系統調用比較頻繁、耗時較多的模塊,如DCT和運動估計等,充分利用BF561的指令集,用匯編語言實現;去掉源程序中不必要的輔助函數和打印信息,以實現基于BF561的H.264編碼器實時編碼。 隨著消費類電子產品進一步進入普通家庭,應用H.264標準的視頻會議、可視電話以及無人監控系統等也將會得到越來越廣泛的應用。 |