国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

H.264編碼器中亞像素運動估計的硬件實現

發布時間:2009-11-30 14:54    發布者:bakedham
關鍵詞: 編碼器 , H.264 , 亞像素
作者:同濟大學超大規模集成電路研究所 鄭巨定 周開倫 林濤    來源:電子設計應用2009年第11期

引言


運動估計是視頻壓縮的關鍵,能進一步減小圖像的冗余度,提高編碼壓縮效率。運動估計就是在幀間預測時設法找到當前幀的像素(或圖像塊)是從上一幀圖像的什么位置移動過來的,以該位置上的像素(或圖像塊)作為預測依據,以此提高預測的準確性。由于H.264中的運動估計采用了一系列新技術,如七種塊尺寸(將一個宏塊分割成16×16、16×8、8×16、8×8、8×4、4×8、4×4七種類型的子塊進行運動估計)、1/4像素精度運動補償技術和多參考幀技術等,在使壓縮效率至少提高兩倍的同時,計算量也大大增加。實驗結果表明,運動估計占H.264編碼器的60%~80%的時間。H.264中的運動估計由整數運動估計和分數運動估計兩部分組成。由于不論是自然視頻圖像序列或是合成視頻圖像序列,實際對象的運動精度都是任意小的,所以引入分數運動估計能非常準確地描述對象的運動軌跡,能更進一步去除視頻圖像序列的時間冗余,其精度達到了1/8像素精度。分像素的運動矢量如圖1所示。


圖1 分像素運動矢量

一般在實際應用中,運動估計普遍采用分級搜索算法:首先在搜索區內找到最佳整像素運動矢量,再在整像素最佳匹配點下尋找最佳1/2匹配點,得到半像素精度的運動矢量,接著在該半像素精度最佳匹配點周圍進行1/4像素點搜索,得到1/4像素精度最佳匹配點以及相應的運動矢量。由于分像素運動估計運算量大,很多學者對分像素運動估計從算法上進行優化,提出了很多快速搜索算法,減少搜索點數目以達到降低運算復雜度的目的。本文就是基于這個目的,在塊匹配算法的基礎上,提出了一種1/4像素精度的亞像素運動估計的硬件實現方法。在整像素運動估計的基礎上用10×10整像素陣列實現半像素精度和1/4像素精度的最佳匹配點搜索,在空間上具有更高的并行度,硬件實現簡潔有效。

FME的運動矢量

幀間編碼宏塊中的每個塊或亞宏塊分割區域都是根據參考幀中同尺寸的區域預測得到的,它們之間的關系用運動矢量來表示。H.264對亮度成分和色度成分進行亞像素搜索時,兩者之間的運動矢量是有差異的,對亮度成分采用1/4像素精度,色度成分采用1/8像素精度。如圖2所示,大寫字母代表整像素點,小寫字母代表1/2像素點。


圖2  亮度半像素內插

假定點H是在整像素運動估計中找到的最佳匹配點,在此基礎上再進行1/2像素點的搜索,如點(bb,aa等),如果MV的垂直和水平分量為整數,參考塊相應像素實際存在;如果其中一個或兩個為分數,則參考塊相應的亮度和色度像素并不存在,需利用鄰近已編碼點進行內插而得。

內插像素生成的步驟如下:

首先生成參考圖象亮度成分的半像素點。半像素點(如b、h、m)通過對相應整像素點進行6抽頭濾波得出,權重為(1/32、-5/32、5/8、5/8、-5/32、1/32)。b通過下式計算得出:

b=round((E-5F=20G+20H-5I+J)/32)      (1)

類似的,h由A、C、G、M、R、T濾波得出。一旦鄰近(垂直或水平方向)整像素點的所有像素都計算出來,剩余的半像素點便可通過對6個垂直或水平方向的半像素點濾波得到。例如,j由cc、dd、h、m、ee、ff濾波得出。

半像素點計算出來后,在此基礎上,1/4像素點可通過線性內插得出,如圖3所示。


圖3 亮度1/4像素內插

1/4像素點(如a、c、i、k、d、f、n、q)由鄰近像素內插而得,如

a=round((G+b)/2)                          (2)

剩余1/4像素點(p,r)由一對對角半像素點線性內插得出,如e由b和h獲得。相應地,對于色度成分的1/8像素精度的運動矢量,也同樣通過整像素點線性內插得出,如圖4所示。


圖4 色度1/8像素內插

其中:
a=round([(8-dx)(8-dy)A+dx(8-dy)B+(8-dx)dyC+dx dyD]/64)       (3)

FME模塊算法原理及硬件實現

在本設計中,FME搜索采用的是如圖5所示的菱形全搜索方法。


圖5 菱形全搜索

即先利用整像素運動估計搜索出最佳整像素點,再在最佳整像素匹配點的基礎上搜索出最佳整像素點周圍的36個亞像素點(假設在圖5中正中心點是最佳整像素匹配點)。等36個亞像素點都計算出來后,加上正中心的最佳整像素點共37個像素點。比較這37個像素點的SATD的值,將SATD值最小的像素點確定為最佳的預測點。

由于H.264采用樹形結構運動估計,每個宏塊可劃分成更小的子塊,其中4×4塊是宏塊劃分中最小的子塊,任何類型的子塊都可由若干個具有相同運動矢量的 4×4塊組成,因此本設計在硬件實現時將4×4塊作為處理的基本單位。考慮到硬件資源的節省及計算的并行度,在本設計模塊中每次能并行處理兩個4×4塊的亞像素點的搜索,一個宏塊(16×16)要分8次完成,處理單元的硬件結構框圖如圖6所示。


圖6 FME硬件框圖

其中IME單元為FME單元提供10×10整像素點陣列,內插法用于1/2像素點的插值,ave單元用于計算1/4像素精度的像素點,Sram單元用于存儲計算出來的亞像素點的值。比較器單元由diff、DCT、satd三個單元組成,用于比較這些亞像素的SATD值,確定最佳的亞像素預測值。

假設當前處理的4×4塊在參考幀中的最佳整像素匹配塊如圖7所示(方框中的4×4塊為匹配的塊),在硬件實現的過程中為減少搜索次數,只要搜索出圖7中對應的5×5塊的每個整像素點左上角的15個亞像素點(見圖8),然后將相鄰整像素點左上角的亞像素點進行組合后就能將當前處理的4×4塊中每個整像素點周圍的36個亞像素點(見圖5)都計算出來。
     
  圖7 最佳整像素匹配塊


圖8 亞像素點



本設計在硬件實現的過程中為提高計算的并行度,利用15個六抽頭濾波器,25個均值器等硬件資源來計算圖8所示的亞像素點的值,計算依據分別如公式1、2所示,硬件搜索計算過程如圖9所示。


圖9 亞像素點硬件搜索步驟

通過上述15個步驟就可將圖8所示的亞像素點全部計算出來,并將計算出來的亞像素點的值都存入到開辟的Sram中,以便在進行P幀重構時從Sram中直接取出最佳的預測值給相關的模塊。由于如上文所述在對每個4×4塊進行亞像素搜索時要計算出對應的5×5塊(如圖7所示4×4塊對應的5×5塊)的每個整像素點左上角的15個亞像素點的值(如圖8所示的15個亞像素點),加上最佳整像素點共16個像素點的值都要存儲起來,且對應的5×5塊中的每個整像素點左上角的亞像素點的像素值都是并行計算出來的(如step1計算點2,是將對應的5×5塊的25個整像素點左上角對應的點2一次全計算出來),所以在進行一個4×4塊的亞像素搜索時,要存儲的像素點共有25×16個。由于在本設計模塊中每次能并行處理兩個4×4塊單元,即利用兩套FME模塊資源并行處理兩個 4×4塊的亞像素搜索,一個宏塊(16×16)要分8次完成。考慮到數據組織的方便性,本設計在一套FME模塊中開辟兩塊Sram資源,一塊大小為 104×128,一個地址存儲13個像素點的值(每個像素點的值占8bit),另一塊大小為96×128,一個地址能存儲12個像素點的值(每個像素點的值占8bit),地址深度128剛好能存儲8個4×4塊的亞像素點的像素值,所以兩套FME模塊中的Sram資源剛好能把一個宏塊的亞像素點的像素值都存儲起來。此設計在硬件的實現過程中計算并行度高,硬件實現簡潔有效。

根據圖6所示的硬件架構及上文描述的算法原理,利用Verilog HDL對其進行建模,建立測試平臺在ModelSim環境中進行編譯、仿真,驗證其功能的準確性。然后使用Synplify工具對其進行綜合,工作頻率可達68MHz。在FPGA 驗證平臺上,可實現對高清碼流(1920×1080)的編碼,利用Design Complier工具進行綜合,在中芯國際0.18μm 工藝標準單元庫的基礎上,綜合后面積占150千門,工作時鐘頻率可達166MHz,達到了預期要求。

結語

H.264中的分數運動估計能有效提高預測精度,但大大增加了計算復雜度。同整數運動估計一樣,分數運動估計存在兩個主要問題,一是計算量大,二是存儲訪問量大。而本文提出的用于H.264/AVC的分像素運動估計的硬件實現方法能在全搜索塊匹配算法的基礎上,采用子塊分解,利用 10×10整像素點陣列實現1/2像素精度和1/4像素精度的最佳匹配點的并行搜索,與其他實現方法相比在空間上具有更高的并行度,處理能力更高,不但減少了大量中間數據的存儲與傳輸,節省了存儲器資源,而且簡化了數據流和控制流,使硬件實現簡潔有效,非常適合高分辨率視頻的分像素運動估計。

參考文獻

1. RICHARDSONIEG. H.264 and MPEG-4 Video Compression:video coding for next-generation multimedia [M ]. U. S: John Wiley& Sons, 2003

2. JVT-G050. Draft ITU-T Recommendation H.264 and Draft ISO/IEC 14496-10 AVC. 2005

3. 畢厚杰. 新一代視頻壓縮編碼標準—H.264/AVC[M]. 北京:人民郵電出版社,2005.5
本文地址:http://m.qingdxww.cn/thread-6185-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • 5分鐘詳解定時器/計數器E和波形擴展!
  • 為何選擇集成電平轉換?
  • 想要避免發生災難,就用MPLAB® SiC電源仿真器!
  • 安靜高效的電機控制——這才是正確的方向!
  • 貿澤電子(Mouser)專區

相關視頻

關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 国外在线观看网 | 亚洲视频自拍 | 99久久综合狠狠综合久久一区 | 成人国产激情福利久久精品 | 亚洲高清一区二区三区久久 | 在线成人毛片 | 免费 高清 日本1在线观看 | 亚洲精品九色在线网站 | 国产乱码精品一区二区三区中 | 九九精品免视频国产成人 | 日韩精品1区 | 99re这里有免费视频精品 | 日本wwww色| 国产精品黄页网站在线播放免费 | 一级毛片在线全部免费播放 | 日韩在线视频在线 | 久久尹人 | 久草视频中文在线 | 天天操夜夜艹 | 麻豆婷婷 | 在线看色 | 久久婷婷久久一区二区三区 | 女人张开腿让男人桶免费最新 | 国产亚洲高清在线精品不卡 | 朋友的母亲hd中字在线观看 | 日本我不卡 | 国产精品一区在线免费观看 | 亚洲男人天堂2020 | 色综合婷婷 | 日韩大片免费观看视频播放 | 欧美整片在线 | 日韩成人免费视频播放 | 久久国产亚洲偷自 | 狠狠综合久久久综合 | 四虎影视永久在线观看 | 99久女女精品视频在线观看 | 中文字幕 国产 | 91精品欧美产品免费观看 | 日本在线网 | 一级网站在线观看 | 欧美日韩精品在线观看 |