国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

H.264中插補(bǔ)算法的VLSI設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2010-12-20 17:56    發(fā)布者:conniede
關(guān)鍵詞: VLSI , 插補(bǔ)算法 , 濾波器 , 色度
H.264/AVC是由ITU和ISO/IEC的專家共同組成的聯(lián)合視頻小組JVT(Joint Video Team)發(fā)展和制定的新一代視頻編碼國(guó)際標(biāo)準(zhǔn)。在相同的視覺(jué)感知質(zhì)量下,H.264的傳輸碼率比以往的H.263、MPEG-4等降低了50%左右。

運(yùn)動(dòng)矢量位移的精度越高,則幀間剩余誤差越小,壓縮比越高。H.263中采用了半像素估計(jì),在H.264中則進(jìn)一步采用1/4像素精度的運(yùn)動(dòng)估計(jì)。分?jǐn)?shù)運(yùn)動(dòng)估計(jì)和運(yùn)動(dòng)補(bǔ)償用到的非整數(shù)像素點(diǎn)必須通過(guò)插補(bǔ)(interpolation)運(yùn)算來(lái)實(shí)現(xiàn),因而插補(bǔ)運(yùn)算的硬件加速對(duì)整個(gè)H.264編解碼系統(tǒng)性能的提高有重要意義。在H.264中采用了6抽頭FIR濾波器的內(nèi)插獲得1/2像素位置的值,則1/4像素值可通過(guò)線性內(nèi)插獲得。而對(duì)于常用的4:2:0的視頻格式,亮度信號(hào)的1/4像素精度對(duì)應(yīng)于色度的1/8像素的運(yùn)動(dòng)矢量,因此需要對(duì)色度信號(hào)進(jìn)行1/8像素的插補(bǔ)運(yùn)算。在H.264的幀間預(yù)測(cè)中,4×4是最基本的處理單元,其7種模式都可以劃分為4×4塊來(lái)進(jìn)行處理,因而基于面積和時(shí)間考慮的4×4模塊的插補(bǔ)電路具有良好的可重用性。

文獻(xiàn)提出了使用4抽頭濾波器取代6抽頭濾波器的算法來(lái)實(shí)現(xiàn)亮度的1/2像素插補(bǔ),利于硬件實(shí)現(xiàn)。本文在4抽頭濾波器的基礎(chǔ)上提出了可以處理4×4塊的流水線結(jié)構(gòu),可以在一個(gè)時(shí)鐘內(nèi)完成27個(gè)1/2像素位置的插補(bǔ)運(yùn)算。對(duì)色度1/8像素的插補(bǔ),本文提出的兩級(jí)處理的結(jié)構(gòu),巧妙地利用移位器和加法器取代了乘法器,節(jié)省了硬件開(kāi)支。


1 插補(bǔ)算法原理

插補(bǔ)原理示意圖如圖1所示。2個(gè)整數(shù)像素位置之間的1/2像素點(diǎn)像素如圖1(a)中的a、b、aa等,是利用一個(gè)帶權(quán)重的6抽頭有限沖擊響應(yīng)(FIR)濾波器對(duì)相鄰整數(shù)位置的像素值進(jìn)行內(nèi)插得到的,權(quán)重值是(1/32,-5/32,5/8,5/8,-5/32,1/32)。如:

a=round((A-5*B+20*C+20*D-5*E+F)/32)(1)

h=round((A-5*G+20*H+20*I-5*J+K)/32)(2)

aa=round((a-5*b+20*c+20*d-5*e+f)/32)(3)

=round((h-5*i+20*j+20*k-5*l+m)/32)

由于6抽頭FIR的結(jié)構(gòu)比較復(fù)雜,文獻(xiàn)提出的權(quán)重值為(-1/8,5/8,5/8,-1/8)4抽頭FIR在對(duì)圖像質(zhì)量和比特率影響很小的情況下,可以很大程度地節(jié)省硬件資源。如圖1(b)中:

a=round((-1*B+5*C+5*D-1*E)/8)(4)

h=round((-1*G+5*H+5*I-1*J)/8)(5)

aa=round((-1*b+5*c+5*d-1*e)/8)(6)

=round((-1*i+5*j+5*k-1*l)/8)

最匹配的1/2像素位置確定以后,1/4像素位置的像素由周圍的整數(shù)像素位置像素和1/2像素位置像素線性插補(bǔ)得到。

在常用的4:2:0采樣中,亮度分量1/4像素精度的運(yùn)動(dòng)矢量應(yīng)用到色度分量需要1/8的像素精度。在色度空間,對(duì)整數(shù)位置的像素值進(jìn)行線性插補(bǔ)可以得到1/8像素精度的插補(bǔ)值。如圖1(b)所示,1/8像素位置的像素a是周圍整數(shù)位置像素A,B,C,D的線性組合:

a=round(8-x)*(8-y)*A+x*(8-y)*B+y*(8-x)*C+x*y*D/64 (7)

2 硬件結(jié)構(gòu)

2.1 亮度1/2像素插補(bǔ)電路

4抽頭FIR與6抽頭FIR結(jié)構(gòu)比較如圖2所示。由圖2可以看出,4抽頭FIR的結(jié)構(gòu)比6抽頭FIR易于硬件實(shí)現(xiàn)。實(shí)驗(yàn)表明前者的電路面積和關(guān)鍵路徑延時(shí)比后者分別減少了36.2%和16.0%。


4×4塊的1/2像素精度插補(bǔ)電路的流水線結(jié)構(gòu)圖如圖3所示,共有16個(gè)4抽頭FIR,利用一個(gè)6× 4的整數(shù)像素點(diǎn)陣列作為緩沖區(qū),每次從存儲(chǔ)器中讀出8個(gè)整數(shù)像素點(diǎn),分別用于5個(gè)水平4抽頭FIR的輸入。每個(gè)時(shí)鐘所有的像素點(diǎn)都會(huì)向下傳送一級(jí),圖中虛線框處已經(jīng)計(jì)算出了整數(shù)像素點(diǎn)周圍的所有27個(gè)1/2像素值,可以輸出到并行處理單元同時(shí)計(jì)算9個(gè)半像素位置的SAD(Sum of Absolute Difference)。該架構(gòu)處理一個(gè)4×4單元需要8個(gè)時(shí)鐘,處理一個(gè)具有相同運(yùn)動(dòng)矢量的4×16塊需要20個(gè)時(shí)鐘。


亮度1/4像素的線性插補(bǔ)可以用一個(gè)加法器和一個(gè)移位器實(shí)現(xiàn)。圖4為4×4塊1/4像素插補(bǔ)電路的結(jié)構(gòu)圖,采用兩級(jí)流水線,輸入部分為18個(gè)像素點(diǎn),利用線性插補(bǔ)生成所需要的1/4像素位置像素。在圖中虛線框部分可以計(jì)算出最佳1/2像素點(diǎn)周圍的所 有1/4像素點(diǎn),輸出給并行處理單元計(jì)算9個(gè)1/4像素位置的SAD。該架構(gòu)完成一個(gè)4×4單元需要6個(gè)時(shí)鐘,完成一個(gè)具有相同運(yùn)動(dòng)矢量的4×16塊需要18個(gè)時(shí)鐘。


H.264的幀間預(yù)測(cè)中,一個(gè)宏塊(MB)可劃分成16×16、16×8、8×16、8×8、8× 4、4×8、4×4不同模式。這7種模式都可以劃分為16個(gè)4×4塊分別進(jìn)行處理。具有相同整像素運(yùn)動(dòng)矢量的縱向相鄰4×4塊可以連續(xù)處理以節(jié)省時(shí)鐘數(shù)。表1列出了亮度為1/2像素插補(bǔ)和1/4像素插補(bǔ)時(shí)流水線處理一個(gè)宏塊不同模式分別需要的時(shí)鐘數(shù)。


2.3 色度1/8像素插補(bǔ)電路

如果利用乘法器來(lái)實(shí)現(xiàn)色度1/8像素精度的插補(bǔ)電路,對(duì)每一個(gè)點(diǎn)的插補(bǔ)運(yùn)算都要用到8個(gè)乘法器,無(wú)論是面積還是時(shí)間都會(huì)有很大的開(kāi)銷。變換公式(7)可得公式(8),可以看出其中含有如(9)式所示的公共運(yùn)算單元。

a=round{{(8-y)[(8-x)×A+x×B]+y[(8-x)×C+x×D]}/64}(8)

cf=(8-h)×M+h×N(9)

硬件設(shè)計(jì)采用兩級(jí)處理的結(jié)構(gòu),采用圖5所示的CU單元處理公式(9),色度1/8插補(bǔ)電路結(jié)構(gòu)如圖6所示。由于該結(jié)構(gòu)的兩級(jí)間比較平衡,非常容易插入寄存器以減少關(guān)鍵路徑的延時(shí)。


3 實(shí)驗(yàn)結(jié)果

使用VerilogHDL對(duì)本文中提到的設(shè)計(jì)進(jìn)行了實(shí)現(xiàn),仿真工具使用VCS7.2,綜合工具使用Synopsys Design Compiler(SMIC 0.18μm工藝)。


文獻(xiàn)中使用6抽頭FIR的4×4塊插補(bǔ)電路流水線結(jié)構(gòu),與本文使用的4抽頭FIR結(jié)構(gòu)進(jìn)行了比較,其電路性能如表2所示。本文的設(shè)計(jì)在速度和面積方面均具有非常明顯的優(yōu)勢(shì)。使用H.264參考軟件JM7.3分別對(duì)亮度1/2像素插補(bǔ)運(yùn)算中使用6抽頭FIR和4抽頭FIR進(jìn)行仿真比較,采用了4個(gè)視頻序列Container、Foreman、News和Tenis。其中每個(gè)序列由30個(gè)QCIF (Quarter Common Intermediate Format)幀組成,序列形式為IBBPBBPBBP。H.264主要檔次,搜索半徑16,使用5個(gè)參考幀。4抽頭FIR與6抽頭FIR圖像質(zhì)量比較如表3所示。表中△b為平均碼率的增加,△P為峰值信噪比(PSNR)的增加?梢钥闯,使用4抽頭FIR對(duì)圖像質(zhì)量和比特率的影響非常小。

與其他的設(shè)計(jì)方法相比較,本文提出的色度1/8像素的插補(bǔ)電路可以很大程度上節(jié)省硬件資源。其性能比較如表4所示。與文獻(xiàn)中的設(shè)計(jì)相比,本文的設(shè)計(jì)關(guān)鍵路徑延時(shí)僅增加了1.5%,門(mén)數(shù)減少了26%。


本文介紹了亮度1/4像素精度下,最常用的4:2:0采樣模式時(shí)插補(bǔ)電路的硬件設(shè)計(jì),通過(guò)4抽頭 FIR代替6抽頭FIR來(lái)實(shí)現(xiàn)亮度1/2像素插補(bǔ),通過(guò)移位器和加法器組成的兩級(jí)處理結(jié)構(gòu)來(lái)實(shí)現(xiàn)色度1/8像素插補(bǔ),設(shè)計(jì)的電路具有面積小、速度快的優(yōu)點(diǎn)。在此基礎(chǔ)上基于功耗和性能考慮的4×4塊的流水線結(jié)構(gòu)具有良好的可重用性,可作為硬件加速器用于基于H.264的編解碼系統(tǒng)。
本文地址:http://m.qingdxww.cn/thread-47314-1-1.html     【打印本頁(yè)】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé);文章版權(quán)歸原作者及原出處所有,如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,我們將根據(jù)著作權(quán)人的要求,第一時(shí)間更正或刪除。
您需要登錄后才可以發(fā)表評(píng)論 登錄 | 立即注冊(cè)

廠商推薦

  • Microchip視頻專區(qū)
  • 使用SAM-IoT Wx v2開(kāi)發(fā)板演示AWS IoT Core應(yīng)用程序
  • 使用Harmony3加速TCP/IP應(yīng)用的開(kāi)發(fā)培訓(xùn)教程
  • 集成高級(jí)模擬外設(shè)的PIC18F-Q71家族介紹培訓(xùn)教程
  • 探索PIC16F13145 MCU系列——快速概覽
  • 貿(mào)澤電子(Mouser)專區(qū)

相關(guān)在線工具

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點(diǎn)地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權(quán)所有   京ICP備16069177號(hào) | 京公網(wǎng)安備11010502021702
快速回復(fù) 返回頂部 返回列表
主站蜘蛛池模板: 大焦伊人| 伊人久久大香线蕉精品哪里 | 香香视频免费版下载 | 精品在线播放视频 | 精品一久久香蕉国产线看观看下 | 日韩欧美一区二区三区四区 | 国产成人免费观看 | 天天视频免费入口 | 免费永久在线观看黄网 | 国产精品男人的天堂 | 国产高清大尺度一区二区不卡 | 国产日本欧美亚洲精品视 | 欧美日韩精品一区二区在线线 | 亚洲成在线 | 亚洲精品乱码久久久久久蜜桃欧美 | 久久综合久久鬼色 | 欧美黑粗硬大 | 91麻豆国产| 欧美成人免费高清网站 | 九九热久久免费视频 | 啊~用力cao我cao死我公 | 久久婷婷五色综合夜啪 | 女生被男生操的视频 | 亚洲精品在线免费观看视频 | 亚洲最色网站 | 亚洲视频在线网 | 九九热只有精品 | 最新日韩欧美不卡一二三区 | 午夜影院在线 | 精品中文字幕一区在线 | 女老师伦理片 | 成人久草 | 一区免费在线观看 | 伊人狠狠操| 欧美人与性动交a欧美精品 欧美人与禽zzz000xxx | 色版网站 | 亚洲视频在线观看网站 | 三级在线国产 | 免费在线视频日本 | 五月天婷婷精品视频 | 最近最新2019中文字幕6 |