1. 引言 隨著網絡視頻平臺的發展,用戶對于4K高清畫質的需求日益增長。然而,許多用戶發現,即使購買了視頻平臺的會員,觀看4K內容時畫質卻不如預期,有時甚至還會出現模糊、卡頓的情況。這種現象背后涉及到視頻編碼、網絡帶寬、和視頻傳輸的諸多因素。 近期“影視颶風”發布的視頻《清晰度不如4年前!視頻變糊是你的錯覺嗎?》因討論視頻平臺降低碼率和改變編碼格式以壓縮視頻畫質,影響了內容表達。 4K視頻清晰度下降的一個主要原因是平臺為了節省帶寬而壓縮視頻流,有時導致比特率降低,無法發揮4K分辨率的全部潛力。 在這種背景下,如何高效地壓縮和傳輸4K視頻成為了一個關鍵技術難題。本文將探討如何通過米爾電子的ZU4EV MPSoC平臺,接入真4k 60UHD-SDI視頻源后,使用VCU進行高效H.265編解碼,再通過SGMII萬兆以太網實現網絡推流,以確保高質量4K視頻的流暢傳輸。 2. 視頻質量下降的原因與優化方法1)帶寬瓶頸:在用戶數量增加的情況下,服務器和網絡的帶寬常常無法滿足4K視頻流的需求。 2)壓縮算法不足:傳統的視頻壓縮技術在高分辨率內容上表現不佳,容易導致畫面模糊。 3)視頻流傳輸的優化在推流過程中,網絡帶寬和視頻壓縮效率直接決定了視頻播放的清晰度與流暢度。為了確保4K視頻在萬兆以太網上的高效傳輸,本設計采用以下優化措施:
1.高性能與低功耗的結合:Zynq UltraScale+ MPSoC采用了16nm FinFET工藝,集成了多核處理器和可編程邏輯,能夠在提高性能的同時降低功耗,這對于音視頻廣播領域來說至關重要,因為它可以在保證高清晰度視頻傳輸的同時,減少能源消耗。2.實時壓縮與解壓縮能力:集成的VCU支持H.264/AVC和H.265/HEVC標準,能夠實現高達4K UHD分辨率的視頻的實時壓縮和解壓縮。這意味著在廣播應用中,可以利用VCU進行高效的視頻編碼,減少存儲空間和帶寬的需求,同時保持視頻質量。3.多視頻流處理能力:VCU能夠同時處理多達八個不同的視頻流,這對于需要同時廣播多個視頻源的4K UHD廣播應用來說非常有用。這種多任務處理能力使得MPSoC成為多媒體中心和視頻服務器的理想選擇。4.靈活性和可擴展性:MPSoC的可編程邏輯(PL)提供了任意到任意高速視頻/音頻接口的靈活性,可以為多媒體管道帶來定制圖像及視頻處理功能的差異化效果。這種可編程性使得系統能夠適應不斷變化的音視頻廣播需求。5.專用硬件加速:MPSoC提供了專用的處理引擎,如基于ARM Cortex A53的APU、Mali圖形處理單元等,這些專用硬件能夠加速圖形和視頻處理任務,提高系統的整體性能。 6.支持多種視頻格式:VCU支持高達4:2:2 10位UHD-4K的視頻格式,適合專業和高端消費級的制作與后期制作解決方案。這種廣泛的格式支持使得MPSoC可以應用于各種不同的音視頻廣播場景。 7.集成的多媒體框架支持:MPSoC結合常見的多媒體框架GStreamer,可以開發硬件加速型多媒體應用。這種集成支持簡化了開發過程,使得開發者能夠快速實現復雜的音視頻處理任務。8.優化的功耗管理:Zynq UltraScale+ MPSoC將處理引擎、硬件編解碼器等組件放置在具有獨立電軌的不同電源域中,這種配置可用于為整個系統設計優化功耗管理方案,進一步降低系統功耗。9.高速互聯外設:MPSoC提供高速互聯外設,如集成式DisplayPort接口模塊,支持高達6 Gb/s的工作速率,這有助于處理來自PS或PL的實時音視頻流,進一步降低系統BOM成本。10.支持新一代地面數字電視廣播技術:隨著超高清電視時代的到來,MPSoC與VCU架構能夠支持新一代地面數字電視廣播技術,如DVB-T2、ATSC 3.0和DTMB-A等,這些技術支持更高的視頻質量和新的廣播應用模式。綜上所述,MPSoC與VCU架構在4K UHD音視頻廣播領域提供了高性能、低功耗、實時壓縮解壓縮、多視頻流處理、靈活性、硬件加速、廣泛格式支持、多媒體框架集成、優化的功耗管理和高速互聯外設等多重優勢,使其成為該領域理想的解決方案。 4. 系統架構概述 在本設計中,我們使用Zynq UltraScale+ MPSoC平臺(具體型號為MYIR XCZU4EV),通過FPGA實現對SDI視頻的H265壓縮,并通過SGMII接口推送到萬兆以太網上。系統架構主要包括以下幾個部分: 1.視頻輸入:輸入源可以是SDI攝像機、SDI信號發生器或通過HDMI轉SDI設備從電腦接入的HDMI信號。視頻信號通過TI公司的LMH1219芯片做均衡處理,并將單端信號轉換為差分信號后輸入FPGA。2.SDI視頻解碼:FPGA中的UHD-SDI GT IP核用于SDI視頻的解串,并將視頻信號轉換為AXI4-Stream格式供后續處理。通過SMPTE UHD-SDI RX SUBSYSTEM IP核,SDI視頻被解碼為RGB格式。3.視頻幀緩存與處理:解碼后的視頻信號存儲在PS側的DDR4中,通過Xilinx提供的Video Frame Buffer Write IP核實現。在這一階段,可以對視頻幀進行顏色轉換、縮放等處理。4.H.265視頻壓縮:使用Zynq UltraScale+ VCU IP核對存儲的RGB視頻幀進行H.265編碼壓縮。VCU支持YUV420格式的視頻,編碼分辨率最高可達到4K@60fps。5.SGMII萬兆以太網傳輸:經過H.265壓縮后的視頻流通過SGMII接口推送至萬兆以太網。通過PetaLinux系統,利用TCP/UDP協議將壓縮后的碼流傳輸到PC或服務器端,用戶可以通過VLC播放器等軟件實時播放接收到的H.265碼流。 5. 工程設計主要流程 1.SDI輸入:通過LMH1219進行信號均衡,SDI信號轉換為AXI4-Stream格式。通過HDMI轉SDI盒子,通過12G UHD-SDI輸出4K 60FPS視頻給FPGA,用戶也可以使用SDI 工業相機;2.視頻解碼:UHD-SDI GT IP核完成視頻解串,SMPTE UHD-SDI RX SUBSYSTEM IP核將視頻解碼為RGB信號。 3.視頻緩存:使用Video Frame Buffer Write IP核將視頻寫入DDR4。 用戶可以選擇在這里做出customer ISP,例如圖像縮放,拼接 4.視頻壓縮:通過Zynq UltraScale+ VCU IP核對視頻進行H265壓縮。 5.網絡傳輸:通過SGMII萬兆以太網接口,將壓縮后的H265視頻流通過UDP協議推送至PC端,使用VLC播放器播放。 6. 結論 在視頻內容不斷向4K發展的大背景下, 通過Zynq UltraScale+ MPSoC平臺,基于VCU實現的SGMII萬兆以太網視頻壓縮推流方案,不僅能夠高效地壓縮和傳輸4K視頻,還可以確保較低的延遲和高質量的圖像輸出。該方案適用于視頻監控、醫療影像、工業自動化等對高分辨率視頻有需求的應用場景。 對于希望在網絡視頻平臺上獲得更好觀看體驗的用戶來說,視頻平臺和服務提供商則需要在視頻編碼、網絡傳輸等方面進行優化,以滿足用戶對于4K視頻的畫質需求。 7. 互動環節在SGMII網兆以太網推流到PC端,因為是萬兆網,CPU無法負擔這里的高速吞吐率,這里我們需要用到網絡卸載,米爾電子的MYC-J7A100T雙芯設計核心板可通過SFP采集SGMII萬兆以太網數據后,PC通過PCIE讀取視頻源,實現萬兆網口數據包卸載,我們會在后續系列文章中做出分享基于米爾MYC-J7A100T SFP采集后PCIE XDMA中斷讀取。 |