国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

HPI接口的視頻數據傳輸系統設計

發布時間:2010-3-4 10:17    發布者:李寬
視頻監控、遠程視頻播放等系統中,通常需要將視頻圖形數據通過網絡傳輸到遠程處理機上。作為數字信號處理專用處理器,DSP雖然在視頻壓縮等方面有很大的優勢,但對諸如任務管理,網絡通信等功能的實現較困難。運行于通用嵌入式處理器的Linux操作系統,開源,可以根據需要修改內核,支持各種網絡協議,并且其任務調度機制性能卓越。綜合二者的優點,嵌入式視頻平臺可以由DSP完成圖形處理功能,并通過高速接口把視頻數據傳輸給嵌入式微處理器,然后由嵌入式Linux系統完成網絡傳輸功能。

目前DSP與微處理器之間的高速通信方式有以下幾種:共享內存,此種技術對軟硬件的設計要求都非常高,同樣效率也最高;通用高速總線接口,如 PCI、 USB等,這種類型的通信方式采用復雜的鏈路協議,軟件設計困難;專用接口,如TI公司DSP提供的HPI(Host Port Inter-face)。本文研究了TMS320E)M642的HPI接口,并提出一種在TMS320DM642和AT91RM9200間高速通信的軟硬件實現方案。通過HPI接口,TMS320DM642可以高速地將實時視頻數據傳輸給AT91RM9200;在AT91RM9200上,Lnux驅動實現存儲器映射I/O和物理內存重映射,避免了視頻數據在應用程序與內核之間的二次拷貝,提高了應用程序的網絡發包效率。

1 HPI接口硬件設計

HPI是一種并行接口,支持32位(HPl32)和16位(HPll6)數據總線,通過HPI的數據寄存器(HPIDA、 HlPIDF),ARM可以間接存取DSP的存儲空間。在DSP內部,數據從存儲單元到HPI數據寄存器的傳輸,是由EDMA(增強DMA)控制器完成的。

HPI控制器的外圍引腳包括HD[0-31]、數據總線。HCNTL[O-1]是寄存器訪問控制線,HPI控制器有4個寄存器,通過這兩根控制線,DSP 可以確定ARM要訪問的寄存器。其中,HPIA地址寄存器,存放當前訪問單元的地址;HPIC為控制寄存器,實現各種控制命令;HPIDA自增長數據寄存器,每訪問一次該寄存器HPIA的內容加4;HPIDF固定地址數據寄存器,與HPIDA不同之處在于,訪問該寄存器后HPIA的內容不變。HHWIL,高低位訪問控制線,它只用于HPll6模式中,該控制引腳決定寄存器的高或低16位被主機訪問。HR/nW,HPI控制器4個寄存器的讀寫控制線。 HDSl、HDS2和HCS,其中HDSl、HDS2可連接ARM的讀、寫控制線,HCS連接ARM的nCS7片選線,三者在DSP內部組合形成一個 HSTROBE信號,當HCS低有效并且HDSl或HDS2的讀或寫低有效,決定數據寄存器(HPIDA、HPIDF)的讀或寫操作。HAS,地址鎖存線,當主機的地址線與數據線復用時,主機可用該控制線通知。DSP鎖存地址;其他不用該控制線情況時,應接高電平。nHRDY,DSP輸出線,表示HPI 總線是否可訪問。nHINT,中斷輸出線,用于中斷ARM。



DSP與ARM接口電路如圖1所示。采用HPI16模式,16根數據線通過1*5數據隔離器接到ARM數據總線的低16位,將HPI的片選空間置于 ARM的nCS7片選線上,HR/nW讀寫信號經反向器接到ARM的AB4地址線,HCNTL[O-1]與ARM的地址線AB[2-3]相連,則HPI的 4個寄存器的讀基地址為0x80000000,寫基地址為0x80000010。在ARM端從這兩個地址開始訪問,相應地對HPI 4個寄存器訪問。

ARM通過HPI讀寫DSP數據空間,須按以下三步順序執行:首先,對HPIC寄存器初始化,主要針對HPI16模式最低位HWOB位設置,決定數據傳輸格式是按高半字在前(設置為0),還是低半字在前(設置為1),該位對于HPI32模式無效,可不設置;然后,對HPIA寄存器初始化,設置訪問單元的地址;最后通過讀寫數據寄存器(HPIDA、HPIDF)實現數據讀寫操作,其中讀寫HPIDA寄存器是完成連續地址單元讀寫操作,讀寫 HPIDF寄存器是完成固定地址單元讀寫操作。注意,在ARM讀寫的過程中,如果DSP的nHRDY控制線一直為高,表示HPI數據總線未準備好,ARM 的讀寫操作必須等待;當nHRDY為低后,ARM才繼續向下執行指令。

2 Linux驅動設計

Linux雖然是一種整體式操作系統,但允許在運行時動態加載或刪除功能模塊。這個特點方便了驅動功能模塊的開發。Linux系統支持兩種模塊調用方式:一種是靜態編譯,直接編譯進內核,在系統啟動時就運行;另外一種是動態加載,在內核運行時,用insmod/rmmod實現模塊的加載和刪除功能。在嵌入式系統開發中,一般采用動態加載方式,避免了系統頻繁重啟。當最終發布產品時,可以把模塊直接編譯進內核。這種處理方式比較簡單,且效率高。

Linux系統中,內存地址主要涉及以下幾個概念:物理地址、內核虛擬地址(包括內核邏輯地址)和進程虛擬地址。在內核層,當內核要訪問某內存空間時,用的是內核虛擬地址,再由MMU(存儲器管理單元)將內核虛擬地址轉換為物理地址。采用虛擬內存技術,每個進程都有互不干涉的虛擬空間。三者直接映射的關系如圖2所示,其中內核函數zap_page_range完成去掉物理地址與進程虛擬地址映射關系的功能。



2.1 驅動結構

在Linux中,設備也是作為文件來訪問的。VFS(虛擬文件系統)為各種不同的文件系統提供了統一的訪問接口,通過這些接口,應用程序可以直接使用open、read和IOctl等系統調用對設備進行訪問和控制。

本例中,把HPI作為一個外圍設備,其驅動主要實現對設備的打開、關閉、內存映射、視頻數據緩沖區管理和物理內存切換等功能。根據原理圖,可以確定HPI 四個寄存器對應的物理地址,在驅動初始化過程中,調用ioremap_uncache函數把物理地址映射為內核虛擬地址,在驅動層通過內核虛擬地址訪問 HPI的4個寄存器。

存儲器映射I/O把HPI驅動分配的數據空間直接映射到應用程序的虛擬地址空間,應用程序直接訪問該空間,避免了用read/write系統調用導致的視頻數據二次拷貝。在內核里,由驅動分配一定的緩存,當應用程序不能及時處理DSP發送過來的視頻數據,可以緩存這些數據;當應用程序處理完一幀圖像時,采用Linux的物理內存切換技術,把下一幀數據所在的物理地址重映射到應用程序的同一虛擬地址,這樣,應用程序不用頻繁調用mmap函數映射內存。

2.2 存儲器映射I/O

一般情況下,當應用程序用read/write讀寫設備數據時,該設備的驅動先將設備數據從設備上采樣到內核緩沖區,再從內核緩沖區拷貝到應用程序緩沖區,數據經過了兩次拷貝。當數據量比較小時,如一些控制命令或狀態信息,對系統性能幾乎沒有影響。但是,如果一次傳輸的數據量比較大,比如視頻顯卡上的實時視頻圖像,兩次拷貝將大大影響系統的數據處理效率。這時,可采用存儲器映射I/O技術,在內核層存儲器映射I/O由函數 remap_page_range完成。

由remap_page_range函數的原型可以知道,該函數的意義在于通過將特定物理地址映射到進程虛擬地址,進程可以訪問特定的物理地址,而這在普通情況下是不可能的。在本例中,當進程調用mmap函數進行存儲映射時,內核會調用驅動注冊的hpi_mmap函數,傳入的參數之一包括進程虛擬地址。在 hpi_mmap函數里,調用remap_page_range完成從緩沖區物理地址到進程虛擬地址的映射。hpi_mmap函數實現如下:



其中vm_flags字段設置了VM_RESERVED,表示該數據緩沖區一直常駐內存,在內存不足時,不會被交換出去。內核和進程同時對數據緩沖區讀寫,為了保證數據的一致性,對該區域的訪問不應該經過CPU內部的緩沖區,所以用pgprot_noncached設置非緩沖標志。

mmap系統調用返回一個進程虛擬地址,該地址就是vma->vm_start字段,進程對該虛擬地址的訪問,最終變為對物理地址 CACHE_PHY的訪問。

2.3 數據緩沖管理

緩沖管理的主要任務是,當ARM接收到新的一幀時,為其分配相應的緩存,并將在物理地址重映射到進程虛擬地址。當應用程序處理該幀時,緩沖管理負責內存區域的回收。

當Linux內核啟動時,可以傳人參數mem=PHY_LEN,指定存儲空間的大小。在本例中,內核啟動時為HPI驅動預留8 MB的高端物理內存。在本例中,借助Linux中對普通外設I/O內存(PCI卡內存等)管理的思想,用高度為2的樹表示一塊連續的區域。該數據結構的優點在于,資源分配簡單,把離散的小內存合并為一塊連續的大緩沖區的算法復雜度為O(1)。具體實現請參閱內核源碼中resource結構相關部分。

重映射新一幀視頻數據到進程虛擬地址是緩沖管理的另一任務。因為前一幀數據物理地址已經映射到進程虛擬地址,需要先將前幀物理地址與進程虛擬地址的映射關系去掉,然后重映射當前幀數據到進程虛擬地址。去掉物理地址與進程虛擬地址的映射關系由內核函數zap_page_range完成,調用該函數后,如果進程再訪問該虛擬地址,內核會產生缺頁中斷。這時再用remap_page_range建立當前幀數據物理地址與進程虛擬地址間的映射關系,進程就可以通過同一虛擬地址訪問當前幀的數據了。該方法的意義在于,進程不用頻繁調用mmap建立物理地址與虛擬地址的映射,只用調用一次,當有新數據到達時,驅動自動將新幀數據映射到先前的進程虛擬地址,提高了進程處理視頻數據的效率。實現代碼如下:



結語

在當前視頻處理平臺上,視頻處理、視頻傳輸、復雜任務管理等工作一般都是由一塊DSP處理器單獨完成,結合其他嵌入式微處理器協同工作的技術方案剛剛起步。經測試,在基于本文提出的高速通信方法設計的視頻處理平臺上,TMS320DM642與AT9LRM9200間的通信速率可以達到50 Mbps,帶寬足夠用來傳輸MPEG等壓縮視頻數據。如果用HPl32模式,速度還會大幅度提高。同時,因為Linux系統的實時性不是很強,如果采用其他實時性強的操作系統,如Vxworks等,系統性能還會有大的提高。

參考文獻

   1. Corbet Jonathan.Kroah-Hartman Greg.Rubini Alessandro Linux Device Drivers 2005
   2. P Daniel.Bovet Cesati Marco Understanding the Linux Kernel 2005
   3. Texas Instruments.TMS320C6000 DSP Host Port Interface Reference Guide 2006
   4. Texas Instruments.TMS320TMS320DM642 Video/Imaging Fixed-Point Digital Signal Processor 2007
   5. Atmel AT91RM9200 Datasheet.Rev 1768E-ATARM 30-Sep-05

作者:四川大學 張行  應三叢 來源:單片機與嵌入式系統應用 2009(5)
本文地址:http://m.qingdxww.cn/thread-8826-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • 使用SAM-IoT Wx v2開發板演示AWS IoT Core應用程序
  • 使用Harmony3加速TCP/IP應用的開發培訓教程
  • 集成高級模擬外設的PIC18F-Q71家族介紹培訓教程
  • 探索PIC16F13145 MCU系列——快速概覽
  • 貿澤電子(Mouser)專區

相關在線工具

相關視頻

關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 芭乐草莓樱桃丝瓜18岁大全| 日本美女论坛| 色综合伊人色综合网站| 在线视频 国产精品 中文字幕| 中文字幕在线观看亚洲视频| 愉拍自拍| 午夜叉| 婷婷在线成人免费观看搜索| 最新午夜韩国理论片77网| 黄色片网站下载| 无码骚夜夜精品| 夜晚美女高清视频在线观看| 欧美视频精品在线观看| 四虎永久免费地址在线观看| 亚洲成人一区在线| 国产精品久久久久久日本| 日本无码免费久久久精品| 亚洲视频在线网站| 日本在线观看一级高清片| 夜夜网站| 亚洲一区在线视频观看| 国产 在线 亚洲 欧美 动漫| 侮辱丰满美丽的人妻| 亚洲欧美日韩中文字幕网址| 天天天天色| 污污免费| 国产欧美精品一区二区色综合 | 日韩高清专区| 中文字幕激情视频| 一区二区三区在线观看视频| 浪潮AV色综合久久天堂| 一级大毛片| 四虎国内精品一区二区| 香蕉黄瓜草莓芭乐绿巨人| YY600800新视觉理论私人| 小玲被公扒开腿| 亚洲国产天堂久久综合网站| 伊人黄| 一个人看的视频www在线观看免费| 国产成人无码AV麻豆| 视频一区国产在线第一页|