引言 Intel公司推出的XScale采用ARM V5TE結構,是Strong ARM的升級換代產品。XScale PXA270處理器最高主頻可達到624M赫茲,加入了Wireless MMX、Intel SpeedStep等新技術,以其高性能、低功耗、多功能等特點在信息家電、工業控制等領域得到了廣泛的應用。在嵌入式控制中,“微處理器+FPGA”是一種常用的解決方案,FPGA(現場可編程門陣列)有編程方便、集成度高、速度快等特點,電子設計人員可以通過硬件編程的方法來實現FPGA芯片各種功能的開發,在我們的一個數控平臺的研究項目中,采用XScale PXA270作為主CPU,并對其進行FPGA擴展,使其具有插補、電機驅動、信號處理、I/O口擴展的功能。Linux以其內核精煉、高效、源代碼開放且免費等優勢,嵌入式領域得到了廣泛的應用。下面以Intel XScale PXA270上的Altera FLEX/ACEX的應用為例,詳細介紹Linux下的FPGA設備驅動的實現。 1 Altera FLEX/ACEX芯片結構 Altera FLEX/ACEX芯片是基于查找表LUT(Look-Up-Table)原理而實現的,LUT本質上就是一個RAM。目前FPGA中多使用4輸入的LUT,所以每個LUT可以看成一個有4位地址線的16×1的RAM。當用戶通過原理圖或HDL語言描述一個邏輯電路以后,FPGA開發軟件會自動計算邏輯電路的所有可能的結果,并把結果事先寫入RAM,這樣,每輸入一個信號進行邏輯運算都等于輸入一個地址進行查表,找出地址對應的內容,然后輸出即可。 由于LUT主要適合SRAM工藝生產,所以目前大部分FPGA都是基于SRAM工藝的,而SRAM工藝的芯片在掉電后信息就會丟失,一定要外加1片專用配置芯片(本實驗電路使用Altera EPC2LC20),在上電時,由這個專用配置芯片把數據加載到FPGA中然后FPGA即可正常工作。由于配置時間很短,因此不會影響系統正常工作,在使用ACEX1K50之前,應對其進行設計編程,實現相應寄存器及I/O口的功能。有關FPGA的詳細內容請參閱相關資料。 2 Intel XScale PXA270處理器的系統存儲器接口 PXA270處理器的可編程靜態存儲體系結構如圖1所示。 在系統上,ACEX1K50位于nCS<2>上,物理地址0x8000000-0x8001000共4K的靜態地址空間,圖2表示了Intel XScale PXA270與ACEX1K50的硬件連接關系。 3 Linux下ACEX1K50設備驅動的實現 3.1 Linux下設備驅動基本原理 設備驅動程序是應用程序與硬件之間的一個中間軟件層,設備驅動程序為應用程序屏蔽了硬件的細節。這樣在應用程序看來,硬件設備只是一個設備文件,應用程序可以像操作普通文件一樣對應用設備進行操作,設備驅動程序是內核的一部分,它主要實現的功能有:對設備進行初始化和釋放;把數據從內核傳送到硬件和從硬件讀取數據;讀取應用程序傳送給設備文件的數據,回送應用程序請求的數據以及檢測和處理設備出現的錯誤。 Linux將設備分為最基本的兩大類:一類是字符設備;另一類是塊設備,字符設備和塊設備的主要區別在于是否使用了緩沖技術,字符設備以單個字節為單位進行順序讀/寫操作,通常不使用緩沖技術,塊設備為了提高效率,利用一塊系統內存作為讀/寫操作的緩沖區,由于涉及緩沖區管理、調度和同步等問題,實現起來比字符設備復雜得多。 Linux通過設備文件系統對設備進行管理,各種設備都以文件的形式存放在/dev目錄下,稱為“設備文件”。應用程序可以像普通文件一樣打開、關閉和讀/寫這些設備文件,為了管理這些設備,系統為設備編了號,每個設備號又分為主設備號和次設備號,主設備號用來區分不同種類的設備,而次設備號用來區分同一類型的多個設備,Linux為所有的設備文件都提供了統一的操作函數接口,方法是使用數據結構struct FILE_operations,這個數據結構中包括許多操作函數的指針,如open()、close()、read()和write()等,但由于外設的種類較多,操作方式各不相同,struct file_operations結構體中的成員為一系列的接口函數,如用于讀/寫的read/write函數和用于控制的ioct1等。打開一個文件就是調用這個文件file_operations中的open操作,不同類型的文件(如普通的磁盤數據文件)有不同的file_operations成員函數,接口函數完成磁盤數據塊讀/寫操作,而對于各種設備文件,則最終調用各自驅動程序中的I/O函數進行具體設備的操作,這樣,應用程序根本不必考慮操作的是設備還是普通文件,可一律當做文件處理,具有非常清晰 、統一的I/O接口,所以file_operations是文件層次的I/O接口。 3.2 ACEX1K50在Linux下設備驅動的實現 驅動程序中使用內存映射可以提供給用戶程序直接訪問設備內存的能力。使用內存映射得好處是處理大文件時速度明顯快于標準文件I/O,無論讀/寫,都少了一次用戶空間與內核空間之間的復制,在用戶空間對ACEX1K50 FPGA設備的訪問是通過內存映射來實現的。 ACEX1K50可以看作是硬件連接在PXA270微處理器的nCS<2>上的一段物理地址來尋址。因為有虛擬內存管理單元,所以如果Linux下,必須先把物理地址映射到虛擬地址空間,然后才能對該段地址進行讀/寫。 在內核驅動程序的初始化階段,通過ioremap()將ACEX1K50的這段物理地址映射到內核虛擬空間;在驅動程序的mmap系統調用中,使用remap_page_range()將該塊COM映射到用戶虛擬空間,這樣內核空間和用戶空間都能訪問ACEX1K50的這段被映射后的虛擬地址。 由于ACEX1K50位于nCS<2>上,參照PXA270靜態存儲體系結構映射表,其物理起始地址為0x08000000。另外,其設備名稱及主次設備號定義如下: ioremap()的作為是把一個物理內存地址點映射為一個內核指針,被映射數據的長度由size參數設定,該函數的實質上把一塊物理區域二次映射到一個可以從驅動程序里訪問的虛擬地址上去,以下是該函數的定義: void*ioremap(unsigned long phys_addr,unsigned long size); 設備驅動通過fpga_init()函數初始化FPGA設備,最終通過init_module(fpga_init)在內核啟動時初始化FPGA設備。 fpga_init()函數的流程如圖3所示。 ioremap()調用的語句如下: pxa270_fpga_base=(unsigned long)ioremap(FPGA_PHY_START,SZ_4K); 可以通過ioremap()調用的返回值pxa270_fpga_base來判斷FPGA物理地址到內核虛擬空間是否映射成功。 if(!pxa270_FPGA_base){ printk(“ioremap pxa270 fpga failed\n”); return-EINVAL; } 向設備文件系統注銷FPGA設備通過調用cheanup_module()函數來實現。其代碼如下: 在向內核設備文件系統注冊該FPGA驅動后,還須實現設備驅動的file_operations結構,ACEX1K50的設備驅動定義了如下file_operations成員函數: 其中fpga_open和fpga_release系統調用的功能只簡單地實現了FPGA設備使用計數器的遞增與遞減,fpga_ioctl系統調用也只是簡單的打印一條沒有ioctl控制的信息提示。這里不再分析實現的具體代碼。下面具體分析fpga_mmap的實現過程: fpga_mmap(struct file*filp,struct vm_area_struct*vma)系統調用允許直接將FPGA設備內存線性地映射到用戶進程的地址空間中,fpga_mmap系統調用是通過調用remap_page_range()函數來實現一段線性物理地址的映射,調用remap_page_range()函數需要填寫vm_area_struct結構的幾個關鍵字段。 4 ACEX1K50設備驅動在用戶程序中的使用 當設備驅動實現后就可以在用戶空間使用該設備了。在用戶空間主要是通過調用mmap()函數來實現對FPGA設備的訪問。以下是用戶空間應用程序的一個示例: 結語 本文通過介紹ACEX1K50在Linux操作系統下設備驅動的實現過程,為FPGA在嵌入式領域的應用提供了一種方法。在實際應用中,通過用戶程序能夠很好地實現對FPGA硬件編程后的各種功能的控制。 |