目前,Linux作為僅次于微軟Windows的操作系統已經在PC和嵌入式領域得到了廣泛的應用,尤其是在嵌入式開發領域,由于Linux操作系統具有成本低,可靠性高,源碼方法等顯著的優點,已經成為受眾多嵌入式開發者青睞的操作系統之一。目前,Linux操作系統所支持的包括X86、ARM、MIPS、MIPS64、Sun SPARC、POWER PC、Motorola 68K、IBM S/390、Alpha、IA64、cris、parisc、sh等主要的體系結構。本文以實際項目中一個MIPS32架構的CPU和板級系統為例,闡述了如何將Linux操作系統移植到目標平臺上。 1 目標平臺概述 本文所討論的開發平臺采用的CPU是同濟大學微電子中心自主開發的BC320處理器,采用MIPS 4KC的體系結構,帶MMU、無浮點協處理器、標準5段流水線,指令及數據Cache的大小各為4KB,尋址空間為4GB,其中0x00000000-0x7fffffff為用戶空間,0x80000000-0xffffffff為核心空間,板級系統采用了PMC的PM8172芯片組,支持最高128MB的SDRAM,BOOT ROM的地址空間是0x1fc00000-0x1fffffff。 2 Linux交叉編譯環境的建立及內核配置和編譯 在進行實際的Linux操作系統移植之前,需要在宿主機上建立圖1所示的MIPS的交叉編譯環境,以便能在普通PC機上通過交叉編譯工具來調試運行在目標開發板上的程序。 建立MIPS交叉編譯環境的主要工具有binutils、GCC、glibc以及作為調試器的gdb等,其中binutils為二進制文件的處理工具,它主要包括一些輔助開發工具,例如:readelf可顯示elf文件信息及段信息;nm可列出程序的符號表;strip將不必要的代碼去掉以減小可執行文件,objdump可用來顯示返匯編代碼等,GCC是GNU提供的支持多種輸入高級語言與多種輸出機器碼的編譯器,是Linux操作系統的配套編譯器,支持Linux所采用的擴展C語言。glibc是連接和運行庫,由于此鏈接和運行庫須運行在目標開發板上,所以必須用先前建立的交叉編譯器對其進行編譯,如圖內核大小要求較為苛刻。還可以使用uclibc等其他鏈接和運行庫作為glibc的替代品,此外,若不是從硬盤啟動,則還須為Linux制作ramdisk。在ramdisk上,除了要安放/dev(放置Linux操作系統所需要的設備文件)、/etc(放置Linux系統配置文件)、/lib(放置交叉編譯后生成的庫文件)等目錄及其下的文件外,還需要在/bin和/sbin下放置各種系統必需的命令程序,如shell、init、vi等,為此需要busybox或者tinylogin等專為Linux操作系統提供的標準工具程序。凡此種種,都可以在GNU旗下的網站下載并自由修改其源代碼。 由于Linux操作系統的內核源代碼支持各種不同的體系結構和不同的應用需要,所以在使用交叉譯碼器編譯前還需要進行內核的配置工作,包括選擇處理器的體系結構、文件系統的種類、板級支持,對設備驅動的支持以及是否使用ramdisk等。配置工具包括make config、make menuconfig、make xconfig,推薦使用操作界面更為良好的make menuconfig及make xconfig。在內核配置工作完成后即可進行內核編譯工作,Linux源代碼提供的強大的makefile功能,使得復雜的編譯過程操作起來并不困難。 關于Linux交叉編譯環境的建立及內核配置和編譯的詳細流程,在《Building Embedded Linux Systems》(Karim Yaghmour著)內有詳細的論述,本文為此不再贅述。 3 Linux移植中實際指令集小于標準MIPS指令集的問題 隨著軟件可移植問題在整個軟件方法學中重要性的日益增長,各種大型軟件無不把提高自身的跨平臺性作為軟件設計的主要目標之一。為此,Linux提供了對應用領域內各大主流體系結構的支持,僅以MIPS體系結構為例,Linux操作系統2.4.26版本的內核就支持幾乎所有32位和64位不同版本的MIPS架構,為操作系統的移植工作提供了巨大的便利。然而,處于種種原因(諸如專利保護或特殊應用),有相當一部分采用MIPS體系結構的芯片產品只提供了標準的MIPS指令集的一個子集。一旦內核代碼在編譯完成后生成了不屬于實際指令集的指令,CPU將發生保留指令例外,可以說,當體系結構間的差異不再成為最主要的移植工作時,如何邏輯等效地消除實際指令集和標準指令集間的差異成了Linux移植工作中最重要的一環,由于MIPS的專利保護,相當多MIPS兼容芯片的開發者并未對指令集的4條非對齊存取指令(lwl、lwr、swl、swr)加以實現,如Realtek RTL8181"Wireless LAN Access Point/Gateway Controller"等,下文將以同濟大學自主開發的BC320芯片為例,從修改內核源代碼、修改編譯器及匯編器這兩個方面出發,討論如何解決4條非對齊存取指令未被實現的問題,由于編譯器及匯編器的修改涉及編譯原理方面的知識,不在本文范圍之內,所以將把重點放在討論修改內核源代碼的方法上,對GCC和GAS修改的基本知識僅作一般介紹。 3.1 修改內核源代碼中的保留指令例外處理程序 當CPU執行到未被實現的機器碼時,將會發生reserved instruction exception,然后根據例外的種類跳轉到相應的例外處理程序入口處。借助于編寫對應的例外處理程序,可以為被實際指令集實現但又屬于標準指令集的指令(Iwl、lwr、swl、swr為例)提供邏輯等效的替換方法。在Linux內核源(以2.4.26版本為例)代碼的目錄樹下進入.\arch\mips\kernal目錄,打開traps.c文件,并添加simulate_lxRI函數,代碼如下:
其中:_OP_為宏操作,可取出32位機器碼中的操作碼以判斷操作類型;0x22對應于lwl指令、0x26對應于lwr指令,0x2A對應于swl指令,而0x2E則對應于swr指令。程序將根據不同的操作碼進入不同的替代程序。va和byte變量則計算出4條非對齊指令的偏移量。 完成代碼后將此函數添加到同一文件的do_ri函數中去,此函數即負責處理Linux操作系統的保留指令例外,添加的代碼為: if(simulate_lxRI(regs,opcode)){ compute_return_epc(regs); return; } 即當simulate_lxRI正確處理完非對齊存取指令并返回1后,系統將通過compute_return_epc函數把epc寄存器的值放回pc寄存器并返回;否則,繼續處理do_ri中其他的例外處理程序。 這一方法工作量小,容易保證修改后的等效性,大多數熟悉C語言的程序員來說都是易于掌握的。在軟硬件協同開發的系統設計前期具有很大的實際使用價值。系統設計師可快速建立原型機跑通操作系統,以驗證軟硬件的正確性。但由于其采用的是例外處理的方式,若頻繁發生例外則將影響系統性能,所以對memcpy(此函數代碼在Linux源代碼的rach\mips\lib目錄下的memcpy.s文件中)這樣使用頻繁的匯編程序應手工修改其代碼。再加上編譯器一般不會生成4條非對齊指令(僅當C程序中的結構體有非字對齊等少數情況下會出現),所以此修改方法可保證大致接近原性能。 3.2 修改GCC編譯器或GAS匯編器 盡管利用exception handler來解決保留指令例外問題方便、快捷、但其效率終究是低于直接修改GCC編譯器或GAS匯編器的,此外,修改exception handler的方法在smp的情況下有可能帶來沖突,所以,直接修改GCC或GAS的方法是有其實用價值的。 GCC的前端可以支持多種語音,后端可以支持多種體系結構,這一特性是由作為中間語言的RTL(寄存器傳輸語言)實現的,其大致結構如圖2所示。 其中負責指令生成的部分在后端,涉及的源代碼文件包括inst-cmit.c、inst-flags.h、inst-config.h、inst-code.h、inst-extrax.h、inst-opinit.c、inst-output.c等。此外,作為機器描述的machine.h、machine.md、machine.h文件也必須加以考慮,相當一部分以inst開頭的文件是由GCC提供的一組gen*工具根據這3個機器描述文件自動生成的。 修改GAS相對簡單,只須修改GAS源代碼中的tcmips.c文件,但效率相對低于修改GCC源代碼。 直接修改GCC編譯器的效率且一勞永逸,但由于編譯器的實現原理和操作系統大相徑庭,所以此方法難度較大,可能會拖延移植工作進度,而編譯器修改其本身的測試工作由于要和Linux操作系統的移植工作混合在一起進行,對軟件Debug來說也是相當復雜的,所以,在系統開發早期推薦使用修改保留指令例外處理程序的方法,當軟硬件都能保證相當的正確性時再使用修改GCC編譯器的方法。 結語 本文根據一個特定的開發平臺,介紹了如何將Linux操作系統移植到MIPS體系結構系統上的大致流程和主要技術,就移植過程中所遇到的問題,以4條非對齊指令為例,具體討論了如何解決實際實現的指令集未能完全覆蓋標準指令集而產生保留指令例外的問題,文中詳細介紹了修改保留指令例外處理程序的方法,簡述了修改GCC或GAS的方法,掌握這些移植流程和修改技術,對于開發嵌入式系統相當的實用價值,對于由其他體系結構實現的開發平臺也具有相當的參考意義。 |