1. Vxworks下的高速緩沖存儲器一致性問題 美國風(fēng)河(Wind River)公司的VxWorks是目前最先進的實時嵌入式操作系統(tǒng)。Tornade是它的集成一體開發(fā)環(huán)境。然而,VxWorks下編程硬件驅(qū)動程序時卻存在著高速緩沖存儲器一致性(Cache Coherence)的問題。該系統(tǒng)下有兩個cache區(qū):數(shù)據(jù)高速緩沖存儲器和指令高速緩沖存儲器。本文討論的高速緩沖存儲器問題均指數(shù)據(jù)高速緩沖存儲器。 高速緩沖存儲器一致性問題是指高速緩沖存儲器中的數(shù)據(jù)必須與內(nèi)存中的數(shù)據(jù)保持同步(一致)。這個問題常發(fā)生在CPU內(nèi)核與另一個設(shè)備異步訪問內(nèi)存時。 高速緩沖存儲器可以工作在Write-through或copyback模式。在Write-through模式下,數(shù)據(jù)輸出時,系統(tǒng)會把數(shù)據(jù)同時寫入高速緩沖存儲器和內(nèi)存中。這樣就保證了輸出時的高速緩沖存儲器一致性。但該模式卻無法解決輸入時的高速緩沖存儲器一致性問題.在Copyback模式下。系統(tǒng)只寫數(shù)據(jù)到高速緩沖存儲器中,因此對于數(shù)據(jù)輸入和輸出都存在高速緩沖存儲器一致性問題。 VxWorks下通常有兩種方法解決高速緩沖存儲器一致性問題。 (1)Cache-safe buffer(即non-cacheable 的buffer)。這種情況下,CPU讀數(shù)據(jù)時會從內(nèi)存中讀取.而不是從高速緩沖存儲器中讀。憾鳦PU寫數(shù)據(jù)時則同時寫入高速緩沖存儲器和內(nèi)存. 該方案可通過以下兩種方法實現(xiàn). * 在內(nèi)存段屬性中定義此段buffer,空間屬性為non-cacheable; * 在內(nèi)存管理單元MMU支持下,用cacheDmaMalloc()/cacheDmaFree()獲得此段buffer。則此段buffer是non-cacheable的(注意無MMU時。分配的buffer是cacheable。此法不支持這種情況)。 (2)對于cacheable的buffer空間,采用flush()/invalidate()函數(shù)或宏來配合讀/寫使用此段buffer空間。flush()將高速緩沖存儲器中的數(shù)據(jù)寫入內(nèi)存。invalidate()則將內(nèi)存中數(shù)據(jù)寫入高速緩沖存儲器。這兩個函數(shù)都保證了高速緩沖存儲器與內(nèi)存同步。 實際flush()/invalidate()函數(shù)有如下兩組,功能相同稍有區(qū)別: 組1:CACHE_DMA_FLUSH()函數(shù)和CACHE_DMA_INVALIDATE()函數(shù) 組2:cacheFlush()函數(shù)和cacheInvalidate()函數(shù) 第一組實際是2個宏,與cacheDmaMalloc()函數(shù)配合使用。 2. MPC860上高速緩沖存儲器一致性的軟件設(shè)計方法 MPC860是摩托羅拉公司的32位多用途集成通信控制器。主要包括一個32位的嵌入式PowerPC core。一個通信處理模塊CPM,一個系統(tǒng)集成模塊SIM60及一個獨立的快速以太網(wǎng)FEC模塊。在VxWorks下編寫MPC860的驅(qū)動程序。要保護的是CPM、FEC模塊的發(fā)送/接收緩沖區(qū)描述符TXBD/RXBD及其對應(yīng)的緩沖區(qū)對于MPC860開發(fā)中象BD(Buffer DescriptiOn)這樣的靜態(tài)空間適合采用cache-safe boffer方法。即采用第1種方法: 而對BD域中對應(yīng)的緩沖區(qū),由于該緩沖區(qū)多是動態(tài)分配和釋放,更適合采用第2種方法,即采用flush()/invalidate()函數(shù)或宏來配合讀/寫使用此段緩沖區(qū)空間。這樣可以避免將整個的包括還未分配的空間都預(yù)先標(biāo)記為non-cacheable而造成效率低下。具體可以采用下面的方法: (1)TXBD/RXBD放在MPC860雙口RAM中。并在板級支持包BSP文件Syslib.c中的頁描述符數(shù)據(jù)結(jié)構(gòu) svsPhysMemDesc[]中定義860上所有64K內(nèi)存空間為non-cachable的緩沖區(qū)。從而不必做cache coherence的保護了。 (2)對應(yīng)TXBD/RXBD中數(shù)據(jù)指針域的發(fā)/收緩沖區(qū)均用cache DmaMalloc()獲得(具體是指初始化時給所有接收RXBD掛接的初始緩沖區(qū)和接收幀函數(shù)中給RXBD掛接的新緩沖區(qū).以及在應(yīng)用層中使用的發(fā)送TXBD對應(yīng)的緩沖區(qū))。而用cacheDmaFree()釋放。同時發(fā)送幀函數(shù)中用cacheFlush()函數(shù)保護待發(fā)送TXBD對應(yīng)的緩沖區(qū):接收幀函數(shù)中用cache Invalidate()函數(shù)保護已經(jīng)裝載了接收數(shù)據(jù)的接收緩沖區(qū)。以快速以太網(wǎng)FEC的驅(qū)動程序為例,保護具體實現(xiàn)如下: /* FEC發(fā)送幀函數(shù) */ FEC_SEND_FRAME() { /* 填寫發(fā)送buffer內(nèi)容,實際填寫在data cache中 */ sptr_tx_buffer[i]=data; fec.txBd.dataPointer=(char*)sptr_tx_buffer; /*將填寫在data cache中的內(nèi)容寫回內(nèi)存中的實際發(fā)送buffer(即以sptr_tx_buffer為地址的內(nèi)存)中*/ cacheFlush(DATA_CACHE,sptr_tx_buffer,1518); /*啟動發(fā)送命令,F(xiàn)EC控制器發(fā)送內(nèi)存中buffer內(nèi)容而非data cache中內(nèi)容*/ *(UINT32*)VXImmrGet()+MOT_FEC_TX_ACT_OFF))=MOT_FEC_TX_ACT; } /*FEC接收幀函數(shù)*/ FEC_RECEIVE_FRAME() { /*取得實際接收buffer的地址*/ pBuffer=(void*)fec.rxBd.dataPointer; /*將RXBD對應(yīng)的內(nèi)存中接收buffer中內(nèi)容寫回data cache中*/ cacheInvalidate(DATA_CACHE,pBuffer,1520); *vptr_buffer=pBuffer; /*以后CPU可以安全使用接收buffer中的內(nèi)容**vptr_buffer了*/ } if ((pBuffer = (void *)malloc (allocBytes)) == NULL) return (NULL); /* Flush any data that may be still sitting in the cache */ cacheClear (DATA_CACHE, pBuffer, allocBytes); cacheInvalidate (INSTRUCTION_CACHE, pBuffer, allocBytes); |