1 嵌入式內存數據庫技術發展的現狀 數據庫理論與技術的發展極其迅速,其應用日益廣泛,在當今的信息社會中,它幾乎無所不在。以關系型為代表的三大經典(層次、網狀、關系)型數據庫在傳統的(商務和管理的事務型)應用領域獲得了極大成功,然而它們在現代的(非傳統)工程和時間關鍵型應用面前卻顯得軟弱無力,面臨著新的嚴峻的挑戰,由此而導致了嵌入式實時數據庫的產生和發展。在實時應用中,事務在運行前的操作邏輯(操作類型、順序等)、數據集及其結構、行為以及時間的相關性等都是可預分析的。然而,對磁盤數據庫而言,數據的I/O 是造成事務執行時間不確定、預報不準確的關鍵因素。為此,要求以大內存作為實時數據庫的主要存儲介質,使一個事務在活動期間沒有I/O, 以達到較準確的預報,從而滿足實時事務的定時限制。但這要解決兩個問題,就是適當的數據安置和適時的內外存交換。隨著內存技術的高速發展,內存數據庫技術日益成熟,在非實時系統中也得到了廣泛的應用。 內存數據庫(MMDB)把數據庫的主拷貝(即“工作版本”)常駐在內存,使系統性能得到了極大的提高。但是,由于所有操作直接作用于內存中的數據庫主拷貝上,數據庫極易受到操作系統和應用軟件錯誤造成的破壞,而且,數據庫恢復所包含的I/O 操作(如做日志、備份等)在事務運行不需要I/O 操作的內存數據庫系統中也顯得極為突出。因此,內存數據庫的恢復機制對系統性能有重要的影響作用,內存數據庫的恢復較之傳統的磁盤數據庫的恢復要復雜得多,也關鍵得多。數據恢復是內存數據庫可靠、實用的關鍵,恢復技術的研究已成為MMDB 研究領域最熱門的課題。 2 內存數據庫的定義 內存數據庫的定義不應涉及內存的大小、存取數據所需I/O 的多少、數據何時進入及怎樣才能留駐內存等這些具體的實現技術,而只包含數據庫常駐內存(而不是磁盤)、事務(不是系統)的數據存取只涉及內存的意思。其本質特征是其“主拷貝”或“工作版本”常駐內存,即活動事務只與實時內存數據庫的內存拷貝打交道。顯然,它要求較大的內存量,但并不要求任何時刻整個數據庫都能存放在內存,即內存數據庫系統還是要處理I/O。傳統的磁盤數據庫即使緩沖區足夠大,以致可以容納所有數據也不能算是一個MMDB。因為它是針對磁盤特性、在數據庫常駐磁盤的假定下設計的。例如,索引結構還是針對磁盤存取的,數據的存取仍必須經過緩沖區管理等。內存數據庫的組織與管理要求新的適于內存特點的數據結構和算法,對于數據的組織與安置、數據庫存取、內外存數據交換、查詢處理及優化、并發控制及數據庫恢復都需要研究新的策略與機制。 內存數據庫是一個較新的研究領域,結合各方面參考,現給出如下定義: 定義:設有數據庫DB,DBM(t)是t 時刻DB 在內存中的數據集,DBM(t)真包含于DB; T S 為所有事務的集合,A T(t)是t 時刻的活動事務集,A T(t)真包含于T S;D t(T)為T 在t 時刻的操作數據集,D t(T)真包含于DB;若在任一時刻t,均有: 對任一事務有T∈A T(t),D t(T)真包含于DBM(t)成立,則稱DB 為一個內存數據庫,簡記為MMDB 。 按此定義,MMDB 的“工作版本”(當然也可以是整個數據庫)常駐內存,任何一個事務在執行過程中沒有內外存間的數據I/O。顯然,它需要一定的內存容量,但并不要求整個數據庫都必須常駐在內存。 3 內存數據庫的特點 3.1 內存數據庫 數據存儲的組織和管理一個MMDB的邏輯整體主要由兩個部分構成,即內存版本與外存版本。 主存儲器是易失內存,它存放MMDB的“工作版本”。它在邏輯上被劃分為若干分區,一個分區用來存放一個關系的數據。每個分區又物理地由若干相互鏈接的塊組成。一塊是一個固定長度的連續區域,它是內外存I/O的單位,也是內存分配、回收以及對MMDB進行恢復的單位。索引與數據記錄分離存放。 NV-RAM(NO Vola tile RAM)兼有內存讀寫速度快和在后備電池維護的情況下非易失的特點,但價格昂貴,不便插拔,廣泛用于嵌入式系統,并可與Flash-RAM配合使用,充當Flash-RAM 寫緩沖區。NV-RAM是主存儲器的拓延,目前可用UPS、固態磁盤或磁盤Cache等實現。主存數據與NV-RAM數據一起統稱為MMDB的“內存版本”。 磁盤存儲器用來存放未在內存的那一部分數據庫數據,同時也用作數據庫恢復的備份,我們稱之為“外存版本”。為便于實現內外存間的數據交換,可將磁盤數據在邏輯上劃分為與內存塊同樣長度的定長塊,建立相同類型的索引。 3.2 事務處理 當內存數據庫用于非實時系統時,除了日志和系統恢復的具體方式跟傳統數據庫差異比較大以外,事務處理過程與傳統數據庫的事務處理相似;然而,當內存數據庫用于實時系統時,既實時內存數據庫中,事務處理由于受到了時間上的限制,傳統數據庫的事務處理已經不再適用。傳統的“ACID” 的事務概念及模型對實時事務不適合。實時事務表現出了許多不同的特征,如實時性和相關性。雖然實時事務的正確性與傳統事務一樣,也包括數據庫狀態正確性和事務執行正確性兩個方面,但其含義與內容有很大的不同。在實時事務中,數據庫狀態正確性包含內部一致性和時間一致性,事務執行正確性則包含其結果正確性、行為正確性、結構正確性和時間正確性等。事務調度也要采取相關的實時調度算法。本文中討論的內存數據庫引擎針對非實時系統。 3. 3 系統恢復 數據庫的備份是數據庫的副本以及一些控制信息,在出現故障的情況下,可以隨時用它進行恢復。數據庫備份最小化了數據丟失,能夠讓您使用恢復過程,從備份副本中重新構造失敗的數據庫。有多種類型的失敗導致需要恢復數據庫。其中包括語句失敗、用戶錯誤、進程失敗、數據庫實例失敗、媒介失敗等。但不是所有類型的失敗都需要進行人工交互。但是,在內存數據庫系統中,由于所有操作都直接作用于內存中的數據庫主拷貝上,數據庫極易受到操作系統和應用軟件錯誤造成的破壞,因此MMDB的恢復技術如備份、檢驗點(Checkpoint)和重啟動(restart)等都較常規的磁盤數據庫(DRDB)復雜。人們從體系結構、事務提交、日志系統到備份、檢驗點算法等各個方面進行了大量的研究和探索。日志管理是內存數據庫恢復機制中至關重要的一環。由于內存有易失性,日志最好保存于另一穩妥的介質上(如磁盤、非易失內存等),而對日志的I/O操作又將在某種程度上影響MMDB的性能,可能成為瓶頸影響系統的事務吞吐量。為此,人們研究了各種各樣的解決辦法,比如構造非易失內存用于保存部分日志;采用“成組提交”的技術,使用影子內存技術等來解決日志瓶頸問題。在檢驗點方面,為了提高系統效率,通常力圖使檢驗點操作和事務處理同時進行。為了提高速度指標和綜合性能,MMDB系統往往利用附加的硬件設備如非易失內存、專用的日志處理器、檢驗點處理器等來支持高效、快速的數據恢復。 4 面向3G平臺嵌入式內存數據庫引擎的設計 4.1 3G平臺中數據庫子系統整體架構 4.1.1 數據庫系統各功能模塊在3G平臺系統中的位置 3G軟件平臺包括圖1所示的除OS和BSP外的6大軟件子系統。 圖1 3G 軟件平臺系統分布圖 DataBase 子系統負責管理平臺的物理資源和平臺實現的信令、協議的配置信息,同時向其它子系統提供數據庫訪問接口。它工作于操作系統之上。 承載子系統向業務子系統、信令子系統、OAM和網管子系統提供ATM、IP、等方面的承載服務。它工作于操作系統和DataBase 子系統之上。 信令子系統實現窄帶No.7 信令、寬帶No.7 信令、IP信令、網關控制信令,向業務處理子系統提供服務。它工作于操作系統、DataBase子系統和承載子系統之上。 系統控制子系統負責對整個系統的監控、啟動、版本下載等。它工作于操作系統和DataBase 子系統之上。 OAM 和網管子系統提供平臺與網管后臺的統一接口,負責對平臺的協議、信令進行配置和管理,以及提供必要的統計數據。它工作于操作系統、承載子系統、DataBase子系統之上。 業務處理子系統實現系統提供的各種業務。它工作于操作系統、承載子系統、信令子系統、DataBase子系統之上。 數據庫子系統分布在3G 平臺各處理器上。從結構上看數據庫子系統屬于分布式數據庫系統;主要為平臺各個子系統提供數據支持,并為將來其上的擴展業務提供支持易擴充機制的數據庫模型。 4.1.2 數據庫子系統內部模塊劃分 數據庫子系統內部劃分五大功能模塊,支持數據來源為RAM、FLASH、硬盤特定格式以及商用數據庫等多種介質。五大功能模塊分別是:輸入輸出模塊、對象管理模塊、業務處理模塊、維護管理模塊及平臺系統工具包。 輸入輸出模塊(I/O模塊)負責完成整個平臺所有與硬件介質相關的數據、裝載、轉儲、存儲空間管理等等相關功能。 對象管理模塊是整個平臺的核心模塊(DBCORE),完成主體功能,即對內存數據、表、索引、鎖等等系列對象的核心組織功能,對整個系統的性能高低有決定性的影響。提供簡易的內部并發控制手段。 業務處理模塊是針對數據庫平臺的用戶提供的使用接口層,完成對內存數據庫的訪問服務。可以支持API 方式及類SQL 訪問方式。支持分布式數據訪問方式。 維護管理模塊完成對整個平臺系統的監控及管理,包括探針、告警、日志、實時業務跟蹤、遠程網絡訪問等等系列功能的實施。 平臺系統工具包針對各模塊均有完善的工具支持,具體如下: 介質層工具:各類特定介質的數據存儲文件檢索、修改、生成。 對象管理模塊工具:根據對象屬性區別性選擇生成主體程序框架,若無特殊要求,生成的代碼可直接用于對象管理。 I/O 模塊工具:根據內存數據庫分布模型,生成數據裝載、轉儲及內存數據存儲空間管理等框架代碼;業務處理子系統工具,常規API 代碼生成。 維護管理模塊工具:接口跟蹤、日志等輸出文件的檢索、管理工具。 其他:各類對象(表、索引……)設計及相關說明文檔生成。 4. 2 系統對象設計原理和處理流程 本子系統是按照面對對象的方法進行設計的,因此在敘述系統處理流程時以子系統的各個對象為主線,而同步流程和監控流程設計上有其自身特點,對它們的敘述以過程為主線。 本子系統的數據分為數據表、索引、隊列、同步實例、監控實例、單向資源隊列六大類。其中數據表為數據庫組織的核心,然后為數據定位的方便建立索引,為資源管理的方便建立了隊列,出于數據同步的需要建立了同步實例,出于資源監控的需要,建立了監控實例,而單向資源隊列作為輔助數據表和同步實例的內存管理之用。 以上除單向資源隊列外每一類數據都定義為系統的數據對象類,系統對于同一對象類的數據統一定義,統一管理。一個具體的數據對象稱為某一數據對象類的數據實例。系統為表、索引、隊列、同步、監控的所有數據實例統一分配唯一一個32 位整數加以標識,稱為數據實例句柄。對數據實例的存取都是通過數據實例句柄進行的。采用這種方式的一個優點是數據管理的穩定性不隨著數據實例的增加而變化,有利于系統的穩定。另一個優點是便于數據對象類的擴充,由于不同數據對象類別分別管理,數據對象類之間的獨立性確保在擴充數據對象類后,不破壞原有數據的安全性。 單向資源隊列作為在表對象和同步對象內部使用的對象。沒有統一分配句柄,相關的表通過保存單向資源隊列對象的指針實現操作。 5 小結: 本文作者創新點是本文首先介紹了嵌入式內存數據庫技術現狀,然后簡單介紹了內存數據庫技術的特點等并提出了一個適用于3G平臺的嵌入式內存數據庫引擎,隨著計算機技術的高速發展和人們對信息處理速度不斷增長的需求,大容量的內存數據庫和經過精簡的嵌入式內存數據庫將會有越來越大的應用空間。目前,還沒有比較好的通用的嵌入式內存數據庫產品,進行這方面的開發和實現將會有很大的市場潛力和空間。 |