如果你開發過USB相關項目,理解USB的一些基本概念,例如設備描述符、配置描述符、子類規范等,那么開發U盤只要概念清晰應該不難。以下是我開發過程中的幾個相關步驟: 保證USB 芯片正常工作,用其他USB成功項目驗證硬件連接及固件的正確性, 按Mass Storage協議Bulk-Only 模式提供描述符,使PC 機控制面板上設備類型出現Mass Storage Device響應SCSI指令集中Inquiry 命令,可以出現盤符, 實現FAT16文件系統處理SCSI命令集中READ命令及其他UFI命令,可以訪問盤符處理SCSI命令集中WRITE命令, U盤開發成功開發U盤有三個工具軟件應該必備:USBVIEW 察看設備描述符,端點測試等;BUSHOUND 截取USB總線數據,可分析UFI命令及U盤返回的數據流;串口助手可實時了解U盤所收命令流及程序流程, 由于每個人知識面不同,我想實現上面的幾個步驟遇到的問題也不一樣。對我最大的困惑是實現FAT16文件系統,直到在微軟網站找到它的白皮書才算解惑。這里簡介一下方便大家有的放矢。 USB 組織定義了海量存儲設備類(Mass Storage Class)的規范,這個類規范包括四個獨立的子類規范, 即: 1. USB Mass Storage Class Control/Bulk/Interrupt (CBI) Transport 2. USBMass Storage Class Bulk-Only Transport 3. USB Mass Storage Class ATA Command Block 4.USB Mass Storage Class UFI Command Specification。 前兩個子規范定義了數據/命令/狀態在USB 上的傳輸方法。Bulk-Only 傳輸規范僅僅使用Bulk 端點傳送數據/命令/狀態,CBI 傳輸規范則使用Control/Bulk/Interrupt三種類型的端點進行數據/命令/狀態傳送。后兩個子規范則定義了存儲介質的操作命令。ATA 命令規范用于硬盤,UFI 命令規范是針對USB 移動存儲。Windows95 OSR2和Windows 98開始支持FAT32 文件系統,它是對早期DOS的FAT16文件系統的增強,由于文件系統的核心--文件分配表FAT由16位擴充為32位,所以稱為FAT32文件系統。在一邏輯盤(硬盤的一分區)超過 512 兆字節時使用這種格式,會更高效地存儲數據,減少硬盤空間的浪費,一般還會使程序運行加快,使用的計算機系統資源更少,因此是使用大容量硬盤存儲文件的極有效的系統。本人對Windows 98下的FAT32 文件系統做了分析實驗,總體上與FAT16文件系統變化不大,現將有關變化部分簡介如下: (一)FAT32 文件系統將邏輯盤的空間劃分為三部分,依次是引導區(BOOT區)、文件分配表區(FAT區)、數據區(DATA區)。引導區和文件分配表區又合稱為系統區。 (二)引導區從第一扇區開始,使用了三個扇區,保存了該邏輯盤每扇區字節數,每簇對應的扇區數等等重要參數和引導記錄。之后還留有若干保留扇區。而FAT16文件系統的引導區只占用一個扇區,沒有保留扇區。 (三)文件分配表區共保存了兩個相同的文件分配表,因為文件所占用的存儲空間(簇鏈)及空閑空間的管理都是通過FAT實現的,FAT如此重要,保存兩個以便第一個損壞時,還有第二個可用。文件系統對數據區的存儲空間是按簇進行劃分和管理的,簇是空間分配和回收的基本單位,即,一個文件總是占用若干個整簇,文件所使用的最后一簇剩余的空間就不再使用,而是浪費掉了。從統計學上講,平均每個文件浪費0.5簇的空間,簇越大,存儲文件時空間浪費越多,利用率越低。因此,簇的大小決定了該盤數據區的利用率。FAT16系統簇號用16位二進制數表示,從0002H到FFEFH個可用簇號(FFF0H到FFFFH另有定義,用來表示壞簇,文件結束簇等),允許每一邏輯盤的數據區最多不超過FFEDH(65518)個簇。FAT32系統簇號改用32位二進制數表示,大致從00000002H到FFFFFEFFH個可用簇號。FAT表按順序依次記錄了該盤各簇的使用情況,是一種位示圖法。每簇的使用情況用32位二進制填寫,未被分配的簇相應位置寫零;壞簇相應位置填入特定值;已分配的簇相應位置填入非零值,具體為:如果該簇是文件的最后一簇,填入的值為FFFFFF0FH,如果該簇不是文件的最后一簇,填入的值為該文件占用的下一個簇的簇號,這樣,正好將文件占用的各簇構成一個簇鏈,保存在FAT表中。0000000H、00000001H兩簇號不使用,其對應的兩個DWORD位置(FAT表開頭的8個字節)用來存放該盤介質類型編號。FAT表的大小就由該邏輯盤數據區共有多少簇所決定,取整數個扇區。 (四)FAT32系統一簇對應8個邏輯相鄰的扇區,理論上,這種用法所能管理的邏輯盤容量上限為16TB(16384GB),容量大于16TB時,可以用一簇對應16個扇區,依此類推。FAT16系統在邏輯盤容量介于128MB到256MB時,一簇對應8個扇區,容量介于256MB到512MB時,一簇對應16個扇區,容量介于512MB到1GB時,一簇對應32個扇區,容量介于1GB到2GB時,一簇對應32個扇區,超出2GB的部分無法使用。顯然,對于容量大于512MB的邏輯盤,采用FAT32的簇比采用FAT16的簇小很多,大大減少了空間的浪費。但是,對于容量小于512MB的盤,采用FAT32雖然一簇8個扇區,比使用FAT16一簇16個扇區,簇有所減小,但FAT32的FAT表較大,占用空間較多,總數據區被減少,兩者相抵,實際并不能增加有效存儲空間,所以微軟建議對小于512M的邏輯盤不使用FAT32。另外,對于使用FAT16文件系統的用戶提一建議,硬盤分區時,不要將分區(邏輯盤)容量正好設為某一區間的下限,例:將一邏輯盤容量設為1100M(稍大于1024M),則使用時其有效存儲容量比分區為950M的一般還少,因其簇大一倍,浪費的空間較多。還有,使用FDISK等對分區指定容量時,由于對1MB的定義不一樣(標準的二進制的1MB為1048576B,有的系統將1MB理解為1000000B,1000KB等),及每個分區需從新磁道開始等因素,實際分配的容量可能稍大于指定的容量,亦需注意掌握。 (五)根目錄區(ROOT區)不再是固定區域、固定大小,可看作是數據區的一部分。因為根目錄已改為根目錄文件,采用與子目錄文件相同的管理方式,一般情況下從第二簇開始使用,大小視需要增加,因此根目錄下的文件數目不再受最多512的限制。FAT16文件系統的根目錄區(ROOT區)是固定區域、固定大小的,是從FAT區之后緊接著的32個扇區,最多保存512個目錄項,作為系統區的一部分。 (六)目錄區中的目錄項變化較多,一個目錄項仍占32字節,可以是文件目錄項、子目錄項、卷標項(僅跟目錄有)、已刪除目錄項、長文件名目錄項等。目錄項中原來在DOS下保留未用的10個字節都有了新的定義,全部32字節的定義如下: (1) 0-- 7字節 文件正名。 (2) 8--10字節 文件擴展名。 (3) 11字節 文件屬性,按二進制位定義,最高兩位保留未用,0至5位分別是只讀位、隱藏位、系統位、卷標位、子目錄位、歸檔位。 (4) 12--13字節 僅長文件名目錄項用,用來存儲其對應的短文件名目錄項的文件名字節校驗和等。 (5) 14--15字節 24位二進制的文件建立時間,其中的高5位為小時,次6位為分鐘。 (6) 16--17字節 16位二進制的文件建立日期,其中的高7位為相對于1980年的年份值,次4位為月份,后5位為月內日期。 (7) 18--19字節 16位二進制的文件最新訪問日期,定義同(6)。 (8) 20--21字節 起始簇號的高16位。 (9) 22--23字節 16位二進制的文件最新修改時間,其中的高5位為小時,次6位為分鐘,后5位的二倍為秒數。 (10)24--25字節 16位二進制的文件最新修改日期,定義同(6)。 (11)26--27字節 起始簇號的低16位。 (12)28--31字節 32位的文件字節長度。 其中第(4)至(8)項為以后陸續定義的。 對于子目錄項,其(12)為零;已刪除目錄項的首字節值為E5H。在可以使用長文件名的FAT32系統中,文件目錄項保存該文件的短文件名,長文件名用若干個長文件名目錄項保存,長文件名目錄項倒序排在文件短目錄項前面,全部是采用雙字節內碼保存的,每一項最多保存十三個字符內碼,首字節指明是長文件名的第幾項,11字節一般為0FH,12字節指明類型,13字節為校驗和,26--27字節為零。 (七)以前版本的 Windows 和DOS與 FAT32 不兼容,不能識別FAT32分區,有些程序也依賴于FAT16文件系統,不能和 FAT32 驅動器一道工作。將硬盤轉換為 FAT32,就不能再用雙引導運行以前版本的Windows(Windows 95 [Version 4.00.950]、Windows NT 3.x、Windows NT 4.0 和 Windows 3.x)。 磁盤結構綜述 1.硬盤結構 硬盤的內部是由圓形金屬片堆疊起來的,每個盤片的兩面都有一個磁頭(Head)負責讀寫這個磁面(Side),在每個磁面上劃分了一圈一圈的同心圓,叫做柱面(Cylinder)對于軟盤通常稱之為磁道,在每個柱面中又劃分了若干段,稱之為扇區(Sector)。由于技術的發展,硬盤的密度越來越大,使得硬盤的實際盤片數越來越少,對磁盤操作的柱面、磁頭、扇區被硬盤控制器內部轉換,已經不是實際的柱面、磁頭、扇區了。由于最早時磁盤存取系統估計不足,傳輸數據時只給扇區留了6位,柱面留了10位,磁頭留了8位。也就是說,柱面最大只能為1023。但是大硬盤的柱面遠大于這個數,所以后來就采用將柱面數減少,將磁頭數增加的方式來滿足磁盤尋址的要求,對于實際地址的轉換在BIOS中進行,這叫邏輯塊尋址方式(Logical Block Addressing,LBA)硬盤中有關柱面、磁頭、扇區的數據都是以此為基準的。 2.分區結構 眾多的文件數據存放在磁盤上,需要有組織,這就形成了文件系統。但是各個操作系統的文件系統都不盡相同,為了劃分管理文件系統,在現在的PC機上都采用通用的分區結構。分區機構是這樣的:硬盤的以一個扇區(就是0柱面0磁頭1扇區)叫主引導扇區(Main Boot Record,MBR),存放著引導程序和主分區表(Main Partition Table)和結束標志“55AA”。一般稱的分區表即是主分區表。一個分區表最多可包含四個分區表項,每個分區表項中標示著一個分區信息或一個擴展分區表的位置,而擴展分區表中可能還有擴展分區表,這就形成了一個鏈狀結構,可以記錄很多個分區。 C語言定義如下 typedef struct { char bootcode[0x1be]; //啟動代碼 PartitionTable PT[4]; //分區表 word EndingFlag; //結束標識 }MBR; 分區表項的如下: typedef struct { byte BootFlag; //啟動標志 CHS StartCHS; //分區開始的柱面、磁頭、扇區 byte SystemID; //分區類型 CHS EndCHS; //分區結束的柱面、磁頭、扇區 dword RelativeSectors; //分區相對扇區數,指分區相對于記錄該分區的分區表的扇區位置之差 dword TotalSectors;//分區總扇區數 }PartitionTable; 其中CHS為一個柱面、磁頭、扇區的結構,定義如下: struct CHS { byte Head; //磁頭 byte Sector:6; //扇區 byte CyH2:2; //柱面的高兩位 byte CyL8; //柱面的低八位 }; word Cylinder() { return (word(CyH2)*256+CyL8); } //返回柱面值 void SetCylinder(word Cylinder) //設置柱面值 { CyH2=(Cylinder>>8)&0x3; CyL8=(Cylinder&0xff); } }; 其中分區類型是對應于各種文件系統統一編排的一個代碼。比如06H是大于32M的FAT16分區的標志,05H是擴展分區的標志,等等。一般的,對于DOS/Windows3.x/Windows95/98的系統來說,第一個分區表項記錄著DOS主分區(C盤)的信息,而且是可以啟動的,第二個分區表項一般是擴展分區,在這個擴展分區表項所指向的分區表中又是一個Dos主分區(D盤)和一個擴展分區,依次類推。而在絕大部分系統中Dos主分區(C盤)是從0柱面1磁頭1扇區開始的。(有些機器在這個位置有個小分區,專門用來管理啟動或機器設置,之后才是C盤的分區) 3.FAT文件系統 FAT文件系統(FAT12/FAT16/FAT32)是從DOS發展過來的一種文件系統,其優點是簡單易用,并被多種操作系統支持。(目前支持FAT32的操作系統還不多)FAT文件系統名稱后的數字是標識文件中系統一個分配單元所需的位(bit)數。一個FAT12/16文件系統的結構是這樣的:引導扇區 第一文件分配表 第二文件分配表 根目錄 數據區 (1).引導扇區 引導扇區是文件系統的第一個扇區,其中包含分區重要的數據信息——BPB(BIOS Paramenter Block-磁盤參數表)。磁盤參數表中包含分區總大小、磁盤參數等重要信息。其C語言定義為: typedef struct { word SectorBytes; //每扇區字節數 byte SectorsPerCluster; //每簇扇區數 word ReservedSectors; //保留扇區數 byte NbrFat; //FAT的個數 word RootEntry; //根目錄項數 word TotalSectors; //分區總扇區數(分區小于32M時) byte Media; //分區介質標識 word SectorsPerFAT; //每個FAT占的扇區數 word SectorsPerTrack; //每道扇區數 word Heads; //磁頭數 dword HiddenSectors; //隱含扇區數 dword BigTotalSectors; //分區總扇區數(分區大于32M時) }BPB_FAT16; 其中保留扇區數為從分區開始到第一個FAT表開始中間的扇區數。隱含扇區數同分區表中的隱含扇區數含義相同。雖然存在FAT個數的定義,但現在的FAT12/16系統基本上沒有除2以外的值。因而一般不考慮其他情況。根目錄項數是指根目錄總共能容納下的目錄的項數。一個目錄項占32個字節,所以一個扇區有512/32=16個目錄項。用這個值除以16就是根目錄所占的扇區數。分區總扇區數在分區大于32M時已經超過65535,兩個字節已經無法表示,因此在大于32M的分區中TotalSector總是等于零,而將實際的數放在BigTotalSectors中。分區介質標識是確定BPB有效的標志。它必須與FAT表中第一個字節的分區介質標識統一。硬盤的分區介質標識為0F8h,如果這個標識不對或者與FAT不統一則將會出“Invalid media type”的錯誤。 SectorsPerFAT是每個FAT所占的扇區數。系統根據分區起始地址+保留扇區數+每個FAT所占扇區數*FAT個數+根目錄項數/16來確定數據區開始的位置,然后由這個位置+簇號*每簇扇區數來最終確定數據在硬盤扇的具體位置。 (2)文件分配表 文件分配表是文件在磁盤上分布的信息。FAT文件系統將數據區按每簇扇區數為單位劃分成一個一個單元,每個單元是文件分配的最小單位。這個單元就稱為簇。一些大的文件可能占用了很多簇,而且在磁盤上沒有連續存放。FAT表就是為了確定文件每個簇的連接關系而設的。FAT表的每一項都對應著數據區的一個簇,FAT16的FAT表每一項占16位,也就是兩個字節。每一項的內容表示其對應簇的分配情況,0表示尚未分配;FFF0h~FFF6h為備用;FFF7h表示壞簇,即該簇中磁盤有損壞;FFF8h~FFFF表示文件結束;其他值則表示當前簇的下一簇的簇號。FAT表的最前面兩項是不用的,因此第一個數據簇的簇號為2。FAT表第一個字節也是分區介質類型,和BPB中的一樣。因此用“F8 FF FF”可以作為硬盤FAT起始的標志。絕大多數FAT系統有兩個FAT表,第二個FAT表又稱為后備文件分配表。系統內部完成后備文件分配表與第一文件分配表的統一。本文討論的完全恢復是基于后備文件分配表沒有被破壞的情況下的恢復,如果兩個文件分配表都被損壞,理論上就無法完全確定文件信息,因此無法完全恢復。 (3)根目錄 FAT12/16的根目錄是單獨列出來的,在后備文件分配表和數據區之間。每個目錄項為32個字節,記錄一個文件或目錄的信息。(長文件名例外)文件修復的原理就是由目錄項中指示的起始簇號和數據區開始位置來確定文件的位置,從而恢復小的文件。 4.FAT32文件系統 FAT32文件系統與FAT12/16的差別較大,一個主要的差別就是將根目錄劃歸到數據區中了,在BPB中專門加了一項根目錄開始簇號。這樣根目錄的大小就不再受到限制,大大增加了根目錄的自由度。 FAT32的BPB定義如下: typedef struct { word BytesPerSector; //每扇區字節數 byte SectorsPerCluster; //每簇扇區數 word ReservedSectors; //保留扇區數 byte NumberOfFATs; //FAT的個數 word RootEntries; //根目錄項數(FAT32不用) word TotalSectors; //分區總扇區數(FAT32不用) byte MediaDescriptor; //分區介質標識 word SectorsPerFAT; //每個FAT占的扇區數(FAT32不用) word SectorsPerTrack; //每道扇區數 word Heads; //磁頭數 dword HiddenSectors; //隱含扇區數 dword BigTotalSectors; //分區總扇區數 dword BigSectorsPerFat; //每個FAT占的扇區數 word ExtFlags; //擴展標志 word FS_Version; //文件系統版本 dword RootDirStartClus; //根目錄起始簇號 word FSInfoSec; //指向包含BIGFATBOOTFSINFO結構的扇區 word BkUpBootSec; //后備引導區的位置 byte Reserved[12]; //備用 }BPB_FAT32; 從上可以看出,FAT32的BPB是在FAT16BPB的基礎上加入了一些參數,并停用了一些參數。每個FAT所占扇區數變為4個字節,根目錄項數不再使用。FAT32與FAT12/16的另一不同點在于,FAT32既可以同時使用多個FAT表,也可以只使用其中的某一個FAT表。ExtFlags正是這個標志。當ExtFlags的第8位為0時表示同時使用每個FAT表,當其為1時表示只使用其中的一個FAT表,這個FAT表的序號由ExtFlags的低4位給出。FS_Version文件系統版本現在都為0。FAT32將根目錄也視作一個目錄文件,使用一個簇鏈(Cluster Chain),RootDirStartClus正是這個鏈的起始簇號。FAT32有個專門放BIGFATBOOTFSINFO結構的扇區,該結構包含了剩余簇個數,下一個空閑簇號等信息。這個扇區通常緊接著引導扇區。由于與恢復關系不大,本文不做討論。FAT32將引導扇區和文件系統信息扇區信息存了兩份,另一份的位置由BkUpBootSec指出。這樣由于偶然發生的損壞就很容易恢復。 5.擴展BIOS參數塊 在BPB的后面是Extended BIOS Paramenter Block。EBPB的結構如下: typedef struct //Extended BIOS Paramenter Block { byte PhysicalDriveNumber; //物理硬盤號 byte CurrentHead; //當前磁頭 byte ExtBootRecSign; //擴展引導記錄標志 dword SerialNumber; //序列號 char VolumeLabel[11]; //卷標 char FSID[8]; //文件系統標識 }EBPB; 其中物理硬盤號和當前磁頭是系統運行時使用的,硬盤上的值沒有什么實際意義。ExtBootRecSign一般為28h或29h。SerialNumber是格式化后生成的序列號。文件系統標識指示了文件系統的類型,即“FAT12”、 “FAT16”、 “FAT32” Mass Storage 協議 Bulk-Only 傳輸協議可參考USBMASSBULK.PDF文檔 SCSI 指令集可參考USBMASSUFI.PDF文檔 FAT16文件系統可參考FAT_PAPER.PDF文檔 相關文檔可到WWW.USB.ORG官方網站下載 |