加密哈希函數(shù)在計算機安全中起著至關(guān)重要的作用,它提供了敏感數(shù)據(jù)的單向轉(zhuǎn)換。許多信息安全應(yīng)用程序都得益于使用哈希函數(shù),特別是數(shù)字簽名、消息身份驗證碼和其他形式的身份驗證。哈希函數(shù)(如SHA512、SHA256、MD5等)的計算是發(fā)揮定制計算優(yōu)勢的潛在舞臺。這是源于RISC-V指令集的靈活性以及經(jīng)由Zk的擴展指令得到加強,結(jié)合自定義指令中合并固有順序位操作的能力,有助于顯著提高產(chǎn)品性能。
SHA512哈希函數(shù) SHA512屬于USNS設(shè)計的“SHA-2”系列。符合FIPS標準,并已通過CMVP得到驗證。 以下為SHA512算法的示意框圖。由于它使用1024位的數(shù)據(jù)塊進行操作,因此輸入信息被格式化并用虛擬位填充。然后,通過80個“循環(huán)”的鏈依次處理每個1024位塊。每個“循環(huán)”在很大程度上依賴于對輸入數(shù)據(jù)塊、初始化向量和一組“循環(huán)常數(shù)”的加法和循環(huán)位移位:
每個80個“循環(huán)”序列的輸出是一個512位的哈希值,作為下一個輸入數(shù)據(jù)塊的初始化向量,或者作為最后一個數(shù)據(jù)塊處理后的最終結(jié)果。 到目前為止,SHA-512仍然是許多安全協(xié)議的主力,包括TLS和SSL、PGP、SSH、S/MIME和IPsec。從算法上說,它本質(zhì)上是順序的:每個階段都需要前一階段的結(jié)果準備就緒,從而防止并行計算。
RISC-V Zk擴展指令應(yīng)用于標量加密 RISC-V的指令集架構(gòu)(ISA)是模塊化設(shè)計,允許添加各種特定于應(yīng)用程序的擴展。標量加密擴展(2022年2月)包含' Zk ' -針對AES, SM3(4), SHA256和SHA512算法的指令子集。 此外,根據(jù)RISC-V標準,針對CPU核的性能、內(nèi)存占用或功耗的某些要求,允許在基準指令集和正式批準的可選擴展之上添加特定于應(yīng)用程序的自定義指令。在本研究中,我們展示了在運行SHA512時,用Codasip Studio工具實現(xiàn)的高級綜合和可重定向LLVM編譯器對優(yōu)化嵌入式內(nèi)核性能的提升。
Codasip Studio, CodAL, Zk及實現(xiàn)方式 針對SHA512哈希算法,RISC-V Zk擴展了以下6條指令的子集。整個子集已經(jīng)實現(xiàn)并包含在Codasip L31 IP核的指令集中。除此之外,還考慮了兩個自定義指令“sha512_ch”和“sha512_maj”。它們負責3個輸入操作數(shù)之間的某些位操作,在SHA512“循環(huán)”中會經(jīng)常遇到。
Codasip L31 RISC-V CPU IP核、Zk子集和自定義指令已經(jīng)用CodAL(一種用于處理器描述的高級語言)進行了描述。與其他HDL不同,CodAL中的指令以一種緊湊而獨特的方式進行描述,使得LLVM編譯器和Codasip高級綜合工具都可以調(diào)用指令語義。一旦完成了自定義指令的CodAL描述,Codasip Studio可以自動生成可綜合的RTL和SDK,其中包含編譯器、調(diào)試器、指令精確和周期精確的模擬器以及可識別新指令的分析器。下面是使用CodAL的自定義“sha512_ch”指令的示例實現(xiàn): 指令體包含3個部分:匯編、二進制和語義。前兩個定義指令語法,并將操作數(shù)、操作碼和立即數(shù)映射到指令二進制。語義包含一系列描述指令行為的類c語句。在上述示例中,從寄存器文件中讀出3個操作數(shù),按照一定的位操作模式計算結(jié)果,然后將其寫入目標寄存器。 由于語義模式簡單,這兩個自定義指令都由編譯器解析并在高優(yōu)化級別(-O2+)下自動使用:
已批準的Zk擴展的指令具有更復雜的語義,它們可由生成的內(nèi)部函數(shù)直接從軟件中調(diào)用。 整個2條自定義指令集和SHA512的Zk子集只需要150行CodAL代碼。這種緊湊的描述與自動生成的SDK一起顯著縮短了產(chǎn)品的設(shè)計周期和上市時間。 PPA效果: 顯著提升SHA512性能 RISC-V Zk子集和自定義指令所帶來的SHA512性能提升,我們在RISC-V Crypto Github存儲庫中包含的SHA512基準上進行了評估。該基準測試使用了3種不同的SDK進行編譯: 1.標準指令集(RV32IMCB)的參考SDK 2.標準指令集 + 批準的SHA512的Zk子集 3.標準指令集 + SH512 Zk子集 + 自定義指令 使用生成的周期精確的評測器對所獲得的可執(zhí)行文件進行評測,獲得處理器在每個軟件例程中花費的時鐘周期的詳細信息以及PPA數(shù)據(jù)。
上圖顯示,單使用Zk指令子集減少了約1.89倍的時鐘周期數(shù)和約9.7%的代碼量,顯著提高了SHA512性能,硅面積僅增加0.8%。 在Zk之上增加自定義指令帶來了進一步的加速,將性能提高到2倍以上,將代碼量減少了10.2%,總面積僅增加了約為初始L31面積的1.6%。可以認為這是一個合理的代價,實現(xiàn)了兩倍的性能提升。 結(jié)論 當涉及到特定的應(yīng)用程序時,通用CPU IP核通常不可能是最理想的解決方案。有時,即使是一個看似簡單的指令也會大大改變游戲規(guī)則。芯片設(shè)計人員應(yīng)該善于利用這些優(yōu)勢來設(shè)計出差異化的產(chǎn)品。由Codasip Studio提供的定制計算方案有助于利用RISC-V指令集的靈活性,通過緊湊的基于CodAL的處理器描述,幫助芯片設(shè)計人員大大縮減設(shè)計時間,同時也為芯片使用者提供豐富的可自動生成的軟件套件。
目前RISC-V已經(jīng)有一組豐富的獲批準的擴展指令,也許您尚無法在現(xiàn)成的RISC-V CPU IP核中獲取相關(guān)方案。但是,經(jīng)由Codasip提供的技術(shù),芯片設(shè)計人員可以便捷地集成這些指令并進一步發(fā)展。本研究演示了8個自定義指令的實現(xiàn):6個來自已批準的Zk子集,2個基于特定算法需求。這直接將SHA512哈希計算的性能提高了兩倍,代碼量減少了10%以上。值得關(guān)注的是,CPU IP核定制計算及軟硬件協(xié)同設(shè)計的應(yīng)用領(lǐng)域,除了SHA512和加密算法可以因此受益外,在其他特定應(yīng)用計算領(lǐng)域也同樣發(fā)展空間巨大。 |