作者:Christian Cruz,應用開發工程師; Gary Sapia,系統應用總監; Marvin Neil Cabuenas,固件工程師 ADI公司 摘要 本文概要介紹了開放計算項目開放機架第3版(OCP ORV3)備用電池單元(BBU)的系統要求。文中強調了可在停電時提供電能的高效、智能BBU的重要性。此外,本文展示了模擬和數字設計解決方案、電氣和機械解決方案及其為滿足書面規范而開發的架構。 引言 數據中心為互聯網提供支持,連接世界各地的社區。Facebook、Instagram和X(前稱Twitter)等社交媒體公司依靠數據中心來傳播和存儲信息,而雅虎和谷歌等搜索引擎則利用數據中心支持其主要搜索引擎和存儲功能。全球幾乎所有大公司和政府機構都需要可靠的數據中心功能,以通過智能計算、存儲和搜索來運營和維護其主要業務職能。隨著用戶數量逐年增加,數據中心容量持續以驚人的速度增長,以適應需求和技術進步。為了跟上不斷增長的需求,數據中心的系統架構也要不斷更新升級。 OCP是一個共享數據中心設計的組織,其系統架構定義基于開放計算項目開放機架第2版(OCP ORV2),其中背板電壓標稱值為12 V,系統功率為3 kW。另一方面,使用量的增加導致功率需求增加,這使得12 V系統的功率要求過高,進而不利于整體系統性能。為了解決這個問題,在系統功率保持不變的情況下,背板電壓增加到48 V,從而盡量減少所需的電流和銅走線,并降低背板散發的熱量。這一變化提高了整體系統效率,并降低了對復雜散熱系統的需求。這就是新的開放機架第3版標準(OCP ORV3)的基礎。 圖1.OCP ORV3電源架構。 數據中心的可靠性是保證運營正常的基本條件。為系統增加BBU可提供系統冗余性。如果發生停電或限電,系統需要時間來察覺情況,保存重要數據,并將操作切換到另一臺數據中心服務器(很可能位于不同的數據中心設施和地點)。這些應對操作必須以無縫的方式完成。每個機架都使用備用電源系統來調節系統的延時電源。這一需求在最新標準ORV3 BBU中被明確為:基于鋰離子電池儲存和調節的電量,每個BBU單元需提供15 kW功率輸出,維持系統運行4分鐘。 在該規范的指導下,ADI公司與OCP組織合作完成和制作了參考設計方案,它包括:用于通過單一電路專門進行充電和放電操作的雙向電源轉換器、電池管理系統(BMS)器件、帶固件和GUI支持的板載設計系統主機微控制器以及硬件放大。 設計要求和硬件實現 OCP組織提供的規范(第1.3版)中概述了滿足BBU模塊標準所需達到的構思和設計要求。BBU模塊參考設計基于ORV3 48 V提案,由帶BMS的電池包、充電/放電電路和其他功能塊組成,如圖2所示。 圖2.OCP ORV3 BBU框圖。 除了電路要求外,BBU模塊在其使用壽命期間還需要有幾種主要工作模式,具體如下: ► 休眠模式:BBU模塊處于運輸或庫存狀態,或者未連接到有源母線。此時電池放電電流最小,以延長儲存時間。BBU監控或報告功能在休眠模式下不可用。當檢測到母線電壓高于46 V且持續時間大于100 ms而小于200 ms,并且PSKILL信號為低電平時,BBU將喚醒并退出休眠模式。 ► 待機模式:BBU模塊已充滿電且運行正常,并持續監控母線電壓,以便為放電事件做好準備。BBU模塊在其使用壽命的大部分時間都以這種模式運行。BBU模塊的狀態和參數通過通信總線顯示在上游機架監視器上。 ► 放電模式:當母線電壓降至48.5 V以下且持續時間大于2 ms時,BBU模塊放電模式就會激活。BBU模塊預計將在2 ms內接管母線電壓,備用時間為4分鐘。 ► 充電模式:當所有條件都滿足時,BBU模塊使能其內部充電器電路,為其電池包充電。根據電池容量的上次放電深度,充電電流可以為0 A至5.5 A之間的任意值。它還允許上游系統通過通信總線超控充電電流。應該有一個基于計算的充電電流的充電器超時控制方案。 ► 運行狀態檢查(SOH)模式:BBU模塊通過對電池包進行強制放電來例行測試電池包容量。BBU模塊應每90天執行一次SOH測試,以確定電池的EOL狀態。 ► 系統控制模式:BBU應允許上游系統通過通信總線控制充電/放電操作。 除了BBU模塊運行要求外,OCP還規定了電池包容量、電芯類型和電池包配置的標準。具體說明如下: ► 電池包容量:BBU模塊可以在4年時間里提供不超過4分鐘的3 kW備用電源。 ► 電芯類型:BBU模塊應為鋰離子18650型,電芯電壓為3.5 V至4.2 V,電池容量至少為1.5 AH,連續額定放電電流為30 A。 ► 電池包配置:BBU模塊的電池包配置為11S6P(6個串聯組合并聯在一起,每個串聯組合由11個電芯串聯而成) 此外,BBU模塊需要有BMS來提供電池充電/放電算法、保護、控制信號和通信接口。BMS還負責建立電芯平衡電路,使電池包中的電芯電壓保持在±1% (0.1 V)容差以內。 參考設計框圖(見圖3)顯示了選定的器件,以及為完成某些任務而集成的各種元件,它們構成的電路能夠提供不間斷電源、判斷模塊運行狀況和故障并執行模塊通信。LT8228是一款雙向同步控制器,位于BBU模塊內。該器件在線路電源中斷的情況下提供電源轉換,并在非故障運行期間提供電池充電功能。LT8551是一款4相同步升壓DC-DC相位擴展器,與LT8228協同工作,將放電功率輸送能力提高至每個BBU模塊3 kW。除了電源轉換IC外,BBU模塊還包含MAX32690,它是一款超低功耗Arm®微控制器,負責整個系統的運行。LTC2971是一款2通道電源系統管理器,用于實現電源路徑的精密感知和故障檢測,以及關鍵的電壓下降功能。MAX31760是一款精密風扇轉速控制器,用于在充電和放電操作期間執行系統散熱功能。EEPROM用作數據存儲設備,允許用戶在BBU模塊可用期間恢復任何有用數據。除了電源轉換器和負責一般管理任務的微控制器之外,設計中還包含BMS IC。ADBMS6948是一款16通道多電芯電池監控器,用于監測電池電壓水平,而其固有的庫侖計數器用于確定充電狀態(SOC)和SOH水平,以進行電池平衡和電池預期壽命計算。電池運行狀態監控程序由超低功耗Arm微控制器MAX32625完成。兩款微控制器均經過精心挑選,以降低總功耗,從而延長BBU休眠工作模式期間的電池壽命。 除了所提供的器件之外,該參考模塊還提供和構建了BBU模塊(見圖4a)和BBU層板(見圖5),以容納和展示符合OCP ORV3 BBU模塊和層板機械規范的參考設計。BBU層板包括6個BBU模塊插槽,因此單個BBU層板可根據需要提供高達18 kW的備用電源。 圖3.ADI OCP ORV3 BBU框圖。 圖4.(a) ADI BBU模塊的3D渲染機械概覽,(b) 氣流仿真。 機械渲染和氣流仿真是BBU模塊參考設計在架構上的兩個優勢。首先,它支持可視化,可提供準確且有吸引力的表示形式。機械結構分析可盡早發現設計問題和潛在變化,這有助于整個設計過程。最后但同樣重要的是,它可以減少對耗時又昂貴的實際原型的需求。另外,氣流仿真可以提供性能分析,幫助識別潛在問題并提高設計效率。它還負責熱管理,能夠協助識別熱點,優化熱損失,并增強整體系統可靠性。此外,它還能夠根據安全和合規的要求規劃電池包空間,從而降低風險。更多信息請參見圖4b。 圖5.已插入六個BBU模塊的ADI BBU層板的3D渲染。 數據與結果 下面給出的測試結果包括穩態性能測量、功能性能波形、溫度測量和工作模式轉換。使用BBU模塊參考設計測試了以下配置: 表1.ORV3 BBU模塊參數 放電操作(升壓模式) 充電操作(降壓模式) 輸入電壓:30 V至44 V 輸入電壓:49 V至53 V 輸出電壓:47.5 V至48 V 輸出電壓:48 V 輸出負載:0 A至63.2 A 輸出負載:0 A至5 A 開關頻率:150 kHz 開關頻率:400 kHz 性能數據 效率與功率損耗 BBU模塊參考設計證明了它能夠在滿足ORV3 BBU規范的約束條件下,實現更高的效率和更低的功率損耗。放電和充電限制分別設置為97%和95%。在放電操作期間,測得的半負載(31.6A)平均效率為98.5%,而滿負載(63.2A)平均效率為98%。受更大電感的影響,較低的MOSFET漏源導通電阻和精心選擇的開關頻率將有助于提高效率和降低紋波電流。此外,BBU模塊在5 A負載的充電操作期間實現了97%的高平均效率。在使用相同電感值的情況下以400 kHz開關頻率運行時,效率得到提高,功率損耗也充分降低。高效率和較低功率損耗將有助于延長電池壽命周期,并降低散熱所需的風扇轉速。參見圖6。 另一方面,控制和同步MOSFET的傳導損耗會影響BBU放電和充電操作期間的整體功率損耗。 圖6.放電和充電工作模式期間各自的效率和功率損耗。 輸出壓降 ORV3 BBU規范的另一個要求是在放電工作模式期間考慮壓降。電壓下降是指在驅動系統負載時有意降低BBU背板電壓的現象。BBU背板電壓將根據LTC2971在線DAC測得的系統負載電流而實時改變。因此,從空載到滿載的背板壓降保持在ORV3 BBU要求的±1%限值以下。參見圖7。 圖7.放電工作模式期間的輸出壓降。 開關波形 檢查開關波形可為性能評估、故障分析、效率優化、降低EMI和安全考量提供有價值的信息。它讓工程師能夠發現和解決問題,優化系統性能,確保數據中心BBU模塊可靠、高效運行。 BBU模塊的開關操作在放電工作模式期間至關重要,它將30 V至44 V電池包電壓轉換為48 V背板電壓。這是通過同步功率MOSFET實現的,它由LT8228脈沖寬度調制(PWM)信號準確調節,配套的LT8551重復LT8228的操作。每相的開關頻率和均流導致電壓升高,是影響其運行的重要因素。主轉換器及其多相擴展器在滿載時的開關波形如圖8所示。在充電工作模式中,雙向轉換器以單相操作,將49 V至53 V背板電壓降低至44 V,為電池包充電。它的工作原理是快速切換同步功率MOSFET并使電感電流斜坡上升。雙向轉換器在5 A負載下的開關波形如圖9所示。 圖8.以44 V輸入和63.2 A輸出負載運行時,放電工作模式期間主控制器和擴展器的開關波形。 圖9.以53 V輸入和5 A輸出負載運行時,充電模式期間主控制器的波形。 熱性能 必須仔細平衡熱性能和效率。BBU模塊必須能夠承受高溫并持續工作,而不會過熱,同時也要以理想效率運行,能夠將盡可能多的輸入功率轉化為輸出功率。在圖10中,在放電工作模式(滿負載運行約4分鐘)期間測得的電路板最差溫度僅為40°C至60°C。在充電模式下,同步MOSFET的溫度低于50°C。合理構建的空氣散熱系統可降低元器件的發熱量,防止熱失控。為避免電池堆過熱,需要設計合理的電芯間距和適當的氣流。參見圖11。 工作模式轉換 BBU模塊的工作模式轉換對于確保電源中斷或變化期間的不間斷供電至關重要。此過程包括將電池包能量順利傳輸到數據中心的背板,確保重要系統和設備保持正常運行4分鐘。BBU模塊持續監測背板母線電壓。當母線電壓在2 ms內下降至BBU模塊激活電平(48.5 V)時,BBU模塊背板電壓必須斜坡上升,以在2 ms內為母線提供全部功率。在整個轉換過程中,母線電壓不得降至46 V以下。BBU模塊檢測到母線電壓超過48.5 V并持續200 ms以上后,退出放電工作模式。參見圖12。 圖10.放電和充電工作模式下各自滿載運行時電路板的熱性能。 圖11.電池堆間隙設計。 圖12.從穩定狀態過渡到電源中斷狀態。 總結 為了節省能源,數據中心正在轉向采用48 V系統。由于電流、銅損和電源母線尺寸更小,48 V服務器機架在功耗、散熱、尺寸及成本方面比12 V服務器機架更具效益。前端無調節的高效率電路級,后面接一個根據適當負載調整的穩壓器,這樣的設計非常適合數據中心服務器微處理器和存儲器。這種高水平的思考,加上OCP的最新創新,為實現更高效的配電和智能備用電池單元設計奠定了基礎,從而可以支持連續和無縫的操作。 為BBU模塊和層板選擇并實現合適的器件可以簡化整體設計,延長電池使用壽命,縮短漫長的工程開發周期,并有效降低工程和生產成本。此外,提供機械仿真可以簡化原型制作步驟,獲得可用于改進散熱和熱管理的數據,并增強設計可靠性。最后,提供適當且精心設計的固件算法和序列可確保BBU輕松順利地運行。 本系列的第二部分將針對面向BBU一般管理任務的專門設計,介紹BBU模塊的各種主要微控制器功能和操作。此外,第二部分將更深入地概述如何監測有用信息,以及如何使用這些信息來構建和執行正確的工作流例程。 關于作者 Christian Cruz是ADI菲律賓公司的高級應用開發工程師。他擁有菲律賓馬尼拉東方大學的電子工程學士學位。他在模擬和數字設計、固件設計和電力電子領域擁有超過12年的工程經驗,包括電源管理IC開發以及AC-DC和DC-DC電源轉換。他于2020年加入ADI公司,目前負責支持基于云的計算和系統通信應用的電源管理需求。 Gary Sapia畢業于德克薩斯農工大學,修讀了電力電子和RF系統設計專業的高級技術課程,獲工程學士學位。他擁有超過28年的模擬系統設計和開發經驗,包括用于通信和GPS市場的電源轉換和高頻解決方案。在加入ADI公司之前,Gary在凌力爾特(現為ADI的一部分)擔任現場應用工程師18年,主要與思科和其他重要的灣區網絡公司開展合作。 Marvin Neil Solis Cabueñas畢業于菲律賓馬尼拉德拉薩大學,獲電子工程學士學位。在2021年加入ADI之前,Marvin曾在Azeus Systems菲律賓公司擔任系統工程師,然后在Technistock菲律賓公司擔任網絡工程師(2014年至2017年),并在2017年至2020年擔任諾基亞技術中心菲律賓公司的研發工程師。他在不同領域擁有超過十年的工作經驗,如嵌入式系統編程、數字信號處理、仿真建模等。目前擔任高級軟件系統工程師,負責ADI電源事業部的不同項目。目前正在攻讀菲律賓大學電氣工程碩士學位。 |