隨著物流行業規?焖僭鲩L,面對海量C端用戶及行業客戶,如何提供高效、可靠、安全的物流IT服務,提升物流服務差異化競爭力,是包括順豐在內的很多頭部物流企業的探索和實踐的方向。 7月8日,華為開發者大會2023 ( Cloud )在廣東東莞華為溪流背坡村正式召開,順豐科技運維專家金可印先生受邀出席大會,在確定性運維專題論壇上圍繞《順豐科技確定性運維實踐》進行主題分享,與全球開發者一起碰撞出新的火花與靈感,探索新的創新方向和可能。 順豐科技快遞+業務運維架構(1+1+1):1個底座,1套體系,1套能力,保障業務高可用 在應對多行業個性化物流需求時,順豐智慧物流通過構建“1+1+1”運維架構:一個混合云底座,一套保障體系,一套穩定性能力,并結合華為云實踐經驗,構建確定性運維能力,做到故障的可防、可控,保障系統高可用,支撐業務快速發展。 一個底座:構建統一云底座,通過云上DevOps、應用云原生改造、IT治理,實現業務敏捷,快速交付 為滿足業務敏捷性和時效性的需求,順豐科技和華為云聯合創新,基于華為云CodeArts,順豐科技實現了云上敏捷 DevOps開發,覆蓋軟件開發全流程,從需求規劃-迭代管理-代碼托管-CICD流水線-測試,應用上線效率提升了3倍,發布成功率達99.5%,線上漏洞數減少29%。順豐科技與華為云合作實現了100多套業務系統云原生改造和全面上云,同時構建了云上IT治理體系覆蓋組織管理、項目管理、資源管理等八大方向,更好地匹配業務發展需要。 一套體系:系統保障體系建設,實現故障可防可控 在變更風險可控上,順豐通過通過自動化、可灰度、可快速回退來控制變更的風險。變更的自動化可以帶來變更效率的提升,并且降低人為操作帶來的風險,保障自動化引起故障的爆炸半徑,確保當自動化程序出錯時,影響控制在可控的范圍之內。 在可觀測性方面,結合華為云AOM、CES、APM、LTS、CES等云監控服務,順豐從用戶層、業務層、應用層、基礎資源層打造立體化的監控體系,可以實時監控系統各項指標,更好地監控和檢測系統的運行情況。通過全面提升IT系統的可觀測性,支持復雜故障快速排查定位,并實現網絡運維從被動響應到主動預防,將有效保證用戶網絡的業務連續和穩定運行。 同時在一些重要節點,為確保故障發生后最快地恢復業務,順豐科技構建了應急處置體系,在“雙11”、“618”等重要電商購物節通過重大事件保障來保障系統穩定。 一套能力:系統穩定性能力構建,實現應用高可用 在面對海量B端客戶服務,順豐科技在華為云上構建跨region的多活高可用架構,從使多活流量接入、多活流量業務改造、多活區域監控得到全方位的業務故障切換及容災備份能力。結合架構健康度、工程能力和韌性健康度,確保不同地點的物理系統能夠提供連續的業務穩定持續在線,實現RPO指標達到秒級、RTO<30分鐘,業務穩定性大幅度提升。 順豐科技基于AIOps規劃——將運維智能化、“確定性”化 金可印先生表示,順豐智慧快遞體系在確定性運維、云原生技術等領域將繼續探索AIOps方面的全新應用,通過AIOps,實現更快的告警事件響應、專注打造更加一體化的“統一運維平臺”、更加自動化的告警處置,圍繞人工智能技術來對智慧快遞中的繁雜的運維工作自動化處理,解放生產力,以專注創新和創造更好的運維工具產品以提高告警的快速響應能力,進而為最終用戶提供更好的產品和服務體驗! 未來,順豐科技智慧快遞業務將更加專注于AI技術在運維領域的探索和應用。在運維領域中,去探索一些場景的匹配、應用和落地,在這些場景中進一步降本提質增效,讓運維部門在商業鏈條中發揮更大的價值,降低企業的IT成本,提升整體運維能力,持續建立一個高效、平穩、安全的運維系統平臺,支撐業務發展、轉型和創新。 |