達(dá)爾文曾說過“能夠生存下來的生物, 既不是最強(qiáng)壯的, 也不是最聰明的, 而是最能夠適應(yīng)變化的物種。” 面對眼下經(jīng)濟(jì)的不確定性,很多企業(yè)在壓力下,被動進(jìn)入到“節(jié)衣縮食”的模式。推動企業(yè)減少支出,如何更好地“降本增效”更是上升為生存問題。 面對成本壓力,企業(yè)不再一味地追逐前沿的技術(shù),而是更加注重?cái)?shù)字化投資的平衡成本與收益,以確保獲得最大化的商業(yè)價(jià)值。然而,可怕的是,面對屢創(chuàng)新高的云支出,許多 IT 團(tuán)隊(duì)卻找不到成本失控的源頭。海外的部分企業(yè)由于上云后過高的 IT 成本,甚至一度掀起了“云回遷”的聲浪。 如何能夠在享受云計(jì)算這個(gè)巨大的創(chuàng)新引擎的同時(shí)又能夠清晰度量云成本,不被“成本刺客”所傷?這一定是 2023 年管理者的數(shù)字化必答題。 1 為什么云成本如此難以駕馭? 事實(shí)上,云成本問題在近年來已經(jīng)引起了很多企業(yè)管理者的重視,也有越來越多的企業(yè)通過優(yōu)化資源使用來進(jìn)行成本管控。可為什么“成本刺客”仍舊防不勝防呢?企業(yè)在云成本管理的過程中,主要面臨四大痛點(diǎn),可歸納為:投資看不清,成本不合理;大把資源閑置和資源浪費(fèi);難以動態(tài)響應(yīng)市場創(chuàng)新業(yè)務(wù)需求和變化;業(yè)務(wù) & 財(cái)務(wù) &IT 對評估投資協(xié)作不佳 。由于本文面向的對象主要是技術(shù)管理者與開發(fā)者,因此,著重對大把資源閑置和資源浪費(fèi)造成云成本失控的原因進(jìn)行分析,主要有以下三點(diǎn): 其一,是性能的浪費(fèi)。由于缺乏明確的衡量指標(biāo)和應(yīng)對策略,很多企業(yè)難以評估其在云端的實(shí)際性能需求,往往會過度采購云資源或使用不必要的高性能服務(wù)。此外,在使用過程中,為了保證應(yīng)用程序能夠正常運(yùn)行,工程師在配置云計(jì)算資源的時(shí)候也通常會選擇過度配置。 其二,是閑置資源無法快速釋放。由于企業(yè)需求的波動性,云資源的使用情況也會隨之發(fā)生變化。但是,如果企業(yè)在使用云資源時(shí)沒有采用自動化的管理策略,就會存在很多閑置的計(jì)算資源,導(dǎo)致企業(yè)付出了不必要的成本。 其三,是對數(shù)據(jù)存儲缺少分級和分層管理。缺乏分級分層管理會導(dǎo)致數(shù)據(jù)存儲在云環(huán)境中不受控制地增長,從而導(dǎo)致云成本的浪費(fèi)。同時(shí),由于沒有對不同數(shù)據(jù)類型的訪問頻率和重要性進(jìn)行分析,數(shù)據(jù)存儲和備份的策略也無法有效地優(yōu)化,從而增加了數(shù)據(jù)存儲的成本和復(fù)雜度。 面對如此多“成本黑洞”,如果企業(yè)不謹(jǐn)慎管理其云計(jì)算資源,必然會付出慘痛的后果。去年,印度一家名為 Paytm 的電子商務(wù)公司就因未能有效管理云計(jì)算資源而導(dǎo)致云成本相比 2021 年急劇增長 400%。2022 年,美國航空公司 Delta Airlines 也因同樣的原因而收到“天價(jià)”賬單。對于一些初創(chuàng)公司而言,云成本管理不當(dāng)造成的后果更為致命,海外初創(chuàng)公司 Milkie Way 曾因測試期間的疏忽,險(xiǎn)些導(dǎo)致公司破產(chǎn)。 以上案例并非個(gè)案,云成本管理問題是普遍存在的。Gartner 的一份報(bào)告指出,云成本浪費(fèi)是全球公有云市場的主要問題,估計(jì)云成本浪費(fèi)率約占總支出的 30%。451 Research 的研究表示,80%的受訪者認(rèn)為與云成本相關(guān)的不良管理已對其業(yè)務(wù)產(chǎn)生負(fù)面影響。 2 “成本刺客”如何退!退!退! 當(dāng)一種現(xiàn)象成為整個(gè)市場的痛點(diǎn),必然會催生出一系列應(yīng)對的方法和舉措。FinOps 的理念正是以此誕生并得到快速發(fā)展的。 FinOps 是指管理和優(yōu)化云計(jì)算成本的一種方法論和實(shí)踐,旨在幫助組織更好地理解和控制其云計(jì)算支出。其核心理念是讓所有涉及云計(jì)算成本的部門(開發(fā)、IT、財(cái)務(wù)等)更加緊密的協(xié)作,以便更好地進(jìn)行成本控制,實(shí)現(xiàn)的手段包括建立透明度、監(jiān)控和分析云資源的使用情況、采用自動化工具和流程等。 早在 2017 年 Joe Kinsella、J.R. Storment 等人就在亞馬遜云科技的 re:Invent 大會上提出過該理念。當(dāng)時(shí)他們認(rèn)為,隨著越來越多的企業(yè)將工作負(fù)載遷移到云上,云計(jì)算成本管理問題將會變得越來越復(fù)雜。因此他們創(chuàng)建了 FinOps Foundation 社區(qū),致力于幫助企業(yè)更好地管理和控制云計(jì)算成本。隨著時(shí)間的推移 FinOps 社區(qū)吸引了越來越多的人,其中包括亞馬遜云科技、Microsoft、Google 等云服務(wù)提供商代表和其他企業(yè)的 FinOps 專家。 FinOps 說到底是一種概念,具體的實(shí)踐與落地還是需要切實(shí)可行的工具和方案來推動。早期 FinOps 相關(guān)的產(chǎn)品主要是由多云管理的商業(yè)化公司推動,近兩年云廠商也加入了推動 FinOps 向前發(fā)展的隊(duì)伍。海外市場亞馬遜云科技推出了 FinOps 工具,如 Amazon Cost Explorer、Amazon Budgets 等。國內(nèi)市場頭部云廠商也相繼發(fā)力,阿里云推出 ACK FinOps 套件、騰訊云推出成本優(yōu)化開源項(xiàng)目 Crane 等。 一般來說,由云廠商提供的 FinOps 產(chǎn)品更便于與其自身的云平臺進(jìn)行深度整合,便于快速訪問和管理資源,可靠性和安全性更高且更具價(jià)格競爭力。唯一不足的是,由于不同云廠商間存在壁壘,因此,該類產(chǎn)品通常只適用于特定的云平臺。 3 一個(gè)戰(zhàn)略,七大路徑,實(shí)現(xiàn)云上降本增效 近年來,云服務(wù)提供商致力于將 FinOps 相關(guān)的工具和產(chǎn)品整合,形成了完整的云財(cái)務(wù)管理(CFM)戰(zhàn)略。其中以 FinOps 領(lǐng)軍者亞馬遜云科技的云財(cái)務(wù)管理(CFM)戰(zhàn)略最具代表性。亞馬遜云科技 云財(cái)務(wù)管理(CFM )戰(zhàn)略經(jīng)歷了從基礎(chǔ)設(shè)施成本管理到應(yīng)用程序與業(yè)務(wù)成本管理,再到如今提供一站式成本管理幾個(gè)階段,已發(fā)展得十分完善。 整個(gè)戰(zhàn)略有四大核心,分別是:成本可見性、成本優(yōu)化、規(guī)劃與預(yù)測和云財(cái)務(wù)運(yùn)營。 在成本可見性方面,亞馬遜云科技 云財(cái)務(wù)管理(CFM)建立了查看、度量與評估的一整套體系,通過云價(jià)值成本可視化報(bào)告,提供更加細(xì)顆粒度的核算,精細(xì)化進(jìn)行成本管理。在成本優(yōu)化維度,該戰(zhàn)略強(qiáng)調(diào)彈性優(yōu)化和利用資源。通過拍賣機(jī)制,以低成本的競價(jià)方式購買閑置資源從而降低采購成本,以分層管理的形式更有效地利用存儲資源,此外,無服務(wù)器模型根據(jù)調(diào)用次數(shù)計(jì)費(fèi),避免閑置計(jì)算資源的浪費(fèi)。在規(guī)劃與預(yù)測的策略上,該戰(zhàn)略采用數(shù)據(jù)驅(qū)動的預(yù)測分析,從而清晰可見地預(yù)測短期 / 長期成本,并通過架構(gòu)優(yōu)化服務(wù),使云支出預(yù)測的準(zhǔn)確性提升 35%。在云財(cái)務(wù)運(yùn)營上,亞馬遜云科技主張借助云財(cái)務(wù)管理(CFM)搭建云商數(shù)字化聯(lián)合團(tuán)隊(duì),財(cái)務(wù)、技術(shù)、業(yè)務(wù)從高層的戰(zhàn)略目標(biāo)開始合作規(guī)劃,優(yōu)化技術(shù)支出,把成本聚焦在可以為業(yè)務(wù)帶來競爭力的 IT 計(jì)劃。 該戰(zhàn)略具體是如何實(shí)踐起來實(shí)現(xiàn)云上降本增效的呢?亞馬遜云科技將其歸納為七條切實(shí)可行的方法,針對性的解決了因用量痛點(diǎn)導(dǎo)致的成本失控。 避免性能的浪費(fèi) • 選擇符合應(yīng)用需求和預(yù)算的實(shí)例類型 上云是否能帶來更低的成本?答案必然是肯定的。但誤區(qū)在于很多企業(yè)只是遷移到了云端,而沒有進(jìn)行后續(xù)的調(diào)整,那么,效果必然會受到影響。云廠商通常都提供有多種類型的實(shí)例,僅亞馬遜云科技提供的實(shí)例類型就有 600 多種,選擇最適合工作負(fù)載的實(shí)例配置,并根據(jù)需求變化不斷調(diào)整實(shí)例的類型,能夠有效消除未使用資源的間接成本。 • 選擇最適合預(yù)算的采購模式 不同的計(jì)費(fèi)模式也會影響云計(jì)算資源的使用和費(fèi)用。云服務(wù)提供商提供的最常見的計(jì)費(fèi)模式有按需付費(fèi)、預(yù)付費(fèi)、混合計(jì)費(fèi)模式等等。一般來說,按需付費(fèi)適合于對資源使用量不確定的企業(yè),但其成本相對較高。而預(yù)付費(fèi)則適合有長期穩(wěn)定的資源使用的企業(yè),通過預(yù)先支付一定費(fèi)用,獲得更高的資源使用量或者折扣。混合計(jì)費(fèi)模式則是將前兩者進(jìn)行結(jié)合,以更好地平衡成本和靈活性,企業(yè)需要合理評估不同計(jì)費(fèi)模式的優(yōu)缺點(diǎn),選擇最適合自己的模式。 • 遷移到 Amazon Graviton,獲得廣泛應(yīng)用的最佳性價(jià)比 相比計(jì)費(fèi)模式需要企業(yè)合理的對自身情況進(jìn)行評估,服務(wù)的選擇則更具規(guī)律性。一般來說,新的計(jì)算與存儲服務(wù),往往會擁有更高的性能與更低的成本。絕大多數(shù)的云服務(wù)都遵循這樣的優(yōu)化方向。例如,亞馬遜云科技新一代處理器 Amazon Graviton 就比同類的前一代基于 X86 的實(shí)力的性價(jià)比提高了 40% 以上。 • 在亞馬遜云科技上構(gòu)建和運(yùn)行您的應(yīng)用程序 事實(shí)上,不僅僅 Amazon Graviton 有如此大規(guī)模性價(jià)比的提升,自成立以來,亞馬遜云科技就將成本節(jié)約列為了首要任務(wù)之一,通過與處理器制造商合作、自研芯片等多樣性的方式,亞馬遜云科技在提升其服務(wù)性能、安全性、加速創(chuàng)新的同時(shí)已將價(jià)格降低了 115 次。 閑置資源快速釋放 • 利用無服務(wù)器計(jì)算優(yōu)化成本并加速創(chuàng)新 云平臺提供了強(qiáng)大、高性價(jià)比的計(jì)算和存儲資源,以滿足各種應(yīng)用程序的需求。然而,許多應(yīng)用程序在不同的時(shí)間段內(nèi)需要不同程度的資源。采用無服務(wù)器技術(shù)可以將計(jì)算資源分配到需要的時(shí)間和地點(diǎn),從而優(yōu)化資源利用率,減少了成本。此外,無服務(wù)器計(jì)算高可用性、彈性、靈活等特點(diǎn),也能夠?yàn)槠髽I(yè)提供更好的計(jì)算體驗(yàn)。 • 優(yōu)化你的資源能力以適應(yīng)需求 除了采用最新的服務(wù)和技術(shù),優(yōu)化資源適應(yīng)需求的能力也至關(guān)重要。過度配置資源會導(dǎo)致不必要的基礎(chǔ)設(shè)施成本,而配置不足則會導(dǎo)致應(yīng)用程序性能不佳。利用 Amazon Compute Optimizer 和 Amazon Auto Scaling 兩項(xiàng)服務(wù)就能夠精準(zhǔn)進(jìn)行配置,幫助用戶應(yīng)對需求的變化。 對數(shù)據(jù)存儲缺少分級和分層管理 • 利用亞馬遜云科技存儲,優(yōu)化您的工作負(fù)載成本 針對數(shù)據(jù)存儲缺少分級和分層管理導(dǎo)致資源浪費(fèi)的問題,亞馬遜云科技也給出了相應(yīng)的優(yōu)化方法。Amazon S3 Intelligent-Tiering 在 Amazon S3 的基礎(chǔ)上可以自動將對象分層,實(shí)現(xiàn)更精細(xì)的數(shù)據(jù)分層和更高效的存儲資源利用。而 Amazon EBS 和 Amazon EFS 則提供了多種不同性能和成本的存儲類型,用戶可以根據(jù)業(yè)務(wù)需求進(jìn)行選擇,以實(shí)現(xiàn)更加精細(xì)的資源分層和更低的成本。通過 Amazon EFS 智能分層技術(shù),最高能將存儲成本降低 92%。 綜上可見,亞馬遜云科技 云財(cái)務(wù)管理(CFM)是一套非常系統(tǒng)、靈活且完整的解決方案,能夠幫助企業(yè)在不確定性中尋找確定方向,通過“ 云財(cái)務(wù)管理(CFM)”,真正認(rèn)清云上業(yè)務(wù)價(jià)值,并持續(xù)演進(jìn)。在 VUCA 時(shí)代更需敏捷轉(zhuǎn)型,讓“ 云財(cái)務(wù)管理(CFM)”快速匹配、指導(dǎo)業(yè)務(wù)發(fā)展,以搶得市場先機(jī)。 在過往的實(shí)踐中,亞馬遜云科技 云財(cái)務(wù)管理(CFM)的效果也得到了很好地驗(yàn)證。MicroStrategy 是全球最大的獨(dú)立上市商業(yè)智能公司,提供領(lǐng)先的分析和移動軟件平臺。該公司通過采用亞馬遜云科技 云財(cái)務(wù)管理(CFM)戰(zhàn)略,將云計(jì)算的支出減少了 30%,每年節(jié)省 250,000 美元,提高了對云計(jì)算使用和支出的可見性,并用這部分省下來的費(fèi)用將培訓(xùn)資源和平臺增加了 50%。全球擁有數(shù)十億游戲玩家的 Wildlife Studios 公司,應(yīng)用亞馬遜云科技提供的戰(zhàn)略來優(yōu)化云成本,了解云上使用情況,將每年的云成本支出減少了 45%。這樣的案例在亞馬遜云科技的客戶中不勝枚舉。 未來,隨著越來越多企業(yè)上云進(jìn)程的逐步加深,云成本管理的實(shí)踐將會越來越普及。云財(cái)務(wù)管理(CFM)或許將成為許多企業(yè)必不可少的一項(xiàng)管理實(shí)踐。當(dāng)然,沒有哪個(gè)戰(zhàn)略或者方案是完美的。目前市面上的云成本管理解決方案仍面臨缺乏統(tǒng)一行業(yè)標(biāo)準(zhǔn)的問題,使得企業(yè)難以進(jìn)行比較和選擇最適合他們的產(chǎn)品。隨著新的技術(shù)的快速發(fā)展,云成本管理戰(zhàn)略也需要持續(xù)發(fā)展和演變,以適應(yīng)市場新的變化。 |