計算機的云計算已經舍我其誰地成為了現今互聯網發展的主題,其延伸和發展出的云存儲也當仁不讓地成為了主流的數據存儲和管理方式。云存儲系統正逐步成為網站和網絡服務方用于存放管理自己數據信息的主要選擇。云那頭究竟風景如何,讓我們來探個究竟。 圖片來源gocloudcomputing.com 根據科技網站ExtremeTech的統計,整個互聯網的下載流量中,有40%是訪問YouTube這樣的視頻網站產生的;色情網站則占了另一大山頭,占據整體流量的30%;剩下的30%由網絡硬盤數據下載、訪問網址、電子郵件等日常網絡服務產生。當電腦前的人們從互聯網上獲取信息時,大概沒有人會去關注信息究竟來自何處。如果大家順藤摸瓜,便可以發現這些信息中的絕大部分都來源于互聯網的云端。 如今提供云存儲服務的服務商不僅有亞馬遜(旗下Amazon Web Services),微軟(旗下Microsoft Azure)和谷歌(旗下Google Drive)這樣的網絡巨頭,還有成百上千的小公司機構。他們中或擁有一整個數據中心,或只有幾個機箱的存儲設備,規模參差不齊。從這些大大小小的公司身上我們大可窺探整個云儲存產業的火爆程度。 云計算因其出眾的能力備受青睞,它可以最快的效率為網絡中的任何一方提供相關服務。谷歌麾下單單一個為YouTube服務的“云團”就可以存儲管理幾個PB(1PB=1024TB)的數據。云計算可以有幾TB的RAM與幾千核的CPU,遠非傳統計算機可比。而云計算延伸發展出的云存儲又究竟有著怎樣的魅力,引得谷歌、微軟和Dropbox這樣的巨頭競相折腰?讓我們從數據入手。 數據規模 微軟的一個數據中心 通常,谷歌、Facebook、亞馬遜和微軟這樣的大公司都很少對外發布自己的詳細數據。不過如果用心去多方核查,還是可以得到一些大概的數值:
帶寬 關于帶寬我們能獲得的數據就更加的有限了。有數據顯示去年全球內每五分鐘都有100萬份數據被下載。今年的網絡用戶比去年多了3倍,那么今年每分鐘的下載數量達到了80萬的水平。亞馬遜的S3作為全球網絡存儲之首,對外宣布他們的服務器每秒鐘要處理的下載請求達到了65萬份。
云的成本分析(以Backblaze為例) 我們知道,以上云存儲服務商都不允許用戶在他們的云端下載自己的軟件,也不允許用戶在自己的云端存儲涉及自己公司硬件數據的信息。不過這個行業內有這么一個例外,它就是Backblaze。特立獨行的Backblaze作為云備份服務提供商來說無法在規模上和上述巨頭相比,不過也別小看它,它的數據肯定會讓你大吃一驚。 Backblaze對外公布,自己管理著32PB的用戶數據。這些數據基本上都被儲存在容量為3TB容量的硬盤內。在處理數據冗余方面,Backblaze把每15個硬盤捆綁為一個磁盤數組,每兩組用RAID 6效驗處理。RAID 6可以校驗重組硬盤傳輸的數據錯誤,同時快捷有效地恢復磁盤錯誤與讀取錯誤,這對于一個數據中心而言是至關重要的。 Backblaze的服務器以每月3PB的速度擴張,他們每一段時間新增一個135TB的定制4U數據盒(此盒內裝置了45個3TB的硬盤)。每月3PB也就是說每月新增大概22個數據盒,相當于每月增加一個48U的機柜。 每個定制數據盒的花費在7384美元,乍看起來每月添置這么多的數據盒真是一筆不小的運營支出,但這筆開銷可以算是Backblaze財務報表內最小的一塊。電費、房租和帶寬開銷才是主要的資金負擔,這些費用保持著與時俱進的態度漲個不停。 Backblaze公司的電費是0.2美元每千瓦時,每個數據盒的每月電費就要100美元。由此可見一個數據中心要負擔的電費是相當高昂的,所以多數網絡公司都選址建于電費相對低廉的地區,比如美國的俄勒岡州(Oregon)。Backblaze并沒有屬于自己的數據中心,他們租用第三方的數據中心存放自己的服務器,也就是說他們每個月還要負擔房租開銷(每個機柜平攤下來月房租為1000美金)。目前Backclaze手下約有300個數據盒,40 個機柜,也就是說每月的電費為30000美元,房租為40000美元。 然后就是帶寬的費用了。Backblaze一直采用12Gbps的境內帶寬(每秒傳輸速度約為1.5GB)和500Mpbs的境外帶寬(每秒傳輸速度約為62.5MB)。之所以兩條線路速度不同是因為Backblaze作為一家提供云備份服務的公司,客戶主要分布在美國國內。但500Mbps的帶寬是非常不流暢的,我們可以想象境外用戶在使用Backblaze時的網絡很不理想。目前Backblaze每天要接受約一億份來自用戶的文件,折合每年 365億份。數字顯示了一個很驚人的發展速度,因為這個數字在2011年還僅僅只有6億。我們不知道一臺計算機具體能夠儲存多少文件,但按照每臺5000 個文件估算(不包括Windows系統文件及program files文件夾文件),保守估計至少有120000臺計算機在Backclaze上做了文件備份。 在Backblaze的初創期,他們每月每Mbps的帶寬費用是30美元,不過現在這個開銷已經下降到每月每Mbps 2美元了。估算公司每月負擔的帶寬費用在25000美元上下。如果Backblaze選擇更為廉價的帶寬服務商,并且建立屬于自己的數據中心而不是租用別人的地皮,公司的費用還有很大的下行空間。綜上所述,合理地考慮房租、帶寬開銷和用電費用后,運營一個40PB規模的“云團”(不計員工工資)每月要耗費 10萬美元。 云的收益分析 圖片來源nytimes 以微軟、谷歌和Dropbox為代表的大批公司都爭先恐后地入駐云儲存領域。為占領市場份額,各公司之間所做的激烈競爭也是路人皆知。各方英雄鹿逐中原究竟為何原因,看了以下數字你就知道了。 以Backblaze為例,Backblaze提供的無限空間網絡備份服務每月收費5美元。上文推導得出該公司每月負擔的費用在10萬美元上下(不計員工工資),也就是說為了達到收益——支出平衡它需要20000個用戶。Backblaze究竟有多少用戶我們不得而知,不過公司的CEO對外宣稱公司是很賺錢的。(Backblaze只有13個員工,順便說一下,他們沒有被拖欠工資) Dropbox公司可以做一個更好的例子。Dropbox提供的50GB網絡存儲服務收費為每年100美元。與Backblaze不同,Dropbox沒有屬于自己的信息存儲設備,他們連設備都是租的。Dropbox把自己的數據存儲在亞馬遜的S3服務器中,儲存規模達到了40PB。對于存儲規模在5PB以上的客戶,亞馬遜的收費標準為每月每GB0.055美元。假設購買了Dropbox50GB容量存儲服務的普通客戶平均在云端存有 25GB文件,那么Dropbox每月要為每一個客戶支付給亞馬遜1.38美元,而他們每月可以從客戶手上拿到近10美元。這樣的利潤是可觀的,但事實上像微軟Skydrive、谷歌Drive和亞馬遜S3這樣自己擁有數據中心的云存儲服務商能到手的收入比這更多。 話說回來以上利潤估值只是一個理想值,它建立在用戶為付費用戶的前提之上。然而在現實中有很多人只選擇了免費的云儲存服務。Dropbox有一億客戶,其中的絕大部分都是非付費用戶,付費用戶的數字相當有限。所以他們到手的利潤也沒有理想中那么豐厚。 云時代 圖片來源talkcloudcomputing.com 對于各大企業來說,入駐云儲存領域更大的動機還是出于發展戰略的考慮。谷歌和微軟兩個老對手已經把云計算作為了他們的下一個戰場。微軟可能會將云計算服務于Windows 8系統,屆時用戶只需登錄自己的網絡賬戶就可以把計算機上所有的文件和設置同步到云端。此時的“個人電腦”將成為一個全新的概念,它將不再依托于我們面前的電腦設備,用戶可以隨意更換電腦,甚至只要用任何一臺可以上網的機器(比如PS 3)連接進入自己的賬戶,就可以使用屬于自己的“電腦”。谷歌也會把自己的Chrome系統打造為“云上系統”,完全地基于網絡。不僅是Chrome,新的安卓系統也會朝著云計算的方向靠近。在不遠的將來谷歌會把自己旗下的一系列產品通過計算機云整合起來,建立一個全新的“云時代”。 最終,這些網絡巨頭將把移動設備和個人電腦通過計算機云融為一體。用戶如果習慣使用谷歌的辦公和數據存儲系統,他可以使用Chrome系統加上安卓手機,因為這兩者已經通過谷歌的計算機云合為一體。用戶如果鐘情于微軟的辦公及數據儲存系統,那么Windows 8加Windows Phone 7就是他最好的選擇。如今的蘋果也已經推出了iCloud服務,用戶使用任何一臺iPad、iPhone 4S或是Mac Pro和Mac Air登陸自己的iCloud賬戶都可以把相當一部分的信息上傳到云端,云儲存幫助蘋果打通了設備之間的隔閡。等到微軟、谷歌和蘋果都把計算機云整合到自己的操作系統內部,建立起屬于自己的網絡軍團時,不知Dropbox這樣的孤兵散將又該何去何從。 文章編譯自ExtremeTech網站: How big is the cloud? 作者: Sebastian Anthony |