注:本文轉自 IBM DeveloperWorks 。 簡介 如果您聽說過 Node,或者閱讀過一些文章,宣稱 Node 是多么多么的棒,那么您可能會想:“Node 究竟是什么東西?”盡管不是針對所有人的,但 Node 可能是某些人的正確選擇。 為試圖解釋什么是 Node.js,本文探究了它能解決的問題,它如何工作,如何運行一個簡單應用程序,最后,Node 何時是和何時不是一個好的解決方案。本文不涉及如何編寫一個復雜的 Node 應用程序,也不是一份全面的 Node 教程。閱讀本文應該有助于您決定是否應該學習 Node,以便將其用于您的業務。 Node 旨在解決什么問題? Node 公開宣稱的目標是 “旨在提供一種簡單的構建可伸縮網絡程序的方法”。當前的服務器程序有什么問題?我們來做個數學題。在 Java™ 和 PHP 這類語言中,每個連接都會生成一個新線程,每個新線程可能需要 2 MB 配套內存。在一個擁有 8 GB RAM 的系統上,理論上最大的并發連接數量是 4,000 個用戶。隨著您的客戶端基礎的增長,您希望您的 web 應用程序支持更多用戶,這樣,您必須添加更多服務器。當然,這會增加業務成本,尤其是服務器成本、運輸成本和人工成本。除這些成本上升外,還有一個技術問題:用戶可能針對每個請求使用不同的服務器,因此,任何共享資源都必須在所有服務器之間共享。例如,在 Java 中,靜態變量和緩存需要在每個服務器上的 JVMs 之間共享。這就是整個 web 應用程序架構中的瓶頸:一個服務器能夠處理的并發連接的最大數量。 Node 解決這個問題的方法是:更改連接連接到服務器的方式。每個連接都創建一個進程,該進程不需要配套內存塊,而不是為每個連接生成一個新的 OS 線程(并向其分配一些配套內存)。Node 聲稱它絕不會死鎖,因為它根本不允許使用鎖,它不會直接阻塞 I/O 調用。Node 還宣稱,運行它的服務器能支持數萬個并發連接。事實上,Node 通過將整個系統中的瓶頸從最大連接數量更改到單個系統的流量來改變服務器面貌。 現在您有了一個能處理數萬條并發連接的程序,那么您能通過 Node 實際構建什么呢?如果您有一個 web 應用程序需要處理這么多連接,那將是一件很 “恐怖” 的事!那是一種 “如果您有這個問題,那么它根本不是問題” 的問題。在回答上面的問題之前,我們先看看 Node 如何工作以及它被設計的如何運行。 Node 肯定不是什么 沒錯,Node 是一個服務器程序。但是,它肯定不 像 Apache 或 Tomcat。那些服務器是獨立服務器產品,可以立即安裝并部署應用程序。通過這些產品,您可以在一分鐘內啟動并運行一個服務器。Node 肯定不是這種產品。Apache 能添加一個 PHP 模塊來允許開發人員創建動態 web 頁,使用 Tomcat 的程序員能部署 JSPs 來創建動態 web 頁。Node 肯定不是這種類型。 在 Node 的早期階段(當前是 version 0.4.6),它還不是一個 “運行就緒” 的服務器程序,您還不能安裝它,向其中放置文件,擁有一個功能齊全的 web 服務器。即使是要實現 web 服務器在安裝完成后啟動并運行這個基本功能,也還需要做大量工作。 Node 如何工作 Node 本身運行 V8 JavaScript。等等,服務器上的 JavaScript?沒錯,您沒有看錯。服務器端 JavaScript 是一個相對較新的概念,這個概念是大約兩年前在 developerWorks 上討論 Aptana Jaxer 產品時提到的(參見 參考資料)。盡管 Jaxer 一直沒有真正流行,但這個理念本身并不是遙不可及的 — 為何不能在服務器上使用客戶機上使用的編程語言? 什么使 V8?V8 JavaScript 引擎是 Google 用于他們的 Chrome 瀏覽器的底層 JavaScript 引擎。很少有人考慮 JavaScript 在客戶機上實際做了些什么?實際上,JavaScript 引擎負責解釋并執行代碼。使用 V8,Google 創建了一個以 C++ 編寫的超快解釋器,該解釋器擁有另一個獨特特征;您可以下載該引擎并將其嵌入任何 應用程序。它不僅限于在一個瀏覽器中運行。因此,Node 實際上使用 Google 編寫的 V8 JavaScript 引擎并將其重建為在服務器上使用。太完美了!既然已經有一個不錯的解決方案可用,為何還要創建一種新語言呢? 事件驅動編程 許多程序員接受的教育使他們認為,面向對象編程是完美的編程設計,而對其他編程方法不屑一顧。Node 使用一個所謂的事件驅動編程模型。 清單 1. 客戶端上使用 jQuery 的事件驅動編程 實際上,服務器端和客戶端沒有任何區別。沒錯,這沒有按鈕點擊操作,也沒有向文本字段鍵入的操作,但在一個更高的層面上,事件正在 發生。一個連接被建立 — 事件!數據通過連接接收 — 事件!數據通過連接停止 — 事件!為什么這種設置類型對 Node 很理想?JavaScript 是一種很棒的事件驅動編程語言,因為它允許匿名函數和閉包,更重要的是,任何寫過代碼的人都熟悉它的語法。事件發生時調用的回調函數可以在捕獲事件處編寫。這樣,代碼容易編寫和維護,沒有復雜的面向對象框架,沒有接口,沒有在上面架構任何內容的潛能。只需監聽事件,編寫一個回調函數,然后,事件驅動編程將照管好一切! 示例 Node 應用程序 最后,我們來看一些代碼!讓我們將討論過的所有內容綜合起來,創建我們的第一個 Node 應用程序。由于我們已經知道,Node 對于處理高流量應用程序很理想,我們就來創建一個非常簡單的 web 應用程序 — 一個為實現最大速度而構建的應用程序。下面是 “老板” 交代的關于我們的樣例應用程序的具體要求:創建一個隨機數字生成器 RESTful API。這個應用程序應該接受一個輸入:一個名為 “number” 的參數。然后,應用程序返回一個介于 0 和該參數之間的隨機數字,并將生成的數字返回調用者。由于 “老板” 希望它成為一個廣泛流行的應用程序,因此它應該能處理 50,000 個并發用戶。我們來看看代碼: 清單 2. Node 隨機數字生成器 啟動應用程序將上面的代碼放到一個名為 “random.js” 的文件中。現在,要啟動這個應用程序并運行它(進而創建 HTTP 服務器并監聽端口 80 上的連接),只需在您的命令提示中輸入以下命令:% node random.js。下面是服務器已經啟動并運行時它看起來的樣子: 訪問應用程序 應用程序已經啟動并運行。Node 正在監聽任何連接,我們來測試一下。由于我們創建了一個簡單的 RESTful API,我們可以使用我們的 web 瀏覽器來訪問這個應用程序。鍵入以下地址(確保您完成了上面的步驟):http://localhost/?number=27。 您的瀏覽器窗口將更改到一個介于 0 到 27 之間的隨機數字。單擊瀏覽器上的 “重新載入” 按鈕,將得到另一個隨機數字。就是這樣,這就是您的第一個 Node 應用程序! Node 對什么有好處? 到此為止,應該能夠回答 “Node 是什么” 這個問題了,但您可能還不清楚什么時候應該使用它。這是一個需要提出的重要問題,因為 Node 對有一些東西有好處,但相反,對另一些東西而言,目前 Node 可能不是一個好的解決方案。您需要小心決定何時使用 Node,因為在錯誤的情況下使用它可能會導致一個多余編碼的 LOT。 它對什么有好處? 正如您此前所看到的,Node 非常適合以下情況:您預計可能有很高的流量,而在響應客戶端之前服務器端邏輯和處理所需不一定是巨大的。Node 表現出眾的典型示例包括: • RESTful API 提供 RESTful API 的 web 服務接收幾個參數,解析它們,組合一個響應,并返回一個響應(通常是較少的文本)給用戶。這是適合 Node 的理想情況,因為您可以構建它來處理數萬條連接。它還不需要大量邏輯;它只是從一個數據庫查找一些值并組合一個響應。由于響應是少量文本,入站請求時少量文本,因此流量不高,一臺機器甚至也可以處理最繁忙的公司的 API 需求。 • Twitter 隊列 想像一下像 Twitter 這樣的公司,它必須接收 tweets 并將其寫入一個數據庫。實際上,每秒幾乎有數千條 tweets 達到,數據庫不可能及時處理高峰時段需要的寫入數量。Node 成為這個問題的解決方案的重要一環。如您所見,Node 能處理數萬條入站 tweets。它能迅速輕松地將它們寫入一個內存排隊機制(例如 memcached),另一個單獨進程可以從那里將它們寫入數據庫。Node 在這里的角色是迅速收集 tweet 并將這個信息傳遞給另一個負責寫入的進程。想象一下另一種設計 — 一個常規 PHP 服務器自己試圖處理對數據庫的寫入 — 每個 tweet 將在寫入數據庫時導致一個短暫的延遲,這是因為數據庫調用正在阻塞通道。由于數據庫延遲,一臺這樣設計的機器每秒可能只能處理 2000 條入站 tweets。每秒 100 萬條 tweets 需要 500 個服務器。相反,Node 能處理每個連接而不會阻塞通道,從而能捕獲盡可能多的 tweets。一個能處理 50,000 條 tweets 的 Node 機器只需要 20 個服務器。 • 映像文件服務器 一個擁有大型分布式網站的公司(比如 Facebook 或 Flickr)可能會決定將所有機器只用于服務映像。Node 將是這個問題的一個不錯的解決方案,因為該公司能使用它編寫一個簡單的文件檢索器,然后處理數萬條連接。Node 將查找映像文件,返回文件或一個 404 錯誤,然后什么也不用做。這種設置將允許這類分布式網站減少它們服務映像、.js 和 .css 文件等靜態文件所需的服務器數量。 它對什么有壞處? 當然,在某些情況下,Node 并非理想選擇。下面是 Node 不擅長的領域: • 動態創建的頁 目前,Node 沒有提供一種默認方法來創建動態頁。例如,使用 JavaServer Pages (JSP) 技術時,可以創建一個在這樣的 JSP 代碼段中包含循環的 index.jsp 頁。Node 不支持這類動態的、HTML 驅動的頁面。同樣,Node 不太適合作為 Apache 和 Tomcat 這樣的網頁服務器。因此,如果您想在 Node 中提供這樣一個服務器端解決方案,必須自己編寫整個解決方案。PHP 程序員不想在每次部署 web 應用程序時都編寫一個針對 Apache 的 PHP 轉換器,當目前為止,這正是 Node 要求您做的。 • 關系數據庫重型應用程序 Node 的目的是快速、異步和非阻塞。數據庫并不一定分享這些目標。它們是同步和阻塞的,因為讀寫時對數據庫的調用在結果生成之前將一直阻塞通道。因此,一個每個請求都需要大量數據庫調用、大量讀取、大量寫入的 web 應用程序非常不適合 Node,這是因為關系數據庫本身就能抵銷 Node 的眾多優勢。(新的 NoSQL 數據庫更適合 Node,不過那完全是另一個主題了。) 結束語 問題是 “什么是 Node.js?” 應該已經得到解答。閱讀本文之后,您應該能通過幾個清晰簡潔的句子回答這個問題。如果這樣,那么您已經走到了許多編碼員和程序員的前面。我和許多人都談論過 Node,但它們對 Node 究竟是什么一直很迷惑。可以理解,他們具有的是 Apache 的思維方式 — 服務器是一個應用程序,將 HTML 文件放入其中,一切就會正常運轉。而 Node 是目的驅動的。它是一個軟件程序,使用 JavaScript 來允許程序員輕松快速地創建快速、可伸縮的 web 服務器。Apache 是運行就緒的,而 Node 是編碼就緒的。 Node 完成了它提供高度可伸縮服務器的目標。它并不分配一個 “每個連接一個線程” 模型,而是使用一個 “每個連接一個流程” 模型,只創建每個連接需要的內存。它使用 Google 的一個非常快速的 JavaScript 引擎:V8 引擎。它使用一個事件驅動設計來保持代碼最小且易于閱讀。所有這些因素促成了 Node 的理想目標 — 編寫一個高度可伸縮的解決方案變得比較容易。 與理解 Node 是 什么同樣重要的是,理解它不是 什么。Node 并不是 Apache 的一個替代品,后者旨在使 PHP web 應用程序更容易伸縮。事實確實如此。在 Node 的這個初始階段,大量程序員使用它的可能性不大,但在它能發揮作用的場景中,它的表現非常好。 將來應該期望從 Node 得到什么呢?這也許是本文引出的最重要的問題。既然您知道了它現在的作用,您應該會想知道它下一步將做什么。在接下來的一年中,我期待著 Node 提供與現有的第三方支持庫更好地集成。現在,許多第三方程序員已經研發了用于 Node 的插件,包括添加文件服務器支持和 MySQL 支持。希望 Node 開始將它們集成到其核心功能中。最后,我還希望 Node 支持某種動態頁面模塊,這樣,您就可以在 HTML 文件中執行在 PHP 和 JSP(也許是一個 NSP,一個 Node 服務器頁)中所做的操作。最后,希望有一天會出現一個 “部署就緒” 的 Node 服務器,可以下載和安裝,只需將您的 HTML 文件放到其中,就像使用 Apache 或 Tomcat 那樣。Node 現在還處于初始階段,但它發展得很快,可能不久就會出現在您的視野中。 |