|
一些著名網頁下載工具
CyberArticle 網文快捕 (原名WebCatcher)
是一個保存/管理網頁的工具,主要功能有:可以在IE里面保存網頁,包括文字,圖片,Flash動畫等等。也可以保存選中的文字,圖片和鏈接等等;在一個樹形孔建里面管理保存下來的網頁。可以通過拖放來分類您的網頁;在一個可視化的編輯器里面編輯網頁;把網頁里面的所有元素保存在一個單一文件里面(*.book),保持您的磁盤清潔;可以把保存的網頁導出成CHM文件,這樣共向您的資料,就會變得非常簡單。在這方面,WebCatcher是一個非常實用的電子書制作工具;可以把.book文件轉換成可執行文件(*.exe);允許您將所有的網頁導出到文件加重。因此您可以復制這些文件到您的PDA上面進行閱讀;支持書籍文件的全文檢索,您可以快速的找到您的資料;可以很好的保護您的資料。您可以給書籍文件或者節點設置密碼。
GNU Wget
GNU Wget是一個免費軟件包,可以透過HTTP, HTTPS和FTP這些使用最廣泛的互聯網協議下載文件。該軟件是命令行工具不提供和用戶的交互。所以比較適合從系統腳本、cron任務、終端來調用。 GNU Wget有許多特性可以從大型網站或者FTP站點下載文件: 支持斷點續傳,使用REST和RANGE方法。支持文件通配符和循環鏡像目錄。支持多種語言的NLS-based報文文件。選項中包含超鏈接轉換,這樣下載下來的文檔中的絕對鏈接可以轉換為相對鏈接。這樣下載后的文檔可以在本地互相鏈接繼續使用。可以在UNIX環境中使用,也可以在Windows中使用。支持 HTTP and SOCKS 代理支持 HTTP cookies 支持持續 HTTP 連接后臺運行使用本地文件時間戳作為是否需要在此下載更新和鏡像備份。符合GNU GPL協議。
WebSuck WebSuck
可以讀取您指定的網頁同時檢查鏈接和數據文件。其中鏈接會被檢查合法性,數據則被整理成您選擇的格式(一般文本文件或者GetRight格式文件)。 這個軟件尤其適合下載包含許多數字照片的網絡相冊。該軟件提供許多選項來適應不同的網站布局。 所有命令行選項均可以透過圖形界面獲得,只需要在運行軟件時候加入一個參數:-gui 注意:WebSuck自己并不下載文件。您必須使用文件下載工具來下載文件。比如WebGet,或者把該軟件的輸出作為各種下載工具的列表來實現此目的。如UNIX下的Wget或者Windows環境中的GetRight。
Teleport
Teleport Pro 是一種通用的高速互聯網數據下載工具。它同時支持十個線程,可以訪問帶有密碼保護的網站,可以根據文件大小、類型來分類,支持關鍵字搜索等等。該軟件是目 前越發復雜的網絡環境中功能最全的、最健壯的網絡爬蟲類工具。Teleport Pro支持HTML 4.0, CSS2.0, DHTML等網站。同時支持服務器端圖形文件搜索、自動撥號連接、Java applet、搜索深度設置、項目定時啟動、沖鏈接能力等。無疑該軟件絕對就是最好的工具。該軟件可以: 把網站的全部或者部分下載到你的本地電腦。使得您可以以最快速度來瀏覽網站。創建抽取復制或者鏡像備份一個網站,包括所有的子目錄接口和所需文件。針對網站根據文件大小和類型搜索指定文件。根據已知地址列表下載文件。從中央網站向所連接的每個站點搜索。針對特定網站搜索關鍵字。把指定網站中的網頁及其文件羅列清單。 |
|