|
地板
發(fā)表于 2009-9-29 11:14:34
|
只看該作者
一些著名網(wǎng)頁下載工具
CyberArticle 網(wǎng)文快捕 (原名WebCatcher)
是一個保存/管理網(wǎng)頁的工具,主要功能有:可以在IE里面保存網(wǎng)頁,包括文字,圖片,F(xiàn)lash動畫等等。也可以保存選中的文字,圖片和鏈接等等;在一個樹形孔建里面管理保存下來的網(wǎng)頁。可以通過拖放來分類您的網(wǎng)頁;在一個可視化的編輯器里面編輯網(wǎng)頁;把網(wǎng)頁里面的所有元素保存在一個單一文件里面(*.book),保持您的磁盤清潔;可以把保存的網(wǎng)頁導(dǎo)出成CHM文件,這樣共向您的資料,就會變得非常簡單。在這方面,WebCatcher是一個非常實用的電子書制作工具;可以把.book文件轉(zhuǎn)換成可執(zhí)行文件(*.exe);允許您將所有的網(wǎng)頁導(dǎo)出到文件加重。因此您可以復(fù)制這些文件到您的PDA上面進行閱讀;支持書籍文件的全文檢索,您可以快速的找到您的資料;可以很好的保護您的資料。您可以給書籍文件或者節(jié)點設(shè)置密碼。
GNU Wget
GNU Wget是一個免費軟件包,可以透過HTTP, HTTPS和FTP這些使用最廣泛的互聯(lián)網(wǎng)協(xié)議下載文件。該軟件是命令行工具不提供和用戶的交互。所以比較適合從系統(tǒng)腳本、cron任務(wù)、終端來調(diào)用。 GNU Wget有許多特性可以從大型網(wǎng)站或者FTP站點下載文件: 支持斷點續(xù)傳,使用REST和RANGE方法。支持文件通配符和循環(huán)鏡像目錄。支持多種語言的NLS-based報文文件。選項中包含超鏈接轉(zhuǎn)換,這樣下載下來的文檔中的絕對鏈接可以轉(zhuǎn)換為相對鏈接。這樣下載后的文檔可以在本地互相鏈接繼續(xù)使用。可以在UNIX環(huán)境中使用,也可以在Windows中使用。支持 HTTP and SOCKS 代理支持 HTTP cookies 支持持續(xù) HTTP 連接后臺運行使用本地文件時間戳作為是否需要在此下載更新和鏡像備份。符合GNU GPL協(xié)議。
WebSuck WebSuck
可以讀取您指定的網(wǎng)頁同時檢查鏈接和數(shù)據(jù)文件。其中鏈接會被檢查合法性,數(shù)據(jù)則被整理成您選擇的格式(一般文本文件或者GetRight格式文件)。 這個軟件尤其適合下載包含許多數(shù)字照片的網(wǎng)絡(luò)相冊。該軟件提供許多選項來適應(yīng)不同的網(wǎng)站布局。 所有命令行選項均可以透過圖形界面獲得,只需要在運行軟件時候加入一個參數(shù):-gui 注意:WebSuck自己并不下載文件。您必須使用文件下載工具來下載文件。比如WebGet,或者把該軟件的輸出作為各種下載工具的列表來實現(xiàn)此目的。如UNIX下的Wget或者Windows環(huán)境中的GetRight。
Teleport
Teleport Pro 是一種通用的高速互聯(lián)網(wǎng)數(shù)據(jù)下載工具。它同時支持十個線程,可以訪問帶有密碼保護的網(wǎng)站,可以根據(jù)文件大小、類型來分類,支持關(guān)鍵字搜索等等。該軟件是目 前越發(fā)復(fù)雜的網(wǎng)絡(luò)環(huán)境中功能最全的、最健壯的網(wǎng)絡(luò)爬蟲類工具。Teleport Pro支持HTML 4.0, CSS2.0, DHTML等網(wǎng)站。同時支持服務(wù)器端圖形文件搜索、自動撥號連接、Java applet、搜索深度設(shè)置、項目定時啟動、沖鏈接能力等。無疑該軟件絕對就是最好的工具。該軟件可以: 把網(wǎng)站的全部或者部分下載到你的本地電腦。使得您可以以最快速度來瀏覽網(wǎng)站。創(chuàng)建抽取復(fù)制或者鏡像備份一個網(wǎng)站,包括所有的子目錄接口和所需文件。針對網(wǎng)站根據(jù)文件大小和類型搜索指定文件。根據(jù)已知地址列表下載文件。從中央網(wǎng)站向所連接的每個站點搜索。針對特定網(wǎng)站搜索關(guān)鍵字。把指定網(wǎng)站中的網(wǎng)頁及其文件羅列清單。 |
|