前幾年在網上出現了一個“一鍵清理系統垃圾文件.bat”,這個簡單又方便的批處理很快就傳開了。而且到現在還是很紅。很多人都在用這個批處理清理Windows系統垃圾文件。大多數人覺得方便好用,也不管它的原理是什么,而一些喜歡搞清楚“為什么”的朋友也多少了解其中的原理。大家都認為這個批處理很安全,不會破壞系統中的正常文件,可以放心地使用。不過真的是這樣嗎?@echo off echo 正在清除系統垃圾文件,請稍等...... del /f /s /q %systemdrive%\*.tmp del /f /s /q %systemdrive%\*._mp del /f /s /q %systemdrive%\*.log del /f /s /q %systemdrive%\*.gid del /f /s /q %systemdrive%\*.chk del /f /s /q %systemdrive%\*.old del /f /s /q %systemdrive%\recycled\*.* del /f /s /q %windir%\*.bak del /f /s /q %windir%\prefetch\*.* rd /s /q %windir%\temp & md %windir%\temp del /f /q %userprofile%\cookies\*.* del /f /q %userprofile%\recent\*.* del /f /s /q "%userprofile%\Local Settings\Temporary Internet Files\*.*" del /f /s /q "%userprofile%\Local Settings\Temp\*.*" del /f /s /q "%userprofile%\recent\*.*" echo 清除系統LJ完成! echo. & pause 嗯,非常簡單的幾行代碼,作用卻不小。我們把它分解看看。 del /f /s /q %systemdrive%\*.tmp del /f /s /q %systemdrive%\*._mp del /f /s /q %systemdrive%\*.log del /f /s /q %systemdrive%\*.gid del /f /s /q %systemdrive%\*.chk del /f /s /q %systemdrive%\*.old 這幾行代碼是刪除系統盤根目錄冗余文件的,沒什么問題,繼續分解。 del /f /s /q %systemdrive%\recycled\*.* 如果我沒有理解錯,這一行代碼的作用是刪除回收站中的文件。不過,recycled是FAT32格式下的回收站文件夾,如果你的硬盤不曾使用過FAT32格式,一般不會出現這個文件夾,F在的Windows系統盤普遍已經采用NTFS格式,及有可能不存在recycled文件夾,所以這一行代碼在大多數情況下,是無效的。而在它有效的情況下,不經用戶確認就直接刪除回收站中的文件,容易造成難以挽回的損失。此為誤區一。 del /f /s /q %windir%\*.bak 這句的作用是刪除Windows目錄下的備份文件,也沒有什么問題。 del /f /s /q %windir%\prefetch\*.* prefetch中存放的是預讀文件,可以加快程序啟動速度。如果你的操作系統還是安裝在機械硬盤中,把它刪除了,雖然能夠加快丁點電腦開機時間,但運行常用程序時會付出更多的時間。此為誤區二。 rd /s /q %windir%\temp & md %windir%\temp 這一行代碼的作用是清理系統臨時文件夾中的臨時文件。先把臨時文件夾刪除,然后再創建。如果系統盤是FAT32文件格式下,這一行代碼沒什么副作用。但如果系統盤的文件格式是NTFS,它會破壞系統文件夾原有的權限設置,造成一些軟件的運行異常。這種異常較難排查(很多人都想不到是因為清理垃圾文件造成的),特別是在服務器中表現尤為常見。此為誤區三。 del /f /q %userprofile%\cookies\*.* cookies的作用大家都很了解了,讓我們在論壇、博客、微博等需要輸入用戶名、密碼的地方不需要頻繁輸入的好東西,它的作用不只如此,不少朋友使用“一鍵清理系統垃圾文件.bat”時都把這句去掉了。姑且把它算為誤區四吧。 del /f /q %userprofile%\recent\*.* del /f /s /q "%userprofile%\recent\*.*" 把這兩行代碼放在一起看。這兩行讓我糾結了很久,我一直以為是自己找到的“一鍵清理系統垃圾文件.bat”有問題,可是在搜索引擎來回翻騰了幾圈下來發現,確實沒有錯……這兩行代碼的作用是一樣的,不過有后一行就夠了,前一行是 多余+無效 。%userprofile%路徑必須加引號才能在批處理中正確識別。此行的作用是刪除最近打開的文檔列表,而把它清空后,就不能快速地從最近打開的文檔列表找到剛剛打開過的文檔,這樣是否方便了電腦的使用,就見仁見智了。此乃誤區五。 del /f /s /q "%userprofile%\Local Settings\Temporary Internet Files\*.*" 刪除IE臨時文件,其實我們只要把IE臨時文件夾的大小設置一個適當的值,通常就可以不用去管它了(推薦100M-200M之間)。Xiaowo遇到過需要清空它的情況有兩種:1、打開網頁緩慢、網頁元素無法更新,這是由于IE臨時文件夾磁盤空間設置過大造成的,把其值設置小一些就行了;2、通過IE瀏覽器看在線視頻時無法緩沖,只要把這個文件夾清空一般就能解決問題。 del /f /s /q "%userprofile%\Local Settings\Temp\*.*" 這是最后一個誤區。此行代碼的作用是刪除當前帳戶臨時文件夾中的臨時文件,不過它只刪除了文件,卻留下了許多空文件夾(del命令只能夠刪除文件,不能夠刪除文件夾)。久而久之,臨時文件夾中就留下了大量無用的空文件夾,沒有完全達到清理垃圾的目的。 以上特別列出了的六點,就是“一鍵清理系統垃圾文件.bat”中的六個誤區,通過對此批處理的分解后,Xiaowo猜測,作者編寫此批處理時是基于 FAT32文件系統格式。雖然代碼上存在一些瑕疵,但不可否認,在很多人都才剛剛開始接觸電腦的時候(包括Xiaowo),就已經有人編寫出了這么優秀的批處理,作者確實是一個讓人佩服的電腦高手。相信在我寫這篇博客的時候,自認為已經高出當時的自己幾個段位了,而現在的批處理作者必定也還是高于現在的 Xiaowo幾個段位的。 不過“一鍵清理系統垃圾文件.bat”畢竟是FAT32時期的產物,已經有點不適應現在的Windows系統環境了,希望大家在使用此批處理時,能夠知道它的具體作用,優點與缺點,懂得根據自己的需求取舍其中的代碼。這也就達到Xiaowo寫這篇博客的目的了。 搜索引擎的認識誤區與技術展望 搜索結果越多越好,技術差距決定優劣,SEO可以提高搜索排名……,媒體和公眾對搜索引擎的這些普遍認知,其實都是嚴重的認識誤區。聚合規則,排序方法,展現方式,將成為未來搜索引擎競爭的關鍵,而競價排名,將隨著競爭的展開逐步退出歷史舞臺。 隨著360搜索的上線以及3B大戰的展開,網絡愛好者們對搜索引擎技術及市場的討論成為近期的互聯網小熱點。筆者也向多位搜索技術專家進行了求教,并與身邊朋友進行了探討,結果發現,人們對于搜素引擎普遍存在嚴重的認識誤區。 誤區一:搜索結果越多越好 描述:“搜索一個關鍵詞,哪個搜索引擎給出的結果多,哪個搜索引擎就比較好!边@是最普遍存在,但也是最不科學的一種認識誤區。不僅很多普通用戶這樣認為,就是很多大眾媒體,在報道搜索市場大戰時,也會采用這種簡單的評判方式來對比搜索引擎的性能。 分析:大量專業研究資料顯示(筆者自查),在搜索結果中,首頁首條的關注度是100%,前3條的關注度超過90%,前10條的關注度約為80%-85%,其后各條結果的關注度和點擊率便直線下降,翻看第二頁的用戶只有20%左右,而翻看第三頁的用戶通常不超過1%。所以說,2頁(最多3頁)以后的搜索結果,對于 99%以上的用戶來說是毫無意義的。 另外,搜索結果多也不一定代表搜索的信息量更大。比如,我們搜索某條熱點話題,搜索引擎往往會將不同網站轉載的同一篇文章依次羅列,甚至會將同一篇文章的各頁回復也羅列出來。有時,同一個網頁也會多次出現在一次搜索的結果當中。通常來說,在10萬條搜索結果中,真正有價值的差異化信息往往不足1000條。 結論:搜索結果有1萬條還是100萬條,其實沒有本質差別,因為幾乎沒有人會查看100條以后的搜索結果。比較搜索引擎好壞的關鍵是要看誰能在前三頁,特別是首頁前幾條,向用戶提供最可靠和最有價值的信息。 技術展望:搜索結果的“聚合”與“排序”方式的創新會成為未來幾年重要的發展方向:首先,大量同質化的信息會被聚合成一條或兩條搜索結果,而具體網頁的羅列則會展現在二級頁面或擴展窗口中,從而大大提高搜索首頁顯示的信息量;其次,搜索引擎還會像微博那樣,標示相似信息最初的發布源頭。在未來的競爭中,誰能提供更好的聚合與排序,誰就能吸引更多的用戶使用。 誤區二:搜索引擎之間的技術差距很大 描述:Google技術最好,百度次之,其他搜索引擎的技術都很攔,而且不是一天兩天能夠桿上的。這是很多JY人士的共同觀點。 分析:這是典型的不懂技術的人的技術觀點。Google問世已經有14年了,但從應用的角度看,搜索技術仍然停留于文字檢索或符號檢索。雖然圖像檢索和視頻檢索的研究已經持續了近10年之久(筆者是這個領域的專家),但由于應用成本太高,因此至今尚未實現大規模的民用化。 也就是說,目前在搜索領域占絕對主導地位的文字檢索,實際上已經經歷了10余年的廣泛應用,其主要的或核心的技術方法不僅早為業界熟知,而且在各類學術期刊上也都可以查到,實在談不上還有什么像樣的技術秘密了。 結論:文字搜索是一種非常成熟的搜索技術,雖然不同引擎的具體技術實現會有一定的差別,但核心的技術方法都是大同小異。造成搜索結果存在差異的主要原因,其實是搜索結果更新周期的不同,以及信息的排序方法和整合方法的不同。 技術展望:未來搜素引擎的競爭,將不再是核心技術方法的競爭,而是內容整合,結果聚合以及信息排序等外圍技術和展現方式的競爭。當然,更新速度的比拼在一定時間內還會持續,不過不會持續很久。 誤區三:網頁優化(SEO)可以提高搜索排名 描述:SEO(Search Engine Optimization),意為搜索引擎優化。主要目的是增加特定關鍵字的曝光率以增加網站的能見度。具體方法是通過研究各類搜索引擎的抓取規則和排序規則,對網頁進行相關的優化,從而提高網頁在搜索結果中的排名。SEO是比較專業的技術方法,目前已經形成產業,很多規規矩矩的網站都希望能通過SEO來增加訪問量。 分析:自從某些主流搜索引擎推出競價排名之后,SEO就淪為一種垃圾技術。這是因為,如果不能在熱搜詞中排名靠前,那么做SEO的價值就不大;但是,一旦某個詞匯成為熱搜詞,那么這個詞匯就會被競價拍賣。到頭來,做再多的網頁優化,也會被競價系統擠出前3頁。如前所述,上不了前3頁,所有的勞動就都是無用功,純屬瞎掰。 結論:競價排名沒啥技術含量,但卻足以謀殺任何專業的SEO技術。在中國,錢永遠是TMD老子,技術永遠是TMD孫子。 技術展望:競價排名不死,還瞎展望個啥! 誤區四:搜索結果由搜索引擎自動生成 描述:搜索引擎的信譽就是搜索結果的公正性。因此,每一家搜索引擎都會宣稱其搜索結果是搜索引擎自然生成的。不過,這一點很少會有用戶相信。 分析:在競價排名體系中,含熱搜詞的網頁搜索結果的前3頁基本都是人工干預出來的。競價上去的自然是人工干預的,那些看起來不像競價上去的,其實也是人工干預出來的,是用來給搜索結果的公正性作偽裝的。 結論:進行熱搜詞搜索時,99%的用戶看到的都是人工干預的結果,但翻過前幾頁之后,我們還是可以看到自動生成的排序結果。 技術展望:如果沒有激烈的市場競爭,競價排名下的人工干預還將是中國搜索的主流。搜索技術的研究實際上已經沒有什么意義了,反正都是錢說了算。 誤區五:新聞搜索是網絡熱點的聚合 描述:主流搜索引擎大多聲稱其新聞首頁是網絡新聞和熱點的聚合。從內容和結果來看,似乎也是八九不離十。 分析:中國最大的新聞網站莫過于四大門戶(搜狐、新浪、網易、騰訊)、鳳凰網和新華網等。不過,我們點開百度新聞首頁的鏈接,進入的基本都是一些不知名的小網站,很難看到上述大站的身影,甚至連知名報刊雜志的網頁版內容也很難上百度的新聞首頁。 Google新聞首頁的情況好得多,至少一半的新聞鏈接來自門戶及大站。而讓筆者最為驚訝的是,在搜狗的新聞首頁中,東家搜狐的連接竟然與另外三大門戶網站差不太多,而四大門戶及鳳凰網和新華網等的連接總量占比超過,70%。 上述情況大家可以親自驗證一下。 結論:即便是相同的新聞內容,某些搜索引擎也會根據自身的利益需求來選擇新聞源。所謂的熱點聚合,其實只是利益驅使的外部偽裝而已。當然,也可能有人會認為,上述情況表明,百度的搜索范圍最廣,能力最強。 技術展望:如何在可靠性,時效性以及盈利能力上進行平衡,考驗的是搜索公司的社會良知。 |