新聞來(lái)源:原創(chuàng) 最近看到一篇文章:《PHP開(kāi)發(fā)者常犯的10個(gè)MySQL錯(cuò)誤》,發(fā)現(xiàn)文中不少內(nèi)容陳舊,隨著時(shí)間推移技術(shù)發(fā)展變化而變得不適用。為了防止誤導(dǎo)新手,特本著與時(shí)俱進(jìn)的精神寫(xiě)出此文,絕非對(duì)原文作者的不尊重。 1.使用MyISAM而不是InnoDB 完全錯(cuò)誤,反駁理由: 首先原文說(shuō)MyISAM是默認(rèn)使用的,而實(shí)際上到了MySQL 5.5.x,InnoDB已經(jīng)成為了默認(rèn)的表引擎。 另外,簡(jiǎn)單的使用InnoDB不是解決所有問(wèn)題的方法,盲目的使用甚至?xí)箲?yīng)用性能下降10%乃至40%。 最佳方法還是針對(duì)具體業(yè)務(wù)具體處理,例如論壇中版塊表,新聞分類(lèi)表,各種碼表等長(zhǎng)時(shí)間不操作的表,還是要用性能優(yōu)異的MyISAM引擎。 而需要用到事務(wù)處理的例如用戶(hù)、賬目、流水等嚴(yán)格要求數(shù)據(jù)完整性和時(shí)序性的,則需要用InnoDB引擎,并且應(yīng)用也要用好事務(wù)處理機(jī)制。當(dāng)然,事務(wù)處理必然要帶來(lái)大量的性能損耗,但是這在簡(jiǎn)單高并發(fā)應(yīng)用上是必須的。 最后,外鍵約束在公共web互聯(lián)網(wǎng)應(yīng)用上一般是不用的,因?yàn)樗麜?huì)嚴(yán)重影響性能。數(shù)據(jù)完整性還是靠程序員或者應(yīng)用架構(gòu)本身的健壯來(lái)維護(hù)。而正規(guī)的第三范式只是在企業(yè)內(nèi)部MIS系統(tǒng)和12306這種網(wǎng)站上使用。 2.使用PHP的mysql方法 不完全錯(cuò),但要酌情選用: mysqli固然好,但是不是所有的服務(wù)器都為PHP編譯了mysqli的支持。 當(dāng)你的應(yīng)用如果是能確定只用自己部署的服務(wù)器,而應(yīng)用也是完全自己開(kāi)發(fā),則mysqli是最好的選擇。 但是一旦你的應(yīng)用有可能部署在虛擬主機(jī)或者由其他人部署(例如分布式項(xiàng)目),還是老老實(shí)實(shí)使用mysql函數(shù)集吧,好好封裝一下或者使用成熟框架杜絕sql注入。 3.不過(guò)濾用戶(hù)輸入 這一點(diǎn)不用說(shuō)了,要么MagicQuote,要么選用成熟框架。sql注入老話題了。 4.不使用UTF-8 大部分情況下對(duì),但也要認(rèn)真考慮: 要知道,一個(gè)UTF-8字符占3個(gè)字節(jié),所以比GBK等其他編碼的文件大33%。換句話說(shuō),相同的網(wǎng)頁(yè)用UTF-8編碼如果是100KB,那么換成GBK編碼則只有66KB。所以即便你的PHP確定要用UTF-8,那么前端頁(yè)面也要根據(jù)情況選擇需要的編碼。但是,如果PHP用UTF-8,前端模版是GBK,再加上模版引擎不強(qiáng)大,那么轉(zhuǎn)碼工作夠你受的。所以盡可能的選用自己需要的編碼,而不是簡(jiǎn)單的選擇UTF-8了事。 最后啰嗦一句:UTF-8下:strlen("我")=3,而GBK下:strlen("我")=2 5.該用SQL的地方使用PHP 同樣酌情考慮: 例如,有些人習(xí)慣在建表時(shí),默認(rèn)值填寫(xiě)CURRENT_TIMESTAMP,用來(lái)達(dá)到注冊(cè)時(shí)間、發(fā)帖時(shí)間的效果。 或者在時(shí)間判斷的SQL語(yǔ)句中,寫(xiě)類(lèi)似SELECT x FROM tab1 WHERE regdate < UNIX_TIMESTAMP()。那么我只能說(shuō),你為系統(tǒng)埋下了很隱蔽的BUG。因?yàn)閿?shù)據(jù)庫(kù)和應(yīng)用往往不在同一臺(tái)機(jī)器上,時(shí)間很容易出現(xiàn)偏差。當(dāng)你一套應(yīng)用的時(shí)間參照不準(zhǔn)確時(shí),就會(huì)出現(xiàn)很大的問(wèn)題。 正確做法是:不要使用MySQL的任何時(shí)間函數(shù),而是在應(yīng)用里計(jì)算時(shí)間。如果是分布式應(yīng)用,一定要有時(shí)間服務(wù)器來(lái)統(tǒng)一管理時(shí)間。 而文中說(shuō)的一些MySQL數(shù)學(xué)函數(shù) ,也是要慎用。因?yàn)樵诖笮蛻?yīng)用中,數(shù)據(jù)庫(kù)的負(fù)擔(dān)往往是最大的,而復(fù)雜的WHERE語(yǔ)句又是造成慢查詢(xún)的元兇。所以,要把計(jì)算盡可能的放在廉價(jià)的、不影響全局穩(wěn)定的應(yīng)用服務(wù)器上,而不是核心數(shù)據(jù)庫(kù)上。 6.不優(yōu)化查詢(xún) 這點(diǎn)也不用說(shuō)了,大型應(yīng)用上甚至不允許使用各種JOIN,哪怕生寫(xiě)兩條查詢(xún),查回來(lái)在用PHP合并數(shù)據(jù)。 7.使用錯(cuò)誤的數(shù)據(jù)類(lèi)型 INT,TinyINT,VARCHAR,CHAR,TEXT這些字段類(lèi)型的合理選用無(wú)可厚非。 而Date、DateTime、TIMESTAMP這三種類(lèi)型,在大型應(yīng)用中是絕對(duì)不可以使用的,而是要用INT(10) UNSIGNED代替。 一個(gè)是性能,另外就是應(yīng)用中尤其是PHP對(duì)UNIX_TIMESTAMP時(shí)間戳的轉(zhuǎn)化實(shí)在太方便了。用Date要輸出各種時(shí)間格式反而麻煩。 8.在SELECT查詢(xún)中使用* 共勉 9.索引不足或者過(guò)度索引 索引是必須的,但是如果索引都解決不了的查詢(xún),考慮memcache或者nosql解決方案吧。 10.不備份 這條是作者湊數(shù)么? 11.另外:不考慮其他數(shù)據(jù)庫(kù) 這條相當(dāng)正確。應(yīng)用中不僅要針對(duì)應(yīng)用選擇其他數(shù)據(jù)庫(kù),甚至還要針對(duì)具體的業(yè)務(wù)類(lèi)型,在同一套應(yīng)用中并行使用多種數(shù)據(jù)庫(kù)。哪怕不是數(shù)據(jù)庫(kù),而是其他各種緩存、內(nèi)存存儲(chǔ)等解決方案。 |