熱門關(guān)鍵詞：單片機(jī) 賽普拉斯智能機(jī)器人凌力爾特 Keil

百度為什么在人工智能測試中作弊？

發(fā)布時間：2015-6-8 10:16 發(fā)布者：eechina

關(guān)鍵詞：人工智能

美國網(wǎng)站MIT科技評論近日撰文對百度在人工智能測試中違規(guī)一事做出評論。文章指出，相對于其他公司一周只“購買2張彩票”，百度行為如同一周“購買200張彩票”增加了“中獎概率”。而百度和其他科技公司不惜以違規(guī)手段吹噓成果，可見機(jī)器學(xué)習(xí)對這些公司意義非凡。以下為文章全文：

人工智能測試領(lǐng)域剛剛曝出了第一起作弊丑聞。上月，中國搜索引擎公司百度宣布其圖片識別軟件在精確度標(biāo)準(zhǔn)化測試中領(lǐng)先于谷歌。但本周二，該公司承諾是通過違反測試規(guī)則實現(xiàn)的這一成績。

負(fù)責(zé)維護(hù)該測試的學(xué)術(shù)專家表示，這導(dǎo)致百度之前的聲明毫無意義。作為該項目的負(fù)責(zé)人，百度研究員Ren Wu已經(jīng)公開道歉，并表示該公司正在評估結(jié)果。百度也對該軟件的技術(shù)論文進(jìn)行了修訂。

目前并不清楚此舉是個人行為還是整個團(tuán)隊所為，但一家擁有數(shù)十億美元收入的科技公司為什么要在這樣一次測試中作弊呢？

百度、谷歌、Facebook等大型科技公司最近幾年都投入巨資組建研發(fā)團(tuán)隊，專門研究深度學(xué)習(xí)技術(shù)，他們開發(fā)的機(jī)器學(xué)習(xí)軟件已經(jīng)在語音和圖像識別領(lǐng)域?qū)崿F(xiàn)了重大進(jìn)展。這些公司都在不遺余力地聘請這個小領(lǐng)域的頂尖專家，經(jīng)常會相互挖角。雖然學(xué)術(shù)界目前的人工智能標(biāo)準(zhǔn)測試數(shù)量不多，但卻可以幫助這些研究團(tuán)隊與其他團(tuán)隊的成就進(jìn)行對比，并向公眾展開宣傳。

百度通過作弊獲得了不公平的優(yōu)勢。要進(jìn)行ImageNet Challenge測試，首先需要用150萬張標(biāo)準(zhǔn)圖片對其進(jìn)行訓(xùn)練，然后將代碼提交給ImageNet Challenge服務(wù)器，針對這些軟件之前沒有見過的10萬張“驗證”圖片進(jìn)行測試。

按照規(guī)定，每周只能對代碼進(jìn)行兩次測試，因為最終的結(jié)果包含概率因素。

百度承認(rèn)，該公司使用多個電子郵件帳號在短短6個月的測試期內(nèi)對其代碼展開了大約200次測試——超過規(guī)定測試數(shù)量的4倍。

艾倫人工智能學(xué)院CEO表示，百度此舉相當(dāng)于購買了多張彩票。“如果你一周購買2張彩票，你大概有一個中獎概率。但如果你一周買200張彩票，概率就會增加。”他說。這樣一來，用略有不同的代碼展開多次測試，便可幫助研究團(tuán)隊針對一組獨特的驗證圖片進(jìn)行優(yōu)化。

在這種測試中，很小的優(yōu)勢也會產(chǎn)生巨大的不同。百度曾經(jīng)表示，該公司的錯誤率僅為4.58%，擊敗了谷歌3月的4.82%。但一些專家指出，這么小的領(lǐng)先差距在這項測試中變得越來越?jīng)]有意義。但百度和其他公司仍在努力吹噓自己的結(jié)果，甚至不惜違反規(guī)則，足以表明在機(jī)器學(xué)習(xí)領(lǐng)域獲得領(lǐng)先優(yōu)勢對他們而言的確意義非凡。

本文地址：http://m.qingdxww.cn/thread-150212-1-1.html 【打印本頁】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布，目的在于傳遞和分享信息，并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)；文章版權(quán)歸原作者及原出處所有，如涉及作品內(nèi)容、版權(quán)和其它問題，我們將根據(jù)著作權(quán)人的要求，第一時間更正或刪除。