美國網(wǎng)站MIT科技評論近日撰文對百度在人工智能測試中違規(guī)一事做出評論。文章指出,相對于其他公司一周只“購買2張彩票”,百度行為如同一周“購買200張彩票”增加了“中獎概率”。而百度和其他科技公司不惜以違規(guī)手段吹噓成果,可見機(jī)器學(xué)習(xí)對這些公司意義非凡。以下為文章全文: 人工智能測試領(lǐng)域剛剛曝出了第一起作弊丑聞。上月,中國搜索引擎公司百度宣布其圖片識別軟件在精確度標(biāo)準(zhǔn)化測試中領(lǐng)先于谷歌。但本周二,該公司承諾是通過違反測試規(guī)則實現(xiàn)的這一成績。 負(fù)責(zé)維護(hù)該測試的學(xué)術(shù)專家表示,這導(dǎo)致百度之前的聲明毫無意義。作為該項目的負(fù)責(zé)人,百度研究員Ren Wu已經(jīng)公開道歉,并表示該公司正在評估結(jié)果。百度也對該軟件的技術(shù)論文進(jìn)行了修訂。 目前并不清楚此舉是個人行為還是整個團(tuán)隊所為,但一家擁有數(shù)十億美元收入的科技公司為什么要在這樣一次測試中作弊呢? 百度、谷歌、Facebook等大型科技公司最近幾年都投入巨資組建研發(fā)團(tuán)隊,專門研究深度學(xué)習(xí)技術(shù),他們開發(fā)的機(jī)器學(xué)習(xí)軟件已經(jīng)在語音和圖像識別領(lǐng)域?qū)崿F(xiàn)了重大進(jìn)展。這些公司都在不遺余力地聘請這個小領(lǐng)域的頂尖專家,經(jīng)常會相互挖角。雖然學(xué)術(shù)界目前的人工智能標(biāo)準(zhǔn)測試數(shù)量不多,但卻可以幫助這些研究團(tuán)隊與其他團(tuán)隊的成就進(jìn)行對比,并向公眾展開宣傳。 百度通過作弊獲得了不公平的優(yōu)勢。要進(jìn)行ImageNet Challenge測試,首先需要用150萬張標(biāo)準(zhǔn)圖片對其進(jìn)行訓(xùn)練,然后將代碼提交給ImageNet Challenge服務(wù)器,針對這些軟件之前沒有見過的10萬張“驗證”圖片進(jìn)行測試。 按照規(guī)定,每周只能對代碼進(jìn)行兩次測試,因為最終的結(jié)果包含概率因素。 百度承認(rèn),該公司使用多個電子郵件帳號在短短6個月的測試期內(nèi)對其代碼展開了大約200次測試——超過規(guī)定測試數(shù)量的4倍。 艾倫人工智能學(xué)院CEO表示,百度此舉相當(dāng)于購買了多張彩票。“如果你一周購買2張彩票,你大概有一個中獎概率。但如果你一周買200張彩票,概率就會增加。”他說。這樣一來,用略有不同的代碼展開多次測試,便可幫助研究團(tuán)隊針對一組獨特的驗證圖片進(jìn)行優(yōu)化。 在這種測試中,很小的優(yōu)勢也會產(chǎn)生巨大的不同。百度曾經(jīng)表示,該公司的錯誤率僅為4.58%,擊敗了谷歌3月的4.82%。但一些專家指出,這么小的領(lǐng)先差距在這項測試中變得越來越?jīng)]有意義。但百度和其他公司仍在努力吹噓自己的結(jié)果,甚至不惜違反規(guī)則,足以表明在機(jī)器學(xué)習(xí)領(lǐng)域獲得領(lǐng)先優(yōu)勢對他們而言的確意義非凡。 |