美國(guó)網(wǎng)站MIT科技評(píng)論近日撰文對(duì)百度在人工智能測(cè)試中違規(guī)一事做出評(píng)論。文章指出,相對(duì)于其他公司一周只“購(gòu)買2張彩票”,百度行為如同一周“購(gòu)買200張彩票”增加了“中獎(jiǎng)概率”。而百度和其他科技公司不惜以違規(guī)手段吹噓成果,可見機(jī)器學(xué)習(xí)對(duì)這些公司意義非凡。以下為文章全文: 人工智能測(cè)試領(lǐng)域剛剛曝出了第一起作弊丑聞。上月,中國(guó)搜索引擎公司百度宣布其圖片識(shí)別軟件在精確度標(biāo)準(zhǔn)化測(cè)試中領(lǐng)先于谷歌。但本周二,該公司承諾是通過違反測(cè)試規(guī)則實(shí)現(xiàn)的這一成績(jī)。 負(fù)責(zé)維護(hù)該測(cè)試的學(xué)術(shù)專家表示,這導(dǎo)致百度之前的聲明毫無意義。作為該項(xiàng)目的負(fù)責(zé)人,百度研究員Ren Wu已經(jīng)公開道歉,并表示該公司正在評(píng)估結(jié)果。百度也對(duì)該軟件的技術(shù)論文進(jìn)行了修訂。 目前并不清楚此舉是個(gè)人行為還是整個(gè)團(tuán)隊(duì)所為,但一家擁有數(shù)十億美元收入的科技公司為什么要在這樣一次測(cè)試中作弊呢? 百度、谷歌、Facebook等大型科技公司最近幾年都投入巨資組建研發(fā)團(tuán)隊(duì),專門研究深度學(xué)習(xí)技術(shù),他們開發(fā)的機(jī)器學(xué)習(xí)軟件已經(jīng)在語音和圖像識(shí)別領(lǐng)域?qū)崿F(xiàn)了重大進(jìn)展。這些公司都在不遺余力地聘請(qǐng)這個(gè)小領(lǐng)域的頂尖專家,經(jīng)常會(huì)相互挖角。雖然學(xué)術(shù)界目前的人工智能標(biāo)準(zhǔn)測(cè)試數(shù)量不多,但卻可以幫助這些研究團(tuán)隊(duì)與其他團(tuán)隊(duì)的成就進(jìn)行對(duì)比,并向公眾展開宣傳。 百度通過作弊獲得了不公平的優(yōu)勢(shì)。要進(jìn)行ImageNet Challenge測(cè)試,首先需要用150萬張標(biāo)準(zhǔn)圖片對(duì)其進(jìn)行訓(xùn)練,然后將代碼提交給ImageNet Challenge服務(wù)器,針對(duì)這些軟件之前沒有見過的10萬張“驗(yàn)證”圖片進(jìn)行測(cè)試。 按照規(guī)定,每周只能對(duì)代碼進(jìn)行兩次測(cè)試,因?yàn)樽罱K的結(jié)果包含概率因素。 百度承認(rèn),該公司使用多個(gè)電子郵件帳號(hào)在短短6個(gè)月的測(cè)試期內(nèi)對(duì)其代碼展開了大約200次測(cè)試——超過規(guī)定測(cè)試數(shù)量的4倍。 艾倫人工智能學(xué)院CEO表示,百度此舉相當(dāng)于購(gòu)買了多張彩票。“如果你一周購(gòu)買2張彩票,你大概有一個(gè)中獎(jiǎng)概率。但如果你一周買200張彩票,概率就會(huì)增加。”他說。這樣一來,用略有不同的代碼展開多次測(cè)試,便可幫助研究團(tuán)隊(duì)針對(duì)一組獨(dú)特的驗(yàn)證圖片進(jìn)行優(yōu)化。 在這種測(cè)試中,很小的優(yōu)勢(shì)也會(huì)產(chǎn)生巨大的不同。百度曾經(jīng)表示,該公司的錯(cuò)誤率僅為4.58%,擊敗了谷歌3月的4.82%。但一些專家指出,這么小的領(lǐng)先差距在這項(xiàng)測(cè)試中變得越來越?jīng)]有意義。但百度和其他公司仍在努力吹噓自己的結(jié)果,甚至不惜違反規(guī)則,足以表明在機(jī)器學(xué)習(xí)領(lǐng)域獲得領(lǐng)先優(yōu)勢(shì)對(duì)他們而言的確意義非凡。 |