美國網站MIT科技評論近日撰文對百度在人工智能測試中違規一事做出評論。文章指出,相對于其他公司一周只“購買2張彩票”,百度行為如同一周“購買200張彩票”增加了“中獎概率”。而百度和其他科技公司不惜以違規手段吹噓成果,可見機器學習對這些公司意義非凡。以下為文章全文: 人工智能測試領域剛剛曝出了第一起作弊丑聞。上月,中國搜索引擎公司百度宣布其圖片識別軟件在精確度標準化測試中領先于谷歌。但本周二,該公司承諾是通過違反測試規則實現的這一成績。 負責維護該測試的學術專家表示,這導致百度之前的聲明毫無意義。作為該項目的負責人,百度研究員Ren Wu已經公開道歉,并表示該公司正在評估結果。百度也對該軟件的技術論文進行了修訂。 目前并不清楚此舉是個人行為還是整個團隊所為,但一家擁有數十億美元收入的科技公司為什么要在這樣一次測試中作弊呢? 百度、谷歌、Facebook等大型科技公司最近幾年都投入巨資組建研發團隊,專門研究深度學習技術,他們開發的機器學習軟件已經在語音和圖像識別領域實現了重大進展。這些公司都在不遺余力地聘請這個小領域的頂尖專家,經常會相互挖角。雖然學術界目前的人工智能標準測試數量不多,但卻可以幫助這些研究團隊與其他團隊的成就進行對比,并向公眾展開宣傳。 百度通過作弊獲得了不公平的優勢。要進行ImageNet Challenge測試,首先需要用150萬張標準圖片對其進行訓練,然后將代碼提交給ImageNet Challenge服務器,針對這些軟件之前沒有見過的10萬張“驗證”圖片進行測試。 按照規定,每周只能對代碼進行兩次測試,因為最終的結果包含概率因素。 百度承認,該公司使用多個電子郵件帳號在短短6個月的測試期內對其代碼展開了大約200次測試——超過規定測試數量的4倍。 艾倫人工智能學院CEO表示,百度此舉相當于購買了多張彩票。“如果你一周購買2張彩票,你大概有一個中獎概率。但如果你一周買200張彩票,概率就會增加。”他說。這樣一來,用略有不同的代碼展開多次測試,便可幫助研究團隊針對一組獨特的驗證圖片進行優化。 在這種測試中,很小的優勢也會產生巨大的不同。百度曾經表示,該公司的錯誤率僅為4.58%,擊敗了谷歌3月的4.82%。但一些專家指出,這么小的領先差距在這項測試中變得越來越沒有意義。但百度和其他公司仍在努力吹噓自己的結果,甚至不惜違反規則,足以表明在機器學習領域獲得領先優勢對他們而言的確意義非凡。 |