6月20日,谷歌近期發表的一篇學術論文,該論文或將為機器學習的未來提供藍圖。谷歌的這篇論文題為“機器學習一個模式足矣(One Model to Learn Them All)”,為打造一種能夠很好地處理多任務的單一機器學習模式提供了樣板。 谷歌公司的研究人員將這種模式稱為“多任務模式(MultiModel)”。這種多任務模式基于多種任務進行訓練,包括翻譯、語言解析、語音識別、圖像識別和目標檢測等。盡管訓練結果與現有的方法相比還沒有大幅進步,但卻能夠表明,基于多種任務來訓練機器學習系統可能會有助于提升整體性能。 例如,多任務模式在基于力所能及的所有行動來進行訓練時,即相對于用單一行動進行訓練,此刻多任務模式下的機器翻譯、語音和解析等準確性都能夠得到提升。 谷歌的這篇論文可能會為研發能夠更加廣泛應用、更加精準的未來機器學習系統提供樣板。這一系統未來的應用廣泛程度有準確度都可能大大超過當前市場存在的狹義解決方案。更為重要的是,這些技術(或其分支)或許會有助于減少打造可靠機器學習算法時所需的訓練數據量。 這主要是由于谷歌研究團隊的研究結果已經表明,當多任務模式基于其力所能及的各種任務進行訓練時,執行任務的準確性會在訓練數據減少的情況下而提高。這一點至關重要,因為在某些領域,積累足夠多的大規模訓練數據是非常困難的。 然而,谷歌目前并沒有宣布自己已經掌握了那種能夠即刻學會所有任務的熟練算法。正如多任務名稱的含義那樣,多任務網絡包括了針對不同挑戰而定制的系統,以及幫助向那些專家算法直接輸入的系統。谷歌的此番研究的確表明,該公司采取的方法將對未來研發解決各個領域問題的類似系統產生幫助作用。 值得指出的是,這方面的研究仍要進行大量的試驗。谷歌的研究結果還沒有得到驗證,目前也很難弄清這項研究如何才能很好地拓展到其它領域!肮雀璐竽X(Google Brain)”團隊已經發布了多任務代碼,以此作為TensorFlow開源項目的一部分,因此,其他人也可以用這種代碼進行試驗,并挖掘更多的結果。 另外,谷歌還有一些改進的明確途徑。谷歌研究團隊指出,他們沒有花費過多的時間來優化系統的部分固定參數(即機器學習中的“超級參數(hyperparameters)”)。他們還表示,經過越來越多的調整和改進,未來多任務模式的準確性也會進一步提高。 --騰訊科技 |