來源:Forbes 《福布斯》網(wǎng)站今日刊文,專訪“谷歌大腦背后的大腦”Jeff Dean。Dean回顧了他自1999年加入至今在公司的不同角色,重點介紹了谷歌大腦的項目內(nèi)容。Dean 認(rèn)為,谷歌保持創(chuàng)新的源泉在于保持部門的靈活性。軟件開源與開放的文化有助于這家公司吸引頂級人才,從事研發(fā)。他個人猜測,實現(xiàn)通用AI最快僅需15年。 Jeff Dean 是谷歌最早的雇員之一,他1996年從華盛頓大學(xué)計算機(jī)系獲得博士學(xué)位,1999年加入谷歌。他是谷歌成長過程的關(guān)鍵人物,谷歌分布式計算基礎(chǔ)構(gòu)架主要由他設(shè)計和完成,該構(gòu)架支持了谷歌的大部分產(chǎn)品。 谷歌 CEO Sundar Pichai 曾說谷歌將從根本上成為一家人工智能公司。作為系統(tǒng)和基礎(chǔ)構(gòu)架部門的資深研究員,Dean和他的團(tuán)隊對于實現(xiàn)這一目標(biāo)至關(guān)重要。在這篇內(nèi)容廣泛的訪談中,Dean 描述了他在谷歌的多種角色、公司的 AI 愿景,他對于谷歌如何在成為巨頭后保持企業(yè)奮斗精神的看法,以及許多其他話題。 谷歌如何與官僚主義戰(zhàn)斗 Peter High:Jeff Dean,你從1999年起就加入了谷歌,見證了谷歌的大部分歲月。請簡要介紹一下在谷歌的 17 年間你的角色演變。 Jeff Dean:當(dāng)我加入時,公司還很小。我們都擠在帕洛阿爾托的大學(xué)街上的一座小辦公室里。我做的第一件主要任務(wù)是建造我們的第一個廣告系統(tǒng)。而后我用了四五年時間做抓取、索引和搜索系統(tǒng),這些是每一次谷歌檢索都會用到的服務(wù)。之后,我大多與我的同事 Sanjay Ghemawat 等人一起工作,建造軟件基礎(chǔ)構(gòu)架,谷歌用該構(gòu)架來存儲和處理大數(shù)據(jù)集、做建立搜索索引或處理衛(wèi)星圖像之類的事。最近,我一直在做機(jī)器學(xué)習(xí)系統(tǒng)方面的工作。 High:你的涉獵范圍如此廣闊,你的職責(zé)也如此多樣,我猜想你不會有模式化的工作日常。你怎樣決定與公司內(nèi)外的哪些人互動?我很感興趣的是,你如何在你現(xiàn)在從事的不同事務(wù)上分配時間。 Dean:我沒有典型的工作日常。在前十四到十五年里,我沒有擔(dān)任任何管理職位,因此我有更多的自由時間來專注寫代碼。在過去的幾年里,我在一些機(jī)器學(xué)習(xí)項目上擔(dān)任了管理職位,這對我來說很有趣,也是一種新的學(xué)習(xí)體驗。在公司歷史上我做過許多項目,我想要與這些不同項目的進(jìn)展保持聯(lián)系,所以我常常會收到很多電子郵件。 我花許多時間來處理電子郵件,大部分時間用來刪除郵件,或是瀏覽郵件以了解正在發(fā)生什么。我有幾個只要有時間就會去做的技術(shù)項目,我在各種會議和設(shè)計評審之類的事之余抽時間去做這些項目。 High: 谷歌在經(jīng)過戲劇性的增長之后仍然是創(chuàng)新的典范。它仍然像當(dāng)年小企業(yè)時期那樣雄心勃勃、富于創(chuàng)新,另一方面它已擁有了科技巨頭的人力和財力資源。公司如何與停滯和官僚主義戰(zhàn)斗,以便能讓自己保持敏捷,不被規(guī)模拖累? Dean:從我加入時起,我們一直經(jīng)歷著公司的持續(xù)增長。在早年,我們每年都會將雇傭人數(shù)翻倍。如果用百分比來衡量,我們現(xiàn)在大大放慢了招聘新員工的速度,然而如果用絕對數(shù)量來衡量,我們?nèi)匀辉诮?jīng)歷著實質(zhì)性增長,大約每年新增10%、20%的雇員。每當(dāng)公司規(guī)模翻倍,這都會驅(qū)使我們重新思考公司做事的方式。那些在X規(guī)模水平上有效的方法,在2X規(guī)模水平上就不再有效了。我們已經(jīng)解決了如何讓我們的企業(yè)風(fēng)格、工程方法、組織結(jié)構(gòu)、團(tuán)隊動力適應(yīng)新的規(guī)模。 我認(rèn)為,對我們的成長幫助很大的一件事是,我們傾向于把工作分岔成許多不同領(lǐng)域,這些領(lǐng)域與谷歌正在做的其他東西保持一定的獨立。建造能帶來互聯(lián)網(wǎng)接入的高空熱氣球,這種項目就和搜索服務(wù)之間沒多大關(guān)系。我們實質(zhì)上擁有多個不同的活躍項目,這些項目不像核心業(yè)務(wù)內(nèi)部的項目那樣需要大量的溝通,由此我們可以獲得規(guī)模和效率。 High:據(jù)我理解,谷歌/Alphabet之間的分離也體現(xiàn)了這種邏輯——試圖保持敏捷性,同時將各種不同的活動分離開。可以這么說嗎? Dean:可以。我認(rèn)為這使得 Alphabet下的其他一些部門能更獨立的運(yùn)行。關(guān)于這種規(guī)模上的翻倍,我想說的第一點是,這確實帶來了一些變化,過去我們每個人都在同一座辦公樓里工作,現(xiàn)在每個人都需要在不同的辦公樓間往返。 另一件事是,過去我們的工程人員都位于山景城,后來我們在蘇黎世、紐約、東京和西雅圖都建立了工程機(jī)構(gòu)。有一段時間,我們同時擁有這五個機(jī)構(gòu),而它們也都發(fā)展得更龐大。之后的短短幾年里,我們從五個工程機(jī)構(gòu)發(fā)展到三十五個工程機(jī)構(gòu),因為我們感到,我們可以在世界各地找到那些有天分的人,并在他們附近建立機(jī)構(gòu)吸引他們。這使得我們必須重新思考我們?nèi)绾螌⒐こ谭矫娴呐M織起來。 如果你只有一家小機(jī)構(gòu),那么你大概不應(yīng)該讓員工去做一百件事;他們應(yīng)該只去做少數(shù)幾件事,并專注于將它們做好。一些小機(jī)構(gòu)曾經(jīng)以山景城總部的做法為榜樣,他們會去看山景城的人在做什么;他們發(fā)現(xiàn)山景城的人在做一百件不同的工作,于是他們以為自己也應(yīng)該去做一百件不同的工作。我們經(jīng)歷周折才找到一種更好的方式,把分布在各地的工程機(jī)構(gòu)的員工都調(diào)動起來。 個人猜測:最快 15 年實現(xiàn)通用人工智能 High:谷歌 CEO Sundar Pichai 曾說,從長期看,硬件設(shè)備將退隱,而計算將從移動優(yōu)先演化到人工智能優(yōu)先。關(guān)于這個人工智能優(yōu)先的世界,你將如何表述谷歌的愿景? Dean:我認(rèn)為我們已經(jīng)從桌面計算轉(zhuǎn)移到了移動計算,現(xiàn)在每個人都隨身攜帶者計算設(shè)備。隨著設(shè)備持續(xù)降價,語音識別和其他替代性的用戶界面變得更加實用,這些將改變我們與計算設(shè)備互動的方式。設(shè)備將隱退到背景中,環(huán)繞在附近,讓我們能夠隨時與他們說話,就想我們能與信賴的同伴說話一樣。 它們將幫助我們獲得更多信息,或幫我們完成各種任務(wù)。我認(rèn)為這是機(jī)器學(xué)習(xí)前進(jìn)的主要目標(biāo)之一:讓計算機(jī)能像人類同伴一樣提供建議,在需要時搜尋更多的信息,以及這一類的事情。我認(rèn)為未來五到十年將會令人振奮。 High:隨著技術(shù)進(jìn)步以及人工智能各種目標(biāo)的實現(xiàn),似乎人們不再將這些已實現(xiàn)的東西稱為人工智能。也就是說,人工智能似乎總是以“將來時”的形態(tài)被談?wù)摗D闳绾味x人工智能的界限? Dean:我認(rèn)為真正的人工智能將是這樣一個系統(tǒng),它能執(zhí)行人類水平的推理、理解,完成復(fù)雜任務(wù)。我們很明顯尚未達(dá)到這一點,但你說的很對,我們已取得了很多進(jìn)展。五年前,還根本不可能讓電腦從圖像中生成對圖片進(jìn)行人類水平的語句描述。如今,電腦生成的句子可能會說,“這是一張男子在網(wǎng)球場上手持網(wǎng)球拍的圖片”。與此同時,人類可能會說,“這是一張網(wǎng)球手準(zhǔn)備發(fā)球的圖片”。 人類所做的描述更精妙,不過計算機(jī)已經(jīng)可以生成接近人類水平的圖片說明,這一事實本身就是一個巨大的進(jìn)步。這只是過去五到六年里人們將更復(fù)雜的機(jī)器學(xué)習(xí)模型投入應(yīng)用所取得的進(jìn)展之一。當(dāng)人們將模型應(yīng)用于更大的數(shù)據(jù)集和更多的計算時,結(jié)果將變得更好。 High:你認(rèn)為我們離通用人工智能還有多遠(yuǎn)? Dean:如果你問不同的人,就會得到不同的答案。出于純粹的猜測,我認(rèn)為我們離通用人工智能的距離是 15 年到 50 年——或許 15 年左右的可能性更大。 High: 正如你提到的,語言是關(guān)鍵要素,而谷歌的許多人工智能創(chuàng)新都圍繞著語言,無論是從網(wǎng)絡(luò)中讀取和理解事物,還是從事智能對話或理解文本。你能否談?wù),通過什么路徑能讓機(jī)器更好地闡釋信息?在你看來,什么是能夠讓我們哪怕不能實現(xiàn)也至少能接近通用人工智能的階梯?你在這方面做哪些工作? Dean:我認(rèn)為,一個重要的領(lǐng)域是信息檢索領(lǐng)域,而這一領(lǐng)域正是谷歌早期工作的基礎(chǔ)。按照傳統(tǒng),信息檢索并不試圖真的理解當(dāng)用戶輸入查詢時想要什么。它更多地是關(guān)于查找那些包含某個單詞或相近單詞的文檔。有趣的是,最近四五年來,我們已能夠開始研發(fā)一些技術(shù),這些技術(shù)能更好地理解“汽車”這個單詞的本質(zhì)。當(dāng)我們知道“汽車”、“汽車們”、“車”、“客車”、“皮卡”等單詞都以某種方式聯(lián)系在一起時,我們就能夠以平滑的方式匹配文檔,使許多語言理解任務(wù)導(dǎo)向更好的結(jié)果。 我們不僅能理解詞語,我們也已經(jīng)快要能夠理解兩個句子互為同義句。這一點是新的語言理解水平的起點,在新的水平上,我們將能夠以機(jī)器學(xué)習(xí)的方式理解長得多的文本。 我們對未來幾年的一個良好目標(biāo)是,我們希望實現(xiàn):輸入數(shù)百或數(shù)千份文件,然后可以就這些文件的內(nèi)容進(jìn)行對話;蛟S系統(tǒng)將會總結(jié)文件的內(nèi)容,或許系統(tǒng)將對文件內(nèi)容進(jìn)行提問或回答。我認(rèn)為,這才是真正能展現(xiàn)高水平語言理解的東西。 谷歌大腦:谷歌的產(chǎn)業(yè)研究院 High: 似乎你和你的團(tuán)隊的一些進(jìn)展已經(jīng)開始進(jìn)入谷歌產(chǎn)品了,例如谷歌新的對話虛擬助理“Google Assistant”、谷歌用來與亞馬遜 Echo 競爭的”Google Home”、用來提供面向谷歌服務(wù)的對話界面的消息應(yīng)用”Allo”。你對近期谷歌推出的這些新產(chǎn)品和服務(wù)有何看法? Dean:我現(xiàn)在領(lǐng)導(dǎo)的研究團(tuán)隊名叫谷歌大腦。我們專注于建造可用于機(jī)器學(xué)習(xí)的大規(guī)模計算系統(tǒng),以及進(jìn)行高級機(jī)器學(xué)習(xí)研究。我們同時擁有這兩方面的人才,而他們聯(lián)合起來解決問題,這常常會帶來顯著的進(jìn)步,這種進(jìn)步是只具有機(jī)器學(xué)習(xí)技能或只具有大規(guī)模計算技能的人無法單獨取得的。我認(rèn)為這是我們團(tuán)隊取得眾多成功的原因之一。它使我們既在這兩個領(lǐng)域取得成功,也讓我們能夠?qū)ⅰ盀閱栴}投入多少計算”和“如何為我們關(guān)心的問題訓(xùn)練大型、強(qiáng)大的模型”方面的最高水平進(jìn)一步提升。 我們認(rèn)識到,我們的一些研究成果能被用來改善谷歌目前的產(chǎn)品,這使得我們對于從事長程研究感到相當(dāng)樂觀。我們將和產(chǎn)品團(tuán)隊一起工作并對他們說,“嘿,我們認(rèn)為這個機(jī)器學(xué)習(xí)研究將會在你的產(chǎn)品的這個情境中有用處”。有些時候我們只是簡單地把東西移交對方。有些時候,需要我們團(tuán)隊和產(chǎn)品團(tuán)隊之間的深度協(xié)作才能讓研究成果在產(chǎn)品中實現(xiàn)。 谷歌大腦研究團(tuán)隊的一項工作,是研發(fā)一個名叫“序列到序列學(xué)習(xí)”的模型。這里的想法是,你使用一個輸入序列來預(yù)測某個輸出序列。這聽起來很小,但它可以和許多你很想解決的現(xiàn)實問題匹配起來。他們發(fā)表的論文最初是在語言翻譯語境下的。輸入序列可能是一個句子中的英文單詞,每次輸入一個句子的序列。 這個模型被訓(xùn)練為輸出等效的法語單詞以創(chuàng)造一個與英文句子同義的法語句子。這與其他機(jī)器翻譯系統(tǒng)很不一樣,別的系統(tǒng)通常是運(yùn)用機(jī)器學(xué)習(xí)或統(tǒng)計模型對問題編碼和分割,再把它縫合起來。與這些方法相反,新的模型是徹底的端到端的機(jī)器學(xué)習(xí)系統(tǒng),你只要向系統(tǒng)喂入不同語言的同義句對子,系統(tǒng)就會學(xué)習(xí)從一個語言翻譯到另一個語言。 在其他情境中,這個一般模型也很有用。Gmail 團(tuán)隊采用了該模型,把它用作“智能回復(fù)”功能的基礎(chǔ)。在該功能中,輸入序列是一段收到的電子郵件,而輸出序列是對來信情境下可能回復(fù)的預(yù)測。例如,你可能收到一封郵件說,“嗨,我們想邀請你參加感恩節(jié)晚餐,請告訴我們你能否參加! 系統(tǒng)所產(chǎn)生的回復(fù)可能是“是的,我們很想?yún)⒓印P枰覀儙c什么來?”或者“抱歉,我們不能來”,或者其他與情境相關(guān)的內(nèi)容。這里使用的是同一個模型,只是在不同的數(shù)據(jù)集上得到了訓(xùn)練。 High:谷歌大腦的研究和突破應(yīng)用,怎么樣在谷歌更加傳統(tǒng)的產(chǎn)品中進(jìn)行部署? Dean:我們已經(jīng)開始正式推進(jìn)這一進(jìn)程。5年前,當(dāng)我們第一次開始組建機(jī)器學(xué)習(xí)研究組,調(diào)查使用大量的計算和深度卷積網(wǎng)絡(luò)處理問題的情況,當(dāng)時公司里還沒有多少人在使用這種方法。后來,我們發(fā)現(xiàn)少數(shù)看起來可以有效應(yīng)用的幾個地方,其中包括語音識別系統(tǒng),所以我們跟語音識別團(tuán)隊的同事緊密合作,把深度神經(jīng)網(wǎng)絡(luò)加入到語音識別系統(tǒng)中去,從而在識別精準(zhǔn)度上獲得了顯著的提升。然后,我們又與幾個計算機(jī)視覺相關(guān)的團(tuán)隊合作,比如圖像識別和一些街景團(tuán)隊,其中包括,用圖像中的原始像素去訓(xùn)練模型做一些有意思的事情,從圖像中提取文本或者理解圖像(是美洲豹,垃圾車或是別的什么東西)。 有趣的是,隨著時間的過去,更多的團(tuán)隊開始采用這些方法,因為他們會聽到別的團(tuán)隊說在嘗試一些別的東西,并且獲得了好的結(jié)果。不然就是,我們可以把他們與這些團(tuán)隊聯(lián)系起來,或者我們可以提供一些在他們特定的問題語境下如何使用這些方法的建議。后來,我們把這些都正規(guī)化,所以現(xiàn)在我們就有了一個團(tuán)隊來做這些擴(kuò)展工作。首先是聯(lián)系想要在產(chǎn)品中用到這些機(jī)器學(xué)習(xí)模型的團(tuán)隊,他們會描述自己遇到的難題,一般情況下,我們團(tuán)隊會說:“這似乎跟其他團(tuán)隊所遇到的難題很像,我們的解決方案很有用,試試看我們的方案,然后給我們反饋”。 2011年到2012年間,公司使用深度神經(jīng)網(wǎng)絡(luò)技術(shù)的團(tuán)隊只有十幾組,現(xiàn)在已經(jīng)超過200多組,有上千人在訓(xùn)練這類的模型,使用的就是我們團(tuán)隊搭建的軟件。 谷歌的開源和開放 High:你也是TensorFlow的主要創(chuàng)建者之一。和其他公司一樣,谷歌也聚焦于開發(fā)開放資源的AI技術(shù)。你對使用開放資源AI技術(shù)的原因和優(yōu)勢有什么看法? Dean:現(xiàn)在有許多不同的框架,用于展示不同的機(jī)器學(xué)習(xí)算法,它們都是開源的項目。我認(rèn)為,能有很多的選擇是一件不錯的事,但是,如果我們能開發(fā)出一些東西,讓機(jī)器學(xué)習(xí)社區(qū)中更多的人可以在后臺使用并且努力去改進(jìn),并且,這些努力中,很多都是在做相同的工作,所以,把他們都集中在一個資料庫,讓多數(shù)人都能采用,這就再好不過了。 其背后的原因是,這會讓機(jī)器學(xué)習(xí)的新想法得以更好地表達(dá)。傳統(tǒng)的方法是,人們?nèi)绻辛诵碌南敕,會寫一篇論文,做實驗,并且不會把代碼也發(fā)表出來,讓人們?nèi)ブ貜?fù)這些實驗。作為一個研究者,你會看別人的論文,并且嘗試對比自己和他人的技術(shù)。通常,由于這是用論文而不是代碼進(jìn)行表示,你需要猜測他們究竟做了什么。論文,從本質(zhì)上看,會忽略掉許多細(xì)節(jié),而這并不是有意的。他們可能會說:“我們使用了一個較低的學(xué)習(xí)率”,但是,你關(guān)心的是,他們使用的學(xué)習(xí)率是0.0001,并且經(jīng)過幾萬步的調(diào)整后,怎么降到了0.005。如果有一個軟件框架,讓人們能夠用代碼展示想法,并用表格的方式發(fā)表這些研究模型和想法,會讓社區(qū)內(nèi)的思想流動更加迅速。 對于我們來說,這也便利了我們與谷歌之外的人的合作。通常,我們會有暑期實習(xí)生。過去,這些實習(xí)生在實習(xí)結(jié)束后還要寫實習(xí)期間工作的論文,但是,那時候他們已經(jīng)離開谷歌了,所以無法再使用谷歌的計算機(jī),所以這會讓他們很難繼續(xù)完成論文,或者再進(jìn)行一兩次實驗。現(xiàn)在, 他們可以隨時使用這些開放資源或TensorFlow來做這件事,甚至也可以在平臺上找到其他能幫忙的人。我們正在教許多谷歌的工程師使用機(jī)器學(xué)習(xí),其中最通用的工具就是TensorFlow。 High:谷歌的一個優(yōu)勢在于擁有很多人工智能和機(jī)器學(xué)習(xí)人才。谷歌研究部門負(fù)責(zé)人 Peter Norvig 估計全球超過5%的機(jī)器學(xué)習(xí)菁英都在谷歌工作。谷歌是如何讓自己對機(jī)器學(xué)習(xí)頂尖人才變得有如此吸引力的?考慮到機(jī)器學(xué)習(xí)或者說人工智能涉及到計算機(jī)科學(xué)、工程學(xué)、神經(jīng)科學(xué)、生物學(xué)、數(shù)學(xué)等不同學(xué)科,你認(rèn)為如何才能確保招聘來的這些人才任人適用呢? Dean:我們工作的范圍很廣,人才也各種各樣。我發(fā)現(xiàn),當(dāng)你把一批不同專業(yè)背景的人聚在一起解決問題時,往往比召集一批專業(yè)背景類似的人效果更好。從整體上說,你做完了一件沒有人能夠單獨做出來的事情。我們的機(jī)器學(xué)習(xí)團(tuán)隊就是一個很好的例子。里面有像我這樣的人,擁有很多開發(fā)大規(guī)模計算系統(tǒng)的經(jīng)驗,也有世界頂級的機(jī)器學(xué)習(xí)研究者。把這些不同類型的人聚在一起就組成了一個非常強(qiáng)大的團(tuán)隊。機(jī)器學(xué)習(xí)正在影響醫(yī)療、機(jī)器人等等很多不同的領(lǐng)域,這是非常好的現(xiàn)象。我們團(tuán)隊中還有幾位神經(jīng)科學(xué)家。 很快我們將開始一個叫做“谷歌大腦實習(xí)培訓(xùn)”(Google Brain Residency Program)的計劃。我們招人到谷歌和Google Brain一起工作一年,基本上是學(xué)習(xí)如何進(jìn)行機(jī)器學(xué)習(xí)相關(guān)的研究。我們現(xiàn)在已經(jīng)得到了大量的申請簡歷,最終項目會留下 28 個人。他們來自不同的背景——計算機(jī)科學(xué)、統(tǒng)計學(xué)、數(shù)學(xué)、生物學(xué)、物理學(xué),處在職業(yè)生涯的不同階段——有人剛剛讀完本科,有些人則博士后畢業(yè),還有的已經(jīng)在產(chǎn)業(yè)界工作了一兩年。我認(rèn)為這將是一個很好的組合,解決問題時都帶來很多不同的觀點。 High:我很好奇,有很多不以技術(shù)為中心的傳統(tǒng)公司也會使用人工智能和機(jī)器學(xué)習(xí),你會在多大程度上與這些傳統(tǒng)公司交流和工作?你怎樣看AI技術(shù)的發(fā)展曲線?顯然,這在公司之間甚至是行業(yè)之間都是不同的。但也有一些領(lǐng)先的傳統(tǒng)行業(yè)開始利用人工智能,包括醫(yī)療和金融領(lǐng)域,這些機(jī)構(gòu)有著大量的非結(jié)構(gòu)化數(shù)據(jù)需要處理。你曾經(jīng)是否與這些傳統(tǒng)行業(yè)的公司打過交道,或者和它們討論人工智能在更為傳統(tǒng)的環(huán)境中的發(fā)展過程? Dean:其他行業(yè)的大多數(shù)公司可能沒有谷歌或者其他科技公司在應(yīng)用機(jī)器學(xué)習(xí)方面表現(xiàn)的好。我認(rèn)為,隨著時間的推移,最終大多數(shù)公司都將越來越多地使用機(jī)器學(xué)習(xí),因為機(jī)器學(xué)習(xí)將會變得非常強(qiáng)大,為他們的業(yè)務(wù)帶來變革。我們已經(jīng)與一些大型的醫(yī)療機(jī)構(gòu)討論了要建立合作關(guān)系,看看機(jī)器學(xué)習(xí)可以為該領(lǐng)域的某些問題做些什么。我們最近推出了一個云機(jī)器學(xué)習(xí)產(chǎn)品,可以讓人們在谷歌的云平臺上運(yùn)行機(jī)器學(xué)習(xí)算法。顯然,有許多公司有興趣了解在他們的業(yè)務(wù)的環(huán)境中該如何使用該產(chǎn)品。 我認(rèn)為這種轉(zhuǎn)變可能要經(jīng)過幾個階段才會發(fā)生,在這些階段中,你可以使用AI技術(shù)和機(jī)器學(xué)習(xí)的方法來解決問題。在一些領(lǐng)域里,理解圖像的內(nèi)容東西對很多行業(yè)來說都是有用的。谷歌和其他公司正在提供簡單易用的界面,而你無需知道任何機(jī)器學(xué)習(xí)的東西。你可以只給出一張圖片,然后說“告訴我這張圖里有什么”,任何沒有機(jī)器學(xué)習(xí)專業(yè)知識的軟件工程師都可以這么使用。他們得到的信息可能是“照片里有個體育場,人們在那里打棒球,而且圖像中還有一堆文字,文字是……”即使沒有應(yīng)用機(jī)器學(xué)習(xí),這也會是非常有用的。 然后將會有已經(jīng)開發(fā)好的模型,可以用公司的數(shù)據(jù)重復(fù)訓(xùn)練這個模型來得到一個定制化的解決方案,而且無需研究核心的機(jī)器學(xué)習(xí)技術(shù)來開發(fā)一個全新的模型。一個很好的例子是序列到序列的工作,我們現(xiàn)在已經(jīng)應(yīng)用到谷歌的六七個不同的問題中。另一個很好的例子是一個采集圖像的模型,它能發(fā)現(xiàn)圖像中有趣的部分。這個通用模型的一個應(yīng)用是,檢測街景圖像中的文本位置。你想閱讀所有的文本,但是首先,你必須能在店門、路牌上等這類地方找到它們。這種通用模型在醫(yī)療環(huán)境中也有用,比如在診斷糖尿病性視網(wǎng)膜病變時,你有一個視網(wǎng)膜的掃描圖像,你想找到該掃描圖像上的疾病指標(biāo),這時你就能用上這個模型了。用的是相同的模型結(jié)構(gòu),你只是在不同的數(shù)據(jù)中指出病變。你不是在用文本高亮顯示的街景圖像,而是在醫(yī)生已經(jīng)圈好病變部位的視網(wǎng)膜圖像上指出它。我認(rèn)為該通用模型的方法將很好地解決很多不同類型的問題。 |