文章來源:微信公眾號 新智元 (AI_era) 《紐約客》8月26日發表文章《人工智能的炒作和希望》,將AI分為三個階段。第一個階段是識別智能,在更加強大的計算機里運行的算法能從大量 文本中識別模式和獲取主題,甚至能從幾個句子獲取整個文章的意義。第二個階段是認知智能,機器已經超越模式識別,而且開始從數據中做出推論。第三個階段的 實現要等到我們能創建像人類一樣思考、行動的虛擬人類才行。作者認為,我們現在只處于第一階段,“識別智能”。 翻譯 張冬君 Om Malik是一名科技作家,還是科技新聞網站GigaOm的創始人和創業基金TrueVentures的合伙人。 本月早些時候,約翰·奧利弗在HBO的脫口秀節目“Last Week Tonight”上,諷刺媒體公司瘋狂追求點擊率。這條視頻在網上瘋狂傳播,在YouTube上已經有近六百萬次觀看。在節目進行到十分鐘左右,奧利弗炮 轟Tronc(更名后的Tribune Publishing Company)和其宣傳視頻。視頻中,一個女性機器人發言人在介紹人工智能給新聞界帶來的好處。 Tronc 董事長 Michael Ferro說,每天要用人工智能制作2000個視頻 Tronc不是唯一熱情擁抱人工智能的公司。AI十分火熱,每一家公司都在談論它將如何改變一切。即便是梅西百貨公司最近也宣布,它已經在旗下十家百貨商店測試一個IBM的AI工具,目的是換回那些放棄傳統零售店轉而支持網上購物的客戶。 就像之前的“云計算”、“大數據”和“機器學習”,“人工智能”這個詞已經被市場營銷人員和廣告文案人員大肆使用。人們說的“人工智能”里面有很大一部分其 實是數據分析,還是原來的套路。如果這些過度炒作讓你忍不住問“人工智能到底是什么?”別擔心,你并不是一個人。我曾向許多專家詢問這個詞的定義,得到了 不同的答案。他們一致同意的只有一件事,那就是人工智能是一組試圖模擬或增強人類智能的技術。對我來說,“增強”才是重點,智能軟件可以幫助我們與這個日 益數字化的世界進行交互。 三十年前,我讀報紙,用電動打字機打字,可以看的電視頻道屈指可數。而在今天,我有來自Netflix、亞馬 遜、HBO等的流媒體視頻,有時候我都不知道怎么選擇。我們越來越難以承受電子郵件、消息、約會和提醒的轟炸。增強智能使人類面對著越來越多的信息輸入和 選擇,數量多到一個人無法應付。 與其他技術相比,計算機和軟件對于大多數人來說更難理解,充斥著神秘感。曾經有一段時間,你要用錄音機把 一封信或者一篇文檔記錄下來,然后再由別人轉寫成文字給你。一個人在機器的幫助下將語音轉換成文本。而在今天,你可以對著你的iPhone說話,它會自己 轉錄你的消息。如果五十年前的人們看到我們目前的語音轉換成文本的功能,他們會覺得技術已經具有知覺。現在也是同樣的情況,我們夸大了與世界交互的方式。 著名的作家和未來學家凱文·凱利說,“我們現在能做到的,在50年前是AI,在50年后就不會被稱作AI。” 在以前沒有互聯網的時候,我 們要么打電話要么寫信給朋友,一次聯系一個人,來了解他們最近的生活。這是一個緩慢的過程,要花很多的精力和時間來了解每一個人。其結果是,我們的互動很 少,因為打長途電話費錢,寫信也要時間成本。隨著因特網的出現,電子郵件成為一種促進和加快這些互動的方式。而Facebook在這方面做的更好,它把你 的電話簿變成了一個中樞,讓你能同時與數百、甚至數千名朋友同時聯系。該算法使我們能輕松維持更多的關系而幾乎無需成本。 Michelle Zhou花了15年的時間在IBM研究院和IBM Watson團隊工作,之后離開IBM成為情緒分析初創企業Juji的聯合創始人。情緒分析是人工智能和人機交互的一個交叉領域,Zhou作為該領域的專 家,將AI分為三個階段。第一個階段是識別智能,在更加強大的計算機里運行的算法能從大量文本中識別模式和獲取主題,甚至能從幾個句子獲取整個文章的意 義。第二個階段是認知智能,機器已經超越模式識別,而且開始從數據中做出推論。第三個階段的實現要等到我們能創建像人類一樣思考、行動的虛擬人類才行。 我們離創建虛擬人類還有很長的路要走。盡管媒體吹得天花亂墜,但是沒有任何一個技術是完美的,AI最有價值的功能在于增強人類智能。要達到這一點,我們需要 訓練計算機來模仿人類。 2016年4月,彭博商業周刊的一篇報道就提供了一個很好的例子。它描述了提供自動化AI個人助理的公司聘請人類“教員”來檢查和評估AI助理的表現。 “我們用復制人類智能的能力來定義人工智能,這很諷刺,”Sean Gourley說,他是數據分析公司Primer的創始人,善于在算法的幫助下從大型數據集挖掘智能。 無論是Spotify、 Netflix或者是新一代AI聊天機器人,所有這些工具都依賴于人類自身提供數據。當我們在聽歌時,把歌曲加入播放列表并分享給別人,我們就在向 Spotify釋放重要的信號。這些信息能訓練其算法,使它不僅能發現我們喜歡什么,還能預測我們的喜好。 甚至是我們經常談論的“計算機 視覺”,它之所以有效,是因為人類上傳了數十億的照片,并且用元數據標記這些照片,給予這些照片情境。日益強大的計算機可以通過掃描這些照片從中找出模式 和意義。同樣地,谷歌利用它多年收集的數十億語音樣本建立了一個智能系統,能理解各種口音和細微差別,這使得谷歌的語音搜索功能成為可能。 將Zhou的三個階段作為衡量標準,我們目前還在“識別智能”階段——今天的計算機使用深度學習來更快更好地發現模式。然而,一些公司正在研究能用于推斷意 義的技術,這將是我們要走的下一步。“我們是否會到達第三階段,這不重要,”Zhou在給我的電子郵件中這樣說。“我仍然熱衷于人機共生,那時,計算機可 以做它們能做到的最好的事(即要求一致性、客觀性和精確度的事),人類做人類能做到最好的事(有創意,不精確但適應性強)。” 未來幾十年里,人類將繼續訓練計算機來模仿我們。而在此期間,我們將不得不面對AI的各種泡沫。 |