知名創投研究機構CB Insights調研了25種最主要的AI趨勢,以確定2019年該技術的下一步趨勢。他們根據行業采用率和市場優勢評估了每種趨勢,并將其歸類為必要、實驗性、威脅性、暫時性。 一 膠囊網絡將挑戰最先進的圖像識別算法 1、開源框架(Open-Source Frameworks) 人工智能的進入門檻比以往任何時候都低,這要歸功于開源軟件。2015年谷歌開放了其機器學習庫TensorFlow,越來越多的公司,包括可口可樂、e-Bay等都開始使用TensorFlow。 2017年Facebook發布caffe2和PyTorch(一種使用Python編寫的開源機器學習平臺),而Theano是蒙特利爾學習算法研究所(Mila)的另一個開源庫。隨著這些工具的使用越來越廣泛,Mila公司已經停止了對Theano的開發。 2、膠囊網絡(Capsule Networks) 眾所周知,深度學習(Deep Learning)推動了今天的大多數人工智能應用,而膠囊網絡(capsule networks)的出現可能會使其改頭換面。深度學習界領航人Geoffrey Hinton在其2011年發布的論文中提到“膠囊”這個概念,而后于2017年-2018年的論文中提出“膠囊網絡”概念。 針對當今深度學習中最流行的神經網絡結構之一:卷積神經網絡(CNN),Hinton指出其存在諸多不足,CNN在面對精確的空間關系方面會暴露其缺陷。 比如將人臉圖像中嘴巴的位置放置在額頭上面,CNN仍會將其辨識為人臉。CNN的另一個主要問題是無法理解新的觀點。黑客可以通過制造一些細微變化來混淆CNN的判斷。 經測試,膠囊網絡可以對抗一些復雜的對抗性攻擊,比如篡改圖像以混淆算法,且優于CNN。膠囊網絡的研究雖然目前還處于起步階段,但可能會對目前最先進的圖像識別方法提出挑戰。 3、生成式對抗網絡(Generative Adversarial Networks) 2014年,谷歌研究員Ian Goodfellow提出“生成式對抗網絡”(GAN)概念,利用“AI VS AI”概念,提出兩個神經網絡:生成器和鑒別器。谷歌DeepMind實習生Andrew Brock與其他研究人員一起合作,對GAN進行了大規模數據集的訓練,以創建“BigGANs”。 GAN面對的主要挑戰就是計算能力,對于AI硬件來說必須是并行縮放。研究人員用GAN進行“面對面翻譯”,還有利用GAN將視頻變成漫畫形式,或者直接進行繪畫創作等,但GAN也被一些不懷好意的人利用,包括制作假的政治錄像和偽造色情制品。 4、聯合學習(Federated Learnnig) 我們每天使用手機或平板會產生大量數據信息,使用我們的本地數據集來訓練AI算法可以極大地提高它們的性能,但用戶信息是非常私人和隱秘的。 谷歌研發的聯合學習(Federated Learning)方法旨在使用這個豐富的數據集,但同時保護敏感數據。谷歌正在其名為Gboard的Android鍵盤上測試聯合學習。 聯合學習方法與其他算法的不同在于考慮了兩個特征:非獨立恒等分布(Non-IID)和不均衡性(Unbalanced)。聯合學習已運用于瀏覽器Firefox、人工智能創業公司OWKIN等。 5、強化學習(Reinforcement Learning) 當谷歌DeepMind研發的AlphaGo在中國圍棋游戲中擊敗世界冠軍后,強化學習(Reinforcement Learning)獲得了廣泛關注。基于強化學習,DeepMind接著又研發了AlphaGo Zero。 UC Berkeley研究人員利用計算機視覺和強化學習來教授YouTube視頻中的算法雜技技能。 盡管取得了進步,但強化學習與當今最流行的人工智能范式監督學習相比,還算不上成功,不過關于強化學習應用的研究越來越多,包括Microsoft,Adobe,FANUC等都在開展這方面的研究。 二 2025年自動駕駛利潤達800億美元,物流率先應用 6、人工智能終端化 人工智能技術快速迭代,正經歷從云端到終端的過程。人工智能終端化能夠更好更快地幫助我們處理信息,解決問題。所謂人工智能終端化,就是舍棄使用云端控制的方法,而是將AI算法加載于終端設備上(如智能手機,汽車,甚至衣服上)。 諸多公司加入了對終端側人工智能領域的突破和探索。2017和2018年是眾多科技公司在人工智能終端化進入快速發展期的兩年,同時他們也在加緊對人工智能芯片的研發。 但AI依然面臨著儲存和開發上的困境,亟需更豐富的混合模型連接終端設備與中央服務器。 7、人臉識別 從手機解鎖到航班登機,人臉識別的應用范圍愈發廣泛,各國對于人臉識別的需求逐漸升高,不少創業公司開始關注這一領域,利用該技術,可以通過臉部特點從而還原蒙面嫌疑犯完整的人臉。 但人臉識別仍有待改進。這一技術仍會對人臉真假存在誤判。人臉識別中所包含的數據遠比我們想象要多,其中的安全問題也應引起我們關注。 8、語言處理 自然語言處理(NLP)是人工智能的一個子領域。對于翻譯技術而言,NLP就像一個潘多拉魔盒——除了豐富的市場機會,還有巨大的挑戰。機器翻譯就是其中一個等待開發的寶庫,從后臺自動化,客戶支持,到新聞媒體,其應用廣泛。 人機共生也是翻譯領域未來的大方向,不少初創公司也期待從中分一杯羹,但要完成基于自然語言處理工作的翻譯系統并不容易,單單中文里的各種方言和書面語就能把眾多科技公司難住。據相關數據顯示,除了熱門的高資源語言,如中文、阿拉伯語、歐洲語言等,低資源語言和少數民族語言的開發和應用依然存在缺口。 9、車輛自動化駕駛 盡管自動化駕駛汽車的市場潛力巨大,但實現全自動的未來依然不明朗。自動化駕駛成為了科技公司和初創公司互相競爭的新領域,他們為此注入的不僅有新的活力,還有大量的投資。 投資者對他們的決定十分樂觀,數個自動駕駛汽車品牌所獲得的投資總額已超百億,預計2025年其市場利潤能達800億美元。物流等相關行業會成為首批應用全自動駕駛的行業,預計可縮減三分之一的成本。 10、AI聊天機器人 盡管許多人把聊天機器人看成是AI的代名詞,但兩者依然存在差別。如今的AI聊天機器人已經進化得十分完善,與真人對話時甚至還會應用“嗯…”這一類口頭語和停頓,但人們擔憂這些機器人的行為過于逼真,開始考慮在對話時對其聊天機器人的身份進行確認說明的需要。 國外的科技巨頭FAMGA(Facebook,Apple,Microsoft,Google與Amazon)以及國內的BAT都把目光投向了這一領域。 三 AI診斷前景巨大,制藥巨頭押注AI算法 11、醫學成像與診斷 美國食品與藥物管理局(FDA)正加速推進“AI即醫療設備”趨勢。2018年4月,FDA批準了AI軟件IDx-DR,它可以在不需要專家干預的情況下篩查糖尿病視網膜病變患者,準確率超過87.4%。 FDA還批準了Viz LVO(可用于分析CT掃描結果以預測患者患中風危險)和Oncology AI套件(專注于發現肺部和肝臟病變),監管機構的快速審批為80多家AI成像和診斷公司開辟了新的商業道路。自2014年以來,這些公司共融資149筆。 在消費者方面,智能手機的普及和圖像識別技術的進步正在把手機變成強大的家庭診斷工具。名為Dip.Io的應用使用傳統尿液檢測試紙來監測各種尿路感染。用戶可以用智能手機給試紙拍照,計算機視覺算法會根據不同的光照條件和攝像頭質量對結果進行校正。 除此之外,許多“ML即服務”平臺正集成到FDA批準的家庭監控設備中,發現異常時即可向醫生發出警報。 12、下一代假肢 早期的研究正在興起,結合生物學、物理學和機器學習來解決假肢面臨的最困難問題之一,即靈活性。這是個十分復雜的問題,比如要讓截肢者能夠在假肢手臂上活動單個手指,需要解碼其背后的大腦和肌肉信號,并將其轉化為機器人控制指令,這些都需要多學科配合。 最近,研究人員開始使用機器學習來解碼來自人體傳感器的信號,并將其轉換成移動假肢設備指令。 還有些論文探討了新媒介解決方案,比如使用肌電信號(殘肢附近肌肉的電活動)來激活攝像頭,以及運行計算機視覺算法來估計他們面前物體的抓取方式和大小。 年度機器學習大會NeurIPS'18已經發起“AI假肢挑戰賽”,進一步突顯了AI社區對該領域的興趣。該大會2018年的挑戰是使用強化學習預測假肢的性能,有442名參與者試圖教AI如何跑步,贊助商包括AWS、豐田等。 13、臨床試驗患者招募 臨床試驗的最大瓶頸之一是招募合適的患者,蘋果公司或許能夠解決這個問題。盡管人們在努力將醫療記錄數字化,但互操作性(在機構和軟件系統之間共享信息的能力)仍是醫療保健領域最大的問題之一。 理想的AI解決方案是從患者的病歷中提取相關信息,并與正在進行的試驗進行比較,為進行匹配研究的AI軟件提供建議。 然而,像蘋果這樣的科技巨頭已經成功地為他們的醫療保健計劃引入了合作伙伴蘋果公司正在改變醫療數據的流動方式,并為AI開辟了新的可能性,尤其是圍繞臨床研究人員招募和監測患者的方式。 自2015年以來,蘋果推出了兩個開源框架——ResearchKit和CareKit,以幫助臨床試驗招募患者,并遠程監控他們的健康狀況,消除了地理障礙。蘋果公司還與Cerner和Epic等流行的EHR供應商合作,解決互操作性問題。 14、先進醫療生物識別技術 利用神經網絡,研究人員開始研究和測量以前難以量化的非典型危險因素。使用神經網絡分析視網膜圖像和語音模式可能有助于識別心臟病的風險。 比如,谷歌的研究人員使用受過訓練的視網膜圖像神經網絡來發現心血管疾病的危險因素,如年齡、性別和吸煙等。梅奧診所通過分析聲音中的聲學特征,可以發現冠心病患者的不同語音特征。 不久的將來,醫療生物識別技術將被用于被動監控,比如谷歌的專利希望通過膚色或皮膚位移來分析心血管功能,這些傳感器甚至可能被放置在病人浴室的“感應環境”中,通過識別手腕和臉頰的皮膚顏色變化,來確定心臟健康指標,如動脈僵硬或血壓。 亞馬遜也申請了被動監測專利,將面部特征識別與心率分析結合起來。AI發現模式的能力將繼續為新的診斷方法和識別以前未知的危險因素鋪平道路。 15、藥物發現 隨著AI生物技術初創企業的興起,傳統制藥公司正尋求AI SaaS初創企業為漫長的藥物研發周期提供創新解決方案。2018年5月,輝瑞與XtalPi建立了戰略合作伙伴關系,預測小分子藥物的性質,開發“基于計算的理性藥物設計”。 諾華(Novartis)、賽諾菲(Sanofi)、葛蘭素史克(GlaxoSmithKline)、安進(Amgen)和默克(Merck)等頂級制藥公司,最近幾個月都宣布與AI初創企業建立合作關系,以發現腫瘤和心臟病等領域的新藥。 像遞歸制藥(Recursion Pharmaceuticals)這樣的生物技術AI公司正在投資AI和藥物研發,傳統制藥公司正在與AI SaaS初創公司合作。盡管這些初創公司中有許多仍處于融資的早期階段,但它們已經擁有自己的制藥客戶。 在藥物研發階段,衡量成功的標準很少,但制藥公司正把數百萬美元押在AI算法上,以發現新的治療方案,并改變曠日持久的藥物研發過程。 四 合成數據集用以解決AI的數據依賴 16、預測性維護 從制造商到設備保險公司,AI-IIoT可以在故障損害發生之前,提出防范措施。現場和工廠設備會產生大量的數據;然而,未預料到的設備故障是制造業停機的主要原因之一。預測設備或單個部件何時失效將使資產保險公司和制造商受益。 在預測性維護中,傳感器和智能攝像機收集來自機器的連續數據,如溫度、壓力等。實時數據的數量和變化形式使機器學習成為IIoT不可分割的組成部分。隨著時間的推移,算法可以在故障發生之前預測可能出現的隱患。 隨著工業傳感器成本的降低、機器學習算法的進步,以及對邊緣計算的推動,預測性維護會更加廣泛。 17、后臺自動化 人工智能正在推動管理工作走向自動化,但數據的不同性質和格式使其成為一項具有挑戰性的任務。根據行業和應用程序的不同,自動化“后臺任務”的挑戰可能是獨一無二的。例如,手寫的臨床筆記對自然語言處理算法來說就是一個獨特的挑戰。 機器人過程自動化(RPA)一直是熱門話題,雖然并非所有的機器人過程自動化都基于機器學習,但許多都開始將圖像識別和語言處理集成到它們的解決方案中。 18、綜合訓練數據 對于訓練人工智能算法來說,訪問大型的、標記的數據集是必要的,合成數據集可能會成為解決瓶頸問題的關鍵。人工智能算法依賴數據,當一些類型的現實世界數據不易被訪問時,合成數據集的用武之地就體現出來。一個有趣的新興趨勢是使用AI本身來幫助生成更“逼真”的合成圖像來訓練AI。 GAN被用于“增強”現實世界數據,這意味著AI可以通過混合的現實世界和模擬數據進行訓練,以獲得更大更多樣化的數據集。此外,機器人技術是另一個可以從高質量合成數據中獲益的領域。 19、網絡優化 人工智能正在開始改變電信行業。電信網絡優化是一套改進延遲、帶寬、設計或架構的技術——能以有利方式增加數據流的技術。對于通信服務提供商來說,優化可以直接轉化為更好的客戶體驗。除了帶寬限制之外,電信面臨的最大挑戰之一是網絡延遲,像手機上的AR/VR等應用,只有極低的延遲時間才能達到最佳的功能。 電信運營商也在準備將基于AI的解決方案集成到下一代無線技術中,即5G。三星收購了基于AI的網絡和服務分析初創公司Zhilabs,為5G時代做準備;高通認為人工智能邊緣計算是其5G計劃的重要組成部分(邊緣計算可減少帶寬限制并與云進行頻繁通信,這是5G的主要關注領域)。 20、網絡威脅搜尋 對網絡攻擊做出反應已經不夠了,使用機器學習主動“搜尋”威脅正在網絡安全中獲得動力。顧名思義,威脅搜尋是主動尋找惡意活動的做法,而不僅僅是在發生警報或違規后做出反應。搜尋開始于對網絡中潛在弱點的假設,以及手動和自動化工具,以在連續的迭代過程中測試假設。 網絡安全中龐大的數據量使機器學習成為流程中不可分割的一部分,從而有望使威脅搜尋獲得更多的動力,然而它也面臨著自身的一系列挑戰,比如應對不斷變化的動態環境和減少誤報。 五 訓練算法、指紋追蹤、人工智能防范假貨 21、電子商務搜索 對搜索詞的上下文理解正在走出“實驗階段”,但要廣泛采用搜索詞還有很長的路要走。當使用電子商務搜索來顯示相關結果時,使用適當的元數據來描述產品是一個起點。 但是僅僅描述和索引是不夠的。許多用戶用自然語言搜索產品(比如“沒有紐扣的洋紅色襯衫”),或者不知道如何描述他們在尋找的商品,這使得電子商務搜索的自然語言成為一個挑戰。 22、汽車索賠處理 保險公司和初創公司開始使用人工智能來計算車主的“風險得分”,分析事故現場的圖像,并監控駕駛員的行為。Ant Financial在其“事故處理系統”中使用深度學習算法進行圖像處理。過去,車主或司機會把他們的車送到“理算師”那里,理算師負責檢查車輛的損壞情況,并記錄下詳細情況,然后將這些信息發送給汽車保險公司。 如今,圖像處理技術的進步使得人們可以拍下這輛車的照片并將其上傳,神經網絡對圖像進行分析,實現損傷評估的自動化。另一種方法是對駕駛員進行風險分析,從而影響汽車保險的實際定價模型。 23、防偽 假貨越來越難被發現,網購使得購買假貨比以往任何時候都容易。為了反擊,品牌和典當商開始嘗試人工智能,在網絡世界和現實世界兩條戰線上與假貨作戰。 不過,網上假冒偽劣產品的范圍和規模非常龐大復雜。造假者使用與原始品牌列表非常相似的關鍵詞和圖片,在假冒網站上銷售假貨、在合法市場上銷售假貨、在社交媒體網站上推廣假貨……隨著“超級假貨”或“aaa假貨”的興起,用肉眼分辨它們幾乎變得不可能。 現在,建立一個假冒偽劣商品的數據庫,提取其特征,并訓練人工智能算法來分辨真偽,雖是一個繁瑣的過程,但對于奢侈品牌和其他高風險零售商來說非常有必要。下一步的解決方案還可能是在實體商品上識別或添加獨特的“指紋”,并通過供應鏈對其進行跟蹤。 24、零售 走進一家商店,挑選你想要的東西,然后走出去,這幾乎“感覺”就像在行竊。人工智能可以杜絕真正的盜竊行為,并讓免結賬手續的零售方式變得更加普遍。 盜竊一直是美國零售商的一大痛點;然而,當你掌握進出商店的人,并自動向他們收費時,有人入店行竊的可能性就會降到最低。此外,如何利用建筑空間也是一件需要考慮的事情,特別是在擁擠的超市,需要確保將攝像頭安裝在最合適的位置,以便追蹤人和物品。 在現階段,零售業采用人工智能面臨的問題主要在于部署成本和由潛在技術故障造成的庫存損失成本,以及零售商能夠承擔這些成本和風險的程度。 25、農作物監測 無人機可以為農民繪制農田地圖、利用熱成像技術監測濕度、識別蟲害作物并噴灑殺蟲劑。 初創公司正專注于為第三方無人機捕獲的數據添加分析。還有人使用計算機視覺使地面上的農業設備變得更智能。按照需要噴灑個別作物,可以減少對非選擇性除草劑的需求,而非選擇性除草劑會殺死附近的一切,精確噴灑意味著減少除草劑和殺蟲劑的使用量。 在實地調查之外,利用計算機視覺分析來處理衛星圖像可提供對農業實踐的宏觀理解;地理空間數據可以提供關于全球作物分布模式和氣候變化對農業影響的信息。 |