如果說2007年 iPhone 的發布開啟了近十年來消費者信息傳達被屏幕和視覺統治的時代,那么,語音將成為繼智能手機之后企業科技界下一個最大的顛覆。 蘋果Siri、谷歌助手、微軟小娜、三星Bixby和亞馬遜Alexa等各類設備和語音助手如雨后春筍般地出現,便折射出了一種趨勢的變化:越來越多的用戶,開始從屏幕靠視覺傳達,轉向用聲音來傳遞和接受信息。 據羿戓設計所了解,據 Strategy Analytics 的分析師透露,智能音箱已經成為了近年來發展最快的新硬件市場。到 2023 年,63% 的美國家庭至少保有一臺智能音箱,而這個數字在 2014 年是 0.03%,2017 年是 16%。 語音技術在企業市場的應用潛力巨大 在過去的幾十年里,隨著技術的不斷成熟,從穿孔卡片到鍵盤再到電腦鼠標設備的緩慢發展,計算機交互已經慢慢變得更加自然。 目前,觸控界面幾乎成了從相機到汽車在內的任何帶有屏幕的設備的默認標準。現在也是時候邁出科技界的另一大步了:和公司的設備交談。至少在很多電影中,人類已經實現了與電腦的交談,從《鋼鐵俠》中的賈維斯到《星際迷航4:暗黑無界》中的著名場景,斯科特試圖向一臺80年代的電腦發出指令。 盡管語音助手已經在手機上使用多年了——蘋果的Siri在2011年問世。但迄今為止,它們對企業環境的影響仍然有限。 而現在,計算能力和機器學習的進步使計算機在無需繁瑣的編碼情況下能夠比人類更好地轉錄語音,然后準確地翻譯出來。并且,新系統可以更有效地自我更新,從錯誤中吸取教訓,而非需要人為明確的指導。 支持語音的設備數量也在持續飆升,預計今年將售出超過5000萬臺,到2023年,全球語音技術產業預計將達到1265億美元。 對于工作人員來說,語音界面能夠帶來很多實際的好處,尤其是與繁瑣的移動鍵盤相比。今年早些時候,斯坦福大學、華盛頓大學和美國百度大學進行的一項研究發現,移動設備的語音輸入速度幾乎是打字速度的三倍,兩種輸入方式的錯誤率差別不大。 語音接口的最大好處之一是可以為企業業務系統提供“通用遠程控制”。谷歌已經證明,語音可用于將計算機連接到基于人的系統,例如在美發沙龍設置預約。 這種連接在企業界甚至更有意義。因為每個大型組織都有許多不同的應用程序,倘若想要在它們之間提供一致的工作流,通常需要進行編碼,這可能很慢,而且代價昂貴。但如果所有系統都支持語音,工作人員可以很容易地從一個系統切換到另一個系統,而不需要任何顯式集成。 此外,企業系統之間很可能會開始相互通信。在計算中實現通用標準是非常困難的,而使用語音(盡管明顯效率低下)可能是實現系統集成的一個非常實用的短期解決方案。其實,在消費級市場已經看到了這一點,最近有消息稱,亞馬遜的Alexa現在可以與微軟的Cortana“對話”,反之亦然。 所有這些進步都意味著,那些為企業的各種業務活動提供聊天和語音接口的企業數字助理正在成為主流。 語音也成為創新服務方式的一部分。例如,Workheld提供創新的現場管理系統,以提高施工和服務流程的生產率。該公司使用機器學習和文本分析技術自動將客戶工作與最合適的技術人員匹配,并提供免提語音接口,幫助員工完成維護步驟。 威脅問題不容忽視 當然,目前語音接口仍然存在一些問題,例如,在有大量背景噪音的繁忙辦公室中使用它可能很難。對此,科技公司正致力于尋求解決方案:例如,使用人工智能進行更先進的降噪,在人群中挑選出你的聲音,進行唇語識別,甚至直接通過你的下巴檢測你的話語,而不需要你大聲說出來。 不過,這也帶來了一些潛在危險。例如,所有這些麥克風都為非法竊聽和個人跟蹤提供了充足的機會。正如喬治?奧威爾的《1984》中寫道的那樣:“隱藏的麥克風總是有危險的,通過它,你的聲音可能會被接收和識別”。 當算法能夠創造出非常精確的合成語音時,公司的安全又將如何通過語音接口來執行呢?現在很多公司的“語音詐騙”已經凸顯出該問題了:如果企業首席執行官獨特的(但虛假的)聲音被連接到系統上,要求銀行進行非正常的電匯,會發生什么?或者更貼近實際一點,如果你十幾歲的女兒(假的,但聽起來聲音是一樣的)打電話給你說她有麻煩了,需要錢,又該怎么辦?! 總的來說,今年企業中的語音應用應該會有巨大的飛躍,主要是通過與聊天機器人接口的可選語音進行交互。
|