国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

智能語音:我們?yōu)槭裁催不能和手機交談

發(fā)布時間:2013-4-22 10:04    發(fā)布者:1770309616
關(guān)鍵詞: 智能語音 , 手機
四十多年前,專家們曾宣稱,語音識別將在“五到十年內(nèi)”發(fā)展為一項成熟的技術(shù)。可多年過后,他們依然重復(fù)著一模一樣的說辭。語音識別的發(fā)展確實費了不少工夫好在,時隔多年以后,我們總算開發(fā)出了一套質(zhì)量過硬的識別技術(shù)。不僅如此,我們還把這玩意應(yīng)用到了移動設(shè)備上(盡管還得靠服務(wù)器提供一大堆技術(shù)支持)。
  然后問題就來了有了這樣的技術(shù),我們?yōu)槭裁催是得整天瞅著自己的手機屏幕鼓搗來鼓搗去,卻無法直接開口跟自己的手機對話交談?
  回答這個問題的關(guān)鍵,在于提供一個語音交互界面,遠比理解一打單詞來得復(fù)雜尤其是對手機而言。我們還必須得理解用戶的“意圖”。要知道,除了語音技術(shù)本身以外,人機語音交流中還有其他因素在作怪輸出方式,互動形式還有語境。
  多元化的輸出:既能秀,也能說
  如今投入使用的語音系統(tǒng),識別的效果一般都過于極端化要么一字不差,要么謬以千里。事實上,當我們查詢一條去某大街的路線時,要是系統(tǒng)能精確無誤地從數(shù)據(jù)庫的上千個條目中識別出我們想要的那一條,還是挺令人稱奇的。不幸的是,如果識別有誤或者街名不準,我們的搜索就只能乖乖從頭再來。
  要想在現(xiàn)有的語音技術(shù)上有所突破,我們必須得認識到一點:我們現(xiàn)有的系統(tǒng),不過就是最原始的識別技術(shù)而已識別技術(shù)本身沒啥問題;但除了這套技術(shù)以外,我們的系統(tǒng)只是一個空殼罷了。而我們需要的,其實是創(chuàng)造一個語音交互界面說白了,就是一整套基于語音的互動模式。
  理解用戶的“意圖”,意味著系統(tǒng)要判斷出用戶真正需要的事物,而這通常得依靠交談來實現(xiàn)。這就是說,系統(tǒng)要了解用戶為什么問這個問題一般來說,這就要求系統(tǒng)去知曉對方在做什么;與此同時,這也要求系統(tǒng)根據(jù)用戶所處的情形合理應(yīng)答。這可決不是一項輕松的任務(wù)畢竟,用戶只是把移動設(shè)備握在手中而已,他們可能有著大把的事情,要忙著分神去處理。
  互動是一種雙向的溝通,意味著我們在提供輸入的同時還得留意輸出;而這些能發(fā)聲的應(yīng)用是怎么回答我們的呢?最常見的方式,是直接向用戶回復(fù)他們所想要的信息。那些提供實時駕駛指南的“殺手級應(yīng)用”就是個典型的例子:用戶雙眼注視路況,雙手把好方向盤,然后嚴格按照語音提示說的做就行這種情況下,這樣的應(yīng)答方式也確實管用。
  但另一些時候,這招就不那么靈了。比如,當我們詢問下班公交什么時候到站時,讓系統(tǒng)自顧自地把整張時刻表背下來就是個不折不扣的餿主意。即使它只是回復(fù)一句“下班車9點12分到站”,效果也好不到哪去這時候,說“下班車12分鐘內(nèi)到站”才是王道。
  這其中的關(guān)鍵在于,語音只是瞬時性的一句話,說完就完了。要是我們一時不小心分神了,或者一下子沒來得及把消息印到腦子里,我們就得再問一遍。說不定還得問上一遍又一遍。
  這就是我們不應(yīng)該拋棄用戶界面的原因:它好歹能幫我們少占用一些記憶容量。未來的語音技術(shù)所迫切需要的,是多元化的輸出:既能秀,也能說。舉個例子,如果我正忙著趕路的話,何不讓移動設(shè)備既在屏幕上給我秀一下時刻表,也在耳邊跟我說一聲“下班車12分鐘后到站”?
  理解背后的“意圖”
  這也引出了未來的語音技術(shù)所需的第三個,也是最重要的一個因素:語境。人們的對話里包含著豐富的語境信息:詞匯表達的意思,代詞指代的對象,還有那些被重讀的單詞。這其中牽涉到一系列細微的語言模式(心理語言學家赫伯·克拉克稱其為“定位”),使得一句像“你懂了沒?”這樣的短問句,就足以暗示一段微妙、共有的經(jīng)歷因為對話中的另一方清楚你所暗指的是什么。
  而這些語境,正是手機可以大展身手的場合,尤其是考慮到語音技術(shù)發(fā)展的現(xiàn)狀與未來的話:手機知道它自己身處何處;它能夠識記我在不在上班、在哪里上班;它清楚我都跟誰打過電話,誰是對我更重要的人。
  如果我用的是清一色的安卓或者iOS應(yīng)用的話,手機還能掌握我的郵件信息、日程安排,還有我的興趣愛好。于是,當我問“公交是幾點來著?”的時候,手機就會聽懂我說的是哪趟車、哪一站、哪個方向,甚至還包括我要將花多久才能趕到車站。事實上,說不定在我發(fā)問之前,手機里的鬧鐘就會自動響起,提醒我該起身出門趕車去了,還能順帶一句“別忘帶雨傘哦”就像一個稱職的管家一樣。
  對語境的分析,不僅有助于我們理解一詞一句,更能幫我們理解其背后的“意圖”。盡管在一些手機應(yīng)用中,我們多多少少已經(jīng)體驗到了這些功能;但就語音而言,相關(guān)技術(shù)還遠未成熟。至少目前看來還言之尚早。畢竟,我們不能忽視社會因素的影響:在公共場合,我們未必會和手機“交談”,可能是因為我們不想打擾他人,也可能是因為我們不愿暴露隱私。
  但事情總是在變化的。我是美國最早用上第一代手機(摩托羅拉MicroTac)的人之一。當年我打著大哥大走在馬路上的時候,周圍的人看我就像看個瘋子一樣即使是在 MIT這樣遍地技術(shù)狂的校園里也毫不例外。而現(xiàn)在,看到那些戴著藍牙耳機自顧自聊天的路人,我們都已經(jīng)見怪不怪了要知道,從前這可都是瘋子的標志呢。
  (作者系麻省理工媒體實驗室科學家,語言+移動項目組負責人,譯者:北大西洋的龍貓)
本文地址:http://m.qingdxww.cn/thread-113946-1-1.html     【打印本頁】

本站部分文章為轉(zhuǎn)載或網(wǎng)友發(fā)布,目的在于傳遞和分享信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責;文章版權(quán)歸原作者及原出處所有,如涉及作品內(nèi)容、版權(quán)和其它問題,我們將根據(jù)著作權(quán)人的要求,第一時間更正或刪除。
您需要登錄后才可以發(fā)表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區(qū)
  • 使用SAM-IoT Wx v2開發(fā)板演示AWS IoT Core應(yīng)用程序
  • 使用Harmony3加速TCP/IP應(yīng)用的開發(fā)培訓教程
  • 集成高級模擬外設(shè)的PIC18F-Q71家族介紹培訓教程
  • 探索PIC16F13145 MCU系列——快速概覽
  • 貿(mào)澤電子(Mouser)專區(qū)

相關(guān)視頻

關(guān)于我們  -  服務(wù)條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯(lián)系我們
電子工程網(wǎng) © 版權(quán)所有   京ICP備16069177號 | 京公網(wǎng)安備11010502021702
快速回復(fù) 返回頂部 返回列表
主站蜘蛛池模板: 亚欧乱色视频网站大全 | 西瓜视频在线观看免费 | 香蕉福利 | www毛片 | 在线精品国精品国产不卡 | 日本视频在线免费观看 | 国产精品午夜寂寞视频 | 女人18一级特级毛片免费看 | 六月综合激情 | 国产短视频精品区第一页 | 久久99国产精品二区不卡 | 视频精品一区二区三区 | 亚洲色图综合网 | 欧美一区二区放荡人妇 | 亚洲区视频| 久久婷婷国产精品香蕉 | 青青青青操| 高清国语自产拍免费视频国产 | 动漫av网站免费观看 | 天天操天天操天天干 | 国产成人亚洲精品乱码在线观看 | 欧美一区视频 | 超昂天使在线观看 | 午夜小视频在线观看 | 九九视频在线观看 | 亚洲第一区视频 | 芭乐视频黄 | 99久久精彩视频 | 日韩美视频网站 | 四虎2023| 国产性夜夜夜春夜夜爽 | 国产精品v欧美精品∨日韩 国产精品va在线观看一 | 日本不卡三级 | 看特级毛片 | 国产精品短视频 | 欧美国产中文字幕 | 日韩第五页 | 亚洲欧美国产精品第1页 | 麻豆国产13p | www.欧美在线 | 日韩欧美精品中文字幕 |