東芝供稿 —RECAIUS 語音深度交互 讓世界零距離 試想一下,我們在高速公路上使用GPS導航時,我們更愿意口述目的地還是手動輸入目的地?未來,語音將極大程度上代替鍵盤,成為我們與計算機交流的主要方式。 隨著深度學習、大數據以及云計算在語音識別中的廣泛應用,語音識別的技術得到了長足的進展,在此方面有多年經驗的東芝綜合運用其先進的語音、圖像識別技術并綜合云計算服務,開發出能夠助力人與人交流的AI技術——“RECAIUS”。 東芝產業信息通信技術ICT解決方案公司負責“RECAIUS”項目研發的梅木秀雄介紹說:“為了實現人與AI安心、舒適、協調共存,AI需要具備能夠捕捉人類感知和體驗的判斷。在語音識別方面,即便AI沒有完全聽清人們的語音,也能夠從表情動作中給出恰當的應答,并實現一對一的簡單會話,還可分辨多個會話組合,通過計算機算法形成文本。為此,東芝開發出的 RECAIUS 能夠根據人的表情、聲音和動作,綜合判斷把握具體意圖和狀況并做出適宜應答。” ![]() “RECAIUS” 你身邊的同聲傳譯 試想一下,如果一個以英語為母語的人,他一句普通話也不懂,當他想和一位土生土長的中國人交談,他面臨的選擇有兩個:要么他開始艱難的學習,直到能夠熟練掌握中文;要么他就得雇另一個人來幫他翻譯對話,而有了“RECAIUS”,就相當于你身邊有一位同聲傳譯。 相對你手機里面其他的翻譯軟件,東芝的“RECAIUS”具備了同聲傳譯的功能,其不僅可以翻譯多國語言,而且即便是語句間沒有間斷的連續語音,“RECAIUS”也能自動判斷適合翻譯的單位,實現智能斷句,然后逐句完成翻譯。面對一些固有名詞被生硬直譯后無法理解的情況,使用者可以登錄固有詞匯或例句,給出應當如何翻譯的指示,“RECAIUS”就能給出恰當的翻譯。 ![]() ![]() 所見即能翻譯 真正的讀圖時代 除了語音識別、交互、翻譯等功能,東芝還開發了將可視文字信息即時翻譯成其他語言的技術。想象一下,人們出國旅行,來到一家以美味著稱的餐館,卻往往被菜單上的異國文字搞得一頭霧水,如果菜單上又沒有圖片,根本不知道該如何點菜,而東芝的“RECAIUS”可幫你擺脫這個困境,拿起智能手機對準菜單進行拍攝,東芝“RECAIUS”可以瞬間把菜品翻譯成母語,讓你輕松點菜。 ![]() (圖:抹茶 綠茶 烘焙茶 烏龍茶 玄米茶 中國茶) 但是,人們用相機拍攝圖像時,照片上不只有文字,還有背景、圖案等其他信息,為了能夠清晰地從復雜圖像中辨別出文字信息,東芝開發出獨有的圖像特征提取技術,可以精準檢測到文字。而這一技術對國外的街景圖像很有效果,“RECAIUS”可以輕松地從街景的圖像中識別其中的字符串,判斷語言屬性并將字符翻譯成你需要的語言文字顯示在屏幕上。未來我們帶上AR眼鏡,沉浸在異國他鄉的外語世界,或許能夠將眼前充斥著外語的世界轉換成母語來欣賞,會不會是一種非常陌生而又熟悉的景象? ![]() 東芝秉承“以人為本”的技術研發理念 梅木秀雄表示:“隨著科技的進步以及物聯網IoT(Internet of Things)時代的到來,未來不僅是物與物相連,還有人與人相連以及人與物相連。為了給人們的生活和工作創造更加安心、安全、舒適的環境,東芝將一如既往地秉承以人為本的理念,開發越來越智能的AI技術,實現更安全、舒適、人與AI和諧共生的社會。” |