作者:QUENTIN HARDY 語音識別技術不僅對于手機產業來說至關重要,而且對很多其他設備,特別是電視機的控制來說,也十分關鍵。該技術目前尚處于初級階段,但如果你在思考,到底“蘋果語音助手”(Apple’s Siri)和“谷歌語音搜索”(Google Voice Search)誰會在這場競爭中取勝,那就想想拼寫檢查給我們的啟示吧。 當埃里克·施密特(Eric Schmidt)還是谷歌首席執政官的時候,我問他,谷歌到底擁有什么,能讓它不被任何新出現的搜索引擎打倒。拼寫檢查,他回答道。谷歌仔細研究了輸入查詢框的數十億信息的拼寫錯誤和修正,因此非常清楚用戶出現像“thsi”這樣的拼寫錯誤時,他們實際想要表達的意思是什么。有了這種了解,谷歌在搜索中提供了“您是不是想找”的功能,最終做到了在人們完成輸入之前,就將問題補充完整。 他表示,其他公司不會有這樣的學習積累,因為人們已經開始指望搜索引擎來修正他們的拼寫。客戶仍會繼續使用已經解決了這個問題的谷歌。微軟必應(Microsoft Bing)證明,施密特關于谷歌獨有拼寫檢查功能的說法并不完全正確,但也只有微軟這種規模的大公司才能應付這樣的問題。 現在,使用谷歌來檢查拼寫在全世界都很普遍,而且在谷歌內部,同樣的輔助性知識也經常應用于新產品。 這也許就是“谷歌語音搜索”似乎深受我同事尼克·比爾頓(Nick Bilton)追捧的原因。在安卓操作系統“軟糖豆”(Jelly Bean)的升級版中,它看起來和Siri相似。尼克說,“谷歌語音搜索”對他所說的話識別能力似乎更強,而且回答問題也更出色。網上也有大量視頻展示了這款產品的威力。 如果說谷歌的表現更好,這極可能是因為谷歌2007年推出的一款產品為上述技術奠定了基礎。這款產品名為“谷歌411“(Google-411),或稱“谷歌本地語音搜索”(Google Local Voice Search)。這款產品表面上是為了提供免費信息查詢,其實讓谷歌最感興趣的,是掌握不同人的發音方式。 雖然語音搜索的“軟糖豆”版本最近才推出,但谷歌語言學家已經有了5年數十億不同發音的數據積累。一年前,谷歌就有一個包括2300億詞組的數據庫,這還只是英語。谷歌還在致力于 23個其他語種的開發。這些開發很大程度上都以“411”及相關語音搜索產品為基礎,其中還包括一個“語音搜索”的早期版本。這又是另一種拼寫檢查。 蘋果從來不曾進行類似功能的研發,這也是為什么Siri成為蘋果官方以測試版形式發布的少數產品之一。在Siri的早期階段,它的語音數據庫逐漸建立。當Siri不明白一個問題的時候,它有一些可愛的表達方式,比如重復你剛才的話,也許實際上,這就是為了看你是否會糾正它的理解,這和谷歌掌握拼寫檢查的方法類似。雖然“谷歌語音搜索”的“軟糖豆”版本出現較晚,但它建立在早期研究基礎上的質量優勢,正是它在初級階段表現突出的原因。 開發一個產品是為了另一個產品,語音識別并不是谷歌這么做的唯一領域。安卓系統上的“谷歌眼鏡”(Google Goggles)應用,使用電腦圖像識別技術,能幫助確認用戶所拍攝的物體,也是一款能與谷歌地圖(Google Maps)聯合使用的產品。你可以用“谷歌眼鏡”拍一條街,如果谷歌地圖也用“街景”(Street View)車拍過這個地點,它就能告訴你,你現在是在什么地方。 |