(蘋果推出了iPhone 4S語音技術,人們第一次可以用語言和手機進行人工智能對話,不過這并不是一個新的想法,早在1987年蘋果就發布過一個視頻“知識導航”闡明了這一概念,一個折疊式的平板運行Mac系統,半透明的可折疊式屏幕,看上去就像是《星際迷航》里的設備,機器里的人工智能助手可以和用戶侃侃而談,并提供圖表和數據,這一切和Siri都是那么的相似。) iPhone 4s發布會現場蘋果演示的Siri技術相當神奇,機器可以根據人的語音自動發起各種動作并將應用和數據信息提供到屏幕上,那么Siri目前能實現多少功能,有多少命令可以被識別呢,TUAW整理了一份命令列表大家可以關注下: Address Book Querying Contacts
Calendars Adding Events
Setting Alarms
Sending Messages
Checking Up on Friends
Directions
Sending Texts
Playback
Creating and finding notes
Phone calls
Requesting reminders
Checking Stocks
Weather Checking the Forecast
Looking up information
Using Wolfram Alpha
業內人士認為,蘋果限制Siri的使用是合理的,因為Siri集成了大量功能,例如學習用戶的自然語音,理解用戶所說的英語、法語和德語詞匯。不過,老款iPhone的用戶可能會對無法使用這一功能感到失望。 蘋果的“Let’s Talk iPhone”大會已經結束,留下了很多值得期待的東西。其中很重要的一項是其即將發布的最新款iPhone 4S中的Siri軟件。 收購 去年 4 月,蘋果收購一家名為 Siri 的公司,Siri公司為iPhone開發了一款名為Siri的“虛擬個人助理”應用,該應用能夠為手機提供自然語言搜索功能。這就是現在iPhone 4S中的Siri。 福音 Siri用到的核心技術為自然語言認知、解析、搜索和匹配,就像一個手機上的語音搜索引擎一樣。或許你會說,一個功能如此受限的手機居然能夠做比強 大的電腦還多的事情。沒錯,從處理能力上講,這些功能對于一款哪怕是雙核處理器的智能手機來講也太難。不過,Siri可以利用網絡的力量。事實上,這正是 Siri的精妙所在。Siri的數據源都是開放API的權威數據源,如維基百科和Wolfram Alpha,前者以其儲存的知識量和知識的權威性著稱,而后者則主要擅長智能分析。如果蘋果能夠將美國航空的數據源拿過來,那你就可以通過Siri定票 了。 此外,因為Siri能夠幫助你把語言轉化成文本,因此可以幫你快速處理日常生活中的很多“瑣事”。比如發郵件或者發Tweets,只需用口頭告訴 Siri就行,不需要用手慢慢的打字。而Todo List也可能不需要你精心打理了,想想你每天浪費在安排事情上的時間有多少! 我們知道,亞馬遜的Slik瀏覽器借助其強大的云后端幫你獲取和處理數據,其實Siri的原理與此類似。如果沒有Wolfram Alpha強大的計算和分析能力,如果沒有維基百科提供的海量數據,Siri恐怕也沒法達到預想的功能。所有這些,再次證明了開放數據的無限可能性。(美帝的)世界因此更美好。 噪音 當然,當你在大街上對著Siri說話的時候,也可能產生噪音。試想,如果你和朋友各自問自己的Siri的話都被對方的Siri聽到了,Siri是否困惑?當你的妻子問她的Siri一些關于你的未知秘密時,你又做何想? 國內類似產品 國內有類似產品如何?據說,你跟手機聊天時,手機可以把你的話錄下來,然后通過網絡傳輸到接受端,接受端有專 門的接受員“解析”你的話,然后為你提供精準服務。這是國內某運營商的一款產品。哪怕你說四川話也能幫你“解析”。當然,這種產品肯定要比Siri這樣所 謂的智能機器強很多。只是其成本和速度不如Siri,更重要的時它的scalability不強。 iPhone 4S全新的語音控制功能名為Siri,令iPhone4S變身為一臺智能化機器人,利用Siri用戶可以通過手機讀短信、介紹餐廳、詢問天氣、語音設置鬧鐘等。Siri可以支持自然語言輸入,并且可以調用系統自帶的天氣預報、日程安排、搜索資料等應用。還能夠不斷學習新的聲音和語調,提供對話式的應答。 事實上,語音控制一直都是人們夢寐以求的功能之一,蘋果在iPhone 3GS中就加入了這一功能。但不得不說的說,直到Siri的出現,蘋果才真正將手機革命帶入了語音控制這塊戰場中,用戶也真正實現了同電子設備的人機交互。 應該說任天堂的Wii游戲機第一次實現了人機在動作感應上的互動,顛覆了人們傳統的游戲方式與游戲體驗。蘋果的第一代iPhone則第一次實現了用戶與移動設備在觸摸面板上的互動,并將大尺寸觸摸面板提升到了業內標準的高度。現在,幾乎所有的智能手機和平板電腦都沿用了蘋果公司的這一策略。 如今,蘋果希望Siri能夠成為語音控制領域的業內標準,說不定在不久的未來,我們將有能力不用觸摸、點擊或者打字,而僅僅通過說話的方式便完成對設備的控制。 就語音控制本身來說,這一技術也有著相當充分的發展空間。通過語音控制用戶將可以大大減少關注手機屏幕的時間與頻率,更好的關注自己手頭的事情。而且,語音控制可以非常有效的提高那些正在運動、開車甚至是視力受損用戶的使用體驗。 除此之外,對大部分用戶來說,通過語音方式來組織句子比在鍵盤上一個個字母的敲擊要容易許多。 當然,在實際使用過程中,Siri同樣面臨著不小的挑戰。我們都知道,語音控制在嘈雜環境中使用效果不佳,且往往在面對繁多地方口音或者語調較快的句子時的識別效果較差。 最近,我曾經在App Store中下載過幾個語音識別應用進行試用,但在實際使用過程中,這些軟件無一例外的都令我感到十分沮喪。 但即便如此,我仍愿意打賭Siri將是一款與眾不同的產品。畢竟,蘋果此前就為業內掀起了兩次革命,也許Siri會成為這第三次革命的導火索。 語音識別 但在周二的iPhone 4S發布會上,最受關注的功能卻是一款名為“Siri”的語音識別技術。蘋果展示了多種人機對話場景,包括管理日程安排、尋找餐館以及查詢天氣。 美國市場研究公司Forrester分析師弗蘭克·吉利特(Frank Gillett)說:“這邁出了很大的一步。能夠與設備對話將為用戶提供更多選擇,而不僅僅是用手指在設備上點點劃劃。” 但這項技術是否足以讓iPhone 4S成為消費者的必備品,并在一眾競爭對手中脫穎而出,仍然有待觀察。美國市場研究公司CCS Insight分析師約翰·杰克遜(John Jackson)說:“目前還不清楚Siri是否足以吸引用戶購買。歷史經驗表明,用戶不會太看重這類技術。” 具體應用 語音識別技術并不新穎,早在十幾年前就已經被應用于PC。就連車載GPS等科技含量較低的設備也已經配備了語音功能。谷歌也在一年多以前面向Android智能手機操作系統推出了語音識別技術。該公司最近還在搜索引擎中整合了語音識別功能。 但吉利特表示,蘋果的技術不僅可以識別語音,還可以根據用戶所說的話執行任務,使之更加接近真正的“個人助理”。 在展示過程中,蘋果高管問iPhone 4S,今天是否需要帶雨衣?這款手機回答到:“今天看起來的確要下雨。”在另外一段Siri技術的演示視頻中,一位正在慢跑的用戶要求手機預訂一個餐館。手機回答道:已經預訂過了。 蘋果稱,Siri最初僅支持英語、法語和德語,很快還將支持更多語種。該公司去年早些時候收購了語音識別創業企業Siri。 其他升級 2007年發布的iPhone如今已經成為全球最暢銷的智能手機。但由于可供摩托羅拉、HTC和三星等手機廠商免費使用,因此谷歌Android操作系統的合并份額仍然高于iPhone。 iPhone 4S采用蘋果自主設計的雙核A5處理器,視頻和圖形性能都得以提升。攝像頭則從500萬像素提升到800萬像素。 蘋果還公布了即將推出的云計算服務的更多細節。iPhone和iPad用戶將可以把音樂、照片和其他數據存儲在蘋果的遠程服務器中,流程與谷歌和亞馬遜的云計算服務類似。 美國市場研究公司Gartner分析師范·貝克(Van Baker)表示,真正能夠令iPhone 4S脫穎而出的是Siri技術。“這項技術很先進,他們把門檻抬高了。”他說。 |