(蘋果推出了iPhone 4S語音技術(shù),人們第一次可以用語言和手機(jī)進(jìn)行人工智能對(duì)話,不過這并不是一個(gè)新的想法,早在1987年蘋果就發(fā)布過一個(gè)視頻“知識(shí)導(dǎo)航”闡明了這一概念,一個(gè)折疊式的平板運(yùn)行Mac系統(tǒng),半透明的可折疊式屏幕,看上去就像是《星際迷航》里的設(shè)備,機(jī)器里的人工智能助手可以和用戶侃侃而談,并提供圖表和數(shù)據(jù),這一切和Siri都是那么的相似。) iPhone 4s發(fā)布會(huì)現(xiàn)場(chǎng)蘋果演示的Siri技術(shù)相當(dāng)神奇,機(jī)器可以根據(jù)人的語音自動(dòng)發(fā)起各種動(dòng)作并將應(yīng)用和數(shù)據(jù)信息提供到屏幕上,那么Siri目前能實(shí)現(xiàn)多少功能,有多少命令可以被識(shí)別呢,TUAW整理了一份命令列表大家可以關(guān)注下: Address Book Querying Contacts
Calendars Adding Events
Setting Alarms
Sending Messages
Checking Up on Friends
Directions
Sending Texts
Playback
Creating and finding notes
Phone calls
Requesting reminders
Checking Stocks
Weather Checking the Forecast
Looking up information
Using Wolfram Alpha
![]() 業(yè)內(nèi)人士認(rèn)為,蘋果限制Siri的使用是合理的,因?yàn)镾iri集成了大量功能,例如學(xué)習(xí)用戶的自然語音,理解用戶所說的英語、法語和德語詞匯。不過,老款iPhone的用戶可能會(huì)對(duì)無法使用這一功能感到失望。 蘋果的“Let’s Talk iPhone”大會(huì)已經(jīng)結(jié)束,留下了很多值得期待的東西。其中很重要的一項(xiàng)是其即將發(fā)布的最新款iPhone 4S中的Siri軟件。 收購 去年 4 月,蘋果收購一家名為 Siri 的公司,Siri公司為iPhone開發(fā)了一款名為Siri的“虛擬個(gè)人助理”應(yīng)用,該應(yīng)用能夠?yàn)槭謾C(jī)提供自然語言搜索功能。這就是現(xiàn)在iPhone 4S中的Siri。 Siri用到的核心技術(shù)為自然語言認(rèn)知、解析、搜索和匹配,就像一個(gè)手機(jī)上的語音搜索引擎一樣。或許你會(huì)說,一個(gè)功能如此受限的手機(jī)居然能夠做比強(qiáng) 大的電腦還多的事情。沒錯(cuò),從處理能力上講,這些功能對(duì)于一款哪怕是雙核處理器的智能手機(jī)來講也太難。不過,Siri可以利用網(wǎng)絡(luò)的力量。事實(shí)上,這正是 Siri的精妙所在。Siri的數(shù)據(jù)源都是開放API的權(quán)威數(shù)據(jù)源,如維基百科和Wolfram Alpha,前者以其儲(chǔ)存的知識(shí)量和知識(shí)的權(quán)威性著稱,而后者則主要擅長智能分析。如果蘋果能夠?qū)⒚绹娇盏臄?shù)據(jù)源拿過來,那你就可以通過Siri定票 了。 此外,因?yàn)镾iri能夠幫助你把語言轉(zhuǎn)化成文本,因此可以幫你快速處理日常生活中的很多“瑣事”。比如發(fā)郵件或者發(fā)Tweets,只需用口頭告訴 Siri就行,不需要用手慢慢的打字。而Todo List也可能不需要你精心打理了,想想你每天浪費(fèi)在安排事情上的時(shí)間有多少! 我們知道,亞馬遜的Slik瀏覽器借助其強(qiáng)大的云后端幫你獲取和處理數(shù)據(jù),其實(shí)Siri的原理與此類似。如果沒有Wolfram Alpha強(qiáng)大的計(jì)算和分析能力,如果沒有維基百科提供的海量數(shù)據(jù),Siri恐怕也沒法達(dá)到預(yù)想的功能。所有這些,再次證明了開放數(shù)據(jù)的無限可能性。(美帝的)世界因此更美好。 噪音 當(dāng)然,當(dāng)你在大街上對(duì)著Siri說話的時(shí)候,也可能產(chǎn)生噪音。試想,如果你和朋友各自問自己的Siri的話都被對(duì)方的Siri聽到了,Siri是否困惑?當(dāng)你的妻子問她的Siri一些關(guān)于你的未知秘密時(shí),你又做何想? 國內(nèi)類似產(chǎn)品 國內(nèi)有類似產(chǎn)品如何?據(jù)說,你跟手機(jī)聊天時(shí),手機(jī)可以把你的話錄下來,然后通過網(wǎng)絡(luò)傳輸?shù)浇邮芏耍邮芏擞袑?門的接受員“解析”你的話,然后為你提供精準(zhǔn)服務(wù)。這是國內(nèi)某運(yùn)營商的一款產(chǎn)品。哪怕你說四川話也能幫你“解析”。當(dāng)然,這種產(chǎn)品肯定要比Siri這樣所 謂的智能機(jī)器強(qiáng)很多。只是其成本和速度不如Siri,更重要的時(shí)它的scalability不強(qiáng)。 iPhone 4S全新的語音控制功能名為Siri,令iPhone4S變身為一臺(tái)智能化機(jī)器人,利用Siri用戶可以通過手機(jī)讀短信、介紹餐廳、詢問天氣、語音設(shè)置鬧鐘等。Siri可以支持自然語言輸入,并且可以調(diào)用系統(tǒng)自帶的天氣預(yù)報(bào)、日程安排、搜索資料等應(yīng)用。還能夠不斷學(xué)習(xí)新的聲音和語調(diào),提供對(duì)話式的應(yīng)答。 事實(shí)上,語音控制一直都是人們夢(mèng)寐以求的功能之一,蘋果在iPhone 3GS中就加入了這一功能。但不得不說的說,直到Siri的出現(xiàn),蘋果才真正將手機(jī)革命帶入了語音控制這塊戰(zhàn)場(chǎng)中,用戶也真正實(shí)現(xiàn)了同電子設(shè)備的人機(jī)交互。 應(yīng)該說任天堂的Wii游戲機(jī)第一次實(shí)現(xiàn)了人機(jī)在動(dòng)作感應(yīng)上的互動(dòng),顛覆了人們傳統(tǒng)的游戲方式與游戲體驗(yàn)。蘋果的第一代iPhone則第一次實(shí)現(xiàn)了用戶與移動(dòng)設(shè)備在觸摸面板上的互動(dòng),并將大尺寸觸摸面板提升到了業(yè)內(nèi)標(biāo)準(zhǔn)的高度。現(xiàn)在,幾乎所有的智能手機(jī)和平板電腦都沿用了蘋果公司的這一策略。 如今,蘋果希望Siri能夠成為語音控制領(lǐng)域的業(yè)內(nèi)標(biāo)準(zhǔn),說不定在不久的未來,我們將有能力不用觸摸、點(diǎn)擊或者打字,而僅僅通過說話的方式便完成對(duì)設(shè)備的控制。 就語音控制本身來說,這一技術(shù)也有著相當(dāng)充分的發(fā)展空間。通過語音控制用戶將可以大大減少關(guān)注手機(jī)屏幕的時(shí)間與頻率,更好的關(guān)注自己手頭的事情。而且,語音控制可以非常有效的提高那些正在運(yùn)動(dòng)、開車甚至是視力受損用戶的使用體驗(yàn)。 除此之外,對(duì)大部分用戶來說,通過語音方式來組織句子比在鍵盤上一個(gè)個(gè)字母的敲擊要容易許多。 當(dāng)然,在實(shí)際使用過程中,Siri同樣面臨著不小的挑戰(zhàn)。我們都知道,語音控制在嘈雜環(huán)境中使用效果不佳,且往往在面對(duì)繁多地方口音或者語調(diào)較快的句子時(shí)的識(shí)別效果較差。 最近,我曾經(jīng)在App Store中下載過幾個(gè)語音識(shí)別應(yīng)用進(jìn)行試用,但在實(shí)際使用過程中,這些軟件無一例外的都令我感到十分沮喪。 但即便如此,我仍愿意打賭Siri將是一款與眾不同的產(chǎn)品。畢竟,蘋果此前就為業(yè)內(nèi)掀起了兩次革命,也許Siri會(huì)成為這第三次革命的導(dǎo)火索。 語音識(shí)別 但在周二的iPhone 4S發(fā)布會(huì)上,最受關(guān)注的功能卻是一款名為“Siri”的語音識(shí)別技術(shù)。蘋果展示了多種人機(jī)對(duì)話場(chǎng)景,包括管理日程安排、尋找餐館以及查詢天氣。 美國市場(chǎng)研究公司Forrester分析師弗蘭克·吉利特(Frank Gillett)說:“這邁出了很大的一步。能夠與設(shè)備對(duì)話將為用戶提供更多選擇,而不僅僅是用手指在設(shè)備上點(diǎn)點(diǎn)劃劃。” 但這項(xiàng)技術(shù)是否足以讓iPhone 4S成為消費(fèi)者的必備品,并在一眾競(jìng)爭(zhēng)對(duì)手中脫穎而出,仍然有待觀察。美國市場(chǎng)研究公司CCS Insight分析師約翰·杰克遜(John Jackson)說:“目前還不清楚Siri是否足以吸引用戶購買。歷史經(jīng)驗(yàn)表明,用戶不會(huì)太看重這類技術(shù)。” 具體應(yīng)用 語音識(shí)別技術(shù)并不新穎,早在十幾年前就已經(jīng)被應(yīng)用于PC。就連車載GPS等科技含量較低的設(shè)備也已經(jīng)配備了語音功能。谷歌也在一年多以前面向Android智能手機(jī)操作系統(tǒng)推出了語音識(shí)別技術(shù)。該公司最近還在搜索引擎中整合了語音識(shí)別功能。 但吉利特表示,蘋果的技術(shù)不僅可以識(shí)別語音,還可以根據(jù)用戶所說的話執(zhí)行任務(wù),使之更加接近真正的“個(gè)人助理”。 在展示過程中,蘋果高管問iPhone 4S,今天是否需要帶雨衣?這款手機(jī)回答到:“今天看起來的確要下雨。”在另外一段Siri技術(shù)的演示視頻中,一位正在慢跑的用戶要求手機(jī)預(yù)訂一個(gè)餐館。手機(jī)回答道:已經(jīng)預(yù)訂過了。 蘋果稱,Siri最初僅支持英語、法語和德語,很快還將支持更多語種。該公司去年早些時(shí)候收購了語音識(shí)別創(chuàng)業(yè)企業(yè)Siri。 其他升級(jí) 2007年發(fā)布的iPhone如今已經(jīng)成為全球最暢銷的智能手機(jī)。但由于可供摩托羅拉、HTC和三星等手機(jī)廠商免費(fèi)使用,因此谷歌Android操作系統(tǒng)的合并份額仍然高于iPhone。 iPhone 4S采用蘋果自主設(shè)計(jì)的雙核A5處理器,視頻和圖形性能都得以提升。攝像頭則從500萬像素提升到800萬像素。 蘋果還公布了即將推出的云計(jì)算服務(wù)的更多細(xì)節(jié)。iPhone和iPad用戶將可以把音樂、照片和其他數(shù)據(jù)存儲(chǔ)在蘋果的遠(yuǎn)程服務(wù)器中,流程與谷歌和亞馬遜的云計(jì)算服務(wù)類似。 美國市場(chǎng)研究公司Gartner分析師范·貝克(Van Baker)表示,真正能夠令iPhone 4S脫穎而出的是Siri技術(shù)。“這項(xiàng)技術(shù)很先進(jìn),他們把門檻抬高了。”他說。 |