隨著城市建設步伐的加快,城市公共交通也得到了迅速發展,公交線路越來越多,極大地方便了市民和外地游客。同時,公交公司也為人們提供了電話查詢公交線路的服務熱線。目前的服務熱線是人工查詢和自動查詢2種方式。 在人工查詢時,時間長、效果不好;在自動查詢時,人們根據語音提示,采用按鍵操作的方式,也要進行較長的時間才能查詢完畢。例如:如果您要查詢"105''路公交車的運行情況,就需要將"1", "0","5"三個數字通過電話機進行按鍵選擇;如果您要查詢去某一個地方的所有公交車次,那只能通過人工查詢了,因為通過按鍵是不能實現這種查詢服務的。 伴隨著計算機技術和數字電子技術的重大突破性發展,語音識別技術也趨于成熟,尤其是在大詞匯量、非特定的連續語音識別方面,取得了重大進展,已經進入到實用階段。因此,我們提出了采用一種公共語音識別系統對原有的服務熱線進行改造的方案。 1 公交線路智能查詢系統的特點 該公交線路語音查詢系統包括按鍵查詢(只包含公交線路查詢)和語音查詢(含按公交線路查詢和按城市地點查詢)2部分,其中按鍵查詢主要為了適應老客戶,但系統主體是語音查詢,其特點有: (1)實現了交互問答式查詢,用戶只需按系統的提示作出相應的回答,便可得到自己所需的信息。 (2)作為系統本身來說,實現了語音識別的大眾化,任何第一次使用本系統的用戶,不需經過語音訓練,便可滿意的得到所需信息。 (3)可統計系統每天的話務量。 2 系統結構與軟件方法 系統主要由計算機網絡、人工座席、語音處理及存儲、系統管理(數據庫管理十語音編輯)幾部分組成,如圖1所示。本系統使用了工業機,性能穩定,系統平臺為Windows NT操作系統,其作用是利用計算機和數字語音卡來處理大量繁雜的電話業務,提供開放式的公交線路智能查詢服務,具有速度快、全天候、高效率等特點。 2.1 系統軟硬件平臺配置和開發工具選擇(按30線配置) 系統的硬件采用工控機,以實現較高的性能價格比,而且可以通過計算機集群系統大幅度提高整個系統的性能。具體是CPU為P4 2.4G以上,內存為1G以上,硬盤為60G以上。 系統的軟件平臺選擇Windows NT。Windows NT具有良好的圖形管理功能,而且提供了可靠的技術支持和開發環境。 語音卡采用D321/641語音卡,該卡在WindowsNT下的開發非常成熟,可以處理各種不同的需求。 D321/641[3]語音卡具有一下特點: (1)集30/60路語音處理和El/2e1(PCM)數字中繼接口于一體,同時支持一號信令(ssl)和數字一號信令(Dssl)。 (2)功能強大,性價比高,便于用戶構建性能穩定、多功能的應用系統。 (3)采用全DSP結構,處理能力強大,可減輕主機負擔,保證高密度、大容量的應用系統高效穩定地運行。同時,DSP技術便于軟件升級。 數據庫系統采用SQL Server。SQL Server是Windows NT環境下比較成熟的數據庫產品,他具有大型數據庫系統的所有特性,而且便于與NT集成管理。 開發工具選擇Visual C++,Visual Basic等。Visual C++功能強大、控制靈活,可以處理各種程序設計的需要;Visual Basic編制程序速度快,對程序設計人員要求不高,因此將兩者結合起來使用。 2.2 軟件設計 本系統界面由Visual Basic 6.0編程實現。以漢字和圖標明確顯示其功能,操作簡單,一目了然,便于值班人員操作和監控。 各功能程序由Visual C++編程實現,主要分為:檢測振鈴事件及接受用戶語音實現相應的功能調用;確定進入系統后界面菜單的有效狀態以及檢測和初始化電話語音卡;登錄數據庫服務器。 2.3 數據庫服務器的設計 客戶/服務器結構是基于數據庫的應用程序廣泛采用的一種結構。他利用了計算機系統硬件和軟件分布的不平衡性,把數據服務集中在服務器端,而識別客戶端則專門負責處理應用邏輯和界面。這使得程序開發的復雜性大大降低,同時識別客戶端和識別服務器實時通信、協同工作,減少了時延,保證了較高的識別效率?蛻簦⻊掌鹘Y構包括了2個獨立的實體:識別客戶端和識別服務器。前者上運行的應用程序稱為"前端"或"前臺",后者的稱為"后端"。也就是說,服務器增加了"后端數據庫引擎",電話接入時,識別客戶端接管電話用戶的語音輸入,實時傳送到識別服務器,并把識別服務器的識別結果向電話應用平臺層返送,然后進行內部運算查找符合條件的數據,此時客戶機還可以利用這些閑置時間處理其他的工作,等到服務器處理完畢,就會把所需的數據傳遞給前端應用程序。 由于客戶/服務器結構的前端應用程序并不直接對數據庫進行處理,因此利用ODBC作為一個橋梁幫我們打開前端應用程序與后端數據庫管理系統的通道,并且由ODBC API提供制式化的控制函數來維護服務器的數據庫數據。 語音合成的處理是通過邊合成邊播放的策略,避免了由于合成長文本帶來的較大的延時。該系統在分段播放語音時,用戶的任何打斷都可以中止該次合成任務,免去了無謂的資源消耗。 3 系統的實現 本系統在啟動時,首先會訪問DataSource.ini文件,從中讀出有關數據庫信息,若數據庫服務器的數據改動時,只需改動此文件便可。DataSource.ini文件內容如下: [Source] namc=flight [DSN] name="ODBC ;DSN=flight;UID=flight;PWD=flight''其中:name=flight為數據源名稱,DSN為數據源名稱,UID為用戶ID,PWD為用戶密碼。 圖2為用戶通過語音實現的自動查詢系統流程圖。 4 結 語 本系統是以通信系統為背景,滿足實際需要為目的,采用現有成熟的硬件產品與軟件開發相結合的方法設計的一種使用方便、功能完善的語音查詢系統,集成語音識別和語音合成技術,改變舊的使用電話按鍵查詢的使用方式,支持語音輸入,人性化的語音界面使查詢更便捷、更有親和力,為公交系統的熱線服務提供了可靠的技術支持。 |