1 引言 據廣州市公布的《2005年廣州市交通發展年度報告》統計,2005年廣州市機動車擁有量為177.4萬輛;據《法制晚報》報道2006年5月份北京機動車保有量可突破300萬輛。奧運時將突破330萬輛;而據2006年GSM協會公布的一組數據稱:GSM手機用戶數量超過20億,中國市場最大。以上三組不同的數據顯示:越來越多的人在駕駛著機動車并通過GSM終端與外界進行通訊。 現階段,許多機動車輛都安裝了車載終端。它主要用于車載導航、車輛調度、車載監控等。而許多終端設備是依靠手工操作顯示終端來完成的,如駕駛員查看車輛調度中心或朋友發來的重要短消息。查看導航終端的地圖等。這樣就導致司機開車時不能專心,其直接后果可能導致嚴重的交通事故。 語音交流是人類最自然的交流方式,如果車載終端的很多操作可由實時的語音來代替的話,將有利于減少交通事故的發生率。例如,GSM Modem收到短消息,司機不用手動查看。語音合成系統可以自動播報出來;可以實時地提示司機行駛的方向與路名;可以實時地將交通狀況播報出來。讓駕駛員了解當前交通狀況,通過了解道路交通擁堵的實時信息,從而避開擁堵路段,更快到達目的地等。語音合功能成的車載終端可提高車載終端的智能性、車輛駕駛的安全性和舒適性,使用戶使用起來更加方便,更具有人性化。 2 語音合成及GSM M0dem 2.1 語音合成技術 語音合成技術是利用計算機、智能系統等設備,按預定的程序和指令,人為產生音素、音節、詞和句子的技術。 目前,語音合成技術已發展到能實時地將任意文本轉換成連續可懂的自然語句輸出,相應技術通常稱為文語合成或文語轉換(Text To Speech,簡稱TTS),涉及到聲學、語言學、語音數字信號處理技術、多媒體技術等多個學科。文語合成的原理:根據韻律建模的結果,從原始語音庫中取出相應的語音基元,利用特定的語音合成技術對語音基元進行韻律特性的調整和修改,最終合成出符合實際的語音。 2.2 語音合成模塊 本設計采用安徽中科大訊飛信息科技有限公司研發的一款高端中文語音合成模塊XF-S4240。該模塊可通過UART、SPI和12C三種接口接收待合成的文本,直接合成為語音輸出(Line out)。 該模塊采用。InterSound4.0 KT系統作為模塊內核,一個是輕量級中文連續語音合成系統。 XF-S4240模塊的特點如下:支持任意中文文本的合成。支持英文字母的合成,遇到英文單詞時按字母方式發音;支持四種內碼格式:GB2312(簡體中文編碼)、GBK(國家標準擴展編碼)、Unicode(字符編碼)、Big5(繁體中文編碼);具有雙發音人:男聲、女聲;具有智能的文本分析處理算法,可正確識別和處理數值、號碼、時間日期及一些常用的度量衡符號,具備較強多音字處理和中文姓氏處理能力;支持軟件調節語速、語調、音量等。 2.3 GSM Modem GSM Modem是繼GSM手機后又一種非常重要的GSM移動通信系統的終端設備。GSM Modem作為一種主要的GSM網絡接入設備,它是傳統調制解調器與GSM無線移動通信系統相結合的一種數據終端設備,因此也叫無線調制解調器。它的出現打開了GSM網絡數據通信及其應用的大門。本設計采用西門子公司生產的第三代GSM雙頻ModemTC35i,該模塊可廣泛應用于POS終端、手持式設備、移動電腦、無線電話、交通控制和導航系統、快速管理安全系統、遠程監視、遠程抄表、自動售賣機等系統。 3 車載終端的硬件設計 系統硬件是以廣州周立功單片機發展有限公司的ARM7系列Smart ARM2200嵌入式平臺為基礎。平臺主控制器采用飛利浦公司生產的16/32位ARM7TDMI-S微控制器IPC2210,它具有豐富的外部接口,例如工業標準的UART、高速的I2C接口(400 kb/s)、SPI接口、A/D轉換接口等,可以方便地與其他外設互連。 系統底層軟件采用μCliunx內核,該內核是針對微控制領域而設計的Linux系統,適合無內存管理單元(MMU)的微控制器。 XF-S4240模塊可通過UART、SPI和I2C接口實現與其他終端設備的通訊。本系統設計利用SmartARM2200嵌入式平臺的I2C接口與XF-S4240的12C接口進行通訊。XF-S4240設置為從設備,默認地址為0x80,Smart ARM2200設置為主設備。GSM Modem則通過標準UART口與SmartARM2200嵌入式系統的通用串口2連接。 4 軟件設計 4.1 語音模塊合成的通訊協議 無論XF-S4240采用UART、SPI還是I2C與其他智能系統連接,語音合成模塊的上層通訊協議是相同的,下面將介紹語音合成的控制命令。 發送給XF-S4240的所有命令與數據均采用"幀"的方式進行數據封裝后傳輸。 其中,幀頭長度為一個字節,定義為16進制"0xFD";數據區長度占兩個字節,高字節在前,低字節在后。數據區長度不定,但須小于1 024個字節。數據區包含命令字、命令參數和合成的語音信息。 此幀的含義:0xFD表示幀頭,0x00 0x0A表示數據區長度為10個字節。0x01表示語音合成命令,0x00表示文本格式為GB2312,剩余的16進制編碼為中山大學的GB2312編碼。 4.2 TC35i GSM Modem的通訊協議 TC35i GSM Modem與其他終端采用通用串行接口進行通訊,通訊協議采用AT指令集。本設計主要讀取GSM Modem的短消息。而與短消息收發有關的規范主要包括GSM 03.38,GSM 03.40和GSM07.05。前兩者重點描述的是SMS技術實現(編碼方式),后者規定了SMS的DTE-DCE接口標準(AT命令集)。AT指令是以AT為開頭,如AT+CMGL=0(GSM 07.05版本)表示讀取最新收到的短消息,AT+CMGC表示發出一條短消息等。 短消息共有3種接收與發送模式:Block Mode(塊模式),Text Mode(文本模式)和PDU Mode(PDU模式)。PDU模式最常用,支持所有手機,可以使用任何字符集。下面給出一個PDU模式下的ASCII串,其短消息中心號碼(SMSC)是+8613800200500,發送者號碼是13826468897.消息內容是"中山大學",則通過讀取它的"PDU串"是:"08 9l 68 3l 0820 00 05 F0 04 0D 91 68 31 28 46 86 98 F7 00 0860 30 02 11 82 21 80 08 D0 D6 BD C9 F3 B4 A7D1"。通過以上這個PDU串得知.要得到需要的用戶信息就必須對"PDU串"進行解碼。下面給出"PDU串"解碼的數據結構。 4.3 應用程序的設計與流程 嵌入式平臺SmartARM220的應用程序是運行于μCliunx內核之上,應用程序不能直接對硬件操作。為了實現硬件與外部設備通訊,必須調用相應的設備驅動程序。本文主要涉及UART驅動、I2C驅動,嵌入式驅動程序的設計方法在這里省略。 5 結束語 基于語音合成技術和語音模塊XF-S4240的車載終端可廣泛應用于導航系統、車載調度、車載監控等。由于該技術的通用性,它還可應用于其他需要語音合成技術的場合,如排隊叫號系統,公交報站器等。目前語音識別技術雖已取得很大的成績,但效果不如語音合成技術,相信不久人們就可利用更加先進的語音技術自然地與機器進行交流! |