智能座艙的語音系統被稱為VOS(語音操作系統),主要負責座艙內用戶和車機的語音交互。在系統架構上,VOS系統分為車機和算法兩部分。VOS系統的車機系統包括車云兩端。車端和駕車人員直接交互的模塊叫做對話系統(DS),其主要由麥克風陣列、喚醒模塊、音頻處理模塊組成。為了實現更好的語音交互體驗,DS的音頻處理模塊功能非常豐富,包括AEC、VAD、音頻壓縮、喚醒詞識別、聲源定位等。 VOS的云端部分主要用于實現在線語音功能,包括在線ASR識別、對話服務以及實時信息同步等。 當然,上述功能的實現都離不開算法的支持,算法是智能座艙VOS的靈魂。對于算法而言,兩種類型的數據最為關鍵。一種是原始訓練數據,主要用于實現VOS系統的各種功能定義和喚醒,以及打造喚醒詞庫;另一種是用戶的個人數據,這是系統算法逐漸體現私人定制屬性的關鍵所在,一般VOS系統會不定期地采集、標注用戶數據,結合系統大數據不斷提升VOS系統的智能化水平。 從發展趨勢來看,智能座艙VOS系統已經逐漸從雙音區變化為四音區,在駕駛員、副駕、后排左側和后排右側四個區域都能實現很好的定位識別,通過聲源定位的方式鎖定當前發布指令的音區。在此基礎上,廠商在逐漸嘗試對VOS系統進行“喚醒連說”,也就是用戶在喚醒系統之后可以不用等待系統反饋音,而是將喚醒詞和指令同時說出。此外,部分VOS系統也在嘗試無喚醒詞下達指令以及離線指令識別,當然這些創新功能對車機硬件的智能化水平要求也比較高。當然,目前的智能座艙不僅會聽回答,也會說會唱。也就是說,現階段的車載聲學系統不僅僅是簡單的交互,而是要打造隔音靜謐性、環繞式座艙體驗,讓駕乘人員感受到沉浸式的聽覺盛宴。以騰訊TAI4.0智能座艙解決方案為例,其中兩個亮點功能是全民K歌車載版以及騰訊愛趣聽,后者是業內首個融合音樂、相聲、視頻、新聞、K歌、長音頻等多內容的車載娛樂產品。 豐富的軟件功能就需要硬件來搭配,這也就推動了智能座艙音響系統的大升級。智能座艙音響系統的第一階段是智能音樂座艙,目前小鵬P7、AION LX、領克05等車型都在主打這一理念。這些品牌的智能音樂座艙有一個明顯的共同點就是品牌音響+多揚聲器,其中小鵬P7采用丹拿品牌音響,用了18個揚聲器。當然,除了多揚聲器的升級方案,部分車企還選擇加裝低音炮產品以提高整車音效。 |