引言 世界是不斷變化的。這種不斷發展的狀態,意味著我們與世界、設備和他人互動的方式也在發生變化。支配這種變化的,除了獲取利潤外,還存在兩種重要的力量:其一,是技術的發展,它推動著我們不斷開拓創新,帶來了各種當今習以為常的設備和應用程序;其二,則是在新冠疫情的推動下,人們對身體健康的關注度變得更高。 當人們擁有更多時間用來娛樂,沉浸式技術便迎來了發展機遇。現在,消費者可以購買到多家制造商推出的虛擬現實和增強現實頭顯設備,業余開發者和專業人員也可以借助開發工具來渲染虛擬世界和場景。這些顯示技術正不時地見諸媒體頭條,與此同時相應的音頻技術也沒被落下。 在公認的五大感知中,聲音也許是人們最先感受到的。不論是大自然的豐富、管弦樂的渾厚,還是靈歌的激蕩,聲音和其他任何感知一樣,都會對我們的情感和生理產生深遠的影響。 發展歷程 我們之所以能繁衍至今,很大程度上離不開我們專注于傾聽的能力。例如,我們的祖先在狩獵時,會通過聲音來追蹤和尋找食物,維持家族或村莊的生計。借助聲音,他們能夠以一種3D沉浸式的方式來定位潛在的致命因素,從而避開捕食者。我們只要聽到聲音,就可以感知到它在哪個方向、距離我們多遠,以及它正以怎樣的速度靠近。 沉浸式音頻是一種高科技音頻處理和音響技術,它的實現離不開高質量的音頻處理,以及一系列經過精心設計、校準和布置的高、中、低音揚聲器單元,這樣才能提供動態的全頻譜聽覺感受。 雖然以往的普通發燒友并不追求這樣的配置,但電影院和各種表演場所多年來一直在運用這項技術。就像所有的開創性技術一樣,它最終會找到自己的方式來惠及其他領域。 現代娛樂系統會采用許多專門的過濾器和動態處理,創造出能讓更多人負擔得起的方案。如今,家庭影院的普及度已經站上新高,新冠疫情的橫行進一步推動了這種趨勢。在遍地開花的游戲裝備和家庭影院中,沉浸式音頻是一種順理成章的需求。 雖然立體聲可以實現基礎的環繞聲能力,但杜比數字5.1 (Dolby Digital 5.1) 技術才是當今應用最廣泛的環繞聲和3D音頻方案。此類系統包括杜比數字、杜比定向邏輯II (Dolby Pro Logic II)、DTS、SDDS和THX等技術,它們都采用圍繞聽眾布置的六揚聲器配置(五個全帶寬聲道、一個重低音揚聲器)(圖1)。這些環繞聲技術首先在電影院中得到應用,這推動了它們實現進一步發展,并將成本降低到大眾可以接受的程度。 圖1:5.1環繞聲使用五個放置在特定位置的全頻揚聲器和一個重低音揚聲器。音頻處理工程師可以通過混音,讓聽眾感覺到聲音似乎在他們周圍移動。重低音揚聲器通常可以放在任意位置。(圖源:Zern Liew/Shutterstock.com) 在這樣的系統中,多個揚聲器都由獨立的音頻流驅動,讓聽眾可以感受到虛擬的聲音環繞在自己周圍。其中,左后和右后聲道負責空間深度;左前、右前和前中置聲道負責橫向深度;重低音揚聲器負責整個空間的低頻聲音。 對于處在收聽區域(也就是沙發)中央的單個聽眾而言,這樣的配置是理想的。在多人收聽的情況下,不同位置的聽眾體驗上會有細微差異,但總體而言是相對一致的,每個人都可以感受到聲音的移動。現在,已經有一些錄音師在新唱片中提供了5.1環繞聲音軌,并以“沉浸式”來進行宣傳。 一個有趣的事實是,前中置聲道針對語音范圍的聲音進行了優化,這有助于聽眾在沉浸于3D音效的同時依然能夠分辨人物對話。在豐富、渾厚的聲音越來越受追捧的情況下,分辨人聲會變得更加困難。通過中置聲道的過濾和放大,聽眾便更容易聽清人物對話。 在5.1環繞聲基礎上,如果取消左后和右后聲道,改為左環繞、右環繞和后中置聲道,便可升級為6.1環繞聲(圖2);如果在6.1環繞聲基礎上取消后中置聲道,改為左后和右后聲道,則成為7.1環繞聲(圖3)。 圖2:6.1環繞聲在左右兩側配備了揚聲器,當音頻對象從前面移向側面或背后時可增強移動音效。重低音揚聲器依然可以隨意放置,這里也不討論有關低音的話題。(圖源:Zern Liew/Shutterstock.com) 7.1環繞聲技術增加了更多揚聲器和獨立聲道,因而可以構建出2.5D的立方體或多邊形聲場,在重要位置配備更多高、中、低音單元,使聽眾沉浸到2D和有限的3D音頻中(圖3)。對于聲音從聽眾正上方或正下方發出的音效,一定程度上可以通過信號處理來近似地實現,但并不能達到比較完美的效果,除非在上方或下方確實有揚聲器。 圖3:以較小角度放置更多揚聲器,有助于消除可能出現的音頻熱點,尤其是在音軌沒有正確地進行混音或處理,或者音頻轉換器未能正確處理環繞聲的情況下。(圖源:Zern Liew/Shutterstock.com) 值得注意的是,我們可以通過音源轉換器對拾取的立體聲音頻信號進行處理,從而創建出合成的多揚聲器環繞聲信號。也就是說,只需借助數字信號處理技術,我們就能夠在很大程度上從立體聲中分離出聲源的位置。當然,3D音頻最理想的解決方案依然是通過3D麥克風拾取聲音,然后使用同樣的3D揚聲器配置來播放,但這種做法即麻煩又困難,而且既然信號處理就能夠實現很近似的效果,也就鮮少有人會如此折騰了。 但信號處理真的是一劑“萬靈丹”嗎?我們敏銳的聽覺,僅僅遇上信號處理和有限的幾個揚聲器,就可以被糊弄嗎?如果不是這樣的話,我們是不是就得用上滿墻、滿天花板的揚聲器? 圖4:有一句老話叫“多多益善”。許多藝人都喜歡在現場配備一大堆揚聲器和功放,這在大型戶外演出中也許是必要的,但你真的希望把整面墻都掛滿揚聲器嗎?在某些情況下,你是不是更希望體驗到更好的音效,而不是更大的音量?(圖源:tommistock/Shutterstock.com) 面向對象的音頻 沉浸式音頻的最新實踐來自杜比全景聲 (Dolby Atmos),它最初是為影院應用而設計的。迄今為止,已有近5000家影院經過改造,通過64個揚聲器帶來這種全新聽覺體驗。該技術支持由多達128個聲道組成的大型陣列,這些聲道可以使用全頻、低音、重低音和高音單元。 與傳統音頻不同的是,杜比全景聲(及其競爭對手索尼360)采用了“音頻對象”的概念。視聽接收器 (AVR) 將自動適配揚聲器的數量、類型和位置,并對每個音頻對象的頻譜構成、振幅位置、速度和方向進行處理。不過,“音頻對象”并不僅僅包含聲音本身,它還帶有各種元數據,幫助對象音頻渲染器 (OAR) 讓對象移動起來。在128個聲道中,10個用于環境效果,余下的118個可用于音頻對象。 這些聲道并不一定對應于特定的揚聲器。聲道信息和聲音對象是對應的,對象音頻可以進行處理,并與其他對象音頻相結合,最終以適當的音量分配到各個揚聲器。整個過程均由AVR借助元數據來實時處理信號,并進行實時混音和分配。 可以想見,這樣的技術絕不像立體聲那樣,只要隨手放兩臺揚聲器就可以實現。對于杜比全景聲以及許多其他環繞聲和3D音響系統,揚聲器在放好位置后還必須進行校準,才能共同呈現出精確的聲場。杜比全景聲還有適用于家庭影院的方案,但并不會用到全部128個聲道。這種家用方案采用的應該是34個揚聲器的配置。 杜比全景聲并不是完全新鮮的事物。2012年,洛杉磯的一家影院舉辦了一部迪士尼電影的首映式,這是該技術的首次實際應用。從那時起,大型影院、IMAX、天文館、音樂劇、戲劇和其他音響應用都積極采用這項技術,使之成為了新電影和活動事實上的音頻拾取標準。杜比全景聲還通過天花板上的揚聲器來構建完整的聲音半球,不僅能夠使聲音真正從上方發出,還讓實時處理變得更加容易。 曾幾何時,杜比全景聲對普通發燒友而言過于復雜和昂貴,但現在它對于有足夠空間和預算的發燒友而言,已經成為讓朋友們驚嘆的必備配置,拉風指數五顆星。 如果你已經在其他環繞聲技術上耗費了大量銀子,那么也可以入手一個杜比全景聲轉換器,然后繼續使用現有的揚聲器和功放。不過,你一定不會止步于此,至少你肯定希望配備天花板揚聲器。該轉換器可以將杜比5.1轉換為17揚聲器的7.4.1環繞聲配置。 值得注意的是,杜比全景聲還可以通過條形音箱而非環繞揚聲器來實現。各種形式的條形音箱技術正越來越受到歡迎。降低成本、簡化設置、降低功耗、減少電纜和縮小尺寸等明顯的優勢推動了這項技術的發展。 相控陣垂直條形音箱已經證明了它們能夠以良好的清晰度和分離度模擬完整的音頻頻譜。使用它們的音樂人會告訴你,帶有6英寸揚聲器的條形音箱柱可為重低音揚聲器應用提供相當于18英寸揚聲器的清晰度。這應該足夠引起一些人的注意了。因此,水平條形音箱和基于條形音箱的混合系統(包括遠程揚聲器)在許多家庭影院和工作室中都很受歡迎。 條形音箱的頂部揚聲器和側邊揚聲器使聲音在墻壁和天花板表面反射,讓聽眾感到它似乎來自上方和背后。現代感十足的特斯拉Model 3就將前置條形音箱技術作為其15揚聲器音頻系統的一部分,從而將環繞聲和沉浸式音頻作為一項賣點。關閉Model 3的后置揚聲器,啟用帶有信號處理和混響的沉浸式音頻模式,便可以體驗到這項功能,那些嘗試過的人都堅信聲音是從后面傳來的。不過它的實際反饋毀譽參半,許多人都不喜歡這樣的音效。測評師的觀點也呈現出兩極化傾向,不少都提到了不同類型的音樂適合或者不適合條形音箱式的沉浸式方案。這是有道理的,因為聲音再現的質量離不開錄音師的混音技術。條形音箱能夠在這種場景中成功落地,意味著準確、帶有上下方向的沉浸式音箱技術在沒有地板和天花板揚聲器的情況下也幾乎都能實現。 拾取和渲染 諸如游戲之類的沉浸式視頻體驗,使用的是一種完全創造出來的環境,由具有表面渲染和指定物理屬性的3D結構組成。真實的視頻片斷可以被捕獲并以數字方式拼接在一起,形成一個包括上下影像的全景。 沉浸式的體驗,例如在國家公園中散步,可以整合豐富的視覺效果,而音頻則可以通過對預先錄制的片段進行組合來合成或創建出來。這些片段可以在3D音響系統中進行拾取,并用作沉浸式體驗的一部分。就像由頭部追蹤控制的視頻一樣,音頻也必須由頭部追蹤來控制。例如,在你面對一條潺潺小溪時,所聽到的聲音與背對它時會有顯著區別。如果沒有通過頭部追蹤來控制聲音,沉浸式體驗就會大打折扣。 好在,你不必為沉浸式的目的而自己發明3D音頻拾取方案。諸如森海塞爾 (Sennheiser) 等知名音頻廠商利用分段軸和數字工具,制造出了專業的真正全向麥克風,以拾取高度定向的聲音(圖5)。AMBEO VR Mic包含多個敏感的寬頻譜麥克風元件,并采用環繞聲配置。DearVR MICRO處理軟件可以渲染定向音頻以提供標準環繞聲配置。 圖5:Sennheiser AMBEO VR Mic等沉浸式音頻拾取技術,使數字音頻引擎能夠根據地磁極和方向來渲染聲場。通過數字求和,可以創造出結合了不同距離多個聲源的復合音頻。(圖源:森海塞爾) 為此,音頻引擎需要知道你頭部的方向和運動。按照今天的標準,這一點在使用頭顯設備時很容易實現,因為它們都內置了頭部追蹤功能用于視頻渲染。但是,如何才能通過局限于兩只耳朵的耳機來實現基于頭部位置的沉浸式音頻系統呢?我們可以把多個微型揚聲器放置在耳機中,模擬環繞聲體驗。對于大多數應用而言,立體聲已經足夠,但它與真正的環繞聲依然不在同一水平上。 非娛樂應用 雖然大多數情況下沉浸式視聽技術會用于娛樂用途,但它在專業用途中也有一席之地。例如,產品設計工程就可以從包括視頻和音頻在內的沉浸式技術中獲益。從視頻的角度而言,可以通過虛擬的方式構建、渲染和檢查復雜組件的機械設計。對于以沉浸式方式生成的虛擬組件,例如噴氣式發動機,我們可以身臨其境地進行構建、推入和檢查,確保齒輪和渦輪對齊。沉浸在制造環境中的工廠專家可以指導世界另一端的維修技術人員進行操作。 沉浸式音頻也可以在工程應用中提供幫助。設計汽車的工程團隊可以聆聽到模擬渲染的發動機和變速箱噪音。他們可以從虛擬設計中提取出氣流、振動和擺動等環境控制要素,也可以在虛擬環境中設計并測試車窗,避免在特定車速下將車窗搖到特定位置時發出砰砰聲——這是一種在當今許多新車上依然會出現的問題。 在各種用例中,音頻都是沉浸式體驗的組成部分,但并不是所有情況都需要環繞聲。至少在通過雙耳耳機實現真正環繞聲的問題解決之前,模擬環繞聲可能就已經足夠了。 來源:貿澤電子 作者:Jon Gabay |