編譯:Monnie From iKnowMusic
校對:K From iKnowMusic
終審:Sing T From iKnowMusic
原文:https://www.sonarworks.com/
引言Introduction
人類創(chuàng)造了一個由“比特”(Bit)構(gòu)建的世界。比特,一種極小的單位,可以測量現(xiàn)實(shí)中的有形事物。在數(shù)字世界里,比特值構(gòu)建了我們在物理世界中所能感知的聲音和畫面。在過去的幾十年里,人類通過數(shù)字計(jì)算來精確還原現(xiàn)實(shí)的能力,正在以不可思議的速度發(fā)展著。音樂領(lǐng)域也是如此,人類可以用這個比特值描繪出整個“聲景”(Sonic Picture)。我們能理解模擬音頻系統(tǒng)為聲音帶來,我們最為迷戀的美妙染色、質(zhì)感增補(bǔ)以及失真音色,但是我們同樣也能使用數(shù)字音頻系統(tǒng),通過算法機(jī)制讓數(shù)字音頻系統(tǒng)達(dá)到與模擬音頻系統(tǒng)相類似的聲音效果。不過,我們要清楚地了解,如何將捕捉到的聲音完美地植入數(shù)字比特值中,以便于為我們的“數(shù)字音頻創(chuàng)建計(jì)劃”提供最為純粹的原料。幸運(yùn)的是,對于數(shù)字捕捉處理的定義只有簡單的幾個原則而已,遵循它們即可讓您的數(shù)字音頻處理中得到優(yōu)化。另外隨文也附帶闡述了關(guān)于您音頻工程的文件管理以及備份存儲的方法。
“一切皆可造,萬物皆神創(chuàng)。” - 托馬斯·布朗(Thomas Browne)
“All things are artificial,? for nature is the art of God.”
第一章、數(shù)字音頻基礎(chǔ)知識
“數(shù)字音頻”(Digital Audio)是完美的,“模擬音頻”(Analog Audio)也是完美的。這兩句話陳述都正確,只是對于“完美”一詞的范疇上各有所指罷了。作為藝術(shù)家,我們篤定地認(rèn)為會選擇后者,但作為技術(shù)人員,會選擇前者。從技術(shù)的角度來說,我們首先需要實(shí)現(xiàn)對數(shù)字音頻信號的精準(zhǔn)捕捉,然后再將它們“完美地”呈現(xiàn)出來。數(shù)字音頻可以由兩個參數(shù)定義:“采樣率”(Sample Rate)及“比特深度”(Bit Depth)。如果這兩個參數(shù)設(shè)置正確,數(shù)字音頻可以幾乎毫無偏差地還原一切音頻信號的“動態(tài)范圍”(Dynamic Range)和“頻率響應(yīng)”(Frequency Response)。熟練掌握這兩個參數(shù)的設(shè)定,剩下的可以輕松搞定。
理解何為采樣率
我們對“采樣率”(Sample rate)和“比特深度”(Bit Depth)這兩個數(shù)字音頻領(lǐng)域的專業(yè)術(shù)語都十分熟悉。盡管這兩個參數(shù)設(shè)置很常規(guī),但我還是經(jīng)常收到來自制作人或混音工程師們,關(guān)于某項(xiàng)目最佳參數(shù)設(shè)置方法的詢問。本文將深入淺出地介紹采樣率的基礎(chǔ)原理及最佳應(yīng)用方法。不用擔(dān)心,比特深度的部分馬上就來!
采樣率的概念
采樣率指的是,當(dāng)模擬音頻的波形轉(zhuǎn)換為數(shù)字信號時,每秒從連續(xù)信號中提取并組成離散信號的采樣個數(shù)。由于采樣率具有速度信息(或者說頻率),它可以用于定義一段音頻的“頻率響應(yīng)”(Frequency Response)。由“奈奎斯特定理”(Nyquists Theorem)可知,在從模擬信號到數(shù)字信號轉(zhuǎn)換的過程中,數(shù)字音頻文件可錄入的聲音的最高頻率是其采樣率的二分之一。也就是說,采樣率為44.1kHz時,它可錄到的最高模擬信號的頻率是22.05kHz,同理可知,96kHz的采樣率可錄到帶有48kHz音頻“帶寬”(Band Width)的信號。如果我們以較低的采樣率錄制高頻信號(超過采樣率一半的信號),或者說超越 “奈奎斯特定理”(Nyquists Theorem)的極限,就會產(chǎn)生人耳可聽的頻率“混疊”(Aliase)現(xiàn)象(一種低采樣率失真)。為了避免該現(xiàn)象的產(chǎn)生,在模擬信號轉(zhuǎn)換為數(shù)字信號的過程中,會使用一個“抗混疊濾波器”(Anti-Aliasing Filter)濾除模擬信號中頻率在采樣率的二分之一以上的部分。在實(shí)際操作中,該低通濾波器的一定的運(yùn)行時間,所以我們以44.1kHz的采樣率記錄20kHz頻率以內(nèi)的聲音。
想必我們都知道,人耳聽覺頻率范圍在20Hz至20kHz之間,那我們?yōu)槭裁匆褂贸^44.1kHz的采樣率呢?理由之一,許多人(包括一些科學(xué)家)聲稱,人類可以通過“骨傳導(dǎo)”(Bone Conduction)感知高達(dá)50kHz的聲音。這個觀念或許在理論上是正確的,但人類通過空氣傳播能夠感知到的聲音頻率仍然僅能達(dá)到20kHz。理由之二,從更實(shí)際的意義上來說,抗混疊低通濾波器并不是一個完美的工具,當(dāng)它在濾波處的“斜率”(Steep)到達(dá)一定程度時,會令聲音產(chǎn)生更明顯的相位失真。因此,在使用濾波器時,要在斜率(過渡帶的陡度)與相位失真度二者之間做些權(quán)衡。
關(guān)于采樣率的建議
我們是否要因?yàn)槿硕犛X上限是20kHz,就僅限于使用44.1kHz的采樣率呢?正如上文所言,使用高于44.1kHz的采樣率可以減少濾波器在模數(shù)轉(zhuǎn)換中對信號造成的影響,帶來更好的聽感。換句話說,盡管44.1kHz的采樣率記錄了人耳可以聽到的全頻段音頻帶寬,但低通濾波器還是會對20kHz以下的頻率造成損失。因此我們建議,在制作流行音樂和混音時,使用48kHz的采樣率。首先,使用48kHz的采樣率在進(jìn)行抗混疊濾波處理時,比使用44.1kHz采樣率有更好的聽感。其次,48kHz采樣率的文件只比44.1kHz的多占了一些磁盤空間。另外,我們的大部分音頻會被嵌入YouTube網(wǎng)站上的視頻或其他影片里發(fā)行,而視頻文件通常需要使用48kHz采樣率的音頻。當(dāng)然,如果您制作的音樂僅用于CD發(fā)行,那么使用44.1kHz的采樣率就足夠了。
更高的采樣率
對于制作高音質(zhì)要求的爵士樂、古典音樂、世界音樂或一些聲音設(shè)計(jì)的項(xiàng)目來說,我會建議使用96kHz的采樣率。該采樣率幾乎消除了所有可聽到的高頻混疊和濾波器引起的失真。此外,96kHz采樣率的音頻文件可以保障更低的處理延遲,在用于聲音設(shè)計(jì)或游戲音頻上保障更好的降調(diào)處理效果。不僅如此,當(dāng)有需求時,96kHz采樣率的音頻文件可以將采樣率降到48kHz并保持音質(zhì)完好。如果您需要開展超過96kHz采樣率的錄音項(xiàng)目,則需要花上大量時間來測試您的錄音系統(tǒng),找到一套符合您需求的方案,包括使用的“數(shù)模轉(zhuǎn)換器”(A/D Converter)和“數(shù)字音頻工作站”(DAW,Digital Audio Workstation)。因?yàn)槭褂?6kHz以上的采樣率可能會產(chǎn)生頻率抖動的問題,增加您的CPU負(fù)擔(dān),減少可使用的音頻軌道數(shù)量,縮小插件的選擇空間。一般來說,我不會建議您使用176kHz或192kHz的采樣率,除非您真正研究過這些高采樣率的利弊。作為參考,《格萊美“美國錄音學(xué)院”對高解析音樂制作的建議》(Grammy’s Recording Academy Recommendations for Hi-Resolution Music Production)一文中曾提道:對于高解析音頻的制作和傳輸需求來說,最好是用96kHz的采樣率,最低采樣率為48kHz。
采樣率轉(zhuǎn)換
我們常常需要對音頻采樣率進(jìn)行轉(zhuǎn)換,并且擁有許多優(yōu)秀的采樣率轉(zhuǎn)換軟件工具。近期,一個對母帶混音師群體的調(diào)查顯示,音頻工作者常用的采樣率轉(zhuǎn)換工具有:“Voxengo”公司的“R8brain”,“Weiss”公司的“Saracon”,Pro Tools中的SRC(Sample Rate Convert,采樣率轉(zhuǎn)換,使用Tweak Head設(shè)定值),“Izotope”公司的“Resample”和“SoX”,還有些其它的工具也能產(chǎn)生很好的采樣率轉(zhuǎn)換效果,與此同時,宿主軟件的開發(fā)者們也在不斷優(yōu)化采樣率轉(zhuǎn)換的算法。
由此可見,選擇采樣率并非難事。下面是一個對上述內(nèi)容歸納整理后,有助您查詢索引的備忘錄。
采樣率知識點(diǎn)備忘錄
以下是針對不同情況使用采樣率的建議:
錄音
流行音樂建議使用48kHz的采樣率(盡管44.1kHz也是可接受的)。在有高音質(zhì)需求的音樂和聲音設(shè)計(jì)項(xiàng)目中,建議最好使用96kHz采樣率。
混音
混音工程應(yīng)當(dāng)與錄音工程保持相同的采樣率,將低采樣率的音頻文件放入高采樣率的音頻工程中并不會提升音質(zhì)。如果您在模擬調(diào)音臺上進(jìn)行混音,就把采樣率設(shè)置為前文所述的48kHz或96kHz吧。
母帶
在制作母帶的過程中,不要提高采樣率。對數(shù)字版母帶制作來說,使用與終混交付工程相同的采樣率即可。對模擬版母帶的話,先用數(shù)字文件的原始采樣率播放該音頻,再通過模擬信號處理器進(jìn)行處理,最后以客戶要求的采樣率(通常是48kHz或44.1kHz)錄入音頻。另外,備份一版用96kHz采樣率錄入的音頻文件。除非萬不得已,盡量不要對最終版母帶進(jìn)行采樣率轉(zhuǎn)換。
發(fā)布
視頻制作者通常需要48kHz采樣率的音頻文件,而像iTunes這樣的數(shù)字音樂發(fā)行平臺則需要44.1kHz以上的采樣率的音頻文件。除非萬不得已,盡量不要對最終版母帶進(jìn)行采樣率轉(zhuǎn)換。
“自然界中的每個部分都息息相通,一片葉子、一滴水、一塊水晶、一個瞬間,都與整體相連,并共享著整體的完美。”
- 拉爾夫·沃爾多·愛默生(Ralph Waldo Emerson)
理解何為比特深度
我們在前一篇文章中探討了采樣率與頻率響應(yīng)之間的關(guān)系,本文將介紹“比特深度”(Bit Depth),以及它與另一個重要的音質(zhì)層面的參數(shù) - “動態(tài)范圍”(Dynamic Range)之間的關(guān)系。
動態(tài)范圍是一個音頻術(shù)語,音頻信號最大值和最小值的比值。下面來具體介紹如何應(yīng)用比特深度這個參數(shù)。
比特深度的概念
如前文所述,比特深度代表了音頻信號的動態(tài)范圍。一“比特”(Bit)可以代表大約6dB的動態(tài)范圍,也就是說,16-bit可以提供96dB的動態(tài)范圍,24-bit可以提供144dB的動態(tài)范圍。比特數(shù)(或者說二進(jìn)制位數(shù))是應(yīng)用于指數(shù)函數(shù)計(jì)算的,這意味著16-bit的文件可以測算出65,536個值(216,即2的16次方),24-bit的文件可以測算出大約1670萬個值(224,即2的24次方)。
現(xiàn)實(shí)中,專業(yè)的模擬錄音機(jī)和調(diào)音臺設(shè)備由于構(gòu)造原理,自帶介于-120dB到-90dB之間的“本底噪聲”(Noise Floor)。所以,對于模擬錄音技術(shù)來說,我們并不能以24-bit錄得完整干凈的144dB動態(tài)范圍模擬信號。但是,音頻信號在使用24-bit進(jìn)行數(shù)字運(yùn)算后,可以產(chǎn)生額外的、更重要的動態(tài)范圍。換句話說,雖然在進(jìn)行傳統(tǒng)模擬錄音時,使用16-bit可以完整地記錄模擬音頻的動態(tài)范圍,而一旦我們需要將其放入宿主軟件中,就需要使用更高的比特深度值。
我收到過許多客戶發(fā)來的文件,都是使用16-bit進(jìn)行多軌錄音和制作的。當(dāng)我對這些16-bit的音頻進(jìn)行混音或制作母帶時發(fā)現(xiàn),重新創(chuàng)建一個24-bit或32-bit浮點(diǎn)的音頻工程進(jìn)行工作,會獲得遠(yuǎn)比只使用16-bit的工程更好的聽感。于是我給自己定下了一個規(guī)矩:一定要在24-bit或32-bit的音頻工程中進(jìn)行混音和母帶制作。Pro Tools,Logic或其它宿主軟件通常會默認(rèn)以32-bit浮點(diǎn)甚至更高的精度來處理音頻。因此,我的建議是,您可以使用24-bit的設(shè)置來創(chuàng)建工程,后續(xù)也不用擔(dān)心比特深度轉(zhuǎn)換的問題了。當(dāng)然,24-bit的音頻文件會比16-bit的占用更多磁盤空間,但這對于現(xiàn)代硬盤容量來說,已經(jīng)不成問題了。
什么是抖動(Dither)?
在討論比特深度的時候,我們有一個不能忽視的概念 – “抖動”(Dither)。把一段音頻波形以數(shù)字信號的方式呈現(xiàn)出來,實(shí)質(zhì)上就是將連續(xù)的(模擬)音頻波形轉(zhuǎn)換為大量離散獨(dú)立的(數(shù)字)測量值。這些離散的測量值無法將連續(xù)的模擬音頻波形完整地還原出來,并會因此令聲音產(chǎn)生一種名為“量化誤差”(Quantization Error)的失真效果。我們可以通過向數(shù)字信號中加入少量的隨機(jī)噪聲信號,來弱化這種失真效果,讓它聽上去不那么明顯。這種信號被稱為抖動噪聲,通常比本底噪聲高出3dB,例如,在處理16-bit的音頻時大約是-93dB。一般來說,我們可以通過抖動處理得到一條幾乎還原模擬信號的波形,但聽起來還是有一點(diǎn)音量極低的噪聲。這么看來,我們似乎無法在數(shù)字采樣的方法下完美還原模擬信號?但依據(jù)奈奎斯特定理(曾在前文<理解何為采樣率>中介紹過),經(jīng)過數(shù)字采樣的模擬信號可以通過采樣率的設(shè)置被完美重建。
如果我們在宿主軟件中以32-bit(甚至更高)的比特深度處理音頻,卻需要從中導(dǎo)出低于32-bit的分軌、混音、母帶時,就需要在導(dǎo)出設(shè)置時加入抖動處理,消除量化誤差。請牢記這個規(guī)則:在宿主軟件中導(dǎo)出比原始比特深度更低的音頻文件時,一定要加入抖動處理。如果您導(dǎo)出的是32-bit浮點(diǎn)音頻文件的話,請不要加入抖動處理。如果您正在和別的制作人進(jìn)行工作交接,請一定要仔細(xì)檢查您的宿主軟件有沒有正確處理音頻文件。
“請牢記這個規(guī)則:在宿主軟件中導(dǎo)出比原始比特深度更低的音頻文件時,一定要加入抖動處理”。
我們能聽見抖動噪聲嗎?
母帶工程師們一致認(rèn)為,適當(dāng)?shù)貞?yīng)用抖動處理,可以提升音頻在由高比特深度向低比特深度轉(zhuǎn)換時的聲音質(zhì)量。因?yàn)槎秳釉肼暿且环N隨機(jī)噪聲,并且比峰值電平低93dB(以轉(zhuǎn)化到16-bit為例),只有在極端聲學(xué)環(huán)境下才能聽見抖動噪聲。不過,如果您真的聽見了抖動噪聲,也請不要擔(dān)心,人類是十分擅長忽略這種隨機(jī)噪聲的。
如果我們在不加抖動處理的情況下降低音頻比特深度,會產(chǎn)生一種影響聽感的失真效果。這種失真效果不像隨機(jī)噪聲那樣容易被人耳忽略,反而會給音質(zhì)本身帶來負(fù)面影響。
抖動處理有很多種,其中包括了不同的噪聲塑形(EQ處理)。如果您愿意的話,可以嘗試借此做一下聽力測試,來聽聽看,不同類型的抖動處理是否會造成不同的聽感。我有時可以根據(jù)經(jīng)驗(yàn)判斷出一個音頻文件在導(dǎo)出時是否加入了抖動處理,但我從來無法分辨它的制作人是使用了什么品牌或者哪種抖動處理技術(shù)。最后,應(yīng)用抖動處理就像按下按鈕一樣簡單,所以,在需要使用它的時候,不要再猶豫了。
結(jié)論
選擇比特深度值相對來說比較容易,關(guān)于應(yīng)用抖動處理的規(guī)則也十分簡單。下面是一個對上述內(nèi)容歸納整理后,有助您查詢的知識點(diǎn)備忘錄。
比特深度知識點(diǎn)備忘錄
以下是針對不同情況下,使用比特深度值的建議:
錄音
對于近距離拾音并采用話放增益的錄音需求來說,雖然使用16-bit的比特深度效果足以,但還是更推薦您使用24-bit。對于現(xiàn)場多軌錄音或者超大動態(tài)范圍的錄音來說,請一定使用24-bit。
混音
需要把混音工程的比特深度設(shè)置為至少24-bit。大多數(shù)宿主軟件的內(nèi)部運(yùn)算以32-bit浮點(diǎn)或更高的比特率來處理音頻。
母帶
由混音師將24-bit或32-bit浮點(diǎn)的混音工程交付于母帶工程師,以供母帶工程師在盡可能高的比特深度值下工作。
抖動處理
在宿主軟件中,導(dǎo)出低于工程設(shè)置的比特深度音頻文件時,請一定要加入抖動處理;導(dǎo)出32-bit浮點(diǎn)音頻時,請不要加入抖動處理。
發(fā)布
PCM音頻格式支持16-bit的文件,因此,在使用CD作為發(fā)布載體時,可以用該比特深度值。請和您的發(fā)行商或發(fā)布平臺確認(rèn)他們需要什么格式的文件。如果該音頻文件需要被轉(zhuǎn)化為有損格式,您最好保證原始文件是24-bit或32-bit的,才不會在壓縮中損失太多音質(zhì)。
儲存
美國國家錄音藝術(shù)與科學(xué)學(xué)院(NARAS,National Academy of Recording Arts and Sciences)建議您,盡量以原始采樣率和盡可能高的比特深度值,存儲PCM格式的音頻文件,如44.1kHz的采樣率和32-bit浮點(diǎn)的比特深度。
“數(shù)字音頻傾向于技術(shù),便于存儲,處理高速;模擬音頻傾向于藝術(shù),聽感飽滿,富有溫度。”
- 亞德里安·比勞(Adrian Belew)
“蘋果數(shù)字母帶技術(shù)標(biāo)準(zhǔn)”(Apple Digital Masters)
編者注:蘋果公司于2019年8月對旗下音樂應(yīng)用軟件iTunes進(jìn)行了品牌重塑,并更新了Mastered for iTunes中的內(nèi)容規(guī)范,本文會對這些更新內(nèi)容進(jìn)行介紹。我們對于一切用戶反饋都感到十分感激,并且,我們會不斷致力于為用戶提供有用的、準(zhǔn)確的最新信息。蘋果公司并沒有停止開發(fā)iTunes,只是為其流媒體服務(wù)以及音樂、播客和有聲讀物的內(nèi)容存儲創(chuàng)建了一個名為Apple Music的平臺。
母帶制作是一個復(fù)雜的過程 - 它是藝術(shù)與科學(xué)的精妙結(jié)合,需要對應(yīng)的工程師有一雙敏銳且訓(xùn)練有素的耳朵,也需要他對數(shù)字音頻技術(shù)與模擬音頻技術(shù)有深刻的理解,或許更重要的是,他具有評判一段音樂的藝術(shù)創(chuàng)作意圖是否被完美表達(dá)的能力。
母帶工程師的工作是,為一段終混后的音樂塑造整體聽覺形象,讓它在所有的音響系統(tǒng)和媒體格式下都有最好的聽感表現(xiàn)。這首曲子的母帶版本將作為母版,基于它制作的各種后續(xù)版本或復(fù)刻版本,將被用于在線流媒體、CD、甚至是黑膠唱片中。
不論是針對模擬信號還是數(shù)字信號,每個發(fā)布平臺都有關(guān)于文件類型、整體響度、元數(shù)據(jù)內(nèi)容的獨(dú)家規(guī)范和標(biāo)準(zhǔn)。其中最嚴(yán)格的一套標(biāo)準(zhǔn),或者說“最佳實(shí)踐標(biāo)準(zhǔn)”,來自于蘋果公司的“蘋果數(shù)字母帶技術(shù)標(biāo)準(zhǔn)”(Apple Digital Master)。本文將介紹如何達(dá)到“蘋果數(shù)字母帶技術(shù)標(biāo)準(zhǔn)”認(rèn)證的規(guī)范標(biāo)準(zhǔn),并解釋那些規(guī)范標(biāo)準(zhǔn)的意義是什么,以及如何確保自己向蘋果提供的是最高品質(zhì)的數(shù)字音頻文件??梢苑判牡氖牵绻哪笌н_(dá)到了“蘋果數(shù)字母帶技術(shù)標(biāo)準(zhǔn)”的話,您的作品在其它流媒體平臺和在線發(fā)布平臺的音質(zhì)也會是一流的。
本文出自《midifan月刊》2020年02月第167期
Copyright © 2025武漢天宇聲源科技有限公司All Rights Reserved