化繁为简、大有可为:拿火 LAVA ME 3 智能吉他究竟能拿什么火?

iZotope RX 9 第一时间上手:Ambience Match 精准匹配变化环境声效

Soundiron 与 Native Instruments 合作的扩展音源套装上手试用

Steinberg 推出最新乐器合集 Absolute 5

复刻经典的成功者:Warm Audio WA-47 大震膜电子管麦克风评测

参考​混音作品的科学方法

官方新闻稿 添加于 2021-07-01 ·

分享到微信

暂无评论

文:Craig Anderton
国际知名音乐技术权威
现任MIDI协会主席

参考一首歌曲音轨,可以帮你检查自己的混音或母带成果。不过,如果只是快速的A/B对比,你大概还是不得其要领。这次,来看看具体做法吧!

把你做的音乐与由一流工程师做混音和母带的类似作品进行对比,是种常见做法,能帮助你了解自己音乐可能需要进行修正的地方。但是,如果你刚刚开始自己做混音和母带,你可能很想搞清楚,为什么尽管自己尽了最大努力将电平和均衡与你最喜欢的参考录音相匹配,但声音仍然差得很远。

当然,经验、耳力和监听系统都是原因。不过我们还可以深入挖掘一下。

与其把你的作品与世界一流工程师的进行直接比较,不如考虑“混音逆向复盘”会更有价值。学习他们混音成功的原因,然后,将所学知识应用到你自己的工作中。

曲线匹配软件是此过程的一种有限工具。它会分析一条音源轨道、一个目标轨道,然后逆向设计出一条EQ曲线,使目标更像音源。尽管这种做法很有用,但并不总能跨越流派,在不同音乐风格上实现好的结果。此外,正如我们将看到的,对音轨的分析要远大于对 EQ的分析。

将你的音乐与参考目标的特性进行比较,涉及五个主要步骤和方面,通常按下面的顺序进行:

  • 感知电平
  • 音乐动态
  • 均衡
  • 立体声摆位
  • 声像和瞬态响应

1. 匹配感知电平

如果不匹配参考物的整体电平,任何额外的比较都不太有效。耳朵在不同电平有着不同的频率响应,低频和高频在低电平时降得最多。除非整体电平匹配,否则你就无法正确地分析EQ。

R128标准以LUFS为单位,量化了音乐的感知电平。LUFS读数越小,感知电平越轻柔。将一首超级压缩的金属歌曲调到与原声民歌相同的LUFS读音,会让它们听起来像是有相同的音量。这对广播公司和流媒体平台来说是一个优势,因为他们不必压缩所有内容(或不断改变电平)来为不同录音提供一致的聆听体验。进行比较时,我们就希望匹配感知电平。

当音乐人开始将他们的混音与商业发行作品进行比较时,通常第一个问题就是:“我的音乐峰值达到0,为什么我的混音还这么软?” 答案是,商业发行作品已经做过了母带,可能涉及到了动态处理以达到更热闹更响亮的声音。像Waves L3 Multimaximizer这样的限制器可以提高声源的LUFS,以匹配目标的LUFS电平(图 1)。


图1:左侧是用WLM Plus Loudness Meter获取的LUFS读数,显示了使用L3 Multimaximizer进行限制的前后结果(分别为-15和-9)。

例如,假设你的Club混音具有-15的LUFS值,但它将在一组母带LUFS值为-9的热门歌曲单中播放。在图1中,用7dB的限制将歌曲的LUFS提高到-9。限制和LUFS之间存在相关性,因为每一个dB的限制会使LUFS增加大约1dB。比如,如果需要将一首-15 LUFS的歌曲提高到-12 LUFS,就从3dB的限制开始,然后根据需要进一步调整。


2. 匹配响度范围 (LRA)

图1中的第二个数字,Range(范围)对应于音乐层面上的音乐整体动态,而不是技术意义上的(即,这个范围与可用的动态余量或信噪比无关)。Range(也称为LRA)被视为是渐强、渐弱和其他音乐动态的程度。古典音乐的范围很广,而大多数说唱音乐则不是。

较低的范围数字表示较小的动态范围。古典音乐的LRA通常约为9或10,摇滚约为5或6,EDM约为4或5,说唱通常约为3。但这些数据因音乐风格差别很大。摇滚民谣的响度范围可能比巴赫的响度范围更广,而DJ的EDM设置可能会有很多的变化,以至于最终的LRA到7或8。

对响度范围测量的判断,并不是说范围越宽就越“好”。例如,Bob Marley有些歌的响度范围非常窄,比如只有3。但是,他的歌经常被削减到较低的感知电平,例如-15 LUFS。这也许就解释了他为何能创造出如此催眠的律动——达到一个相当稳定的动态平衡点,并限制住电平。

需要注意,LUFS和LRA之间没有特定的相关性。在上面的图1中,虽然LUFS变得很高了,但动态范围保持不变。这是因为限制基本上只是削减了峰值,因此合理量的限制保留了大部分动态范围。但我们也可以反过来做:减少动态范围,但保持相同的LUFS 读数(图 2)。


图2:压缩已将-15 LUFS / 7 LRA的歌曲转换为-15 LUFS / 3 LRA。

Renaissance Compressor这样的压缩器是缩小动态范围的理想选择。如何缩小范围是主观的,因为,在动态范围顶部进行大量压缩的高阈值和高压缩比,可以为低阈值和低压缩比提供类似的(非声音性的)数值结果。这会将更细微的压缩应用于更宽的动态范围。图2中的设置就介于这两个极端之间。

随着LUFS的采用,“响度战争”开始偃旗息鼓,音乐可以更好地利用动态了,因为试图达到最响不再是人们的首要目标。尽管如此,宽动态范围并不总是可取的。有些人认为,因为Spotify将曲目调整为-14 LUFS,他们不再能限制自己的音乐,因为最终结果会比-14更响。但这种说法并没有抓住重点。

一些音乐,比如摇滚,可以从较少的动态中体现风格上的优势——所以许多工程师将总线压缩器(例如SSL G-Master总线压缩器)用在他们的最终混音上。因此,你可以使用压缩器或限制器,最终得到一首在-12或-9 LUFS等等条件下听起来都“正确”的歌曲,而Spotify只会将其降低到-14 LUFS。不同的音乐纵使会有相同的感知电平,但由于压缩、限制或两者兼而有之,音乐特性会有所不同。


SSL G-Master 总线压缩器

下面的音频示例演示了改变LUFS和LRA的结果。第一个示例的LUFS = -16,LRA = 5。第二个示例相同,但LRA = 3(压缩更多,动态更少)。第三个例子,LUFS = -12(来自于限制),LRA = 5,因此它保持了与第一部分相同的动态,但具有更高的感知电平。第四个例子是压得“最扁”的,LUFS = 12,LRA = 3。

第五个示例与第三个示例相同(我最喜欢的),但电平降低以匹配第一个示例。注意,示例1和示例5具有相同的感知电平,但由于加了压缩,示例5的特征略有不同。

音频示例1.mp3

音频示例2.mp3

音频示例3.mp3

音频示例4.mp3

音频示例5.mp3

匹配电平只是匹配参考音乐的一个部分。你需要考虑动态范围 (LRA)、感知电平 (LUFS) 以及两者如何相互作用。


3. 匹配均衡

PAZ Analyzer能显示不同频率上的相对电平。仅基于图形匹配EQ并不是一个好主意,因为图形之于特定的具体音乐作品会有变化。但是,你可以在某些频率范围内看到总体趋势。

仔细聆听你的音乐,并将其与参考音乐逐个频率范围地进行比较。从低频开始,确保它是饱满的,但不过度不浑浊。然后听下中频,通常商业录音作品在250–500Hz范围内会有所收敛。(不过,这可能不会反映在PAZ的图中,因为那个范围可能已经被衰减了。)

仔细检查1000Hz左右的中音区域,在那里人声和吉他通常更加突出。中高频更多关乎于清晰度,而高频则负责“空气感”和明亮度。

下面来看看EQ多年来如何变化以及电平如何变化,很有意思的(图 3):


图3:左,从上到下
Abba《Dancing Queen》
Led Zeppelin《Rock and Roll》
Steely Dan《Josie》
Peter Gabriel《In Your Eyes》
右,从上到下
Madonna《Ray of Light》
The Lox《The Interview》
Carl Cox《Global》
Kassav《Si’w Pa La》

左边一栏大多是几十年前的老歌。Abba都是中频和人声——这并不奇怪——但他们在8kHz到10kHz范围内添加了一些空气感。

Led Zeppelin也有很多中频,但看看低音的颤动——John Paul Jones的贝斯确实推起了低频。仔细注意,中低频被拉低了,以便为低频和中频的其余部分腾出空间。

Steely Dan以其干净的声音而闻名。这条曲线显示了他们抵制了大量低音的诱惑,但并没有像Abba那样回避它。5kHz附近的衰减很意思——这里通常很刺耳,所以这种衰减可能有助于他们实现“平滑”的声音。这条混音还是具备相对均匀的频率响应。

Gabriel的这首歌出自他相对早期的作品,并且开始显示出一些更“现代”的尝试。低频峰值在频率上提得更高(与《Digging in the Dirt》之类的歌曲相比),这使其更加适合缺乏深度低音响应的播放系统。8–10kHz附近的主要高频增强,在后来的几十年中变得更加普遍,以增加音乐里的“空气感”。

右栏则展示了一些更极端的混音案例。尤其值得注意的是,电平经常会超过-20那条线。(所有这些音频示例都是从CD中翻录的,未经修改。)

麦当娜的这首歌贯穿整个频谱——有一个明显的低频峰值,在1kHz还有推动人声和旋律乐器的凸起,在4-5kHz的刺耳频率周围有所缓解,最后还有着明亮的高频。

Lox是说唱乐的典型代表。贝斯/底鼓的低频很强,中频持续稳定,高频倒不夸张。说到低音,DJ Carl Cox为舞池环境设计了巨大的低频,同时还有清晰的中频和大量高频。

最后的Kassav是一支加勒比风格乐队,强烈注重舞蹈感。同样有着强劲的低频,以及在大约8kHz的好听高频气息。

许多决定EQ的因素是根据音乐风格流派而定的。你找不到低频薄弱的说唱音乐,也找不出没有亮度的流行歌曲。所以,请不要盲目跟随PAZ生成的曲线,而是要从与你的风格相关的音乐中分析多条曲线,并寻找出其中的共性。


4. 立体声摆位

那么,为什么即使在低音量下,麦当娜的《Ray of Light》也会从你的扬声器中爆发而出呢?为什么Peter Gabriel的《Digging in the Dirt》听起来更沉稳,却仍能带来巨大的情感冲击?对于这些问题,我们需要两个答案——来自于工程师和艺术家。

《Ray of Light》MV:


试听:《Digging in the Dirt》


从混音工程师的视角

混音工程师可以加载PAZ立体声位置表 (SPD),它能以比传统相位表更有用的方式显示整个立体声场的能量分布(图 4)。


图4:Peter Gabriel (左)、麦当娜(右)

两侧的波瓣代表左右声道的能量大小,而中间的波瓣就是中心的。波瓣的高度代表了电平。另外,请注意波瓣之间的空间。Gabriel的《Digging in the Dirt》里,左、右波瓣不仅比麦当娜更安静,而且更清晰,与中心分离得更远。显然,《Ray of Light》在左右两侧和中心的电平推得很大。Gabriel则在中间做了提升,让你可以听到他富有表现力的嗓音的每个细节。

让我们再看两张图表(图5):巴赫精湛绝伦的《勃兰登堡协奏曲第5号》,以及Carl Cox的《Global》——我最喜欢的EDM甩头曲目之一。


图5:巴赫(左)、Carl Cox(右)

巴赫在立体声场中的位置正如你所期望的——平衡良好,独奏家在中央足够突出,两侧分布均匀,各个节点之间没有明显的电平差异。而Carl Cox是以中心为主的。中心波瓣的额外电平与突出的底鼓有很大关系。尽管如此,两边还有很多东西可以填入。但请注意他中心和左/右之间的差距,这并不奇怪,因为它是俱乐部音乐,主要用在单声道世界中。

图6比较了Lox和Led Zeppelin。


图 6:Lox(左)、Led Zeppelin(右)

The Lox的图形是说唱的代表:中心最突出,因为那里是人声、底鼓和军鼓所在。两侧则是好听的点缀,不让人对中央部分的信息分心。另一方面,Led Zeppelin以类似于上面麦当娜的方式覆盖立体声场,但更加低调。但是,注意看中心的电平凸起,它可能就是Robert Plant的人声与Bonham底鼓相加的结果。


从艺术家的视角

我们有了混音工程师的答案。但我们仍然不知道为什么《Ray of Light》能从音箱中炸裂而出,而《Digging in the Dirt》的声音却是如此迷人。为了找出分布在立体声场中的能量类型,而不仅仅是数量,让我们看看艺术家们的答案。

我们在这里选择的工具是Scheps 73 EQ或Abbey Road RS56 EQ。两者都可以监听立体声混音的中央或两侧(图7),因此你可以听到置于中央的内容以及移到两侧的内容。


图7:左侧的Scheps 73显示了麦当娜的两侧电平。Abbey Road RS56 EQ显示的是Peter Gabriel的两侧电平。

更棒的是,使用这些插件,你在单声道模式中,通过转动一个控件就听到中心或两侧的声音。比起一只耳朵听侧面,另一只耳朵听中心——就像通常使用M/S编码器那样,这种方式更能说明问题。

《Ray of Light》的两侧是艳丽的合成器和吉他,混音结果听起来就好像它们是节目中的明星一样。但是因为它们被放置在两侧很远处,所以它们为人声、贝斯和底鼓留出了足够的空间。同时,Gabriel的两侧都是在为歌曲构建框架,主要是利用氛围,其目的与绘画作品的画框相同——本身虽自有其审美,但并非被关注的中心。

比较参考曲目的两侧和中心声音是有启发性的。在Led Zeppelin的《Rock and Roll》中,Page的很多叠录轨都在两边,Bonham的踩镲和嗵鼓也是。贝斯则完全位于中心,还有大部分鼓声和Plant的演唱。而对于Bob Marley来说,两侧似乎主要用于体现高度节奏性以及旋律性的乐器。

Kassav将多轨人声呼应中的混响和氛围放置在侧面,还有乐器的氛围声,以填充节奏。对于他们的许多作品,两侧给人一种身处现场空间的感觉。至于The Lox,两侧几乎总是用于声音点缀和次要说唱人声。

我还比较了Peter Gabriel在《Digging in the Dirt》几年后录制的《In Your Eyes》。其中更多地利用了两侧,包括Jerry Marotta的嗵鼓,以及“装饰性”吉他和键盘。


5. 瞬态和其他修复

我们已经讨论了音轨参考的主要方面,但还有更多。立体声宽度主要由声像功能实现,但声像移动也有其局限——特别是因为越来越多的艺术家使用像S1 Stereo Imager这样的声像增强插件来创建超现实的立体声。但是,如果需要调整立体声声像,S1就不仅仅是扩宽。它还可以重新平衡左右声道,并通过低频增加空间感。请注意,虽然S1通常被认为是用于母带或完整混音的处理器,但S1也是可以增强单个立体声轨道的声像的。


S1 Stereo Imager

另一个要考虑的因素是瞬态响应。有时,专业棚和小预算工作室之间的区别就在于不同设备对瞬态处理的体现——打击乐器的一些兴奋感会被便宜设备抹杀。Smack Attack插件可以帮助你恢复这些瞬态,或是对现存的瞬态加以强调。有些人会提高高频以使瞬态更加明显,但这种操作影响面太大,结果就不仅仅是提升瞬态了。你需要小心,不要过度使用像Smack Attack这样的插件。但是对瞬态的轻微提升,特别是针对鼓和其他打击乐器,着实可以让混音变得生动起来。


Smack Attack

分析完这些最后调整之后,想必你已经更好地了解了,是什么成就了世界一流的混音,我们的复盘工作也就完成了。所有这些元素就像一个密码锁:一个数字不对,锁就打不开。但是,如果你可以优化自己音乐的电平、动态、均衡、立体声摆位、声像和瞬态响应,你也就走在创造自己的“世界级混音”的路上了。



真爱音频事业,支持正版软件
www.waves.com

 

暂无评论