朱慰中
21世纪初,广播电视技术领域与其他领域一样,正在或已经接近完成了由模拟向数字技术过渡的历程。数字技术给各行各业提供了比模拟技术更为有效和广阔的应用前景。在广播电视技术应用中的最为常见的数字录音已无处不在我们周围的生活之中。由于以前在一些有关数字录音概念方面的图书、资料的表述不甚普遍,本文将介绍有关数字录音的一些新的实用概念及其一些发展动向,期望能与有关从事数字录音人员共同探讨。
1.模拟与数字的对比(Analog versus Digital)
在模拟时代,声音是被记录在模拟录音机上的。在磁带上的磁畴以模拟音频波形的图形来排列的。而数字录音则把音频信号转换成一串联1和0的数字编码。
模拟录音机和数字录音机所放出的声音有所不同。模拟录音机所放出的声音比较精确,而且声音还带有一点温暖感。这是因为它们有轻微的三次谐波失真、磁头磨损(低频提升)和磁带饱和等原因所致。但是模拟录音机却往往伴有一些磁带咝咝声、频率响应误差、抖动和晃动、调制噪声以及复印效应等缺陷。
数字录音机就不会有这些问题,所以它们的声音非常干净。虽然老式的数字录音机与模拟机相比有些刺耳,但每更新一代后就会有所改进。尤其是在目前,数字录音机在24比特和96kHz下所录出的声音已可以完全与模拟机一样柔和。
与模拟录音机和开盘式磁带相比,数字录音机和它们的磁带更趋于低成本、小型化、允许更便捷地查找定时信息的位置以及允许更便捷地装载记录媒体。
2.数字录音(Digital Recording)
像模拟磁带录音机一样,数字录音机也是把音频存储到磁性媒体上的,但是它们所使用的是不同的记录方法。最常用的数字录音方法——脉冲编码调制或称之为PCM方式。
数字录音可以降低噪声、失真、速度变化以及数据误差等。由于数字重放磁头仅仅读出那些1和0的信号,所以它对磁性媒体的噪声和失真很不灵敏。在记录和重放期间,那些数字被读入到一个缓存器,而且又以一种恒定的速率读出,这样就消除了在旋转媒体上的速度变化。在记录期间的里德—所罗门编码以及在重放期间的解码,用冗余的数据来为一些丢失的比特加以校正。
如果是在像一张擦伤的CD盘上做数字录音的话,那么会出现误差(取样丢失)。这些误差通常可以用内插法来加以校正。这种算法会查找空白取样的前后数据,会“猜测”出应该是一个什么样的值。如果误差超过了校正的范围,结果会导致音频有一种无声点或是爆裂噪声。
几乎所有的数字录音设备使用相同的A/D、D/A转换处理,但是它们使用不同的存储媒体:DAT录音机记录在磁带上,硬盘录音机记录在硬磁盘上,CD机和DVD录音机记录在一张光盘上,闪存式录音机记录在闪存卡上,取样录音机则记录在计算机的存储器上等。这其中任何一种设备的声音质量,主要取决于它们的A/D和D/A转换器的质量。
数字音频在计算机的硬盘上是以波形文件或是AIFF文件格式来被记录的。两种都是音频文件的标准格式。波形(.wav)文件用在PC机上;AIFF(Audio Interchange File Format—音频内部交换文件格式)格式用于Mac。
两种格式都是使用线性PCM(脉冲编码调制)编码,不使用数据压缩。两种wave(波形)格式是Riff和Broadcast(广播)wave(波形),它们可便于在音频工作站之间的程序素材内部进行交换。
3.比特深度(Bit Depth)
如前所述,音频信号是经过了每秒数千次测量后而产生的一串二进制数[叫做字(word)]。每个字的字长愈长(具有更多的比特),那么每次测量的精度就愈高。短的字长对信号电压给出很差的分辨率(高失真);长的字长则给出好的分辨率(低失真)。比特深度(Bit depth)或分辨率(Resolution)是字长(Word Length)的另一种术语。
16比特的字长已足够(但不是最好)用于高保真重放。它是目前CD盘的标准。有些数字录音机提供20或24比特的字长。比特愈多,则声音愈柔和并且更清晰和透明,但是它们需要更大的存盘存储空间和更快的硬盘驱动。用24比特录音而制成的CD盘的声音会更好听。
4.取样率(Sampling Rate)
取样率是A/D(模/数)转换器在录音期间对模拟信号的取样或测量的速率。例如,一个48kHz的取样率就是每秒钟有48000个取样;也就是说,对声音的每秒钟内发生48000次测量。取样率愈高,那么录音的频率响应愈宽广。
根据奈奎斯特(Nyquist)定理,录音频率的上限为取样率的二分之一。所以CD盘使用44.1kHz的取样率时,那么它们的频响上限可达到22.05kHz。
用于高质量音频的取样率可以为44.1kHz、48kHz、88.2kHz、96kHz或192kHz。取样率愈高,则声音愈柔和并且更清晰和透明,但是它们需要更大的存盘存储空间和更快的硬盘驱动。CD质量为44.1kHz/16比特。一种96kHz的取样率可以用在DVD上。最顶级的是超级音频CD(SACD)或是线性PCM的取样率为192kHz/24比特(也有人更喜欢用96kHz/24比特取样率)。
概括地说,一个数字音频系统对模拟信号作每秒数千次的取样,以及对每个取样作量化(分配其一个数值)。取样率影响高频响应。比特深度影响动态范围、噪声和失真。
在数字传输方面,一个立体声节目的两个声道采用多路复用传输方式。
也就是说,来自声道1的一个字跟随着声道2的一个字,声道2的一个字又跟随声道1的一个字,依此类推。
5.数据速率和存储需求量
(Data Rateand Storage Requirements)数字音频的数据速率(每秒钟的字节数)可用下式计算:
比特深度/8×取样率×声轨数
其得数除以1048576以后得到每秒兆字节(MB/sec)数。例如,一个24比特/44.1khz、16声轨记录的数据速率应为(24/8×44100×16)/1048576=2MB/sec把数字音频记录到硬盘上去的时候,需要占用大量空间。其存储的需求量可通过下式计算:
比特深度/8×取样率×声轨数×60×分钟数其得数除以1048576以后得到兆字节(MB)单位。再除以1024得千兆字节(GB)单位。例如,假如要用24比特、44.1kHz、16声轨的条件下录一场时间长达2个小时的音乐会,那么所需要的硬盘空间容量应为:(24/8×44100×16×60×120)/1048576=14534.9MB或14.2GB。
6.数字录音电平(Digital Recording Level)
在一台数字录音机内,录音电平表是一种峰值读数的LED(发光二极管指示)或是LCD(液晶显示)光柱表,在其顶端的读数为0dBFS(FS意为满刻度)。在一台16比特的数字录音机内,0dBFS表示全部16比特都工作。在一台24比特的数字录音机内,0dBFS则表示全部24比特都工作。OVER(过载)指示意为输入电平超过了产生0dBFS所需的电压,也意味着在输出的模拟信号波形上有某些短时间的削波。这种削波可发出令人厌恶的声音。
有些制造商在校正他们的表头时,使在0dBFS时的量化比特数稍低于16或24比特,使之减少一点儿动态余量。当在设定录音电平时,一种方法是让光柱表在最大值对准-5dB或-3dB,这样在不可预期的峰值来到时不致超过0dBFS。如果正在作24比特录音,那么,这时候的录音电平不会太临界,因为一个16比特的信号正位于-48dBFS处。