预告：音频信号分析

( 6 )

闲云孤鹤

5757

#1 03-4-26 16:06 …

预告：音频信号分析

最近朋友送来一本国外的现场扩声杂志《livesound!》

这是一本很不错的杂志

我决定翻译其中的一篇文章献给大家

此文主要阐述了以下内容：

语言与音乐信号的频谱范围

可懂度与的关系响度

响度与可懂度的关系

信号峰值限制与功放的输出能力的关系

峰值限制练习

二种信号表VU和PPM

后面还有……

配了很多图片

我正在做

估计有4000字

我第一次翻译外国文章

谬误的地方还请大家指正

观众反应

rosion

：加油。。。

回复此帖报告

闲云孤鹤

5757

#2 03-4-28 15:40 …

文字上的工作已经基本做完

大概有4000字

现在正联系北京的朋友帮我扫描其中的14张图片

图片扫好了就完成了

这是最后的瓶颈

回复此帖报告

闲云孤鹤

5757

#3 05-2-5 23:12 …

上集

音频信号分析

---- 关于带宽、动态范围和正常操作电平

如果我们以倍频程为单位来分析语言信号，见图 15-2 ，这是一位普通成年男人的语言频谱。频谱显示在 250hz 处为能量的最大值。 250hz 两边都呈下滑趋势。 1khz 以上的倍频呈每倍频 6dB 开始衰减。

图 15-3 显示了古典音乐与摇滚音乐信号的长期能量谱。大家有没有注意到，古典音乐与语言的频谱在中频和高频两个范围是相似的。

请比较图 15-2与图 15-3 。

[attach]a34708[/attach]
倍频程与可懂度

见图 15-4 ，在普通的语言能量谱中，完全独立的倍频部分十分有助于语言的可懂度。语言的可懂度并不意味着声音的听起来真实。众所周知，我们用电话的时候，我们的语言频率范围被限制在 300hz-3000hz 之间。

看图，在 1khz 到 4khz 之间的频段对可懂度是最有影响力。这就是为什么在非常嘈杂的环境中，扩声系统一般在这个频段显得不足。最为理想的是，我们主动的去再生或增强语言信号，以同时获得真实度与可懂度。在合理的安静的环境中这是很有可能的。

可懂度与环境噪声水平之间的关系

在理想的情况下，本底噪音电平低于语言信号电平（平均值） 25dB ，以得到真实的语言扩声。如果噪音电平只低于语言信号 15dB ，大多数听众对于信息的理解并不感到困难。不过，此时已有少数人开始抱怨噪音。如果信噪比继续降低，对于所有的听众来说，字词之间的可懂度就没有了。激励器可以增加语言信号的响度，然而，处理的量是有限的。

什么时候的语言音量太吵耳？正常面对面交谈的声压级在 60dB-65dB 之间。然而为大多数语言扩声时声压级被定在70-75dB 。当语言扩声超过 85-90dB, 可懂度的增加就很少了。并且大多数听众开始抱怨音量太大了。如果音量继续增加，很多听众确确实实感到难以忍受，“音量太大了！！！”。图 15-5 显示显示了声压级与可懂度之间的关系。

这里有一个语言扩声的最佳范例。例如在非常安静的环境中以 65-75dB 的声压级来扩声，这简直是完美的。当噪声不断增加的时候，必须提高信号电平，以保证信噪比至少为 15dB 。这里有一种典型峰值，当噪音在 60-65dB 的范围，于是让系统声压级的峰值在80dB ，这样可以得到最好的可懂度。

体育场经常出现人群的欢呼声，声压级范围在 85-95B 之间。在这种情况下想让扩声系统发挥作用是根本不可能的。最好等人群的欢呼声退去之后，再开始播音和讲解。

[ 本帖最后由闲云孤鹤于 2006-7-11 18:40 编辑 ]

本帖子中包含更多资源

您需要登录才可以下载或查看，没有帐号？注册

观众反应

回复此帖报告

闲云孤鹤

5757

#4 05-2-6 02:01 …

原文《An examination of bandwidth, dynamic range and normal operating levels》

http://www.livesoundint.com/archives/2003/jan/asa/asa.php

回复此帖报告

闲云孤鹤

5757

#5 06-7-11 09:18 …

以前的空间停止运行了，我晚上补图片。

回复此帖报告

闲云孤鹤

5757

#6 10-3-10 20:55 …

下集

匹配语言信号电平的能力

我们发现被放大的语言电平在实际操作中，一般都被控制在 15-20dB 这样相当窄的范围。并且系统就是按照这样的要求设计的。首先，我们将显示负载为 8 欧姆，输出功率为 100W 的功放，它在输出正弦波和方波信号时不同的能力。注意放大器整个电压驱动边界，可以输出 100W 的正弦波功率，与此同时方波信号的输出功率可以接近 200W 。

为什么此时的评估报告中此放大器的输出功率仅为 100W ？

这是因为所有的放大器的额定功率都是以额定阻抗，输出正弦波信号的最大功率被评估。正弦波最大功率是怎么得出的？从图 15-6 我们可以看出，在正弦波的定义域相对于方波有 3dB 的峰值系数（ peak-to-RMS ratio ），而方波信号的峰值系数是不变的。相对来说，音乐和语音信号主要由各种正弦波复合而成。功率放大器的额定功率是用额定峰值电压乘以 0.707 这个系数后计算得到的。比原先的峰值功率低了 3dB.

如果我们随意地录 20& nbsp;秒典型的讲话信号，信号的音频块看起来十分像图 15-7 所示。

你看到的盘旋在基线附近的黑色区域大部分是平均值。伴随着偶然的比较高的峰值，只有少数信号值能达到表格的上下边框。现在，让我们把这个信号送到额定阻抗 8 欧姆，输出功率 100W 的放大器。如图 15-8 所示。我们把放大器的实际输出电压标记在表格左边的轴上，将近似的平均值信号电压标记在表格右边的的轴上。

在图 15-8 中，清楚地显示了平均值信号输出电压为正负 10V 。而实际上放大器的满输出电压为正负 40V 。正负 10V 与正负 40V 之间有 12dB 的差异，两者的功率比为 16:1 。两者的不同是显然的。让我来说说为什么要这样？为了对输入语言信号提供 100W 的峰值输出能力。前面说过了语言信号有 15 到 20dB 的动态。放大器为了解决这样的问题只能对普通语言信号提供 6.3W 的平均值输出功率。

为了处理偶然的语言信号峰值，放大器只能以输出& amp;nbsp;6.3W 的平均值功率运行，否则当大动态信号来临的时候将会发生过载失真。然而，在实际操作过程中可能出现功率不够的状况。我们有两种方法解决这个问题。

A ，用一台更大功率的放大器。例如，一台 200W 的放大器可以提供 12.5W 的平均值输出功率 (12.5W 与 200W 是 -12dB 的关系 ) 。这样虽然能完成工作，但这仍旧是一个没有效率的设计。

B ，对输入信号进行峰值限制。为了让峰平比 (peak-to-average signal ratio) 低于 12dB 。如果我们这样做 , 这台 100W 的放大器可以获得比 A 方案更高的平均值输出功率。

信号峰值限制 , 调节

图 15-9 显示了输入信号被压缩 3.5dB 后的结果。这样做了以后，随着满输出功率的增加，此刻新的峰值信号可能被抬升。现在普通的信号电平值为 15V 。结果，此时还用 100W 的放大器，对于普通的节目信号有了 14W 的平均值输出。

我们可以继续延伸一小步上面的峰值限制处理，在 3.5dB 的基础上增加 2.5dB ，对输入信号进行最大值为 6dB 的限制处理。结果见图 15-10，可以明显的看到中间的黑色区域粗壮了许多。到此，我们对普通信号电平的可利用功率提高到 25W 。

如果你研究图 15-8& nbsp;、 15-9 、 15-10 ，你会发现。在这过程中，总共的有用“信号空间”被有效地加倍。图中的黑色区域与信号能量是一种正比例关系，并且，它和人耳察觉到响度有直接联系。

与此同时，峰值电平保持一致。压缩后的信号有一个很明显的特点，那就是他们的峰值变化范围很小，在后面我们将继续介绍。

这时有几个老问题：压缩处理是否对信号有损害？你能否听出被压缩处理的声音？综合答案如下：一个有经验的听者能够识别出压限后的声音是怎样的效果。如果处理的合适，声音听起来不会不真实。压限后声音可以更响，同时可以改进可懂度。

在普通情况下，对于语言信号使用的限制最多为 12dB 。对于音乐信号，习惯上使用更高程度的限制。加上一定程度的压缩。压缩与限制是相关联的操作。两种电平控制方法相互结合可以将原来相当宽的动态范围变小。在现场扩声中，没有经验的演讲者会使话筒产生高动态范围的电平，这时可以用限制和压缩一前一后的进行处理，使得声音变得平稳。

音频表

目前，有两种基本的计量方式，平均值和峰值。 VU 表就是一种平均值表。指针上升时间和回落时间都是 0.3 秒。

上升时间指的是不变的输入信号达到最终指针位置的 63% 所需的时间；回落时间指的是不变的信号回落到最终指针位置的 37% 所需的时间。上升时间与回落时间是对表针与动性质的全面阐释。作为最古老的平均值指示器， VU

至今被用在广播业。因为它的指示和人们所察觉到的响度基本保持一致。

从一开始，峰值表（ PPM ）就是电子的，目的是要对信号作出极快反映。一般， PPM 的上升时间为 10 毫秒，回落时间为 4 秒。快速的上升时间可以对持续时间极短的信号做到正确的读取。与此同时，缓慢的回落时间给予音响工程师足够的时间去关注信号峰值。

图 15-11 显示了二者的界面， VU 表 (A) 和 PPM 表 (B), 他们上升时间的比较 (C) 。

二者正面刻度的关联见图 15-12 。

如果图中所示的 VU& nbsp;表和 PPM 表是已经被校准的。那么，普通的语言节目信号在 VU 表上的最大读数为 +2 或 +3VU ，与此同时， PPM 的读数在 +4dB 和 +6dB 之间，这应归于 PPM 相对于 VU 表来说，他那飞速的上升时间。（译者注：注意这里所说的PPM表和我们平时调音台上所使用的峰值表不是一个东西，具体可见0VU、+4dBu、PPM大讨论现在开始！
http://www.audiobar.net/viewthread.php?tid=84964

音响系统的增益调整

正如我们所知，普通语言信号的峰值波动幅度大概在 12dB 左右。在另一方面，音乐的峰值波动幅度可以在 16dB 至 20dB 之间，这是由于信号的自然属性所导致的。被高度压缩的音乐信号，例如我们平时听到的现代流行音乐和摇滚音乐，他们的峰值波动幅度最多不超过 4dB ：然而，古典音乐可能出现众多的信号电平幅度，因为随着音乐的进行，音量往往此起彼伏。（译者注：不同时期的CD母带制作压缩量是不一样的，如果你拿一盘80年的CD和现在的CD进行比较，你会发现如今的CD比以前的音量要大许多。总的来说母带处理所做的压缩越来越狠，声音也越来越响。）

在很多次的夏日音乐节中，音响系统被仔细的手动调节，通常音响师同一位手拿乐谱的制片人助理一起工作。

图 15-13 显示了一个该怎样做的典型事例。工程师必须明白管弦乐队将要以多响去演奏，这时将有多大的响度电平通过音响系统。这样做的目的是确保信号中的峰值级别能被广大听众中的特定区域所允许的。例如音量在这里经常被确定，以至于不对附近的居民区产生干扰。

与此同时，音响师和制片人都知道低音量的章节会被环境噪音掩盖掉，这些因素包括听众、交通，飞机越空此类噪音。操作电平在 12dB 这样的级别间移动是很平常的，平稳地完成操作，听众几乎听不出其中的变化。

推荐的增益联调

系统的 headroom 和操作电平通常是由调音台的上排成一行的输出增益决定的，系统的本底噪音受话筒的输入增益影响。音响的总动态范围就这样被确定了，在这之后的系统链中无法改进。不管用何种方法，从头到尾粗心的增益调整将使系统指标被大大降低。

我推荐一个完全可靠的操作过程。那就是在“ 0 dbu ”刻度以上留有 20dB 的空间。这样的要求不仅仅是对调音台而言，对整个音响系统链上的设备都有这样的要求。一旦 headroom 的 dB 值被确定，那么 headroom 和操作电平之间就有一个明确的关系被确立，那就是， headroom 的值是由整个音响系统链上的电路电平所共同维持，而不是某一台设备。

放大器和音箱是系统链最后的组合。将被分配的信号电平（ e.g.,0dBu ）转换成房间里的声压级。图 15-14 显示了一套简单扩声系统链之间的关系。

我们推荐的是当VU表上读到 0 的时候，调音台分配出去的电平可以使中央部分的座位产生 72dBL 的声压级。这样你可以根据一些局部设备轻微的调整这个值。这是一种简化音响系统操作标准；为了在听众区域内保持一致的音量级别，所有的操作者都不得不提高或是降低调音台上的推子，使得输入信号达到 0dB,。

[ 本帖最后由闲云孤鹤于 10-3-10 21:02 编辑 ]

本帖子中包含更多资源

您需要登录才可以下载或查看，没有帐号？注册

回复此帖报告

闲云孤鹤

5757

#7 10-11-12 21:24 …

这篇翻译的背景是非典时期，我当时是学生会的“干部”，负责看守学校院墙的一个容易翻墙的地方，防止“病毒”传入学校。

当时，人心惶惶，前途未卜，也不知道自己是否能熬过非典这一劫。

我决定无论如何也得做点自己想做，能做的事情，于是我开始在开始本子上写（当时没有电脑），用新华字典查不懂的单词。经历了百无聊赖的白天和寒风凌厉的黑夜。

一转眼，7年过去了。我来北京做了我想做的事业，但越发感触到人在艰苦的时候才能做点东西。

虽然沉寂过，但从未停止。

[mp3]http://www.synergysf.com/ver2/flash/songs/T-Pain%20Feat.%20Akon%20-%20Bartender.mp3[/mp3]

[ 本帖最后由闲云孤鹤于 10-11-13 19:18 编辑 ]

本帖子中包含更多资源

您需要登录才可以下载或查看，没有帐号？注册

回复此帖报告

返回列表