频谱分析幅值单位_Chapter1|1.1 声音的时间和频谱特征
在这一章中,简要地回顾了声音的时间特性和频谱特性之间的一些基本关系。描述了电信号通过扬声器和耳机转化为声音的过程。此外,还介绍了一些心理物理的方法和步骤。最后,讨论了一般听觉刺激声与听觉感知之间的关系以及心理声学中原始数据的处理过程。
1.1 声音的时间和频谱特征****
图1-1概述了心理声学中一些常用声音的时间和频谱特征。声音很容易用时变声压p(t)来描述。与大气压的大小相比,声源引起的声压随时间变化非常小。声压的单位是帕斯卡(Pa)。在心理声学中,10-5pa(绝对可听阈值)和102pa(疼痛阈值)之间的声压值是相关的。为了处理如此大范围的声压,通常使用声压级L。声压和声压级之间通过以下方程联系起来
L=20log(p/p0)dB (1.1)
参考声压p0被标准化成p0=20μPa。

图1-1 心理声学中常用的声激励时域信号与相关的频谱;声音文件Track 4
在心理声学中,除了声压和声压级外,声强I和声强级也有关系。在平面行波中,声压级和声强级由该方程联系起来
L=20log(p/p0)=10log(I/I0)dB (1.2)
I0的参考值定义为10-12W/m2。
特别是在处理噪声时,最好不要直接使用声强,而应使用它的密度,即1Hz带宽内的声强。“噪声功率密度”的表达式虽然不太正确,但也使用。声强密度的对数表示称为声强密度级,通常简称为密度级l。对于白噪声,它表现为与频率无关的密度级,l与L由以下方程联系起来
L=[l+10log(Δ f /Hz)]dB (1.3)
其中,Δf表示测量的声音的带宽(单位为Hz)。
图1-1中“1kHz纯音 ”子图表明声压p的连续正弦波动的时域信号在最大值之间的时间间隔为1ms,对应的频谱只在1 kHz处有一条谱线。
“拍 ”子图在频域最容易解释,显示为幅值相同的两个纯音的组合。对应的时间函数表现出较强的时间包络变化。
“调幅纯音 ”子图描绘了正弦调幅2kHz纯音的时间函数和频谱。时间函数表现为正弦振荡,其包络线随调制频率的变化而变化。相应的频谱图说明调幅纯音由三条谱线来描述。在2kHz处谱线的幅值与其左侧或右侧谱线的幅值差值ΔL与调制度m(调制度=调制波幅值/载波幅值,译者注),通过以下方程关联起来
ΔL=20log(m/2) dB (1.4)
图中包络线的周期为6ms,对应的调制频率为167Hz,在频域中,这个频率代表了被称为载波的中心谱线与上下边谱线之间的频率差。
“纯音脉冲 ”子图显示了一个定时矩形门控的纯音的时间函数和频谱。纯音频率为2000Hz,门控时间间隔为6ms。在频域中,谱线与谱线之间的间距对应于门控频率167Hz。
“直流脉冲 ”子图显示了类似的情况。然而,在这种情况下,是一个直流电压在有规律地发生门控现象,而不是纯音门控。直流脉冲的持续时间为1ms,直流脉冲的间隔为8ms。对应的频谱表明谱线间隔为8ms的倒数,即125 Hz。在频率分别为1/1ms(1kHz)、2/1ms(2kHz)、3/1ms(3kHz)等处,谱线幅值有明显的最小值。
最后一个产生离散频谱或线谱的例子是“调频纯音 ”。一个频率为2kHz的纯音在1至3 kHz之间受调制频率为200Hz的正弦频率调制。相关的幅值谱关于2kHz是对称的,其包络线为贝塞尔函数。如果调制指数(即频率偏移的频带与调制频率之比)很小,那么贝塞尔谱的大部分谱线就会消失,得到的谱线类似于一个有一条中心线和两条边线的调幅纯音的频谱。但是,与调幅纯音相比,调制指数较小的调频纯音边频谱线相位偏移了90度。
图1-1中的“猝发纯音 ”子图是产生连续谱而不是线谱的一系列声音的第一个例子。该函数演示了一个持续时间2ms的2kHz猝发纯音。对应的频谱显示在2kHz处有最大值,在间隔500Hz处有最小值。因此,单个猝发纯音的频谱可与纯音脉冲或直流脉冲的频谱相当。尽管纯音脉冲和直流脉冲产生线谱,单个猝发纯音产生连续谱。
白噪声是声音产生连续频谱的一个重要例子。在心理声学中,由于实际原因,白噪声的带宽通常限制在20Hz~20kHz范围内。从图1-1的“白噪声 ”子图中可以看出,在整个20kHz频率范围内,谱密度与频率无关。应该指出的是,这适用于长期频谱,而白噪声的短期频谱可能表现出一些频率依赖性。白噪声时间函数的幅值呈高斯分布。
如果白噪声的带宽受到滤波器的限制,就会产生带通噪声。图1-1中的“带通噪声 ”子图显示了一个典型的带通噪声例子,带通噪声的时间函数在1kHz处的带通频宽Δf为200Hz。显示的时间函数是单个事件,不会周期性地重复。与白噪声一样,带通噪声的规律是在特定的时刻,幅值只能以一定的概率给出,概率函数呈高斯分布。包络波动的速度受滤波器带宽的限制。在初次近似中,所示的带通噪声的时间函数可以被认为是一个1 kHz的纯音,它受随机幅值(和相位)调制。平均而言,每秒的包络最大值n可以用公式近似表示
n=0.64Δf (1.5)
因此,带宽为Δf的带通噪声的“有效”调制频率f*mod可近似表示为
f *mod=0.64Δf (1.6)
对于之前那个带宽为200Hz的带通噪声,这意味着包络线的最大值应该出现在平均距离为8ms的地方。图1-1中“带通噪声”子图的时间函数表明该近似是有效的。
“窄带噪声 ”子图表现出与讨论的带通噪声相同的特征。但是在这个例子中,带宽只有20Hz,包络线波动非常缓慢,包络线最大值的时间距离平均增加到80ms左右。时间函数的变化表明窄带噪声可以在初次近似中看作是1 kHz的纯音,受随机幅值调制。
在“高斯直流脉冲 ”子图中展示了用高斯型包络线表示直流脉冲的时间函数和频谱。高斯形状代表了时间包络的变化速度和相关频谱的带宽之间的最佳交易,因为带宽和持续时间的乘积是高斯形状的最小值。在这个例中,选择时间tp=1 ms基于这样的原因:具有相同最大声压的矩形时间函数在曲线下的面积与高斯直流脉冲相同。在这种情况下,持续时间tp刚好低于声压最大值的一半,正好是最大声压的0.456倍。在本例中,频域中对应的带宽约为500Hz。
“高斯型猝发纯音 ”子图显示了一类门控纯音的时间函数和频谱,由于其时间包络的斜率较陡,同时其频谱分布也较窄,因此是心理声学研究的首选。图1-1所示为单次高斯型纯音脉冲的情况。如果脉冲以1Hz的频率重复,则频谱包络保持不变,但出现了谱线间距为1Hz的线谱。
如上所述,噪声信号的最大幅值是不能给定的,因为在高斯噪声中,幅值是按高斯分布变化的。这意味着只能指示出声压超过给定值的概率。在图1-2中,这个概率是实际声压的函数,根据其长期均方根值(RMS值)进行归一化。实际声压高于均方根值的概率随实际声压与均方根值之比的增大而减小。如果一个噪声信号的幅值削波能被容忍时间的1%,这意味着一个幅值是均方根值2.6倍的声压必须不失真地传递(If clipping of a noise signal can betolerated 1% of the time, this means that a sound pressure with an amplitude2.6 times that of the RMS value has to be transmitted undistorted.由于对这句话理解不准确,所以列出了原文—— 译者注)。对于心理声学实验来说,更严格的限制是必要的,因为只有0.1%的情况下可以容忍峰值削波。因此,如果声压超过均方根值3.4倍,就必须在不失真的情况下传输。在实际应用中,这意味着与纯音信号相比,声级计上的读数必须降低10分贝,以避免噪声信号的严重失真。

图1-2 高斯噪声的声压超过给定声压的概率,根据其均方根值归一化
注 :翻译自Hugo Fastl,Eberhard Zwicker,Psychoacoustics:Facts and Models ,Springer,2006

扩展阅读
1.《模态试验实用技术:实践者指南》独家预售通知
2.工程师们,该写写文章总结了
3.什么是分贝dB?
4.什么是声压级?
5.什么是声功率?
6.什么是声强?

