人类听感的基本特征
人耳的听觉生理特性
首先室内音质问题与人耳的听觉生理特性有关。人耳作为一个声接收器具有许多独特的性质,他接受声波的频段为20Hz~20KHz,宽达10个倍频程;它的灵敏度很高,能发觉极其微弱的声音;它具有滤波功能,能从很强的背景声中听出某些频率的声音;它还能判别声音的音调、音色以及声源的方位。声音的三要素为:声音的强弱、音调的高低和声色的好坏。其中,音调除了取决于声音的频率外,还与声压级和温度有关。音调随温度变化,即声音的温度效应,其产生的原因是气温每上升1摄氏度,声音加快(或减慢)0.5m/s。当温度升高、声速变大而声波波长不变时,声音的频率会升高;反之,声音频率就会降低,因此,音调就发生变化。因此厅内的通风、空调设备很重要,以避免因温度变化使音调失真。音色主要取决于声音的频谱结构,乐器发出的声音都是复音,其频率成分含有基波和高次谐波,即通常所说的基音和泛音。一般来说,泛音多,且低次泛音的强度也较大,音乐就优美动听,音色也就丰富。因此为尽量避免发生音色失真现象,应努力保持语言、音乐原有的频率结构。
一、响度
人耳对声音强弱的主观感觉称为响度。
(一)声压级与声强级
1、声压级
声压级: (dB)式中,Prms——某点声压的有效值;Pref——零声级的参考声压值。国际规定1kHz时人耳刚能听的声音(称闻阈)声压为2′10-5Pa,作为声压级的0dB。
2、声强级
声强级: (dB)式中,I ——某点的声强值;Iref——零声级的参考声强值。国际规定Iref=10-12W/m2,该数值是人对1kHz声音刚能听到时的声强值。
(二)可闻声的频率范围
通常将人耳可感知(听觉)的这部分频率范围称作可闻声,将低于20Hz的频段称为次声,将高于20kHz的频段称为超声。将人耳刚能听到的各频率声音最低声压级联成一条曲线,称作闻阈曲线(在1kHz时为0dB);将人耳对响度过大以致难以忍受的各频率声音的声压级也联成一曲线,称作痛阈曲线(在1kHz时为120dB或140dB)。
(三)等响度曲线
响度级定义:将某一频率的声音与1kHz的声音比较,当两者响度一样时,1kHz声音的声压级(以2′10-5Pa为0dB的相对分贝数)就是该声音的响度级。若此声音听起来与1kHz的声压级0dB一样响,则该声音的响度级为0Phon。显然,最高一条等响线是痛阈级,其响度级为120Phon。
1、低声压级时,等响上曲线各频率声音的声压级相差很大。
2、高声压级时,等响曲线较为平坦,说明在高声压时,各频率的听感等响基本相同。
3、曲线簇在高频段,高响度级与低响度级的曲线斜率及其间隔基本一致,说明高频段的响度变化与声压级增量基本一致;而在曲线簇的低频段,低响度级曲线斜率甚大,等响曲线的间隔却较小,说明低频段声压级的微小变化会导致响度的较大变化。
响度开关(Loudness)
在用于测量声音响度的声级计中,插入符合不同等响级要求的计权网络,网络能与等响曲线在高低频时的响度损失大致相吻合,使声级计的示数反映出人耳的听感特点。
二、音高
人耳对声音调子高低的主观感觉称为音高或称音调、音准。
(一)人耳对声音频率的主观感觉
大量实验证明,人耳对音高变化的感觉大体上呈对数关系,即音高=Klgf
倍频程的概念:若两个声信号的频率f1、f2相差一倍时(f2/f1=2),称其为一个倍频程。
(二)音律
在乐音中,为了反映音高的规律,常用音律来表述。
12平均律是指在1个倍频程(音律中称8度音(Octave))内,按频率对数划分成12等分,这12个相邻音的频率比各为1/12的倍频。
具有1/12的倍频关系称为半音,2个半音组成1个全音(1/6倍频)。乐器的键盘就是根据这一规则将音高由低向高排列起来,称为音阶。C、D、E、F、G、A、B为音名,1、2、3、4、5、6、7为唱名。在音乐中是以音名A作为标准音推算出来的。A音频率为440Hz。在电声学中为方便起见常用C音作标准音,其基音频率取28=256Hz(此时的A音频率可计算出为426.66Hz)。C、C'之间正好为一个倍频程,称为纯8度。除E、F与B、C'音阶之间为半音外,其余均为全音,它们由黑键定出半音来(以升半音#或降半音b来记名)。
(三)响度对音高的影响
通常情况下,响度增加时,人耳对音高的听感降低;如果该声波是低频,人耳对音高的听感降低得愈加明显。
三、音色
人耳在主观感觉上区别相同响度和音高的两类不同声音的主观听觉特性称为音色。
(一)线状谱
在声压级—频率的坐标系中画出各谐波分量,将可见到它们呈现密线状排列的频谱图。谐波成分的多少及振幅的比例决定了乐音的音色。
(二)连续谱
有一些声音不存在明显的周期性特征。非周期声的频谱具有连续谱的性质。
四、可闻声的频域特征
(一)共振峰
在乐音中,决定的因素正是分量突出的谐波成分,即共振峰。共振峰的高度、位置和数量决定着每种乐器的特色。
(二)谱级分布
1.语声
男声与女声相比,在200Hz以下有显著差异(在70Hz时约差18dB),而在200Hz以上就相当接近了;在中频段女声略高;高频段男声略高。语声分布曲线还说明,一般人的讲话声主要能量分布在100Hz~5kHz之间,尤以200Hz~700Hz间的能量更为集中。
2.音乐
音乐的频谱分布曲线比语声的曲线宽些。
五、可闻声的时域特征
(一)起振段
起振段指声源激发发声体或空气柱使之克服静止张力或阻尼而开始振动的时段。例如,钢琴约10多毫秒,风琴约100毫秒;铜管乐器的起振时间约40毫秒;一般语言信号约50—80毫秒,等等。同时,同一种乐器或发音器官,高频音起振时间较短,低频音则较长。
(二)稳态段
稳态段指起振后具有稳定鸣响的时段。通常拉弦乐器有较长的稳态阶段,如二胡等,有些如大提琴的稳定段可达数秒以上;而打击乐器的稳定段时间较短或基本没有,如板鼓等。以持续力激发的声源(包括电子乐器)多具有稳定振荡,以断续力激发的声源则多缺少稳定振荡。
(三)衰减段
衰减段指振幅开始减小直至停振的时段。不同乐器的衰减时间不尽相同,有些长达数秒,有些甚短。高频音的衰减时间较短,低频音较长。
以上三个具有不同过渡特性的阶段缺一不可,它们与音高一起构成了各种乐器的不同音色。音响的频率域和时间域共同构成了音色的全部要素。过渡特性同样也是人工模拟声音所必不可少的一项内容。
人耳听觉的非线性掩蔽效应
在考虑室内声学时,哈斯效应(优先效应)也是一个不容忽视的问题。两个相同的声音,一先一后到达人耳朵时,只要时间差在30ms以下,听声者就会感到声音似乎是从第一个声源中发出的,并不能感觉到第二个声源的存在。时间差在30~50ms时,听声者仍感到声源是来 自第一个声源,但已可以识别出延时声源的存在。时间差超过50ms,听声者就可以清晰的辨别出两个声源。在室内声学、扩声工程中必须要考虑到哈斯效应的存在并应对其加以利用。
实验表明,当两个或两个以上的声音同时存在时,其中的一个声音在听觉上会掩盖另一个(或其它的)声音,这种现象称为掩蔽效应。人们把被掩蔽声的“闻阈”在受其它声干扰时应提高的分贝数定为掩蔽量,以dB表示。掩蔽量不仅与频率有关,也与声音的性质有关。
(一)纯音的掩蔽
由曲线可见,掩蔽量在掩蔽音附近最大;两音在十分接近时会产生差拍,掩蔽量反而下降;在纯音的2倍、3倍频处也有类似的情况。
(二)噪声对纯音的掩蔽
与纯音掩蔽相比,它的曲线比较对称,在噪声带内没有起伏,但带内的掩蔽作用更为显著。“鸡尾酒会效应”(Cock Tail Effect),就是在纷乱的酒会现场,人们照样能听出其中某个人的声音来。人耳的这种功能是与人的心理需求有关,当人把注意力相对集中于某一说话内容,而忽略或不去理会(不注意)掩蔽声的存在时,人耳在噪声中分辨信息的能力便大大提高。这种性质在通讯中有很大的益处,即使S/N=0也能提取信息。
对掩蔽效应的进一步研究还可得出以下一些结论:
1.低频声对高频声的掩蔽作用明显,反之,则作用较小。所以,播音(演播)室特别要防止空调的低频振动声、气流声;电子线路产生的交流哼声(50Hz或100Hz)低于一般的讲演声,稍有干扰就令人厌烦,一定要设法减小到最低限度。
2.当掩蔽声是由多个声音组成的复音时,若它们的声压级不同或发生变化,则由于复音中各成分的掩蔽值不同而会影响到整个复合音的音色。
3.在时间上,掩蔽声越接近被掩蔽声时,掩蔽作用越大,且后掩蔽(掩蔽声在被掩蔽声之后)比前掩蔽(掩蔽声在被掩蔽声之前)效应更为明显。
4.单耳听觉的掩蔽效应大于双耳听觉。
5.提高掩蔽声的声压级可展宽掩蔽的频率范围。
音质的主观评价
室内音质好坏的最后标准是听众的主观感受。声音的主观评价,大体可分为三个方面,即量的因素、质的因素和空间因素。
量的因素:又称“音量感”或力度。其评价标准主要是“响度”与“丰满度”。响度是人们感受到的声音的大小。足够的响度是室内具有良好音质的基本条件。
质的因素:主要指对声源音色的保持和美化。保持声源固有的音色不至于室内声学条件产生失真,是质的因素的基本评价标准。与质的因素相对应的物理指标主要是混响时间的频率特性以及早期衰减的频率特性。
空间因素:只室内的声学条件给予听者的一种空间感受。包括听者根据声音对声源方位的判断(方位感),距声源远近的判断(距离感)等。
清晰度:在室内音质评价中,对于语言信号,有一个定量的评价标准,即清晰度。语言的清晰度常用“音节清晰度”表示。它是在某种声学条件下,听者能够正确听到的音节数占发音人发出的全部音节数的百分比。
随着晚会中台上演员与台下观众的互动不断增多,语言的可懂度也是一个很重要的评价标准,它是音质评价中的量的因素与质的因素的综合结果。
没有回声等声学缺陷:回声就是在听到原来的声音之后,又重复听到与之相同的声音的现象。它听起来相当清楚,因而不同于混响声。在某种情况下,回声有时会以一定的时间间隔重复出现,形成所谓多重回声。回声与多重回声是延时较长的强反射,它妨碍正常的听闻,在室内音质设计中应当注意避免和消除。