社区应用 最新帖子 精华区 社区服务 会员列表 统计排行
主题 : 科学和艺术是电声学的两翼——电声专家一席谈
级别: 论坛版主
显示用户信息 
楼主  发表于: 2008-04-03   

科学和艺术是电声学的两翼——电声专家一席谈

摘自《音响世界》1995年6月刊

科学艺术是电声学的两翼
      ——电声专家一席谈
                      管善群教授口述
                      本刊特约记者 渝声整理
(注:相片从略,红色字体是管教授对原刊载的更正或注释)

整理者按:“发烧”的理论基础是电声学。当前使业余爱好者们大惑不解或争论不休的许多热点问题,其中固然有暂时还无法用理论解释的现象,但更多的是电声学理论早已解决了的问题。如果我们对电声理论有所了解,很多问题本来是不应当成为问题的。笔者也是一名业余爱好者,虽然玩过若干年音响,大学里修的也是电子专业课程,但电子学毕竟不能和电声学划等号,因而常常会产生一些似是而非的想法,甚至误入歧途。最近有机会拜访了著名电声专家、北京邮电大学电视电声教研室教授管善群老师。听了他一番阐述,深感电声学理论之博大精深。要想当一名合格的发烧友,今后非在这方面痛下功夫不可。想到其他发烧朋友也许会有同感,特此将管教授的部分谈话整理出来,请他审阅后发表于此,以飨读者。
电声学是技术与艺术相结合的产物
    电声学的任务是通过技术手段再现艺术作品的内容。搞技术的人和搞艺术的人的思维方式是不一样的:艺术是写意的,判别艺术作品好坏的分界线可以比较模糊;而理工科则要求精确,必须善于用数量来确定质量界限。从事电声工作的人必须同时具备这两方面的素质:你必须能够理解艺术家的感觉,懂得他们的表达方式,而且自己也能够感受到它,会用电声手段去实现它。还要能够找出这种感觉的实质是什么:物理上如何解释,声学上如何解释,在心理上又是怎么回事。科学家认为:无论是生理感觉还是心理感觉,一切生命现象都是客观的而不是主观的,只不过有些现象还不能用现在已经掌握的科学原理来解释。例如人类听觉系统的机理,迄今为止了解得还很不够。七十年代就已发现:人的听觉神经毛细胞向大脑传送的信号不是模拟信号,而是数码信号。当一个人连续两次听到相同的声音信号时,听觉神经发出的信号是不同的。这种数码信号的实质尚未完全破解,据推测,很可能是人的大脑中有一个庞大的“数据库”,听到声音后要到这个数据库里搜索,提取以前存储的声音数据,进行对比。当然,这仅仅是推测,要完全解开听觉的奥秘,还有许多工作要做。
    世界上的艺术家很多,科学家也很多,但是电声学家却不多,原因就是因为电声学家必须同时掌握科学和艺术这两种方法,而两者的思维方式是有许多区别的,所以这样的人就比较少。现在电声学方面有许多争议:科学家认为某些做法不科学,艺术家又认为没能表达出他的艺术内涵,一个很大的障碍就是他只熟悉一个方面,只会用一种方式思考问题,而对另一方面则不太熟悉。如果一个人能同时掌握这两种不同的思维方式,所产生的结果就不是简单的加法关系,而是乘法关系,比两者分离的思维方式更高了一层,可以从更高的角度来看问题。前些年李政道等几位科学家和艺术家在北京发起了一个“科学与艺术”的研讨会,与会的科学家和艺术家都认为:“科学和艺术是一个事物的两个方面”。同样,科学和艺术也是电声学的两翼。只有一个翅膀是飞不起来的。如果搞电声的人陷入到纯艺术或者纯技术里去,是一定搞不好的。我们的高保真爱好者也应该向这个方向努力,如果觉得自己在哪方面不够好,就应当在这方面多下工夫,并逐步将两者结合起来。
物理指标与音质评价
    目前的物理测量方法和测量手段还不能把电声设备的全部特性表达出来。用物理指标来表示电声设备的性能,充其量只能算是一些必要条件而不是充分条件,而且我个人怀疑其中个别指标已经落到不必要条件里去了。就像用考试来衡量一个学生的好坏一样,最多只能表现出他全部能力的四分之一或五分之一。要充分评价设备的好坏,目前除了测量其物理指标以外,还要靠听觉来测试。物理指标的测试高低好比一个学生的考试成绩优劣,如果一个学生的考试成绩很不好,说他是个好学生也是不对的,好学生的分数也不能太低。同样,如果电声器材的物理测试结果很差,那么这台设备就肯定是不好的,没有必要再作听音评价;但如果两台设备的物理测试指标都是合格的,指标较高的那台性能并不一定比指标较低的那台好。
    中文使用的“音质评价”这个词我认为不太合适,但由于约定成俗,我在参与起草音质评价的国家标准时还是采用了它。在英文文本上使用的是“Listening Test”,意思是听觉测试。听觉测试的目的不是为了重复检验用物理手段已经测试过的东西,例如失真、频率响应等等,而是要听那些用物理手段测量不到的那一部分东西。有人问:你听后感觉这台设备的频响怎么样?这就背离了Listening Test的宗旨。试听用的节目源(样件)必须经过认真挑选,因为人对不同种类音乐信号的敏感程度是不一样的,对于某些类型的音乐,即使不太好的电声设备也感觉不出声音的变化,而另一些类型的音乐只要稍有变化就可以让人觉察得到。所以必须选择那些人们比较敏感的,也就是选用那些对听觉测试贡献较大的节目源作听觉测试的样件。
    要讲清这个问题,我想可以用“接口失真”的听觉测试为例子。所谓接口失真,就是当扬声器和放大器连接的时候所产生的一种非线性失真。放大器中的每一级都可以看成一个四端网络,而一个四端网络的某些参数将取决于与其相连的另一个四端网络的参数。当连接在放大器上的扬声器参数改变的时候,至少将使功放最后两级受到影响。这时虽然放大器的电路和元器件没有改变,但是参数已经变了。换接不同的扬声器,就会有不同的接口失真,这种失真是可以用物理方法模拟出来的。有人作了一个试验,请了四个音乐家来试听。听钢琴声的时候,只要有十万分之几的接口失真,其中三个人就认为已经对听觉有影响了;改用大众音乐,还是这四个人听,即使接口失真达到百分之十,他们却认为还是可以的。
    由此可见,不同的样件对于音质评价的意义是不一样的:有些样件在各种不同的设备上听起来都差不多,有些样件则可以辨别出设备间微小的差别。要搞音质评价,首先要研究不同信号对音质评价的贡献,要挑选那些能够把问题暴露出来的节目源来作样件。我近二十年的研究结果表明:汉语对音质评价的贡献非常之大。其实这在日常生活中也有体现,例如我们在收看汉语电视节目的时候会感到音质很不好,损伤很大。一旦变成英语节目,还是这台电视机,还是这个电视台,我们就会感到损伤不大了,这说明汉语中所含的信息量是最大的。国家法定的用于音质评价的样件是从上万种节目源中精心筛选出来的,第一段就是汉语,男声是方明,女声是亚坤,他们二位的发音是国家语言文字工作委员会承认的标准普通话。音乐样件的第一段选了钢琴弹奏的“月光奏鸣曲”的第三乐段,其中有一处演奏者的手指弹得不太好,在好设备上可以分辨出这个弹得不好的地方,用较差的设备就可能觉察不出来。样件也可以选用一部分自然声,但不要搞到极端的程度,例如枪炮声。用扬声器播放出的枪炮声是绝对不会真实的,真实的炮声能使我们在听到炮响后若干秒内丧失听力,强度将远远超过180分贝。要重放这样强的声音,即便几万瓦的功放也不够用,没有任何一种扬声器能产生这样强的声压,实际上艺术方面也不是这样要求的。
    听觉评价结果的一致性和可重复性问题是大家所关心的。一致性的好坏与所选的样件有很大关系,只要样件选择得好,能够明显暴露出不同设备间的差异,听觉测试结果的一致性就好,反之就不好。我国的音质评价标准(指GB 10240-88与GSBM 6001-89)在鉴定中充分注意了这个问题。科学实验的最基本原则之一就是必须是可重复的。
错觉与非线性
    现代的立体声系统可以划分成两大类:一类是模拟声场式,另一类是听觉错觉式。模拟声场式的典型的例子是Dolby公司的5•1声道系统(即前左、前右、前中、左环绕右环绕共五个声道,再加一个低频效果声道);听觉错觉式立体声的典型例子就是家用双声道立体声系统。要用两组扬声器表现出四维(三维空间再加上时间)的声音效果,就必须利用人的听觉错觉。在对声音进行处理的时候,听觉错觉式系统绝不能把能引起错觉的成份丢掉;模拟声场式反而比较简单。
    人的听觉错觉和视觉错觉是不一样的:把一块红颜色和一块绿颜色放在非常靠近的位置上,我们的视觉错觉会让我们感到是看见了二者的中间色——黄色;但如果同时听到一个低音和一个高音,我们听起来就绝不会是一个中音。如果让你分别听一个20000赫兹的声音和一个21000赫兹的声音,你可能什么也听不见。但如果让你同时听这两个信号,你会感觉听到了两者的差频信号——1000赫兹的声音。造成这种现象的原因是人耳的非线性。(整理者按:管教授当场用电脑声频工作站演示了一系列证明人耳非线性的实验,笔者亲耳听到了这些现象。详细情况请阅本文“附录”。)
    我有一个学生写了一篇文章,主张不要用描述视觉的词汇来描述听觉的感受,我是赞成他的意见的。例如说声音“明亮”,到底什么样的声音算是明亮的?这种说法是不确切的。(笔者在说话中有一次用了“原汁原味”的说法,管教授当即指出:这个词是用来形容味觉的,也不适用于描述听觉。)
    不仅人耳是非线性的,当声压超过90分贝的时候,空气也是非线性的。有不少人都作过以下的实验:在一个行波筒的一端放一个机械式活塞,让活塞作正弦振动,使筒中的空气产生行进声波。逐渐加强振动幅度,当振动强度达到一定程度后发现:活塞附近的空气波形还是正弦的,到远处就变成非正弦波了。这个实验可以证明空气的非线性,而且在声音传播的过程中,非线性会随着传播距离的增加而越来越大。很多乐器的声音也是这样,小号的号口处声压可以达到150分贝,在台下远距离处听到的声音与号口处是不会一样的,原因就在于空气的非线性。
    懂得了这一点,有些当前争论不休的某些问题就可以不必再争了,因为这种争论是没有意义的。
电声与音乐
    我们所遇到的音乐作品可以分为两大类:一类是为现场演出而创作的,写作时没有希望电声参与,最典型的例子是古典音乐。另一类是必须要用电声播放的,例如电影、电视节目的配乐和为声像制品而创作的音乐。作曲家为不同用途所写的作品应该是不一样的,因为现在的电声系统还不可能把作曲家想要表达的东西全部表达出来。但电声系统也有它的优势:可以用简单的方法突出我们所要的效果。对电声有一定了解的作曲家就会知道:哪些东西能够通过电声表达出来,哪些东西现场可以表达而电声却表达不出来,什么情况下电声会歪曲你的东西,什么时候使用不太复杂的电声系统而效果却会很好。根据不同的情况采用不同的写作手法和配器,就可以避开电声的劣势,把它的优势充分发挥出来。有一次一位作曲家写了个作品,录声效果却怎么也搞不好。这种情况下单靠录音师调整是不行的,于是我根据电声系统的特点修改了他的总谱,重新录制的结果作曲者很满意,认为这样才能真正表达了他的想法。
    音乐的源头是在作曲家的脑子里,我们欣赏音乐就是在欣赏作曲家是怎么想的。作曲家要通过电声把自己的意图传达给听众,就必须事先考虑到:通过电声后作品的效果是什么样的。从录声的角度来看,那些最初并未指望电声参与的作品是最难录制和重放的,最容易录制的是电子合成音乐,因为它是就是根据电声系统重放出来的声音听感调整的。电声器材的厂家有时会随机附赠一张试听用的唱片或磁带,这张唱片或磁带上的节目一定是精心选择的,能够尽量表现这种器材的优点,掩盖缺点。如果随机唱片的内容是电子合成音乐,那么马上就可以肯定:设备一定是低档的。反之,如果厂家敢于给你古典音乐,那么这种设备的档次就不会太低。
Hi-End到底在哪里?
      发烧友不懈地追求着Hi-End,为了达到这个目的,许多人把主要注意力集中在器材上,在一条线、一个元器件上下功夫。这种做法还是处于初级阶段。什么时候一个发烧友已经不再将精力注重在器材上,而是注重声场的特性,那才是进入了高级阶段。
声场对还声效果的影响是很大的。同一扬声器放在不同的房间里,效果是不一样的,正如同一乐队在不同的音乐厅演奏,效果也是不一样的。换句话说,某一扬声器在某种条件下是最好的,换一种条件,它就可能是不好的。
    我们听到的声音不仅有直达声,而且有房间墙壁的反射声,反射声对听感的影响是非常重大的。我们都有过这样的体会:两个人一边走一边说话,从院子里通过走廊走进房间里,你会觉得这个人的声音变了。造成这种现象的原因就是因为院子、走廊和房间里的反射声是不一样的。我们用电声聆听的各种节目源里除去录制了乐器发出的直达声外,也录下了剧场的反射声。但由于剧场比较大,反射声来得比较晚。在小房间里播放的时候,你听到的第一个反射声并不是节目源中录制的剧场反射声,而是重放房间的墙壁产生的,你听到的房间反射声就混到节目里去了。为了真正听到节目源中的情况,必须把房间的反射声基本消除到听觉掩蔽阈以下。要做到这一点,就必须用切实可行的办法设置吸声面。房间的声学处理都必然是有个性的,没有统一的模式,基本方法是把反射面变成吸声面,例如玻璃是声反射面,但只要换成穿孔玻璃,就变成了吸声面。
    前面说过音乐作品的源头在作曲者的脑子里,那么通过电声手段聆听音乐的终结点应该是在听者的脑子里,Hi-End的“End”也应是在听者的脑子里,通过声场产生感觉。要想听觉效果好,声场特性必须搞好。
功放的技术指标问题
    按照国家标准(指GB 1982-80与GB 1983-80),功放按听觉感受优劣分成四个等级,其中二级相当于国际上的Hi-Fi级。国标中有些规定非常重要,但没有引起足够的重视。例如频响,大家都只注意到20Hz至20kHz的要求,其实还有一条容易被忽略,那就是从20Hz至2Hz之间必须单调下降,从20kHz至200kHz也必须单调下降。这是很重要的。如果在这两段出现峰谷,说明“零、极点”没有搞好。
    零、极点设计是负反馈放大器的一个重要问题。现在有些人在没搞清这个问题时就评论用负反馈好还是不好,这样说是不公平的。我们知道反馈环内一定会有相移,当相移增大到一定程度的时候,负反馈就逐渐向正反馈转变。当负反馈变成正反馈时,虽然放大器并不一定产生自激,但在这些频率附近放大器的特性一定是很坏的。零、极点设计搞得好,就可以在整个有效频段内保证负反馈环内的相移不能超过几度,也就是说必须把正反馈产生的频率移出有效频段很远的地方,这样的负反馈放大器就不会有问题。
    频率响应是越宽越好吗?一个放大器如果不能把非线性失真做得很低,那么宁可把频带做得窄一些,反而会觉得好听些。对于比较廉价的低档放大器尤其是这样。现在有些放大器(包括一些国外产品)的说明书上给出的失真指标只给中频一点处(例如lkHz处)的失真,那是没有用的,应该标出整个有效频段的失真。如果一台放大器的失真到20kHz仍然很低,那就绝对不会有问题。高频部分虽然人耳不能直接听到,从前面说过的人耳的非线性可以知道:如果一个20kHz的信号和一个21kHz的信号同时出现,虽然我们不能直接听到这两个信号,但是可以听到他们的差频 — lkHz的声音。如果所用的放大器的高频段失真很大,那么我们就会觉得在中频lkHz处有很大的失真。我们感觉到失真出现在中频段,但实际上问题是出在高频段。有些放大器频响标得很宽,但不标失真,或只标中频一点的失真,内行人看了就明白:这个放大器是不好的。
    按照国际惯例,电声设备的指标应该分为三类:第一类指标是设备的工作条件,例如电源电压,这种指标应该标在设备上。第二类指标是设备的主要性能,必须在说明书上标明。不但要给出指标值,还应该给出测试条件。如果采用的是国际或国内的标准测试方法,那么也应该写明所采用的标准的名称或代号。这两类指标是可以作为索赔条件的,而商业上总是要尽可能回避问题,因此可以认为:凡是只给指标而不给测试条件的,那么测试条件一定很宽;凡是不给指标的,那么这项指标一定很坏。除去前两类指标外,还有第三类指标,即企业内部的质量控制指标。这类指标一般是不给客户的,也不能作为索赔条件。如果客户认为第三类指标中的某项指标对于他特别重要,那么也可以要求把某些第三类指标升级为第二类指标,这时该项指标就可以作为索赔条件。当然,这时厂家是会要求提高价格的。
附录:关于人耳非线性的实验
  实验设备:
  l.Olivetti电脑声频工作站
  2.Windows支持下的声音编辑器
  3.功率放大器及扬声器箱,系统频响上限不小于22kHz
  实验一:差频信号的演示
  单独播放18kHz的纯正弦波信号,此时一般人的感觉是听不到声音。
  单独播放19kHz的纯正弦波信号,仍然听不到声音。
  将这两个信号分别使用不同声道同时播放,此时听到了lkHz的声音。这是由于人耳的非线性造成的。
  实验二:4kHz信号的“变调”演示
  一般认为:音调的高低与信号频率具有固定的对应关系。但由于人耳非线性的缘故,听觉神经产生的信号谱与听到的信号谱并不完全相同。故音调高低并不总是依赖于信号频率。
  采集一个4kHz的连续纯正弦波信号,用声音编辑器对此信号进行处理,在这个连续信号上“开槽”,即制作出若干组基频仍然为4kHz正弦波,但不连续的信号。第一组为每出现2毫秒后停止2毫秒;第二组间隔为4毫秒;……依次类推。
  按照间隔由小到大的顺序连续播放这些信号,听感是信号音高频率在逐渐下降,而实际上信号的频谱是逐渐向4kHz集中的。
  实验三:用单一频率的正弦波信号演奏乐曲
  在实验二的基础上,仍用4kHz的正弦信号,调整“开槽”的宽度,然后连续播放,可以演奏出一首乐曲。某些电子合成的工作原理实际上就是如此。





欢迎垂询,QQ:952240202
级别: 论坛版主
显示用户信息 
1楼  发表于: 2008-04-03   
全文PDF格式供有需要的网友下载
欢迎垂询,QQ:952240202
级别: 论坛版主
显示用户信息 
2楼  发表于: 2008-04-03   
请到Adobe官方网站免费下载PDF文档的阅读软件:http://www.adobe.com/cn/products/acrobat/readstep2.html?promoid=BPAVN
欢迎垂询,QQ:952240202
级别: 新手上路
显示用户信息 
3楼  发表于: 2008-08-12   
  人的听觉错觉和视觉错觉是不一样的:把一块红颜色和一块绿颜色放在非常靠近的位置上,我们的视觉错觉会让我们感到是看见了二者的中间色——黄色;但如果同时听到一个低音和一个高音,我们听起来就绝不会是一个中音。如果让你分别听一个20000赫兹的声音和一个21000赫兹的声音,你可能什么也听不见。但如果让你同时听这两个信号,你会感觉听到了两者的差频信号——1000赫兹的声音。造成这种现象的原因是人耳的非线性。(整理者按:管教授当场用电脑声频工作站演示了一系列证明人耳非线性的实验,笔者亲耳听到了这些现象。详细情况请阅本文“附录”。)

做过实验,人耳听不到1K信号。
级别: 新手上路
显示用户信息 
4楼  发表于: 2008-08-12   
应该是管老师的设备有非线性。这些实验已没有意义。
级别: 论坛版主
显示用户信息 
5楼  发表于: 2008-08-13   
引用
引用第3楼胡思于2008-08-12 17:46发表的  :
  人的听觉错觉和视觉错觉是不一样的:把一块红颜色和一块绿颜色放在非常靠近的位置上,我们的视觉错觉会让我们感到是看见了二者的中间色——黄色;但如果同时听到一个低音和一个高音,我们听起来就绝不会是一个中音。如果让你分别听一个20000赫兹的声音和一个21000赫兹的声音,你可能什么也听不见。但如果让你同时听这两个信号,你会感觉听到了两者的差频信号——1000赫兹的声音。造成这种现象的原因是人耳的非线性。(整理者按:管教授当场用电脑声频工作站演示了一系列证明人耳非线性的实验,笔者亲耳听到了这些现象。详细情况请阅本文“附录”。)

做过实验,人耳听不到1K信号。


引用
引用第4楼胡思于2008-08-12 17:51发表的  :
应该是管老师的设备有非线性。这些实验已没有意义。


能否把你的实验过程和条件详细说明?
欢迎垂询,QQ:952240202
级别: 新手上路
显示用户信息 
6楼  发表于: 2008-08-18   
我用的音频信号发生器是:
1、安捷伦33220A任意函数发生器,
2、R&S SMT02信号发生器。
由上面两台信号发生器分别发生20k和21k信号,分别接两个独立的功放(为避免串音),再分别接喇叭。
实验时,先分别用1k信号,调到差不多的响度,再分别调到20k和21k。五个人都听不到声音。

注:原来想用AP音频分析仪发出音频,发现其音频不纯,20k时象调幅波,有可闻的声音。
要点:音频信号发生器要过关。
级别: 论坛版主
显示用户信息 
7楼  发表于: 2008-08-19   
引用
引用第6楼胡思于2008-08-18 17:12发表的 :
我用的音频信号发生器是:
1、安捷伦33220A任意函数发生器,
2、R&S SMT02信号发生器。
由上面两台信号发生器分别发生20k和21k信号,分别接两个独立的功放(为避免串音),再分别接喇叭。
实验时,先分别用1k信号,调到差不多的响度,再分别调到20k和21k。五个人都听不到声音。
.......


首先感谢您的详细说明,

有关人耳听觉非线性的实验问题有以下几点:

1.可能扬声器箱未能完整重放20kHz和21kHz的信号,

2.建议降低频率来再做一次实验,分别向左右扬声器箱同时馈送16kHz和17kHz的正弦信号,

3.室内的本底噪声要足够低,

希望这些能帮到您!
欢迎垂询,QQ:952240202
级别: 新手上路
显示用户信息 
8楼  发表于: 2008-08-22   
有人能听到16K的信号,所以选用17和18K信号。
能听到16K信号的人听到有声音,只能听到13K信号的人听不到。
据听到的人说,听到的声音不是1K,更像14K的声音。
级别: 论坛版主
显示用户信息 
9楼  发表于: 2008-08-23   
引用
引用第8楼胡思于2008-08-22 11:29发表的  :
有人能听到16K的信号,所以选用17和18K信号。
能听到16K信号的人听到有声音,只能听到13K信号的人听不到。
据听到的人说,听到的声音不是1K,更像14K的声音。


根据你描述的情况,我建议改用较为容易听出来的频率来做这个人耳非线性的实验,
以下是信号的样件:
1左声道为1000Hz,右声道为1250Hz。
2左声道为4000Hz,右声道为4250Hz。
均为正弦信号,在适当的声压下可明显听到250Hz的信号,但并不是单纯的250Hz。
说明:
信号样件为wav格式,长度10秒,
前面只有一个声道分别有信号,后面再同时出现,
请下载后再播放。
[ 此贴被xiehuiquan在2008-08-23 23:55重新编辑 ]
附件: 1000Hz-1250Hz.wav (1723 K) 下载次数:1244
附件: 4000Hz-4250Hz.wav (1725 K) 下载次数:1086
欢迎垂询,QQ:952240202
描述
快速回复

认证码:

验证问题:
audiomercury.com 正确答案:audiomercury.com
按"Ctrl+Enter"直接提交