首页 > 学院 > 开发设计 > 正文

音频处理中的尺度--Bark尺度与Mel尺度

2019-11-06 09:58:08
字体:
来源:转载
供稿:网友

由于人耳对声音的感知(如:频率、音调)是非线性的,为了对声音的感知进行度量,产生了一系列的尺度(如:十二平均律),这里重点说下Bark尺度与Mel尺度。刚开始的时候,我自己也没弄明白这两个尺度的区别。后来才逐渐的明白他们的思考出发点,这里简单分享出来。

 

  Bark(巴克)频率尺度是以Hz为单位,把频率映射到心理声学的24个临界频带上,第25个临界频带占据约:16K~20kHz的频率,1个临界频带的宽度等于一个Bark,简单的说,Bark尺度是把物理频率转换到心理声学的频率。Bark尺度频率的中心频率与临界带宽边界频率如下表所示:

 

临界频带频率/Hz
Bark频带中心频率下界频率上界频率
1500100
2150100200
3250200300
4350300400
5450400510
6570510630
7700630770
8840770920
910009201080
10117010801270
11137012701480
12160014801720
13185017202000
14215020002320
15250023202700
16290027003150
17340031503700
18400037004400
19480044005300
20580053006400
21700064007700
22850077009500
2310500950012000
24135001200015500
25187751550022050

 

  我发现有不少式子试图对上表进行建模,用的比较多的一个式子是(Zwicker,Terhardt 1980):

B=13tan−1(0.76f1000)+3.5tan−1(f7500)2

  上式中频率f代表中心频率,我把上面的式子在Matlab中代入进行计算,发现前5个Bark频带与计算出来的出入比较大,尚不知道这是什么原因。

 

  Mel频率尺度也是一种频率映射感知模型,它描述的是音高感知的非线性映射,函数表示如下:

m=1127.01048loge(1+f700)

  要注意的一点是,这里的频率f单位是1kHz,也就是说,1kHz是Mel频率与以赫兹为单位的真实频率之间的参考点(1kHz=1000mel),另一方面,Mel一词来源于音乐术语melody,是旋律的频率分量与与音高感知之间距离的度量。


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表