式(1)中,x(n)是音频信号,矩形窗序列沿音频样点序列逐帧移动,每段帧长度为N。30s的RMS的概率分布即信号分布频数直方图如图1(b)、图2(b)所示。由图可知两分布有效明显的差异,可以作为识别语音和音乐信号的特片依据。进一步研究发现其概率分布服从不同参数时的广义X2分布。选取上述30s的语音和音乐信号RMS概率分布作为参考序列,记为xj={xj(k)k=1,2,…,K},其中x1为语音参序列,x2为音乐参考序列,记作yi={yi(k)k=1,2,…,k},其中y1为语音比较数列,y2为音乐比较序列。K为特征数量,本文取K=10。为检验不同长度比较序列的灰关联度,特征提取的比较序列时间长度分别取0.1s、1s、10s。图3为与30s的语音和音乐参考信号RMS概率分布比较图。由图3可知,比较序列的时间长度越长,概率分布与参考序列的相似程度就越大,当比较序列时长为10s时,概率分布几乎与参考序列吻合。为保证音频序列的可比性,在进行灰关联分析时,需要对序列进行初值化生成处理,即对一个数列的所有数据均用其第一个数去除。这个新序列表明原始数列中不同时刻的值相对于第一个时刻值的倍数。
其中,Nj={1,2},Ni={1,2},K={1,2,…,10},常数ξ称为分辨系数,ξ∈[0,1],其作用是调整比较环境的大小。ξ越小,分辨力越大。一段取ξ=0.5。minminminxj(k)-yi(k)称为两极最小差,maxmaxmaxxj(k)-yi(k)称为两极最大差,xj(k)-yi(k)称为第k个指标xj与yi的绝对差。4 计算灰关联度灰关联分析的实质,就是对数列曲线进行几何关系的比较。若两数列曲线重合,则关联性好,关联系数为1,两数列关联度也行装于1。同时两数列曲线不可能垂直,即无关联性,所以关联系数大于1,故关联度也大于0。由于在比较全过程中,关联系数不止一个,因此,取关联系数的平均值作为比较全过程的关联程度rji的度量,即:
5 按灰关联度大小排序对参考序列xj和比较序列yi的关联度从大到小进行排序,即得灰度联序列。本文采用最大灰关联度的识别原则。新闻热点
疑难解答