專利名稱:測量語音波形相似度的一種新方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語音信號的處理技術(shù),屬于語音信號處理領(lǐng)域。
背景技術(shù):
語音信號是一種非平穩(wěn)的隨機信號,可以用隨時間變化的一維波形來描述。從語音信號的波形分析,可以大致分為兩類一類是輔音,其波形類似于噪聲;另一類是元音,其波形類似于準周期信號。目前,判斷兩個語音波形是否相似一般采用相關(guān)性檢測的方法,或者類似的方法。由于語音信號的時變特性,基于相關(guān)性檢測的方法往往對語音波形的相似性判斷準確性不高。另外一類判斷兩個語音波形是否相似的辦法是變換域法,即把時域波形的相似性問題變換為等價的頻域的相似性問題。變換域法同樣也存在判斷準確性不高的問題,同時還帶來計算量增加的問題。為了解決上述問題,我們設(shè)計實現(xiàn)了一種測量語音波形相似度的新方法,其特點是完全基于時域?qū)崿F(xiàn),計算量小,抗噪聲性好,準確度高。本發(fā)明的語音波形相似度測量方法,不僅能測量語音波形的絕對相似度,而且能夠測量語音波形的相對相似度(即語音波形經(jīng)放大或縮小后的相似度),可以用于語音信號的基音檢測,語音信號的高質(zhì)量壓縮與還原,非線性特征抽取等方面,對語音信號處理有多方面的影響。
發(fā)明內(nèi)容
本發(fā)明是一種基于時域的語音信號處理技術(shù),用來測量兩個語音波形的相似度,其基本思想是對一段語音信號x(t),首先找出兩個相鄰的過零點t1和t2(且t1<t2);在區(qū)間[t1,t2]上,用平行于橫軸的直線將語音信號x(t)切分成互不重疊的N部分,計算每一部分的面積,然后將這N部分的面積按順序作成一個N維向量;對另一段語音信號也做類似的處理,得到另一個N維向量;計算兩個N維向量的距離就可以得到兩個語音波形的相似度。如果兩個N維向量的對應(yīng)分量成比例,則可以判斷兩個語音波形經(jīng)放大或縮小后相似(即相對相似)。
本發(fā)明的技術(shù)方案是數(shù)字化后的語音信號用一個有限序列{x(n)}表示,其中n表示語音樣本的序號,x(n)表示第n個樣本點的取值。語音信號x(n)的取值有三種情況正數(shù),負數(shù),零。正數(shù)表示波形在時間軸上方,負數(shù)表示波形在時間軸下方。語音信號x(n)的過零點有兩類情況一類是x(n)正好為零,那么這是稱n為過零點的位置;一類是x(n)和x(n+1)都不為零,但它們的符號相反,這時稱在x(n)和x(n+1)之間存在過零點,這個過零點的位置可以通過插值計算近似得到。
對一段離散化的語音信號x(t),首先找出兩個相鄰的過零點t1和t2(且t1<t2);在區(qū)間[t1,t2]上,語音信號x(t)要么全大于0,要么全小于0,不妨設(shè)x(t)全大于0;找出語音信號x(t)在區(qū)間[t1,t2]上的最大值(如果x(t)全小于0則找出最小值),不妨設(shè)最大值為x(t0);在橫軸(時間軸)到x(t0)之間,用平行于橫軸的直線將語音信號x(t)在區(qū)間[t1,t2]上圖像分為N部分,每一部分類似于梯形,其上下底邊都是直線,但左右邊是曲線,對這樣的每一部分采用近似算法計算其面積;然后將這N部分的面積按順序作成一個N維向量;對另一段語音信號也做類似的處理,得到另一個N維向量;然后計算兩個N維向量的距離就可以得到兩個語音波形的相似度。如果兩個N維向量的對應(yīng)分量成比例,則可以判斷兩個語音波形經(jīng)放大或縮小后相似(即相對相似)。
權(quán)利要求
1.本發(fā)明涉及一種測量語音波形相似度的新方法,其特征是對于兩個相鄰的過零點之間的語音信號的圖像分塊計算面積。
2.根據(jù)權(quán)利要求1,語音信號的圖像分塊計算面積的技術(shù)特征是語音信號的圖像被平行于橫軸(時間軸)的直線切分成N部分,每一部分類似于梯形,其上下底邊都是直線,但左右邊是曲線,對這樣的每一部分采用近似算法計算其面積。
3.根據(jù)權(quán)利要求1和權(quán)利要求2,對語音信號的圖像分成N塊并計算每一塊的面積后,可以將這N部分的面積按順序作成一個N維向量;對另一段語音信號也做類似的處理,得到另一個N維向量;計算兩個N維向量的距離就可以得到兩個語音波形的相似度。如果兩個N維向量的對應(yīng)分量成比例,則可以判斷兩個語音波形經(jīng)放大或縮小后相似(即相對相似)。
全文摘要
一種測量語音波形相似度的新方法,其特點是完全基于時域?qū)崿F(xiàn),計算量小,抗噪聲性好,準確度高;其基本思想是對一段語音信號x(t),首先找出兩個相鄰的過零點t1和t2(且t1<t2);在區(qū)間[t1,t2]上,用平行于橫軸的直線將語音信號x(t)切分成互不重疊的N部分,計算每一部分的面積,然后將這N部分的面積按順序作成一個N維向量;對另一段語音信號也做類似的處理,得到另一個N維向量;計算兩個N維向量的距離就可以得到兩個語音波形的相似度。如果兩個N維向量的對應(yīng)分量成比例,則可以判斷兩個語音波形經(jīng)放大或縮小后相似(即相對相似)。本發(fā)明的語音波形相似度測量方法,不僅能測量語音波形的絕對相似度,而且能夠測量語音波形的相對相似度(即語音波形經(jīng)放大或縮小后的相似度),可以用于語音信號的基音檢測,語音信號的高質(zhì)量壓縮與還原,非線性特征抽取等方面,對語音信號處理有多方面的影響。
文檔編號G10L11/02GK101067928SQ20071012262
公開日2007年11月7日 申請日期2007年7月10日 優(yōu)先權(quán)日2007年7月10日
發(fā)明者章森 申請人:章森