專利名稱:根據(jù)窄帶語音信號(hào)估測(cè)寬帶語音信號(hào)的語音擴(kuò)展器和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及按照權(quán)利要求1所述的前序部分一種語音擴(kuò)展器和涉及按照權(quán)利要求8所述的前序部分一種根據(jù)窄帶語音信號(hào)估測(cè)寬帶語音信號(hào)的方法。
為壓縮語音信號(hào)的數(shù)據(jù)傳輸率,使用了語音編碼器也稱之為語音編譯碼器。這種語音編譯碼器首先用在移動(dòng)無線系統(tǒng)中。在GSM移動(dòng)無線系統(tǒng)(全球移動(dòng)通信系統(tǒng))中使用了按照線性預(yù)測(cè)編碼(LPC)的方法進(jìn)行工作的語音編碼器。在此,與信號(hào)波形編碼相反,在人的持續(xù)通話(Sprecktrackt)中不是復(fù)制語音信號(hào)本身,而是復(fù)制其形成過程。在8kHz語音信號(hào)的取樣速率中,當(dāng)分辨率為13比特時(shí)得到的數(shù)據(jù)率為104KBit/s。在GSM中,借助LPC就可將這個(gè)數(shù)據(jù)率降到恒定的13KBit/s(所謂的代碼速率)。對(duì)此,在GSM中譬如使用了全速率(全速率編譯碼)或改進(jìn)的全速率編譯碼(增強(qiáng)型全速率編譯碼)。采用半速率編譯碼,在語音質(zhì)量相應(yīng)降低的情況下,還會(huì)大大降低比特率,也即降到5.6KBit/s。
在未來的通信系統(tǒng)、譬如UMTS(通用移動(dòng)電信系統(tǒng))中,將使用可以用可變比特率對(duì)語音信號(hào)進(jìn)行編碼的語音編碼器。這種類型的語音編碼器譬如是用不同比特率進(jìn)行編碼的自適應(yīng)多速率(AMR)語音編碼器。它被設(shè)計(jì)用于GSM移動(dòng)無線系統(tǒng),但也應(yīng)作為標(biāo)準(zhǔn)的語音編碼器用于UMTS移動(dòng)無線系統(tǒng)。
在這種類型的語音編碼器中,比特率與傳輸已編碼語音信號(hào)所提供的帶寬相匹配。如果提供進(jìn)行傳輸?shù)淖銐驇?,則語音信號(hào)可用高比特率編碼。這也稱之為寬帶編碼。否則,也即在帶寬窄時(shí),可用低比特率編碼(窄帶編碼)。
在傳輸語音信號(hào)期間可實(shí)現(xiàn)比特率的匹配。對(duì)此,以現(xiàn)有的比特率的形式連續(xù)地測(cè)量傳輸信道的帶寬。如果在傳輸語音信號(hào)期間可供使用的比特率低于給定的閾值,則變換編碼,以便語音信號(hào)用窄帶編碼。
譬如可規(guī)定具有相當(dāng)不同的比特率的兩種不同的編碼。譬如一種寬帶編碼在取樣頻率約為16kHz時(shí)實(shí)現(xiàn),而一種窄帶編碼可在取樣頻率為8kHz時(shí)實(shí)現(xiàn)。在第一種情況中,覆蓋語音頻段達(dá)8kHz,在第二種情況中,則達(dá)4kHz。但是,由于比特率變換所引起的信號(hào)質(zhì)量的起伏和由此所帶來的通信線路的質(zhì)量起伏是成問題的。通過所規(guī)定的閾值實(shí)現(xiàn)這種變換是比較突然的,以致于在通話期間會(huì)突然降低通信連接的質(zhì)量。
通過使用所謂的寬帶語音擴(kuò)展器或簡稱語音擴(kuò)展器,可以不改變通信協(xié)議,也在窄帶編碼時(shí)獲得明顯改進(jìn)的語音質(zhì)量,和減少突然變換所帶來的質(zhì)量降低的效應(yīng)。對(duì)此,寬帶語音擴(kuò)展器為此根據(jù)窄帶信號(hào)通過合成高于4kHz的語音頻率部分估測(cè)寬帶信號(hào)。由此,為了編碼在進(jìn)行比特率變換時(shí)可避免出現(xiàn)太大的質(zhì)量降低。為適應(yīng)語音信號(hào)的比特率,由寬帶語音擴(kuò)展器提供的方法對(duì)幾乎所有的通話者來說工作得相當(dāng)好,特別是提供了完全可接受的語音質(zhì)量。
用本發(fā)明可進(jìn)一步改進(jìn)語音擴(kuò)展器的語音質(zhì)量、特別是寬帶語音擴(kuò)展器的語音質(zhì)量。此外,還給出了一種根據(jù)窄帶語音信號(hào)估測(cè)寬帶語音信號(hào)的方法,使語音質(zhì)量得到改進(jìn)。
通過權(quán)利要求1的特征所述的語音擴(kuò)展器可達(dá)到這種改進(jìn)。此外,用權(quán)利要求8的特征所述的方法,在估測(cè)寬帶語音信號(hào)時(shí)還可獲得明顯地改進(jìn)。根據(jù)窄帶語音信號(hào)估測(cè)寬帶語音信號(hào)的語音擴(kuò)展器和方法的優(yōu)選的實(shí)施方案由相應(yīng)的從屬權(quán)利要求給出。
本發(fā)明的核心是在語音信號(hào)傳輸期間與通信終端裝置相適配和/或與通話者相適應(yīng)。借此,與已知的方法和語音擴(kuò)展器相比還會(huì)再次改進(jìn)語音質(zhì)量。
本發(fā)明具體地涉及一種語音擴(kuò)展器,該語音擴(kuò)展器是如此構(gòu)成的,使它根據(jù)窄帶語音信號(hào)估測(cè)寬帶語音信號(hào)。此外,它是自適應(yīng)的,它在編碼時(shí)與通信終端裝置相匹配和/或與通話者相適應(yīng)。在語音傳輸期間首先實(shí)現(xiàn)這種匹配適應(yīng)。由此,語音擴(kuò)展器可連續(xù)地適應(yīng)遠(yuǎn)程用戶。
語音擴(kuò)展器可分析和存儲(chǔ)至少一個(gè)語音參數(shù)并且可用該語音參數(shù)進(jìn)行匹配。所述的至少一個(gè)語音參數(shù)首先系指在語音傳輸期間出現(xiàn)的一個(gè)寬帶語音參數(shù)。特別是,所述的至少一個(gè)語音參數(shù)是專用于通話者和/或通信終端裝置的。譬如可把語音擴(kuò)展器用在不同的移動(dòng)電話中,并且與其聲音特征匹配。此外,它還可適應(yīng)不同的用戶、也即適應(yīng)其聲音特征如不同的語音頻譜。因此,作為語音參數(shù)首先引入通信終端裝置和/或通話者獨(dú)特的聲音特征、譬如頻率分布、確定的頻率或頻段的衰減以及通話者聲調(diào)頻譜。這種類型的語音參數(shù)特別可在語音傳輸期間通過測(cè)量獲得。
優(yōu)選語音擴(kuò)展器進(jìn)行估測(cè),方式是通過它分析評(píng)價(jià)至少一個(gè)已存儲(chǔ)的語音參數(shù)。如上已述,為達(dá)到適應(yīng)可引用不同的語音參數(shù)。在其測(cè)定后存儲(chǔ)這些不同的語音參數(shù),并且由此隨時(shí)為實(shí)現(xiàn)適應(yīng)提供這些不同的參數(shù)。不斷地更新已存儲(chǔ)的語音參數(shù),以總是最佳地與當(dāng)前的聲音條件匹配,也是可能的。
最后,語音擴(kuò)展器可用在移動(dòng)站和/或基站的語音編碼器中,這些移動(dòng)站和/或基站都是或是為第三代移動(dòng)無線系統(tǒng)構(gòu)建的。第三代移動(dòng)無線系統(tǒng)特別系指UMTS。
如果移動(dòng)站是一個(gè)移動(dòng)無線終端裝置、優(yōu)選移動(dòng)電話,則語音擴(kuò)展器優(yōu)選在硬件中、特別在集成電路中、和/或軟件中實(shí)現(xiàn)。在硬件中實(shí)現(xiàn),優(yōu)點(diǎn)在于語音擴(kuò)展器與移動(dòng)無線終端裝置的其它主要的電路元件一起可集成在一塊芯片上。譬如,芯片制造商可為移動(dòng)無線終端裝置的生產(chǎn)商提供這種類型的語音擴(kuò)展器。相反,在軟件上實(shí)現(xiàn),優(yōu)點(diǎn)在于容易更換語音擴(kuò)展器、首先是事后更換、特別是當(dāng)語音擴(kuò)展器的軟件存儲(chǔ)在可擦存儲(chǔ)器和可重復(fù)寫入的存儲(chǔ)器譬如EEPROM中時(shí)更是如此。
此外,本發(fā)明涉及根據(jù)窄帶語音信號(hào)估測(cè)寬帶語音信號(hào)的一種方法。按照這種方法,在估測(cè)時(shí)與通信終端裝置匹配和/或與通話者匹配。
在該方法的優(yōu)選的實(shí)施方案中,分析和存儲(chǔ)至少一個(gè)語音參數(shù)和使用該語音參數(shù)進(jìn)行匹配。優(yōu)選至少一個(gè)語音參數(shù)是在語音傳輸期間出現(xiàn)的一個(gè)寬帶語音參數(shù)。該至少一個(gè)語音參數(shù)特別是專用于通話者和/或通信終端裝置的。
所述的方法有利地應(yīng)用在移動(dòng)站和/或基站的語音編碼器中,該移動(dòng)站和/或基站都是或是為第三代移動(dòng)無線系統(tǒng)、特別是UMTS系統(tǒng)構(gòu)建的。在優(yōu)選的實(shí)施方案中,移動(dòng)站是一個(gè)移動(dòng)無線終端裝置,并且所述的方法在硬件中實(shí)現(xiàn),特別在集成電路中實(shí)現(xiàn)、和/或至少部分地在軟件上實(shí)現(xiàn)。
下面將就實(shí)施例說明本發(fā)明。
譬如首先應(yīng)說明寬帶語音擴(kuò)展器的功能方式,以便更好地理解本發(fā)明的應(yīng)用。
為產(chǎn)生高于所確定的頻率的語音頻率部分,在語音編碼器中需要一個(gè)寬帶激勵(lì)信號(hào)和供合成濾波器用的寬帶濾波器系數(shù)。由于通常只知道窄帶激勵(lì)信號(hào)和窄帶濾波器系數(shù),所以,必須進(jìn)行“窄帶”到“寬帶”的轉(zhuǎn)換。這種轉(zhuǎn)換可借助寬帶語音擴(kuò)展器實(shí)現(xiàn)。譬如通過一個(gè)非線性信號(hào)處理可擴(kuò)大激勵(lì)信號(hào)。另一種可能就是激勵(lì)信號(hào)與白噪聲疊加。
通過使用兩種代碼簿可估測(cè)濾波器系數(shù)。代碼簿的項(xiàng)表示濾波器系數(shù)的可能的數(shù)組。在訓(xùn)練階段要訓(xùn)練窄帶和寬帶代碼簿。因?yàn)樗鼈兺瑫r(shí)用相同的激勵(lì)信號(hào)(一次為窄帶和一次為寬帶)進(jìn)行訓(xùn)練,所以,在兩種代碼簿的項(xiàng)之間的關(guān)系是已知的。譬如窄帶代碼簿的項(xiàng)1與寬帶代碼簿的項(xiàng)2對(duì)應(yīng)。
在寬帶語音擴(kuò)展器的應(yīng)用階段按照如下方式使用兩種代碼簿1、從窄帶語音信號(hào)計(jì)算窄帶濾波器系數(shù)。
2、這些濾波器系數(shù)與窄帶代碼簿的項(xiàng)比較。
3、選出最合適的項(xiàng)。由于代碼簿之間的關(guān)系是已知的,所以可同時(shí)找出最佳寬帶濾波器系數(shù)。
根據(jù)所找出的寬帶濾波器系數(shù)和擴(kuò)展的激勵(lì)信號(hào)合成語音信號(hào)段。
這樣,在語音擴(kuò)展期間可計(jì)算窄帶語音的窄帶濾波器系數(shù)。這些系數(shù)與具有窄帶濾波器系數(shù)的窄帶代碼簿的項(xiàng)比較,并且選出最合適項(xiàng)。由于(如上已提到的)代碼簿之間的關(guān)系是已知的,所以用這種方式可估測(cè)寬帶語音擴(kuò)展器的語音合成濾波器的最佳濾波器系數(shù)。
所述的方法也可自適應(yīng)地譬如用下列步驟實(shí)現(xiàn)1、在寬帶語音傳輸期間可計(jì)算“真正的”濾波器系數(shù)(FK),并且尋找出具有寬帶語音系數(shù)的代碼簿的最合適的項(xiàng)。
2、重新計(jì)算代碼簿的項(xiàng)。
CB-向量(新的)=c*FK+(1-c)*CB-向量(舊的)3、在窄帶語音傳輸期間,根據(jù)修正的代碼簿估算寬帶濾波器系數(shù)。
替代方案可用下列步驟實(shí)現(xiàn)1、在寬帶語音傳輸期間計(jì)算“真正的”濾波器系數(shù)(FK)。
2、從寬帶語音信號(hào)計(jì)算窄帶語音信號(hào)并求出窄帶濾波器系數(shù)。
3、為窄帶濾波器系數(shù)尋找出具有窄帶系數(shù)的代碼簿的最合適的項(xiàng)。
4、借助代碼簿之間已知的關(guān)系尋找出具有寬帶系數(shù)的代碼簿的最佳項(xiàng)。
5、重新計(jì)算這個(gè)代碼簿的項(xiàng)。
CB-向量(新的)=c*FK+(1-c)*CB-向量(舊的)6、在窄帶語音傳輸期間,根據(jù)修正的代碼簿估算寬帶濾波器系數(shù)。
通過本發(fā)明所述的語音擴(kuò)展器可獲得進(jìn)一步地改進(jìn)語音質(zhì)量。該語音擴(kuò)展器特別優(yōu)選用在所有的通信系統(tǒng)中,譬如在UTSM中,在這些通信系統(tǒng)中都使用具有可變比特率的語音編碼器,這些語音編碼器不僅可用窄帶而且可用寬帶編碼。
權(quán)利要求
1.語音擴(kuò)展器,該語音擴(kuò)展器如此構(gòu)成,以致于它根據(jù)窄帶語音信號(hào)估測(cè)寬帶信號(hào),其特征在于,它是自適應(yīng)地與通信終端裝置和/或與通話者相匹配。
2.按照權(quán)利要求1所述的語音擴(kuò)展器,其特征在于,該語音擴(kuò)展器具有一種裝置,用該裝置該語音擴(kuò)展器可分析、存儲(chǔ)至少一個(gè)語音參數(shù)和用該語音參數(shù)進(jìn)行匹配。
3.按照權(quán)利要求2所述的語音擴(kuò)展器,其特征在于,該至少一個(gè)語音參數(shù)是一個(gè)在語音傳輸期間出現(xiàn)的寬帶語音參數(shù)。
4.按照權(quán)利要求2或3所述的語音擴(kuò)展器,其特征在于,該至少一個(gè)語音參數(shù)是專用于通話者和/或通信終端裝置的。
5.按照權(quán)利要求4所述的語音擴(kuò)展器,其特征在于,它在分析評(píng)估至少一個(gè)所存儲(chǔ)的語音參數(shù)的情況下進(jìn)行估測(cè)。
6.按照上述權(quán)利要求之一所述的語音擴(kuò)展器,其特征在于,該語音擴(kuò)展器應(yīng)用在移動(dòng)站和/或基站的語音編碼器中,該移動(dòng)站和/或基站都是或是為第三代移動(dòng)無線系統(tǒng)、特別是UMTS構(gòu)建的。
7.按照權(quán)利要求6所述的語音擴(kuò)展器,其特征在于,移動(dòng)站是一個(gè)移動(dòng)無線終端裝置,并且語音擴(kuò)展器可用硬件、特別是用集成電路和/或至少部分地用軟件實(shí)現(xiàn)。
8.根據(jù)窄帶語音信號(hào)估測(cè)寬帶語音信號(hào)的方法,其特征在于,在估測(cè)時(shí)實(shí)施與通信終端裝置和/或與通話者相匹配。
9.按照權(quán)利要求8所述的方法,其特征在于,分析、存儲(chǔ)至少一個(gè)語音參數(shù)和用該語音參數(shù)進(jìn)行匹配。
10.按照權(quán)利要求9所述的方法,其特征在于,該至少一個(gè)語音參數(shù)是一個(gè)在語音傳輸期間出現(xiàn)的寬帶語音參數(shù)。
11.按照權(quán)利要求9或10所述的方法,其特征在于,該至少一個(gè)語音參數(shù)是專用于通話者和/或通信終端裝置的。
12.按照權(quán)利要求11所述的方法,其特征在于,在分析評(píng)估至少一個(gè)所存儲(chǔ)的語音參數(shù)的情況下進(jìn)行估測(cè)。
13.按照權(quán)利要求8-12之一所述的方法,其特征在于,該方法應(yīng)用在移動(dòng)站和/或基站的語音編碼器中,該移動(dòng)站和/或基站都是或是為第三代移動(dòng)無線系統(tǒng),特別是UMTS構(gòu)建的。
14.按照權(quán)利要求13所述的方法,其特征在于,移動(dòng)站是一個(gè)移動(dòng)無線終端裝置,并且所述的方法可用硬件,特別是用集成電路,和/或至少部分地用軟件實(shí)現(xiàn)。
全文摘要
本發(fā)明涉及一種語音擴(kuò)展器,該語音擴(kuò)展器如此構(gòu)成,以便它根據(jù)窄帶語音信號(hào)估測(cè)寬帶語音信號(hào)。此外,該語音擴(kuò)展器是自適應(yīng)的,以便它在編碼時(shí)與通信終端裝置和/或與通話者相匹配。
文檔編號(hào)G10L21/038GK1630896SQ01823673
公開日2005年6月22日 申請(qǐng)日期2001年9月28日 優(yōu)先權(quán)日2001年9月28日
發(fā)明者S·A·克林克 申請(qǐng)人:西門子公司