專利名稱:寬帶信號傳輸系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及傳輸系統(tǒng),它包括通過傳輸信道向接收機傳送窄帶音頻信號的發(fā)射機,該接收機包括頻域帶寬擴展器,頻域帶寬擴展器通過用接收到的窄帶音頻信號的高頻擴展對該信號進行補充,從而擴展接收到的窄帶音頻信號的帶寬。帶寬擴展器包括振幅擴展器,用于通過將窄帶振幅映射到高頻帶振幅,從而擴展接收到的窄帶音頻信號的振幅頻譜帶寬;帶寬擴展器還包括相位擴展器,用于擴展接收到的窄帶信號的相位頻譜帶寬;以及組合器,用于將擴展振幅頻譜和擴展相位頻譜組合成帶寬擴展音頻信號。
本發(fā)明還涉及一種接收機,用于通過傳輸信道接收來自發(fā)射機的窄帶音頻信號;本發(fā)明還涉及一種通過傳輸信道接收窄帶音頻信號的方法。
根據(jù)前序部分的傳輸系統(tǒng)從Hynek Hermansky等人的論文“基于時間處理的語音增強”(proceedings of the 1995 IEEE InternationalConference on Acoustics,Speech,and Signal Processing,pp.405-408)中得知。
這種傳輸系統(tǒng)可用于,例如通過諸如無線信道、同軸電纜或者光纖的傳輸媒體傳輸音頻信號,例如語音信號或者音樂信號。這種傳輸系統(tǒng)還可以用于在諸如磁帶或者磁盤的記錄媒體上記錄這種音頻信號。可能的應(yīng)用有自動應(yīng)答機、錄音機、(移動)電話或者MP3播放機。
現(xiàn)有電話網(wǎng)中所用的窄帶語音帶寬為3100Hz(300-3400Hz)。如果帶寬提高到約7kHz(50-7000Hz),則語音聽起來會更自然。具有這種帶寬的語音叫做寬帶語音,它具有附加的低頻帶(50-300Hz)和高頻帶(3400-7000Hz)。從窄帶語音信號有可能通過外插法產(chǎn)生高頻帶和低頻帶。所得的語音信號稱之為偽寬帶語音信號。例如,從論文″編碼窄帶語音的寬帶增強新技術(shù)″(IEEE Speech CodingWorkshop 1999,June 20-23,1999,Porvoo,F(xiàn)inland)中,已經(jīng)知道幾種用于擴展窄帶信號帶寬的技術(shù)。這些技術(shù)用于改善諸如電話網(wǎng)的窄帶網(wǎng)絡(luò)中的語音質(zhì)量,而不改變所述網(wǎng)絡(luò)。在接收側(cè)(例如移動電話或者電話應(yīng)答機),可以將窄帶語音擴展為偽寬帶語音。
已知傳輸系統(tǒng)的接收機包括頻域帶寬擴展器,用于擴展接收到的窄帶語音信號的帶寬。這種帶寬擴展器包括長度為128的FFT,用于將接收到的時域窄帶語音信號變換成頻域窄帶語音信號。接著,分別擴展這種頻域信號的振幅頻譜和相位頻譜的帶寬,隨后將得到的寬帶振幅頻譜和寬帶相位頻譜組合成頻域?qū)拵дZ音信號。通過將128點窄帶振幅頻譜映射到128點高頻帶振幅頻譜來執(zhí)行振幅頻譜的帶寬擴展。
已知傳輸系統(tǒng)中接收到的窄帶信號的振幅頻譜的帶寬擴展相對復(fù)雜,因為它需要執(zhí)行相當(dāng)大量的計算,并因為它要求較大的存儲器存儲(中間)數(shù)據(jù)。
本發(fā)明的目的是提供開頭段落中描述的傳輸系統(tǒng),這種傳輸系統(tǒng)相對簡單,所要求的計算較少,存儲器較小。此目的于根據(jù)本發(fā)明的傳輸系統(tǒng)中實現(xiàn),該傳輸系統(tǒng)的特征在于,所述振幅擴展器包括振幅映射器以及第一和第二頻標變換器,第一頻標變換器經(jīng)配置,用于將振幅頻譜的線性頻標變換成對數(shù)頻標,振幅映射器經(jīng)配置,用于根據(jù)對數(shù)頻標將窄帶振幅映射到高頻帶振幅上,第二頻標變換器經(jīng)配置,用于將擴展振幅頻譜的對數(shù)頻標轉(zhuǎn)換為線性頻標。通過將振幅頻譜的線性頻標(它被劃分成相對精細的大小相等的單位)轉(zhuǎn)換成對數(shù)頻標(它被劃分成相對較粗的大小遞增的單元),振幅頻譜包括比原來的線性頻標振幅頻譜少得多的數(shù)據(jù),結(jié)果窄帶振幅到高頻帶振幅的映射要求的計算較少,且要求的存儲器較小。最好選擇所謂的Bark刻度的對數(shù)頻標?;蛘?,可以利用ERB對數(shù)頻標。
圖5顯示寬帶語音信號的Bark刻度頻譜和線性頻標頻譜的例示。虛線表示線性頻率頻譜,實線表示根據(jù)Bark刻度的頻率區(qū)。一個頻率區(qū)中的各頻率具有相同的振幅(即為所有振幅頻標頻譜的平均值)。當(dāng)采用Bark刻度時,語音信號的窄帶部分(即低于4000Hz)可以只用18個振幅表示,而語音信號的高頻帶部分(即高于4000Hz)可以用4個振幅表示。現(xiàn)在,不用將128點窄帶振幅頻譜映射到128點高頻帶振幅頻譜上(如同已知傳輸系統(tǒng)中的做法),將18個窄帶振幅映射到4個高頻帶振幅上就足夠了,顯然這樣的計算效率高得多,而且要求的存儲器較少。還發(fā)現(xiàn),當(dāng)把數(shù)量較大的窄帶振幅映射到數(shù)量較小的高頻帶振幅上時,計算得到的高頻帶振幅非常精確。
根據(jù)本發(fā)明的傳輸系統(tǒng)的一個實施例的特征在于,所述振幅映射器還包括從多個映射矩陣中選擇映射矩陣的矩陣選擇器和用于將窄帶振幅與選中的映射矩陣相乘以獲得高頻帶振幅的矩陣乘法器。已經(jīng)證明,使用映射矩陣是將窄帶振幅映射到高頻帶振幅的有效途徑。用于擴展振幅頻譜的映射矩陣僅需要少量的數(shù)據(jù)ROM(只讀存儲器)。前面段落里描述的示例中的矩陣為18×4。常用的擴展方法是使用編碼本,為了取得可比性能,它消耗較多的數(shù)據(jù)ROM。而且這種編碼本方法的計算復(fù)雜度較高,因為必須搜索編碼本各條目以得到最佳匹配。國際專利申請WO 01/35395(PCT/EP00/10761,PHF99607)中更詳細地描述了用于寬帶語音合成目的的映射矩陣應(yīng)用。
根據(jù)本發(fā)明的另一傳輸系統(tǒng)實施例的特征在于,所述振幅映射器還包括用于將窄帶振幅歸一化的歸一化裝置和根據(jù)接收到的窄帶信號的音量對高頻帶振幅定標的縮放裝置。以這種方式,對不依賴于實際窄帶語音信號音量的歸一化窄帶振幅執(zhí)行實際的映射操作。在映射操作完成之后,通過對高頻帶振幅定標,從而再包含原來的音量信息。
根據(jù)本發(fā)明的傳輸系統(tǒng)的另一實施例的特征在于,振幅映射器還包括用于平滑高頻帶振幅的平滑裝置。當(dāng)前的高頻帶振幅最好使用之前幀的高頻帶振幅進行平滑處理,從而避免振幅的突變。
根據(jù)以下參照附圖對最佳實施例的描述,本發(fā)明的以上目的和特性將變得顯而易見,附圖中
圖1顯示根據(jù)本發(fā)明的傳輸系統(tǒng)10的實施例的框圖,圖2顯示根據(jù)本發(fā)明的傳輸系統(tǒng)10中所用的帶寬擴展器18的在這些圖中,相同的部分用相同的標號指示。
圖1顯示根據(jù)本發(fā)明的傳輸系統(tǒng)10的實施例的框圖。傳輸系統(tǒng)10包括發(fā)射機12,用于通過傳輸信道16向接收機14傳送窄帶音頻信號,例如窄帶語音信號或者窄帶音樂信號。傳輸系統(tǒng)10可以是電話通信系統(tǒng),其中,發(fā)射機可以是(移動)電話,而接收機可以是(移動)電話或者應(yīng)答機。接收機14包括頻域帶寬擴展器18,它利用接收到的窄帶音頻信號的高頻帶擴展對該信號進行補充,從而擴展接收到的窄帶音頻信號的帶寬。
圖2顯示根據(jù)本發(fā)明的傳輸系統(tǒng)10所用的帶寬擴展器18的實施例的框圖。首先將接收到的窄帶音頻信號分段成10ms的幀(或采樣頻率為8000Hz的80個樣本),這樣每幀與其相鄰幀有5ms的重疊。接著,每幀使用漢明窗20進行開窗處理。隨后,對開窗處理過的信號應(yīng)用長度為128的FFT 22(快速傅立葉變換),得到長度為128的復(fù)頻譜S。將復(fù)頻譜S變換為它的振幅頻譜|S|和相位頻譜,如下所示|S|=Sr2+Sl2-----(1)]]>以及 其中,Sr表示S的實數(shù)部分,而Sl表示S的虛數(shù)部分。修改振幅頻譜|S|和相位頻譜,以便實現(xiàn)帶寬擴展。
帶寬擴展器18包括振幅擴展器24,用于通過將窄帶振幅映射到高頻帶振幅,從而擴展接收到的窄帶音頻信號的振幅頻譜|S|的帶寬。帶寬擴展器18還包括用于擴展接收到的窄帶信號的相位頻譜帶寬的相位擴展器26和將擴展的振幅頻譜|Se|和擴展的相位頻譜e組合成帶寬擴展音頻信號的組合器28。振幅頻譜|Se|和相位頻譜e通過下式轉(zhuǎn)換成頻譜Se 通過對Se應(yīng)用長度為256的反FFT 30并取起始的160個樣本獲得時間信號Se。由于采樣頻率為16kHz,因此這對應(yīng)10ms,這樣。應(yīng)用具有與前一幀和后一幀有5ms重疊的重疊相加(OLA)過程32。因為這些幀已經(jīng)用漢明窗作了開窗處理,因此無需再作開窗處理。
相位頻譜e可以通過對窄帶頻譜上采樣而加以擴展。結(jié)果是4與8kHz之間的相位頻譜為0到4kHz頻帶中的相位頻譜的鏡像型式。有可能這樣簡單地實現(xiàn)這種過程通過將128點相位頻譜的鏡像并取反的型式與原來的相位頻譜合并,從而獲得256點的用c表示的偽寬帶頻譜。此外,在無聲語音情況下,隨機序列可以在鏡像之前加到高頻帶相位頻譜中。對于這種目的,有聲/無聲檢測器可能有用。
圖3顯示根據(jù)本發(fā)明的傳輸系統(tǒng)10所用的振幅擴展器24的實施例的框圖。振幅擴展器24包括振幅映射器42以及第一和第二頻標變換器40和44。第一頻標變換器40經(jīng)配置,用于將振幅頻譜的線性頻標變換成對數(shù)頻標。振幅映射器42經(jīng)配置,用于根據(jù)對數(shù)頻標,將窄帶振幅映射到高頻帶振幅上。第二頻標變換器44經(jīng)配置,用于將擴展的振幅頻譜的對數(shù)頻標變換成線性頻標。
振幅頻譜|S|的頻率和振幅都是線性的。兩種刻度上都采用非均勻變換。線性頻標在第一頻標變換器40中變換到屬于所謂的Bark刻度的臨界帶寬,Bark刻度是具有臨界帶寬的對數(shù)刻度。頻率f的相應(yīng)臨界帶寬由下式給出w=25+75·(1+1.4·10-6·f2)0.69------(4)]]>針對每個臨界頻帶中的一個頻率對振幅頻譜|S|采樣。低于4kHz的頻帶中有18個采樣點,而在高頻帶中有4個點。然后,采樣頻譜|Sw|的振幅通過下式變換到對數(shù)域An=20log10|Sw| (5)在振幅映射器42中用映射矩陣執(zhí)行振幅擴展(即根據(jù)Bark頻標將窄帶振幅映射到高頻帶振幅上)。多映射矩陣的應(yīng)用在國際專利申請WO 01/35395(PCT/EP00/10761,PHF99607)中描述,其中,對LPC參數(shù)應(yīng)用多映射矩陣。在這種方法中,對18個窄帶振幅An執(zhí)行擴展將會得到4個高頻帶振幅Ah。
然后,在第二頻標變換器44中,高頻帶振幅從對數(shù)Bark刻度轉(zhuǎn)換到線性頻標。這可用兩種方式完成。一種方式是使全部臨界頻帶的振幅恒定。也可能對振幅點作多項式擬合(即所謂的樣條擬合)。這種更為復(fù)雜的方法導(dǎo)致更好的語音質(zhì)量。同樣將振幅變換到線性域。通過把該高頻帶振幅頻譜和窄帶振幅頻譜合并,獲得長度為256的偽寬帶振幅頻譜|Sc|。
圖4顯示根據(jù)本發(fā)明的傳輸系統(tǒng)10所用的振幅映射器42的實施例的框圖。如前所述,對18個窄帶振幅An執(zhí)行映射或者擴展,將會得到4個高頻帶振幅Ah。這是根據(jù)如下步驟完成的首先,在歸一化裝置50中,通過從窄帶振幅中減去平均值將窄帶振幅歸一化A=An-An‾---(6)]]>接著,在矩陣選擇器52中,基于窄帶振幅頻譜|S|,從多個映射矩陣中選出一個映射矩陣。例如,多個映射矩陣可能包括10個矩陣5個用于有聲語音,5個用于無聲語音。有聲/無聲檢測器可用于將頻帶0到1kHz中的能量與頻帶0到4kHz中的能量相比較。如果能量差高于某個門限,則該幀可分為有聲類,否則分為無聲類。為了從5個(有聲或者無聲)矩陣中選出一個,可以使用頻帶0到1kHz中的能量與頻帶1到2kHz之間的能量差。矩陣和用于選擇矩陣的門限可以通過訓(xùn)練獲得。
之后,在矩陣乘法器54中,將歸一化窄帶振幅A與選中的映射矩陣相乘,以獲得高頻帶振幅A′A′=M·A, (7)其中,M是18×4的映射矩陣M=m[1,1]m[1,2]···m[1,18]m[2,1]m[2,2]···m[2,18]m[3,1]m[3,2]···m[3,18]m[4,1]m[4,2]···m[4,18]----(8)]]>接下來,將計算得到的高頻帶振幅通過縮放裝置56縮放到適當(dāng)水平(即根據(jù)接收到的窄帶信號量)。這種定標是通過加入窄帶振幅的平均值而完成的Ah=A′+An‾----(9)]]>最后,擴展了的頻帶振幅通過在當(dāng)前振幅Ah中內(nèi)插之前幀的振幅而加以平滑。
用于將窄帶振幅映射到高頻帶振幅的矩陣數(shù)量可以改變。實驗表明,在依然獲得可接受語音質(zhì)量的同時,有可能將矩陣數(shù)減少為4(而不是上述的10)。可以通過數(shù)字硬件或者由數(shù)字信號處理器執(zhí)行的軟件或者通過通用微處理器實現(xiàn)帶寬擴展器18。
本發(fā)明的范圍不限于這些明確公開的實施例。本發(fā)明實施在每個新特征和特征的每個組合中。任何標號并不限制所述權(quán)利要求的范圍。單詞“包括”不排除存在權(quán)利要求中所列舉的以外的其它單元或步驟。在單元之前使用單詞“一個”并不排除存在多個這樣的單元。
權(quán)利要求
1.一種傳輸系統(tǒng)(10),包括發(fā)射機(12),它通過傳輸信道(16)向接收機(14)傳送窄帶音頻信號;接收機(14),它包括頻域帶寬擴展器(18),用于利用接收到的窄帶音頻信號的高頻帶擴展對該信號作補充從而擴展所述接收到的窄帶音頻信號的帶寬,所述帶寬擴展器(18)包括振幅擴展器(24),用于將窄帶振幅映射到高頻帶振幅從而擴展所述接收到的窄帶音頻信號的振幅頻譜帶寬,所述帶寬擴展器(18)還包括相位擴展器(26),用于擴展所述接收到的窄帶信號的相位頻譜的帶寬;以及組合器(28),用于將所述擴展振幅頻譜和所述擴展相位頻譜組合成帶寬擴展音頻信號,其特征在于所述振幅擴展器(24)包括振幅映射器(42)以及第一和第二頻標變換器(40,44),所述第一頻標變換器(40)經(jīng)配置,用于將所述振幅頻譜的線性頻標變換成對數(shù)頻標,所述振幅映射器(42)經(jīng)配置,用于根據(jù)所述對數(shù)頻標將所述窄帶振幅映射到所述高頻帶振幅,所述第二頻標變換器(44)經(jīng)配置,用于將所述擴展振幅頻譜的對數(shù)頻標變換成所述線性頻標。
2.如權(quán)利要求1所述的傳輸系統(tǒng)(10),其特征在于所述對數(shù)頻標是Bark刻度。
3.如權(quán)利要求1或2所述的傳輸系統(tǒng)(10),其特征在于所述振幅映射器(42)還包括矩陣選擇器(52),用于從多個映射矩陣中選擇映射矩陣,以及矩陣乘法器(54),用于通過將所述窄帶振幅與所述選中的映射矩陣相乘,從而獲得所述高頻帶振幅。
4.如權(quán)利要求1至3中任何一項所述的傳輸系統(tǒng)(10),其特征在于所述振幅映射器(42)還包括歸一化裝置(50),用于將所述窄帶振幅歸一化,以及縮放裝置(56),用于根據(jù)所述接收到的窄帶信號的音量對所述高頻帶振幅進行縮放。
5.如權(quán)利要求1至4中任何一項所述的傳輸系統(tǒng)(10),其特征在于所述振幅揚聲器(42)還包括平滑裝置(58),用于平滑所述高頻帶振幅。
6.一種接收機(14),用于通過傳輸信道(16)從發(fā)射機(12)接收窄帶音頻信號,所述接收機(14)包括頻域帶寬擴展器(18),用于利用接收到的窄帶音頻信號的高頻帶擴展對該信號作補充從而擴展所述接收到的窄帶音頻信號的帶寬,所述帶寬擴展器(18)包括振幅擴展器(24),用于將窄帶振幅映射到高頻帶振幅從而擴展所述接收到的窄帶音頻信號的振幅頻譜帶寬,所述帶寬擴展器(18)還包括相位擴展器(26),用于擴展所述接收到的窄帶信號的相位頻譜的帶寬;以及組合器(28),用于將所述擴展振幅頻譜和所述擴展相位頻譜組合成帶寬擴展音頻信號,其特征在于所述振幅擴展器(24)包括振幅映射器(42)以及第一和第二頻標變換器(40,44),所述第一頻標變換器(40)經(jīng)配置,用于將所述振幅頻譜的線性頻標變換成對數(shù)頻標,所述振幅映射器(42)經(jīng)配置,用于根據(jù)所述對數(shù)頻標將所述窄帶振幅映射到所述高頻帶振幅,所述第二頻標變換器(44)經(jīng)配置,用于將所述擴展振幅頻譜的對數(shù)頻標變換成所述線性頻標。
7.如權(quán)利要求6所述的接收機(14),其特征在于所述對數(shù)頻標是Bark刻度。
8.如權(quán)利要求6或7所述的接收機(14),其特征在于所述振幅映射器(42)還包括矩陣選擇器(52),用于從多個映射矩陣中選擇映射矩陣,以及矩陣乘法器(54),用于通過將所述窄帶振幅與所述選中的映射矩陣相乘,從而獲得所述高頻帶振幅。
9.一種通過傳輸信道(16)接收窄帶音頻信號的方法,所述方法包括-將窄帶振幅映射到高頻帶振幅,從而擴展所述接收到的窄帶音頻信號的振幅頻譜的帶寬,-擴展所述接收到的窄帶信號的相位頻譜的帶寬,-將所述擴展的振幅頻譜和擴展的相位頻譜組合成帶寬擴展音頻信號,其特征在于所述方法還包括-將所述振幅頻譜的線性頻標變換成對數(shù)頻標,-根據(jù)所述對數(shù)頻標將所述窄帶振幅映射到所述高頻帶振幅,-將所述擴展振幅頻譜的對數(shù)頻標變換成所述線性頻標。
10.如權(quán)利要求9所述的通過所述傳輸信道(16)接收所述窄帶音頻信號的方法,其特征在于所述對數(shù)頻標是Bark刻度。
11.如權(quán)利要求9或10所述的通過所述傳輸信道(16)接收所述窄帶音頻信號的方法,其特征在于所述方法還包括-從多個映射矩陣中選擇映射矩陣,-將所述窄帶振幅與所述選中的映射矩陣相乘,從而獲得所述高頻帶振幅。
全文摘要
描述了一種傳輸系統(tǒng)(10),它包括通過傳輸信道(16)向接收機(14)發(fā)送窄帶音頻信號的發(fā)射機(12)。接收機(14)包括頻域帶寬擴展器(18),它利用接收到的窄帶音頻信號的高頻帶擴展對該信號作補充,從而擴展接收到的窄帶音頻信號的帶寬。帶寬擴展器(18)包括振幅擴展器(24),用于將窄帶振幅映射到高頻帶振幅從而擴展接收到的窄帶音頻信號的振幅頻譜帶寬,帶寬擴展器(18)還包括相位擴展器(26),用于擴展接收到的窄帶信號的相位頻譜帶寬;和組合器(28),用于將擴展振幅頻譜和擴展相位頻譜組合成帶寬擴展音頻信號,傳輸系統(tǒng)的特征在于振幅擴展器(24)包括振幅映射器(42)以及第一和第二頻標變換器(40,44),第一頻標變換器(40)配置用于將所述振幅頻譜的線性頻標變換成對數(shù)頻標,例如Bark刻度。振幅映射器(42)配置用于根據(jù)對數(shù)頻標將窄帶振幅映射到高頻帶振幅。第二頻標變換器(44)配置用于將擴展振幅頻譜的對數(shù)頻標變換成線性頻標。
文檔編號G10L21/02GK1520590SQ02812738
公開日2004年8月11日 申請日期2002年6月20日 優(yōu)先權(quán)日2001年6月28日
發(fā)明者R·J·斯瑞特, R J 斯瑞特, A·J·格爾里茨, 格爾里茨, S·陳諾克, 悼 申請人:皇家菲利浦電子有限公司