專利名稱:用于語音質(zhì)量增強的方法及設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于在網(wǎng)絡(luò)中檢測及處理語音質(zhì)量增強(voice quality enhancement, VQE)的方法及設(shè)備,特別是涉及一種用于網(wǎng)絡(luò)元件的語音質(zhì)量增強VQE檢測 器及一種用于控制語音質(zhì)量增強VQE裝置VED提供的語音質(zhì)量增強VQE的方法。
背景技術(shù):
在電信系統(tǒng)中,如果語音信號的質(zhì)量降級,則要求語音質(zhì)量增強VQE?;芈?、背景噪 聲或回響可能形成通信網(wǎng)絡(luò)中輸送的語音信號發(fā)生信號降級的可能原因中的一些原因。可 在終端中或在通信網(wǎng)絡(luò)的中間網(wǎng)絡(luò)節(jié)點中或這兩者中應(yīng)用語音質(zhì)量增強VQE。通過去除回 聲及背景噪聲,并且通過調(diào)整話音電平以實現(xiàn)對于用戶來說一致且舒適的收聽體驗,語音 質(zhì)量增強可顯著改善通話質(zhì)量。
當在電信網(wǎng)絡(luò)中應(yīng)用語音質(zhì)量增強VQE時,可由例如ITU-TG. 160中規(guī)定的語音增 強裝置VED來進行此處理。語音增強裝置VED可提供某些信號處理網(wǎng)絡(luò)功能SPNF,例如通 信網(wǎng)絡(luò)的數(shù)字發(fā)射路徑中的降噪及回聲消除,其中所述功能可對可能穿越電信網(wǎng)絡(luò)的語音 頻帶信號執(zhí)行語音質(zhì)量增強功能。網(wǎng)絡(luò)可為有線及/或無線通信網(wǎng)絡(luò)。
一般來說,例如移動電話等通信網(wǎng)絡(luò)的終端可能包含語音質(zhì)量增強VQE模型,例 如用于降噪及回聲消除的模型?;芈曄P椭粚νㄐ叛b置或終端的數(shù)字取樣音頻信號起 作用。回聲消除模型使用聲環(huán)境從通信裝置的揚聲器到麥克風的轉(zhuǎn)移功能,估計所述功能 可消除從麥克風信號接收到的回音信號?;芈曄P托纬捎糜谙蚓W(wǎng)絡(luò)的任何形式的語音 通信裝置提供語音質(zhì)量增強VQE功能的基本部分。此外,降噪模塊可自適應(yīng)地減少背景噪 聲,并有效地提高話音信號的SNR。在聲環(huán)境中可能存在由不同頻譜特性組成的許多噪聲來 源,其不隨時間變化或隨時間變化。降噪模塊提供的降噪必須對于所有類型的噪聲表現(xiàn)穩(wěn) 健。此外,在常規(guī)網(wǎng)絡(luò)中,可能仍然存在例如移動電話等許多設(shè)計不良的終端,其留下語音 信號的高水平降級。終端的不良設(shè)計可能源于設(shè)計不良的聲接口,也可能源于使用VQE模 塊提供的表現(xiàn)不良的語音質(zhì)量增強功能。這種情況導致通話質(zhì)量總體不良,并且促使需要 將語音信號從一個終端輸送到另一個終端的通信網(wǎng)絡(luò)的網(wǎng)絡(luò)元件提供的網(wǎng)絡(luò)語音質(zhì)量增 強功能(VQEF)。網(wǎng)絡(luò)元件提供的語音質(zhì)量增強功能可例如補償來自用戶的移動終端的殘余 回聲,還可執(zhí)行額外的降噪。因此,常規(guī)通信網(wǎng)絡(luò)的一個常見功能性是通信網(wǎng)絡(luò)的網(wǎng)絡(luò)元件 提供的語音質(zhì)量增強功能(VQEF)。此VQE功能可形成通信網(wǎng)絡(luò)的關(guān)鍵功能,并且是相應(yīng)網(wǎng) 絡(luò)運營商向客戶提供的通話質(zhì)量的特色。
盡可能靠近聲音前端(即終端)執(zhí)行總的音頻信號處理,特別是語音質(zhì)量增強 (VQE)信號處理,目的是從用戶的角度來說保證高質(zhì)量通信??稍诮K端中更好地應(yīng)用語音質(zhì) 量增強功能,因為可能會在不可靠的通信信道(例如無線電鏈路)上編碼、調(diào)制且發(fā)射音頻 信號,這會增加所發(fā)射的信號的失真,例如非線性及編碼噪聲,這樣會降低網(wǎng)絡(luò)中的語音質(zhì) 量增強功能(VQEF)特別是基于模型的語音質(zhì)量增強(VQE)處理的性能。另一方面,在相應(yīng) 終端中不可能有信號處理能力的情況下(例如在PSDN電話中),或者如果終端中提供的能力的性能較低的情況下,一般會使用通信網(wǎng)絡(luò)中的信號處理功能的實施方案。因此,在常規(guī) 通信網(wǎng)絡(luò)中,可能會發(fā)生“串聯(lián)情況”,其中向話音信號應(yīng)用兩次或兩次以上語音質(zhì)量增強 功能(VQEF),即既在終端中又在通信網(wǎng)絡(luò)的至少一個網(wǎng)絡(luò)元件中應(yīng)用。非線性及隨時間變 化的信號處理功能的此類型的串聯(lián)對于用戶所察覺的總體話音質(zhì)量是不利的。在大多情況 下,話音信號由于此串聯(lián)信號處理而降級。典型的實例是由于串聯(lián)噪聲消除引起的上行鏈 路連接中的話音降級,或由于串聯(lián)回聲消除引起的不良的雙端通話性能。例如削波等嚴重 假象可能被引入到經(jīng)處理的話音信號中,這可導致更容易被用戶察覺的質(zhì)量降級。
在ITU-T G.799.2 “Mechanism for Dynamic Coordination for Signal Processing Function”(信號處理功能的動態(tài)協(xié)調(diào)機制)ITU-T SG16中,近來定義了一種 用于在終端及網(wǎng)絡(luò)元件中的實施機制,其可形成跨終端及通信網(wǎng)絡(luò)的網(wǎng)絡(luò)元件的信號處理 功能的控制的基礎(chǔ)。此常規(guī)機制的內(nèi)容是在通信網(wǎng)絡(luò)中添加信令以通知是否已向信號應(yīng) 用了語音質(zhì)量增強VQE功能。在ITU-T SG. 11中研發(fā)了意在實施此信令機制的用于有線及 光學網(wǎng)絡(luò)的適當協(xié)議。對于移動通信網(wǎng)絡(luò)來說,類似類型的協(xié)議是必要的。當移動電話及 移動網(wǎng)絡(luò)元件支持此常規(guī)信令機制時,可實現(xiàn)用戶的總質(zhì)量感覺的提高。連接中不需要的 信號處理功能被關(guān)閉。提供此信令的問題是網(wǎng)絡(luò)當前并不知道相應(yīng)終端何時利用其信號處 理能力時。因此,如果未使用信令,則此用以避免語音質(zhì)量增強VQE串聯(lián)的常規(guī)機制失敗或 者缺失。
使通信網(wǎng)絡(luò)的網(wǎng)絡(luò)元件知道終端中存在或不存在語音質(zhì)量增強裝置(VED)的信 號處理能力的信令的引入仍然有許多缺點。通過引入此信令,通信網(wǎng)絡(luò)的所有網(wǎng)絡(luò)元件必 須知道如何發(fā)信號通知及如何解釋接收到的信令,以便獲得高效的處理。如果引入使用此 信令的額外終端,則舊式語音增強裝置無法解釋此信令。因此,引入此信令需要更新網(wǎng)絡(luò)元 件的所有現(xiàn)有的語音增強裝置VED,使得語音增強裝置能夠解釋此信令。因此,在現(xiàn)有通信 網(wǎng)絡(luò)中實施此控制機制需要高成本及精力。此外,任何信令機制及協(xié)議均必須首先標準化, 特別是在通信網(wǎng)絡(luò)是由多個廠商的網(wǎng)絡(luò)部署組成的情況下。此標準化過程可能是一個漫長 的過程。
因此,本發(fā)明的目標是提供一種用于提供允許例如避免VQE串聯(lián)或VQE雙重處理 的語音質(zhì)量增強VQE的改善的設(shè)備及改善的方法。發(fā)明內(nèi)容
根據(jù)第一方面,本發(fā)明提供一種用于從網(wǎng)絡(luò)的先前網(wǎng)絡(luò)元件接收音頻信號的網(wǎng)絡(luò) 元件的語音質(zhì)量增強(VQE)檢測器,其中所述語音質(zhì)量增強(VQE)檢測器適于基于所述接 收到的音頻信號執(zhí)行語音質(zhì)量增強檢測,其中所述語音質(zhì)量增強檢測包括檢測所述網(wǎng)絡(luò)的 至少一個先前網(wǎng)絡(luò)元件已將至少一個語音質(zhì)量增強功能VQEF應(yīng)用于所述接收到的音頻信 號;以及依據(jù)檢測結(jié)果來控制對接收到的音頻信號的語音質(zhì)量增強處理。
所述先前網(wǎng)絡(luò)元件可包括將兩個終端彼此連接的通信鏈或網(wǎng)絡(luò)路徑內(nèi)的一個或 若干個網(wǎng)絡(luò)元件。所述網(wǎng)絡(luò)元件可包括終端或網(wǎng)絡(luò)的中間網(wǎng)絡(luò)節(jié)點。因此,術(shù)語先前網(wǎng)絡(luò) 元件是指網(wǎng)絡(luò)的任何網(wǎng)絡(luò)元件,其是關(guān)于音頻信號被發(fā)送通過網(wǎng)絡(luò)的網(wǎng)絡(luò)路徑,位于網(wǎng)絡(luò) 的執(zhí)行語音質(zhì)量增強檢測的當前或?qū)嶋H網(wǎng)絡(luò)元件之前。
網(wǎng)絡(luò)的至少一個先前網(wǎng)絡(luò)元件應(yīng)用于接收到的音頻信號的語音質(zhì)量增強功能(VQEF)可能已經(jīng)由實際網(wǎng)絡(luò)元件直接從其接收到音頻信號的先前網(wǎng)絡(luò)元件應(yīng)用于音頻信 號,或由網(wǎng)絡(luò)的相對于音頻信號的網(wǎng)絡(luò)路徑的任何早先網(wǎng)絡(luò)元件應(yīng)用于音頻信號。
根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器不依賴于載運到網(wǎng)絡(luò)的網(wǎng) 絡(luò)元件的控制信令,而是執(zhí)行其自身的關(guān)于是否已將語音質(zhì)量增強功能VQEF應(yīng)用于音頻 信號的檢測。根據(jù)本發(fā)明的第一方面的用于網(wǎng)絡(luò)元件的語音質(zhì)量增強(VQE)檢測器可檢 測先前或在接收到音頻信號之前是否已經(jīng)對接收到的音頻信號執(zhí)行了語音質(zhì)量增強功能 (VQEF),且任選地還檢測先前或在接收到音頻信號之前已對接收到的音頻信號執(zhí)行了哪個 語音質(zhì)量增強功能(VQEF),以避免例如在網(wǎng)絡(luò)元件中及/或在網(wǎng)絡(luò)的終端中執(zhí)行同一語音 質(zhì)量增強功能(VQEF) —次以上,以便可避免話音信號的降級。
根據(jù)本發(fā)明的第一方面的用于網(wǎng)絡(luò)元件的語音質(zhì)量增強(VQE)檢測器可提供于 通信網(wǎng)絡(luò)內(nèi)的通信鏈的任何網(wǎng)絡(luò)元件中。確切地說,用于網(wǎng)絡(luò)元件的語音質(zhì)量增強(VQE) 檢測器可提供于通信網(wǎng)絡(luò)的網(wǎng)絡(luò)終端中或中間網(wǎng)絡(luò)節(jié)點中。
在根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器的可能的實施方案中,所 述語音質(zhì)量增強檢測包括檢測由至少一個先前網(wǎng)絡(luò)元件已應(yīng)用于接收到的音頻信號的至 少一個特定語音質(zhì)量增強功能VQEF。
在根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器的可能的實施方案中,所 述至少一個語音質(zhì)量增強VQE功能(VQEF)是降噪功能及/或回音消除功能。其它語音質(zhì) 量增強(VQE)功能也是可能的,例如動態(tài)范圍壓縮功能及/或自動增益控制功能。
在根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器的可能的實施方案中,所 述接收到的音頻信號是經(jīng)編碼的音頻信號,且所述語音質(zhì)量增強(VQE)檢測器連接到信號 輸入端,且處理在對所述語音質(zhì)量增強檢測的信號輸入端處接收到的經(jīng)編碼的音頻信號的 比特流。
在根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器的可能的實施方案中,所 述語音質(zhì)量增強(VQE)檢測器連接到比特流解碼器的輸出端,且基于接收到的經(jīng)編碼音頻 信號來處理所述比特流解碼器產(chǎn)生的解碼器信號,以執(zhí)行所述語音質(zhì)量增強檢測。
因此,語音質(zhì)量增強(VQE)檢測器可在信號域(即,對經(jīng)解碼的話音信號)中操 作,或在經(jīng)編碼的域中對接收到的經(jīng)編碼的音頻信號的比特流操作。
在根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器的可能的實施方案中,語 音質(zhì)量增強(VQE)檢測器可依據(jù)檢測結(jié)果來調(diào)整自適應(yīng)語音質(zhì)量增強裝置VED的參數(shù)。因 此,在此實施方案中,語音質(zhì)量增強(VQE)檢測器執(zhí)行軟決策,且控制由語音質(zhì)量增強裝置 VED執(zhí)行的VQE處理的參數(shù)化。
在根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器的另一可能的實施方案 中,所述語音質(zhì)量增強VQE檢測器依據(jù)檢測結(jié)果來進行控制以打開或關(guān)閉所述語音質(zhì)量增 強裝置VED提供的至少一個語音質(zhì)量增強VQE功能(VQEF)。因此,在此實施方案中,語音質(zhì) 量增強(VQE)檢測器執(zhí)行硬決策,且根據(jù)檢測結(jié)果來激活或去激活語音質(zhì)量增強裝置VED 提供的VQE功能。
在根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器的另一可能的實施方案 中,所述語音質(zhì)量增強檢測是閉環(huán)語音質(zhì)量增強檢測,且包括由所述語音質(zhì)量增強裝置將 語音質(zhì)量增強功能應(yīng)用于所述接收到的音頻信號,以獲得所述接收到的音頻信號的經(jīng)處理的版本;以及如果對所述接收到的音頻信號獲得的語音質(zhì)量度量及對所述接收到的音頻信 號的所述經(jīng)處理的版本獲得的語音質(zhì)量度量的評估滿足預(yù)定準則,則檢測至少一個語音質(zhì) 量增強功能VQEF,或檢測所述先前網(wǎng)絡(luò)元件中的一者已將至少所述所應(yīng)用的質(zhì)量增強功能 應(yīng)用于所述接收到的音頻信號。
舉例來說,語音質(zhì)量度量是平均意見得分(MOS)或主觀差異等級(SDG)。舉例來 說,可通過將對接收到的音頻信號獲得的語音質(zhì)量度量與對接收到的音頻信號的經(jīng)處理的 版本獲得的語音質(zhì)量度量進行比較來執(zhí)行對語音質(zhì)量度量的評估,但所述評估還可包含更 復(fù)雜的評估。語音質(zhì)量度量可直接提供接收到的音頻信號與接收到的音頻信號的經(jīng)處理的 版本之間的比較。在此情況下,正值可指示經(jīng)處理的版本比接收到的音頻信號好,且負值可 指示經(jīng)處理的版本降級。
在根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強VQE檢測器的再一可能的實施方案中, 語音質(zhì)量增強(VQE)檢測器對接收到的音頻信號執(zhí)行非侵入性話音質(zhì)量評價。非侵入性話 音質(zhì)量評價技術(shù)提供僅基于接收到的音頻信號的對話音質(zhì)量的估計。
在根據(jù)本發(fā)明的第一方面的VQE檢測器的可能的實施方案中,VQE在閉環(huán)中運行, 其中將接收到的音頻信號與經(jīng)VQE處理的信號之間的MOS得分進行比較。檢測則是基于具 有最聞得分的一者。
在根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器的可能的實施方案中,語 音質(zhì)量增強(VQE)檢測器適于檢測由先前網(wǎng)絡(luò)元件中的一者或由所述語音質(zhì)量增強裝置 VED應(yīng)用于接收到的音頻信號的語音質(zhì)量增強VQE功能(VQEF)的強度,且相應(yīng)地調(diào)整經(jīng)調(diào) 適的語音質(zhì)量增強裝置VED的參數(shù)。
在根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器的另一可能的實施方案 中,語音質(zhì)量增強(VQE)檢測器適于提取及分析來自接收到的未經(jīng)解碼或經(jīng)解碼的音頻信 號的信號特征,以執(zhí)行所述語音質(zhì)量增強檢測。
在根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器的可能的實施方案中,所 述語音質(zhì)量增強(VQE)檢測器提取及分析的所述接收到的音頻信號的所述信號特征可包 括接收到的音頻信號的頻譜平坦性量度及/或頻譜動態(tài)及/或基音周期及/或基音增益 及/或話音變化。也可使用其它信號特征。
在根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器的可能的實施方案中,所 使用的統(tǒng)計模型是高斯混合模型GMM。
在根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強VQE檢測器的另一可能的實施方案中, 將語音質(zhì)量增強(VQE)檢測器提供的檢測結(jié)果發(fā)信號通知給所述網(wǎng)絡(luò)的其它網(wǎng)絡(luò)元件。這 些網(wǎng)絡(luò)元件可包括終端及網(wǎng)絡(luò)的中間網(wǎng)絡(luò)節(jié)點。此外,檢測結(jié)果可被發(fā)信號通知給同一通 信鏈內(nèi)的其它網(wǎng)絡(luò)元件,或者網(wǎng)絡(luò)的相應(yīng)通信鏈內(nèi)未提供的網(wǎng)絡(luò)元件。有可能第一網(wǎng)絡(luò)元 件中的VQE檢測器執(zhí)行VQE檢測,且相應(yīng)地控制另一網(wǎng)絡(luò)元件中的VED裝置。
根據(jù)本發(fā)明的第二方面,本發(fā)明提供有線及/或無線通信網(wǎng)絡(luò)的一種網(wǎng)絡(luò)元件, 其包括根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器及/或其實施方案中的一者, 以及受所述語音質(zhì)量增強(VQE)檢測器控制的用于接收到的音頻信號的語音質(zhì)量增強處 理的至少一個語音質(zhì)量增強裝置(VED)。
在可能的實施方案中,網(wǎng)絡(luò)元件的語音質(zhì)量增強(VQE)檢測器及語音質(zhì)量增強裝置(VED)形成集成單元,其可為硬件或軟件實施的。
在根據(jù)本發(fā)明的第二方面的網(wǎng)絡(luò)元件的可能的實施方案中,網(wǎng)絡(luò)元件是用戶終端。在可能的實施方案中,網(wǎng)絡(luò)元件可由用戶設(shè)備(UE)裝置或移動電話形成。
在根據(jù)本發(fā)明的第二方面的網(wǎng)絡(luò)元件的另一可能的實施方案中,網(wǎng)絡(luò)元件可為用戶終端之間的光、電或電磁通信網(wǎng)絡(luò)的通信鏈內(nèi)的網(wǎng)絡(luò)節(jié)點。網(wǎng)絡(luò)節(jié)點可例如為例如網(wǎng)關(guān)等中間網(wǎng)絡(luò)節(jié)點。
根據(jù)第三方面,本發(fā)明進一步提供一種通信網(wǎng)絡(luò),其包括根據(jù)本發(fā)明的第二方面的網(wǎng)絡(luò)元件。此通信網(wǎng)絡(luò)可為無線或有線通信網(wǎng)絡(luò),或無線或有線通信子網(wǎng)絡(luò)的組合。
根據(jù)第四方面,本發(fā)明進一步提供一種用于控制從通信網(wǎng)絡(luò)的網(wǎng)絡(luò)元件接收音頻信號的網(wǎng)絡(luò)元件的語音質(zhì)量增強裝置(VED)提供的語音質(zhì)量增強(VQE)的方法,所述方法包括以下步驟基于所述接收到的音頻信號執(zhí)行語音質(zhì)量增強檢測,其中所述語音質(zhì)量增強檢測包括檢測所述先前網(wǎng)絡(luò)元件中的一者已將至少一個語音質(zhì)量增強功能VQEF應(yīng)用于所述接收到的音頻信號;以及依據(jù)檢測結(jié)果來控制對接收到的音頻信號的語音質(zhì)量增強處理。
在第四方面的可能的實施方案中,所述語音質(zhì)量增強檢測包括檢測所述至少一個先前網(wǎng)絡(luò)元件已應(yīng)用于所述接收到的音頻信號的至少一個特定語音質(zhì)量增強功能VQEF。
關(guān)于本發(fā)明的第一方面及其實施方案提供的解釋對應(yīng)地適用于第四方面及其實施方案。
下文中,參照附圖描述本發(fā)明的不同方面的可能的實施方案。
圖1繪示網(wǎng)絡(luò)中的包括根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器的網(wǎng)絡(luò)元件的框圖;
圖2繪示包括根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強檢測器的網(wǎng)絡(luò)元件的另一可能實施方案的框圖3繪示包括根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強檢測器的網(wǎng)絡(luò)元件的另一可能實施方案的框圖4繪示用于解釋由根據(jù)本發(fā)明的第一方面的另一可能實施方案的語音質(zhì)量增強檢測器執(zhí)行的特征提取及分析的圖5繪示根據(jù)本發(fā)明的另一方面的通信網(wǎng)絡(luò)內(nèi)的網(wǎng)絡(luò)元件的通信鏈的框圖。
具體實施方式
在圖1的框圖中,繪示了網(wǎng)絡(luò)的網(wǎng)絡(luò)元件1,其中網(wǎng)絡(luò)元件I包括根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器2。網(wǎng)絡(luò)元件Ι-1包括信號輸入端3,用于從至少一個先前網(wǎng)絡(luò)元件l-(1-l)接收音頻信號。先前網(wǎng)絡(luò)元件ι-α-ι)可由網(wǎng)絡(luò)中的通信鏈內(nèi)的先前網(wǎng)絡(luò)元件形成。根據(jù)本發(fā)明定義網(wǎng)絡(luò)元件的排序,使其與信號路徑一致,即,網(wǎng)絡(luò)元件的先前網(wǎng)絡(luò)元件將接收信號,對其進行處理,且將其發(fā)射到網(wǎng)絡(luò)元件。例如圖1所示的網(wǎng)絡(luò)元件可由終端或中間網(wǎng)絡(luò)節(jié)點形成。在圖1的實施方案中,可看出語音質(zhì)量增強VQE檢測器2可集成在通信網(wǎng)絡(luò)的網(wǎng)絡(luò)元件Ι-1中。語音質(zhì)量增強(VQE)檢測器2適于檢測先前網(wǎng)絡(luò)元件中的一者已將至少一個語音質(zhì)量增強功能(VQEF)應(yīng)用于接收到的音頻信號,或檢測由先前網(wǎng)絡(luò)元件中的一者應(yīng)用于接收到的音頻信號的至少一個特定語音質(zhì)量增強功能(VQEF),如圖1的實施方案中所示。語音質(zhì)量增強VQE檢測器2進一步適于控制相應(yīng)網(wǎng)絡(luò)元件I的語音質(zhì)量增強裝置(VED)4。依據(jù)檢測結(jié)果來控制語音質(zhì)量增強裝置(VED)4。在所繪示的實施方案中,使用檢測結(jié)果來控制兩個開關(guān)6、7。在圖1的所繪示的實施方案中,語音質(zhì)量增強檢測器2在信號域中操作,S卩,基于比特流解碼器5產(chǎn)生的經(jīng)解碼的音頻信號而操作。比特流解碼器5接收從先前網(wǎng)絡(luò)元件供應(yīng)到網(wǎng)絡(luò)節(jié)點I的輸入端3的比特流或音頻信號,且對接收到的音頻信號比特流進行解碼。在圖1中繪示的實施方案中,語音質(zhì)量增強檢測器2連接到比特流解碼器5的輸出端,且處理由比特流解碼器5產(chǎn)生的經(jīng)解碼的信號,以檢測由先前網(wǎng)絡(luò)元件中的一者應(yīng)用于由比特流解碼器5解碼的接收到的音頻信號的至少一個語音質(zhì)量增強功能VQEF。檢測到的語音質(zhì)量增強功能VQEF可由不同類型的語音質(zhì)量增強功能VQEF中的一種形成,特別是語音質(zhì)量增強(VQE)降噪功能及/或語音質(zhì)量增強(VQE)回音消除功能。此外,VQE功能可包括動態(tài)范圍壓縮功能及/或自動增益控制功能。在可能的實施方案中,語音質(zhì)量增強檢測器2可被調(diào)諧或配置以檢測至少一個特定語音質(zhì)量增強功能,例如語音質(zhì)量增強檢測器2可適于檢測回音消除功能及/或降噪功能是否已由至少一個先前網(wǎng)絡(luò)節(jié)點應(yīng)用于接收到的音頻信號。如果語音質(zhì)量增強檢測器2在接收到的音頻信號上檢測到例如降噪或回聲消除等特定語音質(zhì)量增強功能VQEF,則檢測器根據(jù)檢測結(jié)果來控制圖1所示的開關(guān)6、7。如果已檢測到特定語音質(zhì)量增強功能VQEF,則語音質(zhì)量增強(VQE)檢測器2控制開關(guān),以便不在當前網(wǎng)絡(luò)元件l_i中將檢測到的同一 VQE功能的語音質(zhì)量增強功能處理應(yīng)用于接收到的信號。舉例來說,如果檢測到特定的語音質(zhì)量增強功能(VQEF),則可如圖1中圖解說明通過相應(yīng)地控制開關(guān)6、7來繞過在網(wǎng)絡(luò)元件Ι-1內(nèi)為此特定語音質(zhì)量增強功能VQEF提供的對應(yīng)的語音增強裝置4,以便不對接收到的音頻信號執(zhí)行語音質(zhì)量增強。相反,如果語音質(zhì)量增強檢測器2未檢測到特定語音質(zhì)量增強功能VQEF,則控制開關(guān)6、7,使得提供此特定語音質(zhì)量增強功能VQEF的語音質(zhì)量增強裝置4從比特流解碼器5接收經(jīng)解碼的信號,且如圖1中圖解說明將語音質(zhì)量增強信號輸出到編碼器8。編碼器8在網(wǎng)絡(luò)元件1-1的輸出端9處輸出最終輸出比特流。此輸出比特流可能被應(yīng)用于網(wǎng)絡(luò)的通信鏈內(nèi)的另一網(wǎng)絡(luò)兀件l-(i+l)。如果語音質(zhì)量增強VQE檢測器2檢測到特定語音質(zhì)量增強功能VQEF,則仍可例如通過同一網(wǎng)絡(luò)元件的VED 4或連續(xù)網(wǎng)絡(luò)元件的VED,用其它語音質(zhì)量增強功能算法來處理接收到的信號,從而實現(xiàn)將不同功能性傳輸?shù)较乱痪W(wǎng)絡(luò)元件。
如果在接收到的音頻信號中,檢測到所有預(yù)定語音質(zhì)量增強功能(VQEF)已經(jīng)被應(yīng)用于接收到的信號,則相應(yīng)網(wǎng)絡(luò)元件Ι-1的語音質(zhì)量增強裝置(4)不執(zhí)行語音質(zhì)量增強(VQE)。相反,如果在接收到的信號中根本未檢測到語音質(zhì)量增強,則可使用網(wǎng)絡(luò)元件1-1中可用的所有語音質(zhì)量增強VQE處理來處理接收到的音頻信號。在圖1的框圖中可看出,網(wǎng)絡(luò)元件Ι-1的語音質(zhì)量增強(VQE)檢測器2不使用在網(wǎng)絡(luò)上載運的來自其它網(wǎng)絡(luò)元件的任何控制信號,而是其執(zhí)行其自身的對是否已應(yīng)用語音質(zhì)量增強VQE的本地檢測,且依據(jù)檢測結(jié)果而適當?shù)赝S没騿⒂镁W(wǎng)絡(luò)元件Ι-1內(nèi)的對應(yīng)的語音質(zhì)量增強VQE處理單元或語音增強裝置4。
圖2繪示包括根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器2的網(wǎng)絡(luò)元件Ι-1的另一可能的實施方案。在語音質(zhì)量增強的所繪示的實施方案中,不在信號域中而是直接在經(jīng)編碼的域中執(zhí)行檢測,即在應(yīng)用于網(wǎng)絡(luò)元件Ι-1的輸入端3的輸入的經(jīng)編碼音頻信號的接收到的比特流中執(zhí)行。在此實施方案中,語音質(zhì)量增強檢測器2連接到信號輸入端3,且處理在信號輸入端3處接收的音頻信號的比特流,以檢測由網(wǎng)絡(luò)的先前網(wǎng)絡(luò)元件中的一者應(yīng)用于接收到的音頻信號的至少一個語音質(zhì)量增強(VQE)功能。在VQE檢測的結(jié)果使得不需要或?qū)⒉粓?zhí)行VQE處理的情況下,使用開關(guān)10直接在經(jīng)編碼的域中在當前網(wǎng)絡(luò)元件處停用VQE,因此不需要編碼及解碼的步驟。換句話說,在此情況下,開關(guān)10繞過在信號域中由比特流解碼器5、語音質(zhì)量增強裝置4及編碼器8執(zhí)行的語音質(zhì)量增強處理。應(yīng)注意,對于某些VED,也可在經(jīng)編碼的信號域中執(zhí)行VQE功能。在此情況下,可能不需要比特流解碼器5及編碼器8,因為將由語音質(zhì)量增強裝置4在經(jīng)編碼的信號域中直接執(zhí)行語音質(zhì)量增強,無需事先解碼及后續(xù)重新編碼。圖3繪示包括根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強(VQE)檢測器2的網(wǎng)絡(luò)元件Ι-1的另一可能的實施方案。圖3的實施方案包括基于非侵入性話音質(zhì)量評估的語音質(zhì)量增強(VQE)解碼器2。VQE檢測器2使用的非侵入性話音質(zhì)量評估技術(shù)提供僅基于接收到的信號的對話音質(zhì)量的估計。在可能的實施方案中,語音質(zhì)量增強檢測器2是閉環(huán)語音質(zhì)量增強檢測,且適于由語音質(zhì)量增強裝置將語音質(zhì)量增強功能應(yīng)用于接收到的音頻信號,以獲得接收到的音頻信號的經(jīng)處理的版本;且檢測至少一個語音質(zhì)量增強功能VQEF,或在對接收到的音頻信號獲得的語音質(zhì)量度量及對接收到的音頻信號的經(jīng)處理的版本獲得的語音質(zhì)量度量的評估滿足預(yù)定準則的情況下,由先前網(wǎng)絡(luò)元件中的一者至少所應(yīng)用的質(zhì)量增強功能已應(yīng)用于接收到的音頻信號。在可能的實施方案中,在使用非侵入性話音質(zhì)量評價技術(shù)將當前網(wǎng)絡(luò)元件Ι-1內(nèi)的語音質(zhì)量增強裝置4提供的語音質(zhì)量增強VQE應(yīng)用于接收到的音頻信號之前及之后,語音質(zhì)量增強檢測器2可例如估計平均意見分(MOS)降級。在繪示的示范性實施方案中,如果在執(zhí)行語音質(zhì)量增強功能之后所估計的MOS值降級,則不使用語音質(zhì)量增強VQE裝置4提供的語音質(zhì)量增強功能(VQEF)。這意味著,雖然為了測量增強程度而增強了輸入信號,但輸出信號對應(yīng)于輸入信號,即,開關(guān)10未將VED 4提供的音頻信號的經(jīng)處理版本選為網(wǎng)絡(luò)元件的輸出,且總地來說,網(wǎng)絡(luò)元件尚未執(zhí)行輸入信號的增強。MOS值的比較結(jié)果是對檢測到對接收到的音頻信號的VQE處理的指示,因為在大多數(shù)情況下,如果VQE裝置4的輸出端處的所估計的MOS得分低于輸入信號的得分,那么存在已應(yīng)用了 VQE的強烈指示,且因此在此情況下不使用VQE裝置。因此,在所繪示的實施方案中,語音質(zhì)量增強(VQE)檢測器2將比特流解碼器5提供的經(jīng)解碼的信號與語音質(zhì)量增強裝置4輸出的經(jīng)增強的信號進行比較,以檢查語音質(zhì)量是否已得到改善。如果在語音質(zhì)量增強VQE之后MOS值降級,或至少未改善預(yù)定程度,則通過控制開關(guān)10而不使用語音質(zhì)量增強裝置(VED) 4提供的語音質(zhì)量增強功能。因此,編碼器8輸出的經(jīng)增強比特流被阻斷,且接收到的比特流在網(wǎng)絡(luò)元件Ι-1的輸出端9處作為最終輸出比特流直接輸出。相反,如果檢測到的MOS值得到改善,則假設(shè)先前未將語音質(zhì)量增強功能或至少未將所述特定語音質(zhì)量增強功能應(yīng)用于音頻信號,且通過將編碼器8的輸出端切換到網(wǎng)絡(luò)元件I的輸出端9而應(yīng)用語音質(zhì)量增強功能VQEF,使得語音質(zhì)量增強裝置4對接收到的音頻信號執(zhí)行語音質(zhì)量增強VQE。
在圖1、2、3的不同實施方案中繪示的語音質(zhì)量增強裝置4可為自適應(yīng)語音質(zhì)量增 強裝置。在可能的實施方案中,語音質(zhì)量增強VQE檢測器2可通過控制自適應(yīng)語音質(zhì)量增 強處理裝置4的參數(shù)化來執(zhí)行軟決策。語音質(zhì)量增強VQE檢測器2可依據(jù)檢測結(jié)果來調(diào)整 經(jīng)調(diào)適的語音質(zhì)量增強裝置4的參數(shù)。在可能的實施方案中,語音質(zhì)量增強(VQE)檢測器 2適于檢測應(yīng)用于先前網(wǎng)絡(luò)元件中的一者的接收到的音頻信號或由相應(yīng)網(wǎng)絡(luò)元件的語音質(zhì) 量增強裝置4應(yīng)用的語音質(zhì)量增強(VQE)功能的強度,且依據(jù)檢測結(jié)果及檢測到的語音質(zhì) 量增強(VQE)功能的強度來調(diào)整經(jīng)調(diào)適的語音質(zhì)量增強裝置4的參數(shù)。
在另一可能的替代實施方案中,語音質(zhì)量增強檢測器2可提供硬決策,且激活或 去激活對應(yīng)的語音質(zhì)量增強功能VQEF。在可能的實施方案中,語音質(zhì)量增強(VQE)檢測器 2依據(jù)檢測結(jié)果來打開或關(guān)閉由網(wǎng)絡(luò)元件Ι-1的語音質(zhì)量增強裝置(VED) 4提供的至少一個 語音質(zhì)量增強(VQE)功能。在形成軟決策的實施方案中,語音質(zhì)量增強檢測器2可檢測先前 語音質(zhì)量增強功能VQEF的強度。如果先前應(yīng)用的語音質(zhì)量增強功能VQEF被檢測為強處理, 例如具有非常有限的殘余背景噪聲的強降噪,則語音質(zhì)量增強檢測器2控制語音質(zhì)量增強 裝置4,以便不將對應(yīng)的語音質(zhì)量增強功能應(yīng)用于當前網(wǎng)絡(luò)元件Ι-1中的接收到的音頻信 號。如果檢測到先前的語音質(zhì)量增強處理,但檢測到的語音質(zhì)量增強功能VQEF不強,例如 具有仍然高水平的背景噪聲的降噪,則語音質(zhì)量增強檢測器2可控制語音質(zhì)量增強裝置4 以進一步通過相應(yīng)地調(diào)整語音質(zhì)量增強VQE裝置4的參數(shù)來處理接收到的音頻信號。如果 語音質(zhì)量增強VQE檢測器2在接收到的音頻信號中檢測到所有語音質(zhì)量增強功能VQEF,且 如果檢測到所有檢測到的語音質(zhì)量增強功能VQEF經(jīng)過強處理,則當前網(wǎng)絡(luò)元件Ι-1的VQE 裝置4不將語音質(zhì)量增強功能VQEF應(yīng)用于接收到的音頻信號。
在又一可能的實施方案中,語音質(zhì)量增強VQE檢測器2適于借助于統(tǒng)計模型提取 及分析來自接收到的音頻信號的信號特征,以檢測應(yīng)用于接收到的音頻信號的至少一個語 音質(zhì)量增強(VQE)功能。通常,可在由已在其上應(yīng)用了特定類型的VQE的若干信號或已在 其上應(yīng)用了不同類型的VQE的信號組成的大數(shù)據(jù)庫上建立及訓練統(tǒng)計模型。在可能的實施 方案中,接收到的音頻信號的所提取及分析的信號特征可包括接收到的音頻信號的頻譜平 坦性量度及/或頻譜動態(tài)及/或基音周期及/或基音增益及/或話音變化??稍诮?jīng)VQE處 理的信號的大數(shù)據(jù)庫上估計及訓練所提取及分析的特征的分布??捎筛咚够旌夏P虶MM來 形成所采用的統(tǒng)計模型?;旌夏P涂蔀槭褂没旌戏植嫉拿芏裙烙嫷母怕誓P汀R簿褪钦f, 假設(shè)混合模型中的觀測結(jié)果是根據(jù)預(yù)定混合密度而分布的??蓪⒒旌夏P鸵暈橐环N類型的 不受監(jiān)管的學習或群集。此統(tǒng)計建模也可基于統(tǒng)計檢測技術(shù),例如貝葉斯檢測或支持向量 機。
圖4圖解說明根據(jù)可能的實施方案的語音質(zhì)量增強檢測器2使用高斯混合模型 GMM執(zhí)行的對信號特征的特征提取及分析。從接收到的比特流中提取第一局部特征,借助于 統(tǒng)計描述從第一局部特征導出全局特征,接著將全局特征應(yīng)用于高斯混合模型GMM映射, 用于檢測應(yīng)用于接收到的音頻信號的語音質(zhì)量增強功能。所述檢測可基于對經(jīng)解碼的信號 的分析及特征提取,或直接基于接收到的比特流,或基于使用MOS降級。網(wǎng)絡(luò)元件Ι-1中的 語音質(zhì)量增強VQE處理的應(yīng)用的條件是在接收到的信號中未檢測到類似的語音質(zhì)量增強 VQE處理,或檢測到集成語音質(zhì)量增強裝置4對信號質(zhì)量的改善。語音質(zhì)量增強VQE功能檢測可為全局的,從而引起去激活當前網(wǎng)絡(luò)元件1-1中的所有語音質(zhì)量增強VQE功能,或者是部分的,從而引起去激活當前網(wǎng)絡(luò)元件Ι-1中的至少一個特定語音質(zhì)量增強功能(如果在接收到的音頻信號中檢測到此VQE功能)。檢測可為硬檢測或軟檢測。在軟檢測中,可估計先前VQE處理的強度,且可與檢測一起使用所述強度來自適應(yīng)地參數(shù)化當前網(wǎng)絡(luò)元件Ι-1中的語音質(zhì)量增強裝置4。根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強VQE檢測器2不需要任何額外信令。因此,此信令不需要標準化或?qū)嵤乙虼烁鶕?jù)本發(fā)明的第一方面的語音質(zhì)量增強VQE檢測器2對于現(xiàn)有的網(wǎng)絡(luò)部署是向后兼容的。根據(jù)本發(fā)明的第一方面的語音質(zhì)量增強VQE檢測器2可用于產(chǎn)生信令。其可例如用于使用根據(jù)ITU-T G. 799. 2構(gòu)想的信令方案。這有益于舊式終端,且一般來說,不支持根據(jù)第一方面的語音質(zhì)量增強檢測器2的信令的舊式語音質(zhì)量增強VQE設(shè)備可觸發(fā)整個通信網(wǎng)絡(luò)中的信令。圖5繪示由網(wǎng)絡(luò)元件Ι-1組成的通信網(wǎng)絡(luò)I內(nèi)的通信鏈的框圖。圖5繪示的通信鏈將第一終端1-1連接到遠程第二終端1-N,其是借助于中間網(wǎng)絡(luò)節(jié)點彼此連接。換句話說,在將音頻信號從作為信號源的網(wǎng)絡(luò)元件1-1發(fā)送到作為信號匯的網(wǎng)絡(luò)元件1-N的情況下,網(wǎng)絡(luò)鏈1-1到1-N形成描述通過網(wǎng)絡(luò)的音頻信號的路徑的網(wǎng)絡(luò)路徑,其中網(wǎng)絡(luò)元件1-1至IJl-(1-l)相對于網(wǎng)絡(luò)元件1-1是先前網(wǎng)絡(luò)元件。根據(jù)本發(fā)明的第二方面,提供有線及/或無線通信網(wǎng)絡(luò)的至少一個網(wǎng)絡(luò)元件Ι-1,其包括至少一個語音質(zhì)量增強VQE檢測器2及至少一個受語音質(zhì)量增強檢測器2控制的語音質(zhì)量增強(VQE)裝置4。此網(wǎng)絡(luò)元件可為例如終端1-1U-N等終端,或通信鏈的中間網(wǎng)絡(luò)節(jié)點Ι-1。網(wǎng)絡(luò)元件可通過無線或有線鏈路連接。此外,網(wǎng)絡(luò)可包括電或電磁通信網(wǎng)絡(luò)或光學通信網(wǎng)絡(luò)。根據(jù)本發(fā)明的另一方面,提供一種用于控制從通信網(wǎng)絡(luò)的至少一個先前網(wǎng)絡(luò)元件接收音頻信號的網(wǎng)絡(luò)元件I的語音質(zhì)量增強裝置4提供的語音質(zhì)量增強VQE的方法,其中檢測由先前網(wǎng)絡(luò)元件中的一者應(yīng)用于接收到的音頻信號的至少一個語音質(zhì)量增強(VQE)功能或因相應(yīng)網(wǎng)絡(luò)元件I的語音質(zhì)量增強裝置4應(yīng)用于接收到的音頻信號的至少一個語音質(zhì)量增強VQE功能引起的信號質(zhì)量增強,且依據(jù)檢測結(jié)果來控制相應(yīng)網(wǎng)絡(luò)元件I的語音質(zhì)量增強VQE裝置4。根據(jù)本發(fā)明的第四方面的方法可由語音質(zhì)量增強(VQE)檢測器2的執(zhí)行單元執(zhí)行的控制程序來執(zhí)行。本發(fā)明提供一種由網(wǎng)絡(luò)內(nèi)的通信鏈的至少一個網(wǎng)絡(luò)元件進行的語音質(zhì)量增強VQE檢測,其中此檢測可基于對經(jīng)解碼的信號的分析及特征提取,或直接基于接收到的比特流,或基于使用MOS降級。當前網(wǎng)絡(luò)元件中的語音質(zhì)量增強VQE處理的應(yīng)用的條件可為未檢測到對接收到的音頻信號的類似語音質(zhì)量增強VQE處理或功能,或條件為同一網(wǎng)絡(luò)元件中集成的語音質(zhì)量增強裝置4引起的信號質(zhì)量的改善。此外,檢測可為全局的,從而引起去激活當前網(wǎng)絡(luò)元件內(nèi)的所有語音質(zhì)量增強功能VQEF,或者是部分的,從而引起去激活當前網(wǎng)絡(luò)元件中的至少特定語音質(zhì)量增強功能VQEF(如果在接收到的音頻信號中已檢測到對應(yīng)的語音質(zhì)量增強VQE)。檢測可為硬檢測或軟檢測。在軟檢測中,可估計先前處理的強度,且可與檢測一起使用所述強度來自適應(yīng)地參數(shù)化當前網(wǎng)絡(luò)元件中的語音質(zhì)量增強功能VQEF。根據(jù)本發(fā)明的方法不需要標準化或?qū)嵤┤魏晤~外信令,且其對現(xiàn)有網(wǎng)絡(luò)部署是向后兼容的。根據(jù)本發(fā)明的第四方面的方法避免了話音降級,且改善了話音質(zhì)量。其避免了當在網(wǎng)絡(luò)的通信鏈中應(yīng)用語音質(zhì)量增強處理兩次或兩次以上時可能發(fā)生的話音或信號降級。只要在網(wǎng)絡(luò)中引入所述方法,所述方法便對通信鏈的每一網(wǎng)絡(luò)元件有效。
權(quán)利要求
1.一種語音質(zhì)量增強檢測器(2),所述語音質(zhì)量增強檢測器(2)用在從前一個網(wǎng)絡(luò)元件接收音頻信號的網(wǎng)絡(luò)元件(1), 所述語音質(zhì)量增強檢測器(2)用于 對接收到的音頻信號進行語音質(zhì)量增強檢測,其中所述語音質(zhì)量增強檢測包括檢測所述網(wǎng)絡(luò)的至少一個前一個網(wǎng)絡(luò)元件(I)將至少一個語音質(zhì)量增強功能VQEF應(yīng)用于所述接收到的音頻信號;以及 根據(jù)檢測結(jié)果來控制所述接收到的音頻信號的語音質(zhì)量增強處理。
2.根據(jù)權(quán)利要求1所述的語音質(zhì)量增強VQE檢測器(2), 其中所述語音質(zhì)量增強檢測包括檢測所述至少一個前一個網(wǎng)絡(luò)元件應(yīng)用于所述接收到的音頻信號的至少一個特定語音質(zhì)量增強功能VQEF。
3.根據(jù)權(quán)利要求1或2所述的語音質(zhì)量增強檢測器, 其中所述至少一個語音質(zhì)量增強VQE功能是降噪功能及/或回音消除功能及/或動態(tài)范圍壓縮功能及/或自動增益控制功能。
4.根據(jù)前述權(quán)利要求1到3中任一權(quán)利要求所述的語音質(zhì)量增強檢測器, 其中所述接收到的音頻信號是經(jīng)編碼的音頻信號;且 其中所述語音質(zhì)量增強VQE檢測器(2)連接到信號輸入端(3),并且處理在所述信號輸入端(3)處接收到的所述經(jīng)編碼的音頻信號的比特流,以執(zhí)行所述語音質(zhì)量增強檢測;或 其中所述語音質(zhì)量增強VQE檢測器(2)連接到比特流解碼器(5)的輸出端,且基于所述接收到的經(jīng)編碼的音頻信號來處理由所述比特流解碼器(5)產(chǎn)生的經(jīng)解碼的信號,以執(zhí)行所述語音質(zhì)量增強檢測。
5.根據(jù)前述權(quán)利要求1到4中任一權(quán)利要求所述的語音質(zhì)量增強檢測器,其中所述語音質(zhì)量增強處理是自適應(yīng)語音質(zhì)量增強處理,且所述語音質(zhì)量增強VQE檢測器(2)依據(jù)所述檢測結(jié)果來調(diào)整所述自適應(yīng)語音質(zhì)量增強處理的參數(shù)。
6.根據(jù)前述權(quán)利要求1到5中任一權(quán)利要求所述的語音質(zhì)量增強檢測器, 其中所述語音質(zhì)量增強VQE檢測器(2)依據(jù)所述檢測結(jié)果進行控制以打開或關(guān)閉由所述語音質(zhì)量增強處理提供的至少一個語音質(zhì)量增強(VQE)功能。
7.根據(jù)前述權(quán)利要求1到6中任一權(quán)利要求所述的語音質(zhì)量增強(VQE)檢測器,其中所述語音質(zhì)量增強檢測是閉環(huán)語音質(zhì)量增強檢測,且包括 由語音質(zhì)量增強裝置(4)將語音質(zhì)量增強功能應(yīng)用于所述接收到的音頻信號,以獲得所述接收到的音頻信號的經(jīng)處理的版本;以及 如果對所述接收到的音頻信號獲得的語音質(zhì)量度量及對所述接收到的音頻信號的所述經(jīng)處理的版本獲得的語音質(zhì)量度量的評估滿足預(yù)定準則,則檢測至少一個語音質(zhì)量增強功能VQEF,或檢測所述前一個網(wǎng)絡(luò)元件(I)中的一者將至少所述所應(yīng)用的質(zhì)量增強功能應(yīng)用于所述接收到的音頻信號。
8.根據(jù)前述權(quán)利要求1到7中任一權(quán)利要求所述的語音質(zhì)量增強(VQE)檢測器, 其中所述語音質(zhì)量增強VQE檢測器(2)包括對所述接收到的音頻信號的非侵入性話音質(zhì)量評價。
9.根據(jù)權(quán)利要求7或8所述的語音質(zhì)量增強VQE檢測器, 其中所述語音質(zhì)量增強VQE在閉環(huán)中應(yīng)用,其中將所述接收到的音頻信號與經(jīng)VQE處理的信號之間的MOS得分進行比較。
10.根據(jù)前述權(quán)利要求1到9中任一權(quán)利要求所述的語音質(zhì)量增強VQE檢測器, 其中所述語音質(zhì)量增強VQE檢測器(2)適于提取及分析來自所述接收到的音頻信號的信號特征以執(zhí)行所述語音質(zhì)量增強檢測,其中所述接收到的音頻信號經(jīng)過編碼或未經(jīng)編碼。
11.根據(jù)權(quán)利要求10所述的語音質(zhì)量增強VQE檢測器, 其中所述接收到的音頻信號的所述經(jīng)信號提取及分析的特征包括以下特征中的至少一者 所述接收到的音頻信號的頻譜平坦性量度, 頻譜動態(tài), 基音周期, 基音增益及/或 話音變化。
12.根據(jù)權(quán)利要求10或11所述的語音質(zhì)量增強VQE檢測器, 其中所述統(tǒng)計模型是高斯混合模型GMM。
13.根據(jù)前述權(quán)利要求1到12中任一權(quán)利要求所述的語音質(zhì)量增強VQE檢測器, 其中所述語音質(zhì)量增強VQE檢測器(2)用于檢測由所述前一個網(wǎng)絡(luò)元件中的所述至少一者相應(yīng)地應(yīng)用于所述接收到的音頻信號的語音質(zhì)量增強VQE功能的強度。
14.根據(jù)前述權(quán)利要求1到13中任一權(quán)利要求所述的語音質(zhì)量增強VQE檢測器, 其特征在于,向所述網(wǎng)絡(luò)的至少一個其它網(wǎng)絡(luò)元件發(fā)信號通知所述語音質(zhì)量增強VQE檢測器(2)提供所述檢測結(jié)果。
15.一種有線及/或無線通信網(wǎng)絡(luò)的網(wǎng)絡(luò)元件,其包括 根據(jù)前述權(quán)利要求1到13中任一權(quán)利要求所述的語音質(zhì)量增強VQE檢測器(2);以及至少一個語音質(zhì)量增強裝置(4),用于接收所述語音質(zhì)量增強VQE檢測器(2)控制以對接收到的音頻信號進行語音質(zhì)量增強處理。
16.根據(jù)權(quán)利要求15所述的網(wǎng)絡(luò)元件, 其中所述網(wǎng)絡(luò)元件(I)是用戶終端或用戶終端之間的光、電或電磁有線或無線通信網(wǎng)絡(luò)的通信鏈內(nèi)的網(wǎng)絡(luò)節(jié)點。
17.—種包括根據(jù)前述權(quán)利要求15或16中任一權(quán)利要求所述的網(wǎng)絡(luò)元件的通信網(wǎng)絡(luò)。
18.一種用于控制語音質(zhì)量增加的方法,該方法由從通信網(wǎng)絡(luò)中前一個網(wǎng)絡(luò)元件接收音頻信號的網(wǎng)絡(luò)元件(I)的語音質(zhì)量增強裝置(4)提供,該方法包括 對所述接收到的音頻信號進行語音質(zhì)量增強檢測,其中所述語音質(zhì)量增強檢測包括檢測應(yīng)由至少一個所述前一個網(wǎng)絡(luò)元件(I)應(yīng)用于所述接收到的音頻信號的至少一個語音質(zhì)量增強功能VQEF ;以及 依據(jù)檢測結(jié)果來控制所述接收到的音頻信號的語音質(zhì)量增強處理。
全文摘要
一種用于從網(wǎng)絡(luò)的前一個網(wǎng)絡(luò)元件接收音頻信號的網(wǎng)絡(luò)元件的語音質(zhì)量增強(VQE)檢測器,其中所述語音質(zhì)量增強檢測器(2)適于基于所述接收到的音頻信號執(zhí)行語音質(zhì)量增強檢測,其中所述語音質(zhì)量增強檢測包括檢測所述網(wǎng)絡(luò)(1)的至少一個前一個網(wǎng)絡(luò)元件已將至少一個語音質(zhì)量增強功能VQEF應(yīng)用于所述接收到的音頻信號;以及依據(jù)檢測結(jié)果來控制對接收到的音頻信號的語音質(zhì)量增強處理。
文檔編號H03G9/02GK103004084SQ201180004253
公開日2013年3月27日 申請日期2011年1月14日 優(yōu)先權(quán)日2011年1月14日
發(fā)明者阿里斯·塔勒布, 大衛(wèi)·維雷特, 許劍峰 申請人:華為技術(shù)有限公司