專利名稱:語音處理器和通信終端設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及用于處理語音信號的語音處理器。本發(fā)明還涉及結(jié)合 了語音處理器的通信終端設(shè)備。
本申請要求日本專利申請No, 2007-182458的優(yōu)先權(quán),并通過引用 將其內(nèi)容結(jié)合與此。
背景技術(shù):
傳統(tǒng)地,已經(jīng)開發(fā)了各種諸如電話和便攜式電話那樣的通信終端 設(shè)備來整合語音處理器,它通過響應(yīng)于配對通信終端的電話號碼而自 動(dòng)切換接收的語音質(zhì)量來調(diào)節(jié)接收的語音使其處于易于聽見的狀態(tài)。 在各種文件中公開了這一技術(shù),例如專利文件1和專利文件2
專利文件1:日本未經(jīng)審査的專利申請公開No. 2005-136788。
專利文件2:日本未經(jīng)審查的專利申請No. 2001-86200。
在上述通信終端設(shè)備中,必需響應(yīng)電話號碼而向存儲(chǔ)器注冊 (register)接收的語音的調(diào)節(jié)情況;因此, 一旦接收來自電話號碼未 知或未預(yù)先注冊的通信終端的呼叫時(shí),就不可能調(diào)節(jié)接收的語音。也 就是說,公知的通信終端設(shè)備的缺陷是它們不是總能調(diào)節(jié)接收的語音 信號。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種能夠適當(dāng)調(diào)節(jié)和處理接收的語音信號的 語音處理器。
本發(fā)明的另一個(gè)目的是提供一種結(jié)合了語音處理器的通信終端設(shè) 備,其中通過該語音處理器來自動(dòng)調(diào)節(jié)接收的語音質(zhì)量。
在本發(fā)明的第一方面,語音處理器包括用于從輸入語音中提取語 音特性數(shù)據(jù)(如聲紋數(shù)據(jù))的提取器,用于根據(jù)設(shè)置的信號處理參數(shù) 來處理所述輸入語音的處理器,用于存儲(chǔ)多個(gè)預(yù)置語音特性數(shù)據(jù),每 個(gè)預(yù)置語音特性數(shù)據(jù)對應(yīng)于多組信號處理參數(shù)之一的存儲(chǔ)器,以及參 數(shù)設(shè)置設(shè)備,用于選擇與所述提取的語音特性數(shù)據(jù)具有相似性的所述 預(yù)置語音特性數(shù)據(jù)之一,并且用于將與所述選擇的預(yù)置語音特性數(shù)據(jù) 對應(yīng)的一組信號處理參數(shù)設(shè)置到所述處理器。
所述處理器包括,例如,高音補(bǔ)償器、增強(qiáng)器、動(dòng)態(tài)范圍壓縮器 和均衡器。
所述語音處理器還包括用于接收來自相對通信終端的語音信號以 便于產(chǎn)生語音信號的語音通信器,以及用于根據(jù)用戶指令來編輯所述 信號處理參數(shù)的參數(shù)編輯器。其中,所述提取器從所述語音信號中提 取表示輸入語音的特性的語音特性數(shù)據(jù),以便所述存儲(chǔ)器存儲(chǔ)與編輯 后的信號處理參數(shù)有關(guān)的所提取的語音特性數(shù)據(jù)。
在本發(fā)明的第二方面,通信終端設(shè)備除了包括上述語音處理器之 外還包括語音通信器。所述語音通信器執(zhí)行與配對通信設(shè)備的通信, 以便于接收語音信號。
根據(jù)本發(fā)明,所述提取器提取與所提取的語音特性數(shù)據(jù)具有相似 性的預(yù)置語音特性數(shù)據(jù)之一,以便將相應(yīng)的信號處理參數(shù)設(shè)置到處理 器,從而適當(dāng)?shù)靥幚磔斎胝Z音信號。
參考附圖,將對本發(fā)明的這些和其他目的,方面以及實(shí)施例進(jìn)行
更具體的描述,在附圖中
圖l是表示根據(jù)本發(fā)明優(yōu)選實(shí)施例的通信終端設(shè)備結(jié)構(gòu)的方框圖; 圖2是表示包含在圖1所示的通信終端設(shè)備內(nèi)的語音信號處理模
塊結(jié)構(gòu)的方框圖3是表示存儲(chǔ)在圖1所示的存儲(chǔ)器內(nèi)的聲紋數(shù)據(jù)與信號處理參
數(shù)之間關(guān)系的表格;
圖4A表示由圖2所示的高音補(bǔ)償器執(zhí)行的信號處理參數(shù)的實(shí)例;
圖4B表示由圖2所示的增強(qiáng)器執(zhí)行的信號處理參數(shù)的實(shí)例;
圖4C表示由圖2所示的動(dòng)態(tài)范圍壓縮器執(zhí)行的信號處理參數(shù)的實(shí)
例;
圖4D表示由圖2所示的均衡器執(zhí)行的信號處理參數(shù)的實(shí)例; 圖5是表示由圖1所示的通信終端設(shè)備執(zhí)行的語音信號處理的流 程圖;以及
圖6是表示用于向存儲(chǔ)器注冊與信號處理參數(shù)有關(guān)的聲紋數(shù)據(jù)的 聲紋數(shù)據(jù)注冊處理的流程圖。
具體實(shí)施例方式
將參考附圖并借助于實(shí)例來更詳細(xì)地描述本發(fā)明。
圖1是表示根據(jù)本發(fā)明優(yōu)選實(shí)施例的通信終端設(shè)備(例如,便攜 式電話)的結(jié)構(gòu)的方框圖,其中它僅僅顯示了有關(guān)語音處理的部分, 因此,為了方便起見未顯示其他部分。
語音通信器1執(zhí)行與配對通信終端(未顯示)的通信,以便于接 收語音信號。語音編解碼器(即,語音編碼器-解碼器)2是將從語音 接收器1輸出的編碼語音信號轉(zhuǎn)換(或解碼)成線性音頻信號的模塊。 作為音頻信號的編碼方法,可以指定QCELP (Qualcomm碼激勵(lì)線性
預(yù)測)和AMR (高級多速率編解碼器)。
聲紋提取器3分析從語音編解碼器2輸出的線性語音信號,以便 于提取表示語音信號特性的聲紋數(shù)據(jù)(或語音特性數(shù)據(jù))。例如,通 過長期的譜分析方法來檢測聲紋數(shù)據(jù)。也就是說,在單位時(shí)間間隔內(nèi)
連續(xù)地對語音信號執(zhí)行使用了 FFT (即,快速傅里葉變換)的頻率分 析;然后,累積所檢測的頻率值。這在預(yù)定數(shù)目的時(shí)間間隔(或執(zhí)行 累積的預(yù)定次數(shù))內(nèi)連續(xù)地執(zhí)行;然后,根據(jù)預(yù)定的數(shù)目來劃分累積 的頻率值,從而產(chǎn)生聲紋數(shù)據(jù)。
存儲(chǔ)器4預(yù)先存儲(chǔ)預(yù)置的與信號處理參數(shù)(定義了由語音信號處 理模塊8執(zhí)行的處理的內(nèi)容)有關(guān)的聲紋數(shù)據(jù)(預(yù)置的語音特性數(shù)據(jù))。 相似性判定器5判定預(yù)置的聲紋數(shù)據(jù)與所提取的聲紋數(shù)據(jù)(由聲紋提 取器3提取)之間的相似性。可以使用各種方法來判定相似性。例如, 執(zhí)行merkepstrum分析以便產(chǎn)生時(shí)間序列特性矢量、計(jì)算其距離以便判 定相似性。
參數(shù)指定器(或參數(shù)設(shè)置設(shè)備)6基于相似性判定器5的判定結(jié)果, 從存儲(chǔ)器4內(nèi)存儲(chǔ)的預(yù)置聲紋數(shù)據(jù)中選擇與所提取的聲紋數(shù)據(jù)(由聲 紋提取器3提取)高度相似的聲紋數(shù)據(jù),然后它從存儲(chǔ)器4中讀取信 號處理參數(shù),由此為語音信號處理模塊8指定(或設(shè)置)所選的聲紋 數(shù)據(jù)。參數(shù)編輯器7響應(yīng)于用戶指令來編輯信號處理參數(shù),其中用戶 通過操作與在顯示器(未顯示)上工作的GUI (圖形用戶界面)相關(guān) 聯(lián)的通信終端設(shè)備(未顯示)的操作鍵來指定該用戶指令。參數(shù)編輯 器7不必整合到通信終端設(shè)備內(nèi),因此,還可以通過諸如個(gè)人計(jì)算機(jī) 那樣的外部設(shè)備來實(shí)現(xiàn)參數(shù)編輯器7的功能,該個(gè)人計(jì)算機(jī)經(jīng)由其接 口 (未顯示)而連接到通信終端設(shè)備。語音信號處理模塊8執(zhí)行處理, 其中由參數(shù)指定器6對于從語音編解碼器2輸出的語音信號來指定處 理的內(nèi)容。這提高了聲音質(zhì)量,而且使用戶容易聽到接收的語音。
麥克風(fēng)9將語音轉(zhuǎn)換成模擬語音信號。A/D轉(zhuǎn)換器(或ADC) 10 將(從麥克風(fēng)9輸出的)模擬語音信號轉(zhuǎn)換成數(shù)字語音信號。與聲紋提取器3相似,聲紋提取器11分析(從A/D轉(zhuǎn)換器IO輸出的)數(shù)字
語音信號,以便于從其中提取聲紋數(shù)據(jù)(或語音特性數(shù)據(jù))。在存儲(chǔ)
器4內(nèi)存儲(chǔ)所提取的聲紋數(shù)據(jù)(由聲紋提取器ll提取)以及由參數(shù)編 輯器7編輯的信號處理參數(shù)。揚(yáng)聲器12基于語音信號處理模塊8所處 理的語音信號(或音頻信號)來產(chǎn)生語音(或聲音)。
圖2是表示語音信號處理模塊8的結(jié)構(gòu)的方框圖。高音補(bǔ)償器81 補(bǔ)償語音信號的高音,其中由于語音編解碼器2的頻帶限制而損失了 該高音。另外,高音補(bǔ)償器81執(zhí)行預(yù)先指定的處理,以便于減少(或 消除)語音的粗糙度。增強(qiáng)器82對于從高音補(bǔ)償器81輸出的語音信 號來增強(qiáng)高音泛音,從而創(chuàng)建生動(dòng)的語音(換言之,使語音聽起來更 清楚)。
動(dòng)態(tài)范圍壓縮器(DRC) 83對于從增強(qiáng)器82輸出的語音信號來 動(dòng)態(tài)地衰減高信號電平(level)(超出了特定電平或閾值)。當(dāng)輸入 語音的音量很高時(shí),降低其音量,以便于在所有范圍內(nèi)提高音量,從 而在所有范圍內(nèi)實(shí)現(xiàn)均一的音量。即使在增強(qiáng)器82提高峰值音量時(shí), 也有可能產(chǎn)生想要的語音,它具有足夠的音量而且不含有失真。均衡 器(EQ) 84在單位頻帶中校正語音信號的頻帶。參數(shù)指定器6為語音 信號處理模塊8內(nèi)的高音補(bǔ)償器81、增強(qiáng)器82、動(dòng)態(tài)范圍壓縮器83 和均衡器84指定適當(dāng)?shù)男盘柼幚韰?shù),從而實(shí)現(xiàn)了指定的信號處理。
圖3表示存儲(chǔ)在存儲(chǔ)器4內(nèi)的聲紋數(shù)據(jù)與信號處理參數(shù)之間的關(guān) 系。具體地說,聲紋數(shù)據(jù)300與定義了高音補(bǔ)償器81的處理的信號處 理參數(shù)310 (見圖4A)、定義了增強(qiáng)器82的處理的信號處理參數(shù)320 (見圖4B)、定義了動(dòng)態(tài)范圍壓縮器83的處理的信號處理參數(shù)330(見 圖4C)和定義了均衡器84的處理的信號處理參數(shù)340 (見圖4D)相 對應(yīng)。
例如,聲紋數(shù)據(jù)"類型A"與定義了信號處理參數(shù)310的語句
(statement) "DB—set A"(見圖4A)、定義了信號處理參數(shù)320的 語句"EH一setA"(見圖4B)、定義了信號處理參數(shù)330的語句"DR—set A"(見圖4C)和定義了信號處理參數(shù)340的語句"EQ—set A (見圖 4D)"相對應(yīng)。
接下來,將參照圖5來描述在與配對通信終端的通信期間的語音 信號處理。當(dāng)用戶操作通信終端設(shè)備以向配對通信終端發(fā)起撥號呼叫 時(shí),或是在通信終端設(shè)備接收來自配對通信終端的撥號呼叫時(shí),在通 信終端與配對通信終端之間建立通信。語音通信器1接收語音信號, 該語音信號被編碼,然后被轉(zhuǎn)發(fā)到語音編解碼器2。在步驟SIOO中, 語音編解碼器2將編碼的語音信號轉(zhuǎn)換成線性語音信號。在步驟SllO 中,聲紋提取器3從語音信號中提取聲紋數(shù)據(jù)。
相似性判定器5判定所提取的聲紋數(shù)據(jù)(由聲紋提取器3提取) 和預(yù)先存儲(chǔ)在存儲(chǔ)器4內(nèi)的預(yù)置的聲紋數(shù)據(jù)之間的相似性。在步驟S120 中,基于相似性判定器的結(jié)果,參數(shù)指定器6從存儲(chǔ)器4內(nèi)存儲(chǔ)的多 個(gè)預(yù)置的聲紋數(shù)據(jù)中檢索出與所提取的聲紋數(shù)據(jù)高度相似的聲紋數(shù) 據(jù);換言之,它檢索出與所提取的聲紋數(shù)據(jù)的相似性髙于預(yù)定閾值的 多個(gè)預(yù)置聲紋數(shù)據(jù)之一。
當(dāng)參數(shù)指定器6成功地檢索到相似性高于預(yù)定閾值的聲紋數(shù)據(jù)時(shí), 步驟S130的判定結(jié)果轉(zhuǎn)向"是",以便流程前進(jìn)到步驟S140。當(dāng)其無 法檢索到相似性高于預(yù)定閾值的聲紋數(shù)據(jù)時(shí),步驟S130的判定結(jié)果轉(zhuǎn) 向"否",以便流程前進(jìn)到步驟S170。
在步驟S140中,參數(shù)指定器6讀取與檢索出的聲紋數(shù)據(jù)有關(guān)的信 號處理參數(shù),該檢索出的聲紋數(shù)據(jù)與來自存儲(chǔ)器4的所提取的聲紋數(shù) 據(jù)具有最高的相似性。在步驟S170中,參數(shù)指定器6從存儲(chǔ)器4中讀
取預(yù)先準(zhǔn)備的信號處理參數(shù)的默認(rèn)值。在完成步驟si40或步驟sno
之后,流程前進(jìn)到步驟S150,在步驟S150中參數(shù)指定器6為語音信號
處理模塊8指定所讀取的信號處理參數(shù)。
在通信結(jié)束之前,語音信號處理模塊8都保留(在步驟S140或步 驟S170中獲得的)信號處理參數(shù)??蛇x地,可以以這樣一種方式來對 圖5的流程圖進(jìn)行部分地修改,S卩,該流程每預(yù)定時(shí)間就自動(dòng)返回到 步驟SIOO,以便于即使在與配對通信終端的通信期間說話者發(fā)生了改 變也能確保易于聽見狀態(tài)(easy-to-hear state)的足夠的電平。在步驟 S160中,在通信結(jié)束時(shí),通信終端設(shè)備停止接收語音信號。因此,結(jié) 束一系列有關(guān)語音信號處理的操作。
如上所述,從存儲(chǔ)器4內(nèi)存儲(chǔ)的多個(gè)預(yù)置的聲紋數(shù)據(jù)中檢索出與 從接收的語音信號(發(fā)自配對通信終端)中所提取的聲紋數(shù)據(jù)具有相 似性的聲紋數(shù)據(jù);然后,將與檢索出的聲紋數(shù)據(jù)有關(guān)的信號處理參數(shù) 設(shè)置到語音信號處理模塊8;因此,就有可能對于接收到的語音信號來 執(zhí)行適當(dāng)?shù)恼Z音信號處理。即使是在通信終端設(shè)備接收來自未知通信 終端的第一呼叫時(shí),如果存儲(chǔ)器4存儲(chǔ)了與從接收的語音信號中所提 取的聲紋數(shù)據(jù)具有相似性的聲紋數(shù)據(jù),也有可能對于接收的語音信號 執(zhí)行適當(dāng)?shù)恼Z音處理。
本實(shí)施例被設(shè)計(jì)為向語音信號處理模塊8提供最佳信號處理參數(shù), 其中該最佳信號處理參數(shù)適合于使用配對通信終端進(jìn)行呼叫的人員的 聲紋(或聲音特性),因此通信終端設(shè)備的用戶就有可能容易地聽到 接收的語音。也就是說,本實(shí)施例提供了顯著的效果,其中可以對音 量相對較低的接收到的語音進(jìn)行增強(qiáng)音量,并在音調(diào)上對含混的語音 (thick voice)進(jìn)行軟化(soften)。
接下來,將參照圖6描述用于向存儲(chǔ)器4注冊聲紋數(shù)據(jù)的聲紋數(shù) 據(jù)注冊處理。在步驟S200中,用戶改變通信終端設(shè)備的操作模式,從 而允許該通信終端設(shè)備向存儲(chǔ)器4注冊聲紋數(shù)據(jù)。接著,麥克風(fēng)9獲 取輸入其中的語音,以便于產(chǎn)生模擬語音信號,然后將該模擬語音信號轉(zhuǎn)發(fā)到A/D轉(zhuǎn)換器10。A/D轉(zhuǎn)換器10將模擬語音信號轉(zhuǎn)換成數(shù)字語 音信號。在步驟S210中,聲紋提取器11分析數(shù)字語音信號,以便于 提取聲紋數(shù)據(jù)。在存儲(chǔ)器4內(nèi)存儲(chǔ)所提取的聲紋數(shù)據(jù)。
接著,用戶操作通信終端設(shè)備,以便于編輯信號處理參數(shù)。也就 是說,用戶利用GUI功能以便編輯信號處理參數(shù)以適合(與輸入語音 相對應(yīng)的)所提取的聲紋數(shù)據(jù)。在步驟S220中,如上所述,參數(shù)編輯 器7編輯信號處理參數(shù)。在步驟S230中,參數(shù)編輯器7在存儲(chǔ)器4內(nèi) 存儲(chǔ)與聲紋數(shù)據(jù)有關(guān)的編輯后的信號處理參數(shù),其中該聲紋數(shù)據(jù)是由 聲紋提取器11所提取并然后被存儲(chǔ)在存儲(chǔ)器4內(nèi)。
當(dāng)用戶打算繼續(xù)向存儲(chǔ)器4注冊聲紋數(shù)據(jù)時(shí),換言之,當(dāng)步驟S240 中的判定結(jié)果為"否"時(shí),流程返回到步驟S210,以便于重復(fù)前述處 理。當(dāng)用戶操作通信終端設(shè)置以停止向存儲(chǔ)器4注冊聲紋數(shù)據(jù)時(shí),換 言之,當(dāng)步驟S240的判定結(jié)果為"是"時(shí),結(jié)束該聲紋數(shù)據(jù)注冊處理。
最后,本發(fā)明不必局限于本實(shí)施例,還可以在所附權(quán)利要求所限 定的本發(fā)明的范圍內(nèi)以各種方式對其進(jìn)行修改。
權(quán)利要求
1.一種語音處理器,包括提取器,用于從輸入語音提取語音特性數(shù)據(jù);處理器,用于根據(jù)設(shè)置的信號處理參數(shù)來處理所述輸入語音;存儲(chǔ)器,用于存儲(chǔ)多個(gè)預(yù)置語音特性數(shù)據(jù),每個(gè)預(yù)置語音特性數(shù)據(jù)對應(yīng)于多組信號處理參數(shù)之一;以及參數(shù)設(shè)置設(shè)備,用于選擇與所述提取的語音特性數(shù)據(jù)具有相似性的所述多個(gè)預(yù)置語音特性數(shù)據(jù)之一,并且用于將與所述選擇的預(yù)置語音特性數(shù)據(jù)對應(yīng)的一組信號處理參數(shù)設(shè)置到所述處理器。
2. 根據(jù)權(quán)利要求1的所述語音處理器,進(jìn)一步包括用于接收輸入其中的語音信號以產(chǎn)生語音信號的語音通信器,以及用于根據(jù)用戶指 令來編輯所述信號處理參數(shù)的參數(shù)編輯器,其中所述提取器從所述語 音信號提取表示所述輸入語音特性的語音特性數(shù)據(jù),并且其中所述存 儲(chǔ)器存儲(chǔ)與編輯的信號處理參數(shù)有關(guān)的所述提取的語音特性數(shù)據(jù)。
3. —種通信終端設(shè)備,包括語音通信器,用于執(zhí)行與配對通信設(shè)備的通信以接收語音信號;以及語音處理器,它包括;提取器,用于從所述語音信號提取語音特性數(shù)據(jù); 處理器,用于根據(jù)設(shè)置的信號處理參數(shù)來處理所述語音信號; 存儲(chǔ)器,用于存儲(chǔ)多個(gè)預(yù)置語音特性數(shù)據(jù),每個(gè)預(yù)置語音特性數(shù) 據(jù)對應(yīng)于多組信號處理參數(shù)之一;以及參數(shù)設(shè)置設(shè)備,用于選擇與所述提取的語音特性數(shù)據(jù)具有相似性 的所述多個(gè)預(yù)置語音特性數(shù)據(jù)之一,并且用于將與所述選擇的預(yù)置語 音特性數(shù)據(jù)對應(yīng)的一組信號處理參數(shù)設(shè)置到所述處理器。
4. 根據(jù)權(quán)利要求1的所述語音處理器,其中所述處理器包括高音補(bǔ)償器、增強(qiáng)器、動(dòng)態(tài)范圍壓縮器和均衡器中的至少一個(gè)。
5. 根據(jù)權(quán)利要求4的所述語音處理器,其中所述信號處理參數(shù)定 義了關(guān)于所述高音補(bǔ)償器、所述增強(qiáng)器、所述動(dòng)態(tài)范圍壓縮器和所述 均衡器之一的處理內(nèi)容。
6. 根據(jù)權(quán)利要求1的所述語音處理器,其中當(dāng)所述存儲(chǔ)器沒有存 儲(chǔ)與所述提取的語音特性數(shù)據(jù)具有相似性的預(yù)置語音特性數(shù)據(jù)時(shí),所 述參數(shù)設(shè)置設(shè)備將預(yù)先準(zhǔn)備的所述信號處理參數(shù)的默認(rèn)值設(shè)置到所述 處理器。
7. 根據(jù)權(quán)利要求1的所述語音處理器,其中所述語音特性數(shù)據(jù)是 聲紋數(shù)據(jù)。
8. 根據(jù)權(quán)利要求3的所述通信終端設(shè)備,其中所述語音特性數(shù)據(jù) 是聲紋數(shù)據(jù)。
全文摘要
在結(jié)合于通信終端設(shè)備內(nèi)的語音處理器中,提取器從向其輸入的語音信號中提取語音特性數(shù)據(jù)(如聲紋數(shù)據(jù));然后,語音信號處理模塊根據(jù)預(yù)先在存儲(chǔ)器內(nèi)存儲(chǔ)的與預(yù)置的語音特性數(shù)據(jù)有關(guān)的信號處理參數(shù)來處理輸入語音信號。參數(shù)設(shè)置設(shè)備選擇預(yù)置的語音特性數(shù)據(jù)中與所提取的語音特性數(shù)據(jù)具有相似性的一個(gè)語音特性數(shù)據(jù),以便于將存儲(chǔ)在存儲(chǔ)器內(nèi)的相應(yīng)的信號處理參數(shù)設(shè)置到語音信號處理模塊。因此,通信終端設(shè)備能夠適當(dāng)?shù)靥幚磔斎胝Z音信號,以便于增強(qiáng)特定范圍或調(diào)節(jié)輸入語音的音量。
文檔編號G10L21/00GK101345055SQ200810135658
公開日2009年1月14日 申請日期2008年7月9日 優(yōu)先權(quán)日2007年7月11日
發(fā)明者川島隆宏 申請人:雅馬哈株式會(huì)社