專利名稱:數(shù)字語聲混合的數(shù)據(jù)交織方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語聲混合方法,特別是涉及一種用于分布式多方會議系統(tǒng)的語聲混合方法。
目前,應(yīng)用于多點(diǎn)會議系統(tǒng)的語聲混合算法,主要有“選大”算法和“線性疊加”算法兩大類,有現(xiàn)成的專用集成電路(ASIC)芯片可供選用,如摩托羅拉(MOTOROLA)公司的“八選一”芯片(MC145611)和敏迪(MITEL)公司的“四路疊加”芯片(MT8924)。“選大”算法(如MC145611)是將需要混合的幾路語聲信號按數(shù)據(jù)進(jìn)行能量比較,根據(jù)比較的結(jié)果,選擇能量最大的一路信號作為輸出,產(chǎn)生混合的效果?!熬€性疊加”算法(如MT8924)則是將輸入的幾路語聲信號逐數(shù)據(jù)進(jìn)行幅值求和,從而獲得混合的語聲信號。選大”算法采取“非此即彼”的選擇方法,任何時刻只能有一路輸入語聲被選中。如果輸入話路中有多于一路的語聲信號同時激活(即正在講話),未被選中的話路就會出現(xiàn)“卡音”,即聲音被“剪頭去尾”,影響混合后的語聲信號的音質(zhì)。對于“線性疊加”算法來說,當(dāng)輸入信號的動態(tài)范圍較大時,由于疊加后的信號動態(tài)范圍有較大幅度的增加,輸出信號的幅值有可能溢出,導(dǎo)致音質(zhì)惡化。當(dāng)輸入語聲信號的能量較小時,噪聲疊加使得輸出信號的信噪比隨輸入話路的增加而急劇下降,造成音質(zhì)惡化,故“線性疊加”算法一般不適合于超過四路的語聲信號的混合?!斑x大”算法和“線性疊加”算法的共同缺點(diǎn)是復(fù)雜度高、造價高,音質(zhì)差,尤其不適用于分布式的多點(diǎn)會議系統(tǒng)。
本發(fā)明的目的是提供一種復(fù)雜度低、音質(zhì)優(yōu)良、尤其適于分布式多點(diǎn)會議系統(tǒng)語聲混合方法。
本發(fā)明目的是這樣實(shí)現(xiàn)的它首先對輸入到終端的N路數(shù)字語聲碼流,按一定規(guī)律進(jìn)行數(shù)據(jù)交織,產(chǎn)生一個語聲混合碼流,然后,以標(biāo)準(zhǔn)取樣速率Fc(=8kHz)的N倍(N·Fc)為幀觸發(fā)頻率,對這個語聲混合碼流進(jìn)行數(shù)模轉(zhuǎn)換(D/A)和低通濾波,在不增大輸出語聲信號的動態(tài)范圍和不降低其信噪比的情況下,實(shí)現(xiàn)多路語聲信號的混合。數(shù)據(jù)交織形成混合碼流的過程將N路輸入數(shù)字語聲,按其隨意選定的次序,進(jìn)行交織排列,并保證在隨后的各幀中次序不變,即N路對應(yīng)關(guān)系不變,使N個數(shù)據(jù)語聲組成一個復(fù)幀?;旌洗a流由一個個復(fù)幀組成;每個復(fù)幀由0到N-1共N個時隙組成;每個時隙固定地包含某一路輸入語聲的數(shù)據(jù),即0時隙包含第0路輸入語聲的數(shù)據(jù),1時隙包含第1路輸入語聲的數(shù)據(jù),依此類推;以上所形成的混合碼流送入解碼器中,并以標(biāo)準(zhǔn)取樣頻率Fc的N倍(N·Fc)為幀觸發(fā)頻率對其進(jìn)行解碼,獲得的模擬信號就包含了所有的N路輸入語聲信息。
本發(fā)明與現(xiàn)有技術(shù)相比所具有的有益效果是眾所周知,數(shù)模轉(zhuǎn)換(D/A)電路的基本功能是將通過解碼輸入數(shù)字信號的包絡(luò)提取出來,而且,當(dāng)數(shù)字信號的取樣頻率滿足奈奎斯特取樣條件時,包絡(luò)信號就是原來的模擬信號。顯然,由上面的說明可知,對任意一個時隙的數(shù)字信號,該數(shù)模轉(zhuǎn)換(D/A)電路均能滿足奈奎斯特取樣條件的要求,從而,解碼后的輸出信號必定包含了全部的N路輸入語聲信息。輸出模擬信號功率由各個時刻的幅值決定,而輸出模擬信號在各個時刻的幅值又由相應(yīng)的輸入數(shù)字信號的幅值決定。這樣,由上述的數(shù)據(jù)交織方案和復(fù)幀結(jié)構(gòu)可以看出,輸出模擬信號的功率的功率是所有各路輸入模擬信號功率的平均值。從而證明本方案具有以下幾個方面的性能優(yōu)勢1)輸出模擬信號的功率是輸入的N路模擬信號功率的平均值,無論參數(shù)N有多大,輸出模擬信號都不會因?yàn)閯討B(tài)范圍過大而造成溢出。這樣,就克服了線形疊加算法在N較大時容易溢出的缺點(diǎn)。
2)因?yàn)檩敵瞿M信號包含了全部的輸入信息,該方案又能很好地避免選大算法在N較大時的“卡音”現(xiàn)象,即對輸入語聲信號的“剪頭去尾”。
3)將語聲混合與數(shù)模轉(zhuǎn)換(D/A)的過程結(jié)合在一起完成,既降低系統(tǒng)成本,又獲得良好的語聲音質(zhì)。
4)語聲混合的多點(diǎn)處理(MP)功能出各個通信終端自行完成,混合的語聲信號不必再送回到通信網(wǎng)絡(luò)上去,使之適用于分布式多方會議系統(tǒng)。
圖1 數(shù)據(jù)交織方法系統(tǒng)2 數(shù)據(jù)交織過程示意3 數(shù)據(jù)交織方法方框圖下面結(jié)合附圖對本發(fā)明的具體實(shí)施方式
作進(jìn)一步說明;圖1是數(shù)據(jù)交織方法電路方框圖,其中右邊虛線方框中的部分為本方法的電路部分。S0、S1、…、SN-1是N個模擬語聲信號,以標(biāo)準(zhǔn)取樣速率Fc(8KHz)進(jìn)行模數(shù)轉(zhuǎn)換(A/D),得到
路數(shù)字化語聲碼流,經(jīng)通信網(wǎng)絡(luò)傳輸?shù)礁鱾€通信終端。在每一個通信終端,數(shù)字化語聲碼流
首先按照圖2.和圖3.所示的方法進(jìn)行數(shù)據(jù)交織,得到混合后的語聲碼流
。然后,以Fd=N·Fc的幀觸發(fā)頻率,對混合后的語聲碼流
進(jìn)行數(shù)模轉(zhuǎn)換(D/A),再經(jīng)過低通濾波處理,濾去高頻噪聲,就得到混合后的模擬語聲信號S∑。
數(shù)模轉(zhuǎn)換(D/A)模塊和通常的數(shù)模轉(zhuǎn)換(D/A)電路基本相同,只是其幀觸發(fā)頻率的上限Fmax受到輸入語聲碼流數(shù)量N和標(biāo)準(zhǔn)取樣速率Fc的限制,要滿足條件Fmax≥N·Fc。數(shù)模轉(zhuǎn)換(D/A)模塊接收到混合碼流后,以幀觸發(fā)頻率Fd=N·Fc對其進(jìn)行解碼。這相當(dāng)于以Fc的幀觸發(fā)頻率分別對各路輸入語聲交替進(jìn)行解碼,從而獲得包含各路輸入語聲的混合模擬信號。
圖2為數(shù)據(jù)交織過程示意圖,表示了N路輸入語聲碼流經(jīng)數(shù)據(jù)交織組成混合碼流的過程。其中,
是N個輸入語聲碼流,
為經(jīng)數(shù)據(jù)交織產(chǎn)生的混合語聲碼流,下標(biāo)n為數(shù)據(jù)序號,1/Fc為數(shù)據(jù)交織前各路輸入語聲碼流中相鄰數(shù)據(jù)之間的間隔,1/Fd為經(jīng)數(shù)據(jù)交織后混合碼流中相鄰數(shù)據(jù)之間的間隔。數(shù)據(jù)交織通過由輸入語聲碼流的數(shù)據(jù)重排來實(shí)現(xiàn),重排的順序是在電路開始工作前隨意確定的,一旦確定,在電路的整個工作過程中,不能改變,即N路對應(yīng)關(guān)系不變。圖2中的虛線表明了一種數(shù)據(jù)排列順序混合碼流的第0個數(shù)據(jù)
等于第0路輸入碼流的第0個數(shù)據(jù)
,即
混合碼流的第1個數(shù)據(jù)
等于第1路輸入碼流的第0個數(shù)據(jù)
,即
混合碼流的第N-1個數(shù)據(jù)
等于第N-1路輸入碼流的第0個數(shù)據(jù)
,即
,至此產(chǎn)生第一個復(fù)幀。
然后,混合碼流的第N個數(shù)據(jù)
等于第0路輸入碼流的第1個數(shù)據(jù)
,即
混合碼流的第N+1個數(shù)據(jù)
等于第1路輸入碼流的第1個數(shù)據(jù)
,即
混合碼流的第2N-1個數(shù)據(jù)
等于第N-1路輸入碼流的第個樣1點(diǎn)
,即
,至此產(chǎn)生第二個復(fù)幀。
以此類推,經(jīng)上述交織,得到一個包括N路輸入語聲信息的混合碼流。這個數(shù)據(jù)排列的過程叫數(shù)據(jù)交織。
圖3為本發(fā)明的一個具體實(shí)施方案。其中數(shù)據(jù)交織過程由可編程器件(EPM7128)和存儲器(RAM,IDT6116)來實(shí)現(xiàn)。上層應(yīng)用軟件通過系統(tǒng)總線將從通信網(wǎng)絡(luò)接收到的N路語聲碼流及相應(yīng)地址和控制信號傳送到可編程器件??删幊唐骷环矫娌煌5貙⒔邮盏降恼Z聲碼流,按字節(jié)逐個寫入存儲器,同時又不停地將語聲碼流的數(shù)據(jù)從存儲器讀出來。在存儲器的寫入和讀出過程中,并不是一對一的讀入讀出操作關(guān)系,而是多個字節(jié)的讀入對應(yīng)于一個字節(jié)的讀出??删幊唐骷ㄟ^變換地址信號,使讀出存儲器地址訪問順序與寫入RAM的地址訪問順序有所不同,并維持上述的對應(yīng)關(guān)系,實(shí)現(xiàn)語聲數(shù)據(jù)的重排,即數(shù)據(jù)交織。經(jīng)過交織的數(shù)據(jù)隊(duì)列在可編程器件中完成并一串變換,產(chǎn)生混合碼流。數(shù)模轉(zhuǎn)換(D/A,MC145480)電路以幀觸發(fā)頻率Fd=N·Fc對混合碼流進(jìn)行解碼,經(jīng)低通濾波器處理,就得到混合后的語聲信號。
權(quán)利要求
1.一種數(shù)字語聲混合的數(shù)據(jù)交織方法,其特征是該方法是將N路輸入到終端的數(shù)字語聲,按其隨意選定的次序,進(jìn)行交織排列,并保證在隨后的各幀中次序不變,即N路對應(yīng)關(guān)系不變,使N個數(shù)字語聲組成一個復(fù)幀;混合碼流由一個個的復(fù)幀組成;每個復(fù)幀由0到N-1共N個時隙組成,每個時隙固定地包含某一路輸入語聲的數(shù)據(jù),即0時隙包含第0路輸入語聲的數(shù)據(jù),1時隙包含第1路輸入語聲的數(shù)據(jù),依此類推;當(dāng)數(shù)模轉(zhuǎn)換模塊(D/A)接受到混合碼流后,以標(biāo)準(zhǔn)取樣速率Fc的N倍(N·Fc)為幀觸發(fā)頻率對其進(jìn)行解碼,獲得的模擬信號就包含了所有的N路輸入語聲信息。
全文摘要
一種數(shù)字語聲混合的數(shù)據(jù)交織方法,涉及一種語聲混合方法。該方法是將N路輸入到終端的數(shù)字語聲,按隨意選定的次序進(jìn)行交織排列,并俁證在隨后的各幀中次序不變,產(chǎn)生一個混合碼流;數(shù)模轉(zhuǎn)換(D/A)模塊接收到混合碼流后,以標(biāo)準(zhǔn)取樣速率Fc的N倍(N·Fe)為幀觸發(fā)頻率,對其進(jìn)行解碼,獲得包含各路輸入語聲的混合模擬信號。該方法提供了一種復(fù)雜度低、音質(zhì)優(yōu)良、適用于分布式多點(diǎn)會議系統(tǒng)的數(shù)字語聲混合方法。
文檔編號H04J3/00GK1248836SQ9911104
公開日2000年3月29日 申請日期1999年7月29日 優(yōu)先權(quán)日1999年7月29日
發(fā)明者馬金明, 丁曉明, 裘正定 申請人:北方交通大學(xué)