專利名稱:一種會(huì)議電視系統(tǒng)的混音處理方法
技術(shù)領(lǐng)域:
本發(fā)明涉及會(huì)議電視領(lǐng)域,具體地說涉及一種會(huì)議電視系統(tǒng)的混音處 理方法。
背景技術(shù):
隨著電信技術(shù)的發(fā)展,會(huì)議電視業(yè)務(wù)得到了越來越廣泛的應(yīng)用,會(huì)議
電視系統(tǒng)中一般包括用于會(huì)議控制的多點(diǎn)控制單元(MCU)和至少一個(gè)會(huì) 場(chǎng)終端(與會(huì)者)。 一般的語音業(yè)務(wù)中僅涉及到兩個(gè)通話方,而在會(huì)議電視 系統(tǒng)中,通常與會(huì)者都不止兩個(gè),其中任一與會(huì)者的語音都可以傳送至所 有其他與會(huì)者,而每一與會(huì)者都同時(shí)可聽到多個(gè)其他與會(huì)者的聲音。因此, 在會(huì)議電視系統(tǒng)中,通常都需要進(jìn)行混音處理,即將多個(gè)與會(huì)者的語音混 合起來,以便任一與會(huì)者都可同時(shí)聽到其他與會(huì)者的聲音。通常,在一個(gè)會(huì)議電視系統(tǒng)的多個(gè)會(huì)場(chǎng)終端中,包括有以下幾種類型 的會(huì)場(chǎng)終端
主席終端即整個(gè)會(huì)議中的主席會(huì)場(chǎng),能夠取得會(huì)議的控制權(quán)。 發(fā)言人終端即會(huì)議中的當(dāng)前發(fā)言人會(huì)場(chǎng), 一般在一個(gè)會(huì)議中的一個(gè) 時(shí)刻只有一個(gè)發(fā)言人,與會(huì)的其他會(huì)場(chǎng)終端都可以看到發(fā)言人會(huì)場(chǎng)的圖像。 其他終端 一般的與會(huì)會(huì)場(chǎng)。
在實(shí)際的會(huì)議過程中,絕大多數(shù)情況下只有主席和發(fā)言人說話,其他 的一般會(huì)場(chǎng)處于聽的狀態(tài)。因此,可確定對(duì)于會(huì)議電視系統(tǒng)的混音處理的 需求主要是
1) 每個(gè)會(huì)場(chǎng)需要隨時(shí)聽見其他會(huì)場(chǎng)的聲音;
2) 應(yīng)該保證主席和發(fā)言人會(huì)場(chǎng)的聲音優(yōu)先權(quán);此外,可能出現(xiàn)的插 話會(huì)場(chǎng)應(yīng)該是聲音較大的一方,以符合人們收聽聲音最大的一方的習(xí)慣。
傳統(tǒng)的混音方法中,包括有全混音方法,即將同時(shí)說話的所有會(huì)場(chǎng)的 語音信號(hào)混音發(fā)送給各會(huì)場(chǎng),這種方案雖然滿足會(huì)場(chǎng)可隨時(shí)聽見其他會(huì)場(chǎng) 的聲音的需求,然而,對(duì)于一個(gè)會(huì)場(chǎng)終端數(shù)目眾多的會(huì)議電視系統(tǒng)而言, 不加區(qū)分的將所有會(huì)場(chǎng)終端的聲音都進(jìn)行混合,不僅對(duì)于會(huì)議電視系統(tǒng)的 MCU處理要求較高,同時(shí),也容易造成混音效果不佳,甚至讓人無法聽 清。
另一種現(xiàn)有的混音方法是混合數(shù)個(gè)聲音較大的會(huì)場(chǎng)終端的語音信 號(hào)。這種方法雖然符合人們收聽聲音最大一方的習(xí)慣,然而,常常有可能 將主席終端和發(fā)言人終端淹沒,導(dǎo)致會(huì)議的秩序混亂,也容易造成聲音的 頻繁切換。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明所要解決的技術(shù)問題是提供一種會(huì)議電視系統(tǒng)的混
音處理方法,可以提高混音效果,降低MCU的能力消耗,同時(shí)保證會(huì)議 的有序進(jìn)行。
為實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案
一種會(huì)議電視系統(tǒng)的混音處理方法,包括至少一個(gè)會(huì)場(chǎng)終端,該方法 包含如下步驟
A、 解碼各會(huì)場(chǎng)終端的語音碼流,獲得各會(huì)場(chǎng)終端語音信號(hào);
B、 將會(huì)場(chǎng)終端中的主席終端和發(fā)言人終端選定為混音激活終端;
C、 對(duì)主席終端和發(fā)言人終端外的會(huì)場(chǎng)終端,比較各會(huì)場(chǎng)終端的語音信 號(hào)音量值,按各會(huì)場(chǎng)終端的語音信號(hào)音量值由大至小的順序依序至少選出 一個(gè)會(huì)場(chǎng)終端作為混音激活終端;
D、 將步驟B和C中確定的混音激活終端的語音信號(hào)按預(yù)定原則進(jìn)行混 音,發(fā)送給相應(yīng)會(huì)場(chǎng)終端。
所述步驟D中,混音激活終端的語音信號(hào)按預(yù)定原則進(jìn)行混音,發(fā)送 給相應(yīng)會(huì)場(chǎng)終端是按如下方式實(shí)現(xiàn)
1) 對(duì)混音激活終端,將除該混音激活終端外的其他混音激活終端的語 音信號(hào)進(jìn)行混音,發(fā)送給該混音激活終端;
2) 對(duì)混音激活終端以外的其他會(huì)場(chǎng)終端,將全部混音激活終端的語音 信號(hào)進(jìn)行混音,發(fā)送給各其他會(huì)場(chǎng)終端。
所述步驟C中,比較各會(huì)場(chǎng)終端語音信號(hào)音量值是采用延時(shí)處理方式 連續(xù)多次采集各會(huì)場(chǎng)終端的語音信號(hào)音量值,計(jì)算采集到的各會(huì)場(chǎng)終端的 多個(gè)語音信號(hào)音量值的平均值,對(duì)各會(huì)場(chǎng)終端語音信號(hào)音量值的所述平均 值進(jìn)行比較。
所述步驟C中,比較各會(huì)場(chǎng)終端語音信號(hào)音量值是采用延時(shí)處理方式 連續(xù)多次采集各會(huì)場(chǎng)終端的語音信號(hào)音量值,計(jì)算采集到的各會(huì)場(chǎng)終端的
多個(gè)語音信號(hào)音量值的平均值,對(duì)各會(huì)場(chǎng)終端語音信號(hào)音量值的所述平均 值進(jìn)行比較。
當(dāng)主席終端和發(fā)言人終端為同一會(huì)場(chǎng)終端時(shí),所述步驟C中,對(duì)主席 終端和發(fā)言人終端外的會(huì)場(chǎng)終端,按各會(huì)場(chǎng)終端語音信號(hào)音量值由大至小 的順序依序至少選出兩個(gè)會(huì)場(chǎng)終端作為混音激活終端。
所述步驟D中,當(dāng)混音信號(hào)超過設(shè)定的混音門限時(shí),在將混音信號(hào)發(fā) 送給相應(yīng)的會(huì)場(chǎng)終端前,還包括對(duì)混音信號(hào)進(jìn)行箝位處理的步驟。 所述步驟D中,確定的混音激活終端的總數(shù)為3個(gè)。
本發(fā)明的有益效果在于確定主席終端、發(fā)言人終端和各會(huì)場(chǎng)終端的
語音信號(hào)音量值由大至小的順序依序至少選出的一個(gè)會(huì)場(chǎng)終端作為混音激 活終端。因此在保證會(huì)議有序進(jìn)行的基礎(chǔ)上,降低了多點(diǎn)控制單元的處理 能力消耗,混音效果清晰。
圖1是本發(fā)明具體實(shí)施方式
的會(huì)議電視系統(tǒng)的系統(tǒng)框架示意圖; 圖2是本發(fā)明具體實(shí)施方式
的混音處理方法的流程圖。
具體實(shí)施例方式
下面對(duì)照附圖結(jié)合具體實(shí)施方式
對(duì)本發(fā)明作詳細(xì)說明。
如圖1所示,圖中示意性地展示了一個(gè)會(huì)議電視系統(tǒng),包括一個(gè)多點(diǎn)
控制單元和6個(gè)會(huì)場(chǎng)終端。需要了解的是,會(huì)場(chǎng)終端的數(shù)目并不構(gòu)成對(duì)本
發(fā)明的限定。
如圖2所示,本發(fā)明具體實(shí)施方式
的所述方法,包含如下步驟
1、 解碼各會(huì)場(chǎng)終端的語音碼流,獲得各會(huì)場(chǎng)終端語音信號(hào);
2、 將會(huì)場(chǎng)終端中的主席終端和發(fā)言人終端選定為混音激活終端;
3、 對(duì)主席終端和發(fā)言人終端外的會(huì)場(chǎng)終端,比較各會(huì)場(chǎng)終端的語音信 號(hào)音量值,按各會(huì)場(chǎng)終端的語音信號(hào)音量值由大至小的順序依序至少選出 一個(gè)會(huì)場(chǎng)終端作為混音激活終端;
4、 將步驟B和C中確定的混音激活終端的語音信號(hào)按預(yù)定原則進(jìn)行混 音,發(fā)送給相應(yīng)會(huì)場(chǎng)終端。
在步驟4中,混音激活終端的語音信號(hào)按預(yù)定原則進(jìn)行混音,發(fā)送給相應(yīng)會(huì)場(chǎng)終端采用如下方式
對(duì)混音激活終端,將除該混音激活終端外的其他混音激活終端的語音 信號(hào)進(jìn)行混音,發(fā)送給該混音激活終端;
對(duì)混音激活終端以外的其他會(huì)場(chǎng)終端,將全部混音激活終端的語音信 號(hào)進(jìn)行混音,發(fā)送給各其他會(huì)場(chǎng)終端。
下面以一實(shí)例對(duì)本發(fā)明作進(jìn)一步說明。
如圖1所示, 一會(huì)議電視系統(tǒng)中包括6個(gè)會(huì)場(chǎng)終端A會(huì)場(chǎng)終端、B 會(huì)場(chǎng)終端、C會(huì)場(chǎng)終端、D會(huì)場(chǎng)終端、E會(huì)場(chǎng)終端、F會(huì)場(chǎng)終端;在一采樣 周期,通常為20毫秒,所有說話的會(huì)場(chǎng)終端的聲音碼流傳送到多點(diǎn)控制單
元,多點(diǎn)控制單元對(duì)這些聲音碼流進(jìn)行解碼,得到每個(gè)會(huì)場(chǎng)終端的語音信 號(hào)。
定義所有允許加入混音的會(huì)場(chǎng)終端為混音候選終端,實(shí)際選定加入混 音的終端為混音激活終端。以上語音信號(hào)到達(dá)多點(diǎn)控制單元的終端即混音 候選終端。由于通?;煲艉蜻x終端的數(shù)目較多,如果全部加入混音,容易 造成混音效果不佳的缺陷。實(shí)驗(yàn)表明,混音三路的效果是在滿足同時(shí)發(fā)言 的條件下最好的選擇。
在一個(gè)有序進(jìn)行的會(huì)議過程中,通常應(yīng)該保證主席終端和發(fā)言人終端 的聲音能夠被其他會(huì)場(chǎng)聽見。因此,可以通過多點(diǎn)控制單元對(duì)主席終端和 發(fā)言人終端設(shè)定標(biāo)志位或優(yōu)先級(jí)的方式,將兩者選定為必選的混音激活終 端。對(duì)于主席終端和發(fā)言人終端之外的其他混音候選終端,比較各會(huì)場(chǎng)終 端的語音信號(hào)音量值,按該音量值由大至小的順序依序至少選出一個(gè)會(huì)場(chǎng) 終端作為混音激活終端。在混音三路的情況下,如果主席終端和發(fā)言人終 端不同,則選出的是聲音最大的會(huì)場(chǎng)終端作為主席終端和發(fā)言人終端之外
的另一個(gè)混音激活終端;如果主席終端和發(fā)言人終端是同一個(gè)會(huì)場(chǎng)終端, 則選出的是聲音最大和次大的兩個(gè)會(huì)場(chǎng)終端作為另外兩個(gè)混音激活終端。
確定了三個(gè)混音激活終端之后,將對(duì)三路語音信號(hào)按預(yù)定的原則進(jìn)行 混音處理,首先是語音信號(hào)的疊加,假設(shè)A會(huì)場(chǎng)終端為主席終端,B會(huì)場(chǎng) 終端為發(fā)言人終端,C會(huì)場(chǎng)終端為聲音最大終端,由于通常說話方并不需
要在混音中聽到自己的聲音,因此,疊加的原則是 對(duì)于主席終端A,疊加的語音信號(hào)是B+C;
對(duì)于發(fā)言人終端B,疊加的語音信號(hào)是A + C; 對(duì)于聲音最大終端C,疊加的語音信號(hào)是A + B;
對(duì)于其他會(huì)場(chǎng)終端D、 E、 F,疊加的語音信號(hào)是A+B+C。
疊加后的混音信號(hào)有可能音量過高,從而使得收聽效果不佳,因此還 需設(shè)定一個(gè)混音門限,當(dāng)疊加的語音信號(hào)超過該混音門限,則對(duì)疊加的語 音信號(hào)按照一定的收縮系數(shù)進(jìn)行收縮。收縮系數(shù)主要用于確定在多大的音 量下進(jìn)行何種程度的收縮,這可以通過實(shí)驗(yàn)進(jìn)行確定。
最后,對(duì)上述四種疊加語音信號(hào)進(jìn)行編碼,按上述的預(yù)定原則,發(fā)送 到相應(yīng)的會(huì)場(chǎng)終端。
進(jìn)一步的,在確定聲音最大的會(huì)場(chǎng)終端的過程中,可以采用延時(shí)處理 方式,通常在現(xiàn)有技術(shù)中確定聲音最大終端時(shí),采用在20毫秒中采樣聲音, 以采樣點(diǎn)中音量絕對(duì)值最大作為終端的音量參考值,此種方式可能因突如 其來的噪聲而造成聲音最大會(huì)場(chǎng)終端的誤判。因此,可連續(xù)多次采集各會(huì) 場(chǎng)終端的語音音量,計(jì)算各會(huì)場(chǎng)終端的連續(xù)多次語音音量采集值的平均值, 對(duì)各會(huì)場(chǎng)終端語音音量的所述平均值進(jìn)行比較,從而更準(zhǔn)確地確定聲音最 大的會(huì)場(chǎng)終端。
比較全混音方法和本發(fā)明方法對(duì)MCU的處理要求,如果會(huì)場(chǎng)終端數(shù)為 N,對(duì)于全混音方法,首先其解碼次數(shù)為N,然后對(duì)于每一終端,需要混合 其自身以外的其他會(huì)場(chǎng)終端的語音信號(hào),因此疊加次數(shù)和編碼次數(shù)同樣也 是N。當(dāng)N數(shù)目很大時(shí),將造成MCU的嚴(yán)重消耗。而對(duì)于本發(fā)明的方法, 其在N《4的情況下,與全混音方法相同,然而,在N〉4的時(shí)候,從上述說 明可以看出,其編碼次數(shù)仍然為N,但是,疊加次數(shù)和編碼次數(shù)都將降至 僅有4次,從而不僅大大降低了 MCU的處理消耗,同時(shí)實(shí)際的混音效果清 晰,易于辨認(rèn)。
與混音數(shù)個(gè)聲音最大的現(xiàn)有混音方法相比,首先,由于在實(shí)際會(huì)議過 程中,主席和發(fā)言人在相對(duì)長(zhǎng)的時(shí)間內(nèi)是基本固定的,不會(huì)頻繁變化,將 其作為必選混音激活終端,可以避免混音激活終端變化過快,此外,也避 免了可能出現(xiàn)主席和發(fā)言人被排除在混音激活終端之外的情況,這些都可 以保證會(huì)議的有序進(jìn)行,使得會(huì)議電視系統(tǒng)更加穩(wěn)定有效。
本發(fā)明通過確定主席終端、發(fā)言人終端和按其他會(huì)場(chǎng)終端的語音音量
由大至小的順序依序至少選出的一個(gè)會(huì)場(chǎng)終端作為混音激活終端,從而可 以滿足良好的混音需求,同時(shí)不但能隨時(shí)聽見每個(gè)會(huì)場(chǎng)的發(fā)言,而且能夠 保證不會(huì)有太多的會(huì)場(chǎng)混合在一起而造成聲音的雜亂。采用本發(fā)明的方法, 會(huì)議過程可以保持有序進(jìn)行,混音效果清晰易辨,多點(diǎn)控制單元的處理能 力消耗不高,整個(gè)會(huì)議電視系統(tǒng)運(yùn)行穩(wěn)定高效。
以上內(nèi)容是結(jié)合具體的優(yōu)選實(shí)施方式對(duì)本發(fā)明所作的進(jìn)一步詳細(xì)說 明,不能認(rèn)定本發(fā)明的具體實(shí)施只局限于這些說明。對(duì)于本發(fā)明所屬技術(shù) 領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若 干簡(jiǎn)單推演或替換,都應(yīng)當(dāng)視為屬于本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.一種會(huì)議電視系統(tǒng)的混音處理方法,包括至少一個(gè)會(huì)場(chǎng)終端,其特征在于,該方法包含如下步驟A、解碼各會(huì)場(chǎng)終端的語音碼流,獲得各會(huì)場(chǎng)終端語音信號(hào);B、將會(huì)場(chǎng)終端中的主席終端和發(fā)言人終端選定為混音激活終端;C、對(duì)主席終端和發(fā)言人終端外的會(huì)場(chǎng)終端,比較各會(huì)場(chǎng)終端的語音信號(hào)音量值,按各會(huì)場(chǎng)終端的語音信號(hào)音量值由大至小的順序依序至少選出一個(gè)會(huì)場(chǎng)終端作為混音激活終端;D、將步驟B和C中確定的混音激活終端的語音信號(hào)按預(yù)定原則進(jìn)行混音,發(fā)送給相應(yīng)會(huì)場(chǎng)終端。
2. 如權(quán)利要求1所述的混音處理方法,其特征在于,所述步驟D中, 混音激活終端的語音信號(hào)按預(yù)定原則進(jìn)行混音,發(fā)送給相應(yīng)會(huì)場(chǎng)終端是按 如下方式實(shí)現(xiàn)1) 對(duì)混音激活終端,將除該混音激活終端外的其他混音激活終端的語 音信號(hào)進(jìn)行混音,發(fā)送給該混音激活終端;2) 對(duì)混音激活終端以外的其他會(huì)場(chǎng)終端,將全部混音激活終端的語音 信號(hào)進(jìn)行混音,發(fā)送給各其他會(huì)場(chǎng)終端。
3. 如權(quán)利要求2所述的混音處理方法,其特征在于,所述步驟C中, 比較各會(huì)場(chǎng)終端語音信號(hào)音量值是采用延時(shí)處理方式連續(xù)多次采集各會(huì) 場(chǎng)終端的語音信號(hào)音量值,計(jì)算采集到的各會(huì)場(chǎng)終端的多個(gè)語音信號(hào)音量 值的平均值,對(duì)各會(huì)場(chǎng)終端語音信號(hào)音量值的所述平均值進(jìn)行比較。
4. 如權(quán)利要求1所述的混音處理方法,其特征在于,所述步驟C中, 比較各會(huì)場(chǎng)終端語音信號(hào)音量值是采用延時(shí)處理方式連續(xù)多次采集各會(huì) 場(chǎng)終端的語音信號(hào)音量值,計(jì)算采集到的各會(huì)場(chǎng)終端的多個(gè)語音信號(hào)音量 值的平均值,對(duì)各會(huì)場(chǎng)終端語音信號(hào)音量值的所述平均值進(jìn)行比較。
5. 如權(quán)利要求1至4任一項(xiàng)所述的混音處理方法,其特征在于,當(dāng)主 席終端和發(fā)言人終端為同一會(huì)場(chǎng)終端時(shí),所述步驟C中,對(duì)主席終端和發(fā) 言人終端外的會(huì)場(chǎng)終端,按各會(huì)場(chǎng)終端語音信號(hào)音量值由大至小的順序依 序至少選出兩個(gè)會(huì)場(chǎng)終端作為混音激活終端。
6. 如權(quán)利要求1至4任一項(xiàng)所述的混音處理方法,其特征在于,所述步驟D中,當(dāng)混音信號(hào)超過設(shè)定的混音門限時(shí),在將混音信號(hào)發(fā)送給相應(yīng) 的會(huì)場(chǎng)終端前,還包括對(duì)混音信號(hào)進(jìn)行箝位處理的步驟。
7.如權(quán)利要求1至4任一項(xiàng)所述的混音處理方法,其特征在于,所述 步驟D中,確定的混音激活終端的總數(shù)為3個(gè)。
全文摘要
本發(fā)明公開了一種會(huì)議電視系統(tǒng)的混音處理方法,包括至少一個(gè)會(huì)場(chǎng)終端,包含如下步驟A.解碼各會(huì)場(chǎng)終端的語音碼流,獲得各會(huì)場(chǎng)終端語音信號(hào);B.將會(huì)場(chǎng)終端中的主席終端和發(fā)言人終端選定為混音激活終端;C.對(duì)主席終端和發(fā)言人終端外的會(huì)場(chǎng)終端,比較各會(huì)場(chǎng)終端的語音信號(hào)音量值,按各會(huì)場(chǎng)終端的語音信號(hào)音量值由大至小的順序依序至少選出一個(gè)會(huì)場(chǎng)終端作為混音激活終端;D.將步驟B和C中確定的混音激活終端的語音信號(hào)按預(yù)定原則進(jìn)行混音,發(fā)送給相應(yīng)會(huì)場(chǎng)終端。本發(fā)明不但能隨時(shí)聽見每個(gè)會(huì)場(chǎng)的發(fā)言,而且能夠保證不會(huì)有太多的會(huì)場(chǎng)混合在一起而造成聲音的雜亂,實(shí)際混音效果清晰,易于辨認(rèn),而且也節(jié)約了多點(diǎn)控制單元的處理能力。
文檔編號(hào)H04N7/15GK101179693SQ20071007727
公開日2008年5月14日 申請(qǐng)日期2007年9月26日 優(yōu)先權(quán)日2007年9月26日
發(fā)明者庶 唐 申請(qǐng)人:深圳市麗視視訊科技有限公司;深圳市迪威視訊技術(shù)有限公司