本發(fā)明涉及多媒體會(huì)議技術(shù)領(lǐng)域,更為具體地說,特別是涉及一種實(shí)現(xiàn)多媒體會(huì)議的方法及裝置。
背景技術(shù):
多媒體會(huì)議是一種在網(wǎng)絡(luò)上開展的融合語音、視頻、數(shù)據(jù)于一體的會(huì)議,多媒體會(huì)議借助寬帶接入網(wǎng)絡(luò),為用戶提供語音、視頻、數(shù)據(jù)、即時(shí)消息等遠(yuǎn)距離傳輸?shù)亩嗝襟w業(yè)務(wù),通過統(tǒng)一的Web門戶,用戶即可創(chuàng)建多媒體會(huì)議。
但是現(xiàn)有技術(shù)的多媒體會(huì)議中,會(huì)議發(fā)言人與其它與會(huì)者經(jīng)常出現(xiàn)溝通不暢的情況,例如:當(dāng)會(huì)議發(fā)言人與其它與會(huì)者的母語不同或者會(huì)議發(fā)言人帶有方言時(shí),常常發(fā)生其它與會(huì)者無法準(zhǔn)確理解會(huì)議發(fā)言人的意思的情況;又如,在多媒體會(huì)議中,若其它與會(huì)者走神,錯(cuò)過會(huì)議發(fā)言人的部分發(fā)言,導(dǎo)致無法準(zhǔn)確理解會(huì)議發(fā)言人的發(fā)言內(nèi)容,大大降低了會(huì)議溝通的效果。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例中提供了一種實(shí)現(xiàn)多媒體會(huì)議的方法及裝置,以解決現(xiàn)有技術(shù)的多媒體會(huì)議中與會(huì)者無法準(zhǔn)確理解會(huì)議發(fā)言人的發(fā)言內(nèi)容的問題。
為了解決上述技術(shù)問題,本發(fā)明實(shí)施例公開了如下技術(shù)方案:
第一方面,本發(fā)明提供一種實(shí)現(xiàn)多媒體會(huì)議的方法,包括:
客戶端獲取本地與會(huì)者的發(fā)言語音信息,并將所述發(fā)言語音信息發(fā)送給多媒體會(huì)議服務(wù)器;
所述客戶端將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息;
所述客戶端將所述發(fā)言文字信息發(fā)送給多媒體會(huì)議服務(wù)器,以使所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給所述多媒體會(huì)議的其它與會(huì)者的客戶端;
其中,所述其它與會(huì)者是所述多媒體會(huì)議的與會(huì)者中除所述本地與會(huì)者之外的其它與會(huì)者。
結(jié)合第一方面,在第一方面的第一種可能的實(shí)現(xiàn)方式中,所述客戶端將所述發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息,包括:
接收多媒體會(huì)議服務(wù)器發(fā)送的發(fā)言通知消息,所述發(fā)言通知消息攜帶發(fā)言人的用戶身份識別信息ID,所述發(fā)言人由多媒體會(huì)議服務(wù)器根據(jù)參加多媒體會(huì)議的與會(huì)者發(fā)送的語音信息的能量,按照所述能量由大到小的順序依次確定出的前預(yù)設(shè)數(shù)量個(gè)與會(huì)者;
判斷所述發(fā)言通知消息所攜帶的用戶ID與所述本地與會(huì)者的用戶ID是否相同;
如果所述發(fā)言通知消息所攜帶的用戶ID與所述本地與會(huì)者的用戶ID相同,利用語音識別引擎將采集到的發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。
結(jié)合第一方面,在第一方面的第二種可能的實(shí)現(xiàn)方式中,所述客戶端獲取本地與會(huì)者的發(fā)言語音信息,包括:
所述客戶端判斷所述本地與會(huì)者是否具有發(fā)言權(quán)限;
如果所述本地與會(huì)者具有發(fā)言權(quán)限,則利用語音設(shè)備采集所述本地與會(huì)者的發(fā)言語音信息。
結(jié)合第一方面,在第一方面的第三種可能的實(shí)現(xiàn)方式中,所述客戶端獲取本地與會(huì)者的發(fā)言語音信息,包括:
所述客戶端向多媒體會(huì)議服務(wù)器發(fā)送發(fā)言請求消息,所述發(fā)言請求消息攜帶所述本地與會(huì)者的用戶ID,以使所述多媒體會(huì)議服務(wù)器將所述發(fā)言請求消息發(fā)送給主持人對應(yīng)的客戶端;
當(dāng)所述客戶端接收到所述多媒體會(huì)議服務(wù)器發(fā)送的語音設(shè)備開啟指令時(shí),利用語音設(shè)備采集所述本地與會(huì)者的發(fā)言語音信息;所述語音設(shè)備開啟指令由所述多媒體會(huì)議服 務(wù)器接收到主持人對應(yīng)的客戶端根據(jù)發(fā)言請求消息返回的發(fā)言響應(yīng)消息產(chǎn)生。
第二方面,本發(fā)明提供一種實(shí)現(xiàn)多媒體會(huì)議的方法,包括:
多媒體會(huì)議服務(wù)器獲取客戶端發(fā)送的發(fā)言語音信息及與所述發(fā)言語音信息相對應(yīng)的發(fā)言文字信息,所述發(fā)言文字信息由所述客戶端將獲得的發(fā)言語音信息利用語音識別引擎轉(zhuǎn)換得到;
所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息及發(fā)言文字信息發(fā)送給其它與會(huì)者對應(yīng)的客戶端,以使所述其它與會(huì)者對應(yīng)的客戶端展示所述發(fā)言語音信息及所述發(fā)言文字信息;
其中,所述其它與會(huì)者是參加所述多媒體會(huì)議的與會(huì)者中除發(fā)送所述發(fā)言語音信息及發(fā)言文字信息的與會(huì)者之外的與會(huì)者。
結(jié)合第二方面,在第二方面的第一種可能的實(shí)現(xiàn)方式中,還包括:
所述多媒體會(huì)議服務(wù)器檢測客戶端發(fā)送的語音信息的能量;
所述多媒體會(huì)議服務(wù)器按照所述能量由大到小的順序確定前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人;
所述多媒體會(huì)議服務(wù)器向所述發(fā)言人對應(yīng)的客戶端發(fā)送發(fā)言通知消息,所述發(fā)言通知消息攜帶所述發(fā)言人的用戶身份識別信息ID,以使所述發(fā)言人對應(yīng)的客戶端獲取所述發(fā)言人的發(fā)言語音信息并將所述發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。
結(jié)合第二方面,在第二方面的第二種可能的實(shí)現(xiàn)方式中,還包括:
所述多媒體會(huì)議服務(wù)器接收客戶端發(fā)送的發(fā)言請求消息,所述發(fā)言請求消息攜帶所述客戶端對應(yīng)的與會(huì)者的用戶ID;
所述多媒體會(huì)議服務(wù)器將所述發(fā)言請求消息發(fā)送給主持人對應(yīng)的客戶端,以使所述主持人對應(yīng)的客戶端根據(jù)所述發(fā)言請求消息判斷發(fā)送發(fā)言請求消息的與會(huì)者是否具有發(fā)言權(quán)限;
所述多媒體會(huì)議服務(wù)器接收所述主持人對應(yīng)的客戶端發(fā)送的發(fā)言響應(yīng)消息,并根據(jù)發(fā)言響應(yīng)消息向具有發(fā)言權(quán)限的與會(huì)者對應(yīng)的客戶端發(fā)送語音設(shè)備開啟指令,以使具有發(fā)言權(quán)限的與會(huì)者采集發(fā)言語音信息;
其中,所述發(fā)言響應(yīng)消息由所述主持人對應(yīng)的客戶端確定發(fā)送所述發(fā)言請求消息的與會(huì)者具有發(fā)言權(quán)限時(shí)產(chǎn)生。
第三方面,本發(fā)明提供一種實(shí)現(xiàn)多媒體會(huì)議的方法,包括:
客戶端獲取本地與會(huì)者的發(fā)言語音信息;
所述客戶端將所述發(fā)言語音信息發(fā)送給多媒體會(huì)議服務(wù)器,以使所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息,以及使所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給參加多媒體會(huì)議的其它與會(huì)者的客戶端
其中,所述其它與會(huì)者是所述多媒體會(huì)議的與會(huì)者中除所述本地與會(huì)者之外的其它與會(huì)者。
第四方面,本發(fā)明提供一種實(shí)現(xiàn)多媒體會(huì)議的方法,包括:
多媒體會(huì)議服務(wù)器獲取客戶端發(fā)送的發(fā)言語音信息;
所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息;
所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給其它與會(huì)者對應(yīng)的客戶端,以使所述其它與會(huì)者對應(yīng)的客戶端展示所述發(fā)言語音信息及所述發(fā)言文字信息;
其中,所述其它與會(huì)者是參加所述多媒體會(huì)議的與會(huì)者中除發(fā)送所述發(fā)言語音信息的與會(huì)者之外的與會(huì)者。
結(jié)合第四方面,在第四方面的第一種可能的實(shí)現(xiàn)方式中,所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息包括:
多媒體會(huì)議服務(wù)器檢測客戶端發(fā)送的語音信息的能量,按照所述能量由大到小的順 序依次確定出前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人;
利用語音識別引擎將確定出的發(fā)言人對應(yīng)的客戶端發(fā)送的發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。
第五方面,本發(fā)明提供一種實(shí)現(xiàn)多媒體會(huì)議的裝置,用于客戶端,包括:
獲取單元,用于獲取本地與會(huì)者的發(fā)言語音信息;
轉(zhuǎn)換單元,用于將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息;
發(fā)送單元,用于將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給多媒體會(huì)議服務(wù)器,以使所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給所述多媒體會(huì)議的其它與會(huì)者的客戶端;
其中,所述其它與會(huì)者是所述多媒體會(huì)議的與會(huì)者中除所述本地與會(huì)者之外的其它與會(huì)者。
結(jié)合第五方面,在第五方面的第一種可能的實(shí)現(xiàn)方式中,所述獲取單元包括:
第一判斷子單元,用于判斷所述本地與會(huì)者是否具有發(fā)言權(quán)限;
第一采集子單元,用于當(dāng)所述第一判斷單元判定所述本地與會(huì)者具有發(fā)言權(quán)限時(shí),則利用語音設(shè)備采集所述本地與會(huì)者的發(fā)言語音信息。
結(jié)合第五方面,在第五方面的第二種可能的實(shí)現(xiàn)方式中,所述轉(zhuǎn)換單元包括:
第一接收子單元,用于接收多媒體會(huì)議服務(wù)器發(fā)送的發(fā)言通知消息,所述發(fā)言通知消息攜帶發(fā)言人的用戶身份識別信息ID,所述發(fā)言人由多媒體會(huì)議服務(wù)器根據(jù)參加多媒體會(huì)議的與會(huì)者發(fā)送的語音信息的能量,按照所述能量由大到小的順序依次確定出的前預(yù)設(shè)數(shù)量個(gè)與會(huì)者;
第二判斷子單元,用于判斷所述發(fā)言通知消息所攜帶的用戶ID與所述本地與會(huì)者的用戶ID是否相同;
第二采集子單元,用于當(dāng)所述第二判斷子單元判定所述發(fā)言通知消息所攜帶的用戶ID與所述本地與會(huì)者的用戶ID相同時(shí),利用語音設(shè)備采集所述本地與會(huì)者的發(fā)言語音信息。
結(jié)合第五方面,在第五方面的第三種可能的實(shí)現(xiàn)方式中,所述獲取單元具體包括:
第一發(fā)送子單元,用于向多媒體會(huì)議服務(wù)器發(fā)送發(fā)言請求消息,所述發(fā)言請求消息攜帶所述本地與會(huì)者的用戶ID,以使所述多媒體會(huì)議服務(wù)器將所述發(fā)言請求消息發(fā)送給主持人對應(yīng)的客戶端;
第二接收子單元,用于接收所述多媒體會(huì)議服務(wù)器發(fā)送的語音設(shè)備開啟指令,
第三采集子單元,用于當(dāng)所述第二接收子單元接收到所述語音設(shè)備開啟指令時(shí),利用語音設(shè)備采集所述本地與會(huì)者的發(fā)言語音信息;所述語音設(shè)備開啟指令由所述多媒體會(huì)議服務(wù)器接收到主持人對應(yīng)的客戶端根據(jù)發(fā)言請求消息返回的發(fā)言響應(yīng)消息產(chǎn)生。
第六方面,本發(fā)明提供一種實(shí)現(xiàn)多媒體會(huì)議的裝置,用于多媒體會(huì)議服務(wù)器端,包括:
獲取單元,用于獲取客戶端發(fā)送的發(fā)言語音信息及與所述發(fā)言語音信息相對應(yīng)的發(fā)言文字信息,所述發(fā)言文字信息由所述客戶端將獲得的發(fā)言語音信息利用語音識別引擎轉(zhuǎn)換得到;
第一發(fā)送單元,用于將所述發(fā)言語音信息及發(fā)言文字信息發(fā)送給其它與會(huì)者對應(yīng)的客戶端,以使所述其它與會(huì)者對應(yīng)的客戶端展示所述發(fā)言語音信息及所述發(fā)言文字信息;
其中,所述其它與會(huì)者是參加所述多媒體會(huì)議的與會(huì)者中除發(fā)送所述發(fā)言語音信息及發(fā)言文字信息的與會(huì)者之外的與會(huì)者。
結(jié)合第六方面,在第六方面的第一種可能的實(shí)現(xiàn)方式中,還包括:
檢測單元,用于檢測客戶端發(fā)送的語音信息的能量;
確定單元,用于按照所述能量由大到小的順序確定前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人;
第二發(fā)送單元,用于向所述發(fā)言人對應(yīng)的客戶端發(fā)送發(fā)言通知消息,所述發(fā)言通知 消息攜帶所述發(fā)言人的用戶身份識別信息ID,以使所述發(fā)言人對應(yīng)的客戶端獲取所述發(fā)言人的發(fā)言語音信息并將所述發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。
結(jié)合第六方面,在第六方面的第二種可能的實(shí)現(xiàn)方式中,還包括:
第一接收單元,用于接收客戶端發(fā)送的發(fā)言請求消息,所述發(fā)言請求消息攜帶所述客戶端對應(yīng)的與會(huì)者的用戶ID;
第三發(fā)送單元,用于將所述發(fā)言請求消息發(fā)送給主持人對應(yīng)的客戶端,以使所述主持人對應(yīng)的客戶端根據(jù)所述發(fā)言請求消息判斷發(fā)送發(fā)言請求消息的與會(huì)者是否具有發(fā)言權(quán)限;
第二接收單元,用于接收所述主持人對應(yīng)的客戶端發(fā)送的發(fā)言響應(yīng)消息;所述發(fā)言響應(yīng)消息由所述主持人對應(yīng)的客戶端確定發(fā)送所述發(fā)言請求消息的與會(huì)者具有發(fā)言權(quán)限時(shí)產(chǎn)生;
第四發(fā)送單元,用于根據(jù)所述發(fā)言響應(yīng)消息向具有發(fā)言權(quán)限的與會(huì)者對應(yīng)的客戶端發(fā)送語音設(shè)備開啟指令。
第七方面,本發(fā)明提供一種實(shí)現(xiàn)多媒體會(huì)議的裝置,應(yīng)用于客戶端,包括:
獲取單元,用于獲取本地與會(huì)者的發(fā)言語音信息;
發(fā)送單元,用于將所述發(fā)言語音信息發(fā)送給多媒體會(huì)議服務(wù)器,以使所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息,以及使所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給參加多媒體會(huì)議的其它與會(huì)者的客戶端
其中,所述其它與會(huì)者是所述多媒體會(huì)議的與會(huì)者中除所述本地與會(huì)者之外的其它與會(huì)者。
第八方面,本發(fā)明提供一種實(shí)現(xiàn)多媒體會(huì)議的裝置,應(yīng)用于多媒體服務(wù)器中,包括:
獲取單元,用于獲取客戶端發(fā)送的發(fā)言語音信息;
轉(zhuǎn)換單元,用于將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息;
發(fā)送單元,用于將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給其它與會(huì)者對應(yīng)的客戶端,以使所述其它與會(huì)者對應(yīng)的客戶端展示所述發(fā)言語音信息及所述發(fā)言文字信息;
其中,所述其它與會(huì)者是參加所述多媒體會(huì)議的與會(huì)者中除發(fā)送所述發(fā)言語音信息的與會(huì)者之外的與會(huì)者。
結(jié)合第八方面,在第八方面的第一種可能的實(shí)現(xiàn)方式中,所述轉(zhuǎn)換單元包括:
檢測子單元,用于檢測客戶端發(fā)送的語音信息的能量,按照所述能量由大到小的順序依次確定出前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人;
轉(zhuǎn)換子單元,用于利用語音識別引擎將確定出的發(fā)言人發(fā)送的發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。
第九方面,提供一種實(shí)現(xiàn)多媒體會(huì)議系統(tǒng),包括:客戶端和多媒體會(huì)議服務(wù)器;
所述客戶端,用于獲取本地與會(huì)者的發(fā)言語音信息并發(fā)送給多媒體會(huì)議服務(wù)器;以及將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,并將所述發(fā)言文字信息發(fā)送給多媒體會(huì)議服務(wù)器;
所述多媒體會(huì)議服務(wù)器,用于將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給參加多媒體會(huì)議的其它與會(huì)者的客戶端;
其中,所述其它與會(huì)者是所述多媒體會(huì)議的與會(huì)者中除所述本地與會(huì)者之外的其它與會(huì)者。
結(jié)合第九方面,在第九方面的第一種可能的實(shí)現(xiàn)方式中,所述多媒體會(huì)議服務(wù)器,還用于檢測參加所述多媒體體會(huì)議的客戶端發(fā)送的語音信息的能量,按照所述能量由大到小的順序確定前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人,并向發(fā)言人對應(yīng)的客戶端發(fā)送發(fā)言通知消息,所述發(fā)言通知消息攜帶發(fā)言人的用戶身份識別信息ID;
所述客戶端,用于接收多媒體會(huì)議服務(wù)器發(fā)送的發(fā)言通知消息,并根據(jù)所述發(fā)言通知信息確定本地與會(huì)者是發(fā)言人時(shí),獲取本地與會(huì)者的發(fā)言語音信息并發(fā)送給所述多媒 體會(huì)議服務(wù)器,以及將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,并將所述發(fā)言文字信息發(fā)送給所述多媒體會(huì)議服務(wù)器。
第十方面,本發(fā)明還提供了一種實(shí)現(xiàn)多媒體會(huì)議系統(tǒng),包括:客戶端和多媒體會(huì)議服務(wù)器;
所述客戶端,用于獲取本地與會(huì)者的發(fā)言語音信息,并發(fā)送給多媒體會(huì)議服務(wù)器;
所述多媒體會(huì)議服務(wù)器,用于將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,并將所述發(fā)言語音信息及與所述發(fā)言語音信息對應(yīng)的發(fā)言文字信息發(fā)送給其它與會(huì)者對應(yīng)的客戶端;其中,所述其它與會(huì)者是參加所述多媒體會(huì)議的與會(huì)者中除發(fā)送所述發(fā)言語音信息的與會(huì)者之外的與會(huì)者;
所述其它與會(huì)者對應(yīng)的客戶端,還用于向用戶展示所述多媒體會(huì)議服務(wù)器發(fā)送的發(fā)言語音信息及發(fā)言文字信息。
結(jié)合第十方面,在第十方面的第一種可能的實(shí)現(xiàn)方式中,所述多媒體會(huì)議服務(wù)器,還用于檢測參加所述多媒體體會(huì)議的客戶端發(fā)送的語音信息的能量,按照所述能量由大到小的順序確定前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人,當(dāng)接收到的發(fā)言語音信息來自確定出的發(fā)言人時(shí),將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。
由以上技術(shù)方案可見,本發(fā)明實(shí)施例提供的實(shí)現(xiàn)多媒體會(huì)議的方案,發(fā)言人的客戶端能夠?qū)l(fā)言人的發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息,并通過多媒體會(huì)議服務(wù)器將該發(fā)言文字信息轉(zhuǎn)發(fā)給參加多媒體會(huì)議的與會(huì)者中除發(fā)言人之外的其它與會(huì)者對應(yīng)的客戶端,以便在所述其它與會(huì)者對應(yīng)的客戶端上顯示發(fā)言人的發(fā)言信息,避免了與會(huì)者只能夠接收發(fā)言語音信息,導(dǎo)致與會(huì)者無法準(zhǔn)確了解發(fā)言人的發(fā)言內(nèi)容的情況,從而提高了會(huì)議溝通的效果。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,對于本領(lǐng)域普通技術(shù)人員而言,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其它的附圖。
圖1是本發(fā)明實(shí)施例示出的一種多媒體會(huì)議的框圖;
圖2是本發(fā)明實(shí)施例示出的一種實(shí)現(xiàn)多媒體會(huì)議的方法流程圖;
圖3是本發(fā)明實(shí)施例示出的再一種實(shí)現(xiàn)多媒體會(huì)議的方法流程圖;
圖4是本發(fā)明實(shí)施例示出的另一種實(shí)現(xiàn)多媒體會(huì)議的方法流程圖;
圖5是本發(fā)明實(shí)施例示出的又一種實(shí)現(xiàn)多媒體會(huì)議的方法流程圖;
圖6是本發(fā)明實(shí)施例示出的另一種實(shí)現(xiàn)多媒體會(huì)議的方法流程圖;
圖7是本發(fā)明實(shí)施例的另一種實(shí)現(xiàn)多媒體會(huì)議的方法的流程圖;
圖8是本發(fā)明實(shí)施例示出的一種實(shí)現(xiàn)多媒體會(huì)議的裝置結(jié)構(gòu)示意圖;
圖9是本發(fā)明實(shí)施例示出的另一種實(shí)現(xiàn)多媒體會(huì)議的裝置結(jié)構(gòu)示意圖;
圖10是本發(fā)明實(shí)施例示出的一種獲取單元的結(jié)構(gòu)示意圖;
圖11是本發(fā)明實(shí)施例示出的一種轉(zhuǎn)換單元的結(jié)構(gòu)示意圖;
圖12是本發(fā)明實(shí)施例示出的又一種獲取單元的結(jié)構(gòu)示意圖;
圖13是本發(fā)明實(shí)施例示出的又一種實(shí)現(xiàn)多媒體會(huì)議裝置結(jié)構(gòu)示意圖;
圖14是本發(fā)明實(shí)施例示出的另一種實(shí)現(xiàn)多媒體會(huì)議的裝置結(jié)構(gòu)示意圖;
圖15是本發(fā)明實(shí)施例示出的再一種實(shí)現(xiàn)多媒體會(huì)議的裝置結(jié)構(gòu)示意圖;
圖16是本發(fā)明實(shí)施例示出的一種應(yīng)用于客戶端的實(shí)現(xiàn)多媒體會(huì)議的裝置的結(jié)構(gòu)示意圖;
圖17是本發(fā)明實(shí)施例示出的一種應(yīng)用于多媒體會(huì)議服務(wù)器的實(shí)現(xiàn)多媒體會(huì)議的裝置的結(jié)構(gòu)示意圖;
圖18是本發(fā)明實(shí)施例示出的一種實(shí)現(xiàn)多媒體會(huì)議的客戶端的結(jié)構(gòu)示意圖;
圖19是本發(fā)明實(shí)施例示出的一種多媒體會(huì)議服務(wù)器的結(jié)構(gòu)示意圖;
圖20是本發(fā)明實(shí)施例示出的另一種多媒體會(huì)議服務(wù)器的結(jié)構(gòu)示意圖;
圖21是本發(fā)明實(shí)施例示出的另一種實(shí)現(xiàn)多媒體會(huì)議的客戶端的結(jié)構(gòu)示意圖;
圖22是本發(fā)明實(shí)施例示出的另一種多媒體會(huì)議服務(wù)器的結(jié)構(gòu)示意圖。
具體實(shí)施方式
本發(fā)明實(shí)施例所提供的多媒體會(huì)議的方案,解決了背景技術(shù)中所介紹的與會(huì)者無法準(zhǔn)確了解發(fā)言人的發(fā)言信息,導(dǎo)致降低會(huì)議溝通的問題。
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明中的技術(shù)方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其它實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。
以上是本發(fā)明的核心思想,為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面結(jié)合附圖對本發(fā)明作進(jìn)一步的詳細(xì)說明。
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明實(shí)施例中的技術(shù)方案,并使本發(fā)明實(shí)施例的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖對本發(fā)明實(shí)施例中技術(shù)方案作進(jìn)一步詳細(xì)的說明。
圖1是對媒體會(huì)議系統(tǒng)的框圖,如圖1所示,該多媒體會(huì)議系統(tǒng)包括多個(gè)客戶端1和至少一個(gè)多媒體會(huì)議服務(wù)器2。其中,客戶端可以是個(gè)人PC機(jī)、筆記本電腦等終端。
客戶端獲取與會(huì)者的媒體流信息(例如,語音信息),并將媒體流信息上傳至多媒體會(huì)議服務(wù)器2,由多媒體會(huì)議服務(wù)器2將各個(gè)客戶端發(fā)送的媒體流進(jìn)行混音處理后發(fā)送給各個(gè)終端,從而使在地理上分散的用戶通過圖形、聲音等方式進(jìn)行交流。
圖2是本發(fā)明實(shí)施例示出的一種實(shí)現(xiàn)多媒體會(huì)議的方法的流程圖,該方法應(yīng)用于圖1所示的客戶端中,如圖2所示,該方法包括如下步驟:
S110,客戶端獲取本地與會(huì)者的發(fā)言語音信息,并將所述發(fā)言語音信息發(fā)送給多媒體會(huì)議服務(wù)器。
本地與會(huì)者是指與客戶端處于同一地理空間的與會(huì)者。例如,與會(huì)者A使用客戶端a參加多媒體會(huì)議,對于客戶端a而言,與會(huì)者A即與客戶端a對應(yīng)的本地與會(huì)者。
客戶端可以使用語音設(shè)備獲取本地與會(huì)者的發(fā)言語音信息。該語音設(shè)備可以包括集成于客戶端上的語音信息采集硬件和控制該語音信息采集硬件的操作軟件。其中,所述語音信息采集硬件能夠?qū)崿F(xiàn)語音采集、語音編碼及語音解碼等功能,例如,MIC。所述操作軟件可以查詢本地語音信息采集硬件的數(shù)量和名稱,還可以開啟、關(guān)閉或者靜音該語音采集硬件。
本實(shí)施例適用于討論式會(huì)議應(yīng)用場景,每個(gè)與會(huì)者都可以發(fā)言,這樣,每個(gè)客戶端都能夠獲得與自身對應(yīng)的與會(huì)者的發(fā)言語音信息。如果客戶端通過語音設(shè)備獲取與會(huì)者的發(fā)言語音信息,則每個(gè)與會(huì)者對應(yīng)的語音設(shè)備都處于開啟狀態(tài)。
S120,客戶端將發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。
客戶端利用語音識別技術(shù)將獲得的本地發(fā)言人的發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息??蛻舳双@得的本地與會(huì)者的發(fā)言語音信息能量相對較強(qiáng),因此由發(fā)言人對應(yīng)的客戶端將發(fā)言語音信息轉(zhuǎn)換發(fā)言文字信息的準(zhǔn)確率較高。同時(shí),此種方式不需要其它與會(huì)者對應(yīng)的客戶端將發(fā)言人的發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息,節(jié)省了其它與會(huì)者對應(yīng)的客戶端的資源。
可選地,發(fā)言人對應(yīng)的客戶端還可以存儲(chǔ)發(fā)言文字信息,以便利用所述發(fā)言文字信息生成會(huì)議紀(jì)要。同理,參加多媒體會(huì)議的其它與會(huì)者對應(yīng)的客戶端也可以存儲(chǔ)接收到的發(fā)言文字信息,以便根據(jù)所述發(fā)言文字信息生成會(huì)議紀(jì)要。此外,發(fā)言人對應(yīng)的客戶端也可以顯示所述發(fā)言文字信息,從而方便發(fā)言人查看自己的發(fā)言內(nèi)容。
S130,客戶端將所述發(fā)言文字信息發(fā)送給多媒體會(huì)議服務(wù)器,以使所述多媒體會(huì)議 服務(wù)器將所述發(fā)言語音信息及發(fā)言文字信息發(fā)送給其它與會(huì)者對應(yīng)的客戶端。
所述其它與會(huì)者是參加多媒體會(huì)議的全部與會(huì)者中除發(fā)言人之外的其它與會(huì)者。
多媒體會(huì)議服務(wù)器將接收到發(fā)言語音信息及發(fā)言文字信息發(fā)送給參加本次多媒體會(huì)議的其它與會(huì)者對應(yīng)的客戶端。其它與會(huì)者對應(yīng)的客戶端展示接收到的發(fā)言語音信息及發(fā)言文字信息,從而有助于與會(huì)者快速理解發(fā)言人的發(fā)言內(nèi)容。
例如,參加本地多媒體會(huì)議的與會(huì)者包括A、B、C、D和E,其中,與會(huì)者A是發(fā)言人,則與會(huì)者B、C、D、E是其它與會(huì)者。多媒體會(huì)議服務(wù)器將與會(huì)者A的發(fā)言語音信息和發(fā)言文字信息發(fā)送給B、C、D、E。
可以在客戶端和多媒體會(huì)議服務(wù)器上都集成T.120協(xié)議標(biāo)準(zhǔn),從而在客戶端和多媒體會(huì)議服務(wù)器之間實(shí)現(xiàn)發(fā)言語音信息及發(fā)言文字信息的收發(fā)功能。其中,T.120標(biāo)準(zhǔn)包括T.120-T.127等一系列協(xié)議,該協(xié)議標(biāo)準(zhǔn)能夠?qū)崿F(xiàn)客戶端之間以及客戶端與多媒體會(huì)議服務(wù)器之間的信息傳輸?shù)目煽啃?,同時(shí),能夠提供點(diǎn)到多點(diǎn)的數(shù)據(jù)分發(fā)服務(wù),并選擇傳輸效率最佳的傳輸路徑傳輸數(shù)據(jù)。
本實(shí)施例示出的實(shí)現(xiàn)多媒體會(huì)議的方法,由客戶端獲取本地與會(huì)者的發(fā)言語音信息,并將發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。然后將發(fā)言語音信息及發(fā)言文字信息發(fā)送給多媒體會(huì)議服務(wù)器,再由多媒體會(huì)議服務(wù)器轉(zhuǎn)發(fā)給參加多媒體會(huì)議的其它與會(huì)者對應(yīng)的客戶端,其它與會(huì)者對應(yīng)的客戶端展示接收到的發(fā)言語音信息及發(fā)言文字信息。利用本發(fā)明提供的實(shí)現(xiàn)多媒體會(huì)議的方法,與會(huì)者既能夠聽到發(fā)言人的發(fā)言語音信息又能夠看到對應(yīng)的發(fā)言文字信息,這樣,與會(huì)者能夠結(jié)合發(fā)言文字信息和發(fā)言語音信息準(zhǔn)確理解發(fā)言人的發(fā)言內(nèi)容,因此提高了多媒體會(huì)議的溝通效果。
在一種應(yīng)用場景中,所有與會(huì)者都允許發(fā)言,例如,討論式會(huì)議。但是,如果將所有與會(huì)者發(fā)出的語音信息都轉(zhuǎn)換成相應(yīng)的文字信息,將會(huì)造成很多與會(huì)議無關(guān)的語音轉(zhuǎn)換成文字,并造成很多與會(huì)議無關(guān)的文字顯示給與會(huì)者,對與會(huì)者造成干擾。鑒于上述應(yīng)用場景,可以將語音能量較大的與會(huì)者確定為發(fā)言人,并將發(fā)言人的發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,其它語音能量較小的與會(huì)者的語音內(nèi)容被忽略。
圖3是本發(fā)明實(shí)施例示出的另一種實(shí)現(xiàn)多媒體會(huì)議方法的流程圖,該實(shí)施例適用于與會(huì)者人數(shù)較多,與會(huì)者均能發(fā)言的應(yīng)用場景。如圖3所示,該方法可以包括以下步驟:
S210,多媒體會(huì)議服務(wù)器檢測客戶端發(fā)送的語音信息的能量。
參加多媒體會(huì)議的客戶端將獲得的與會(huì)者的語音信息發(fā)送給多媒體會(huì)議服務(wù)器,由多媒體會(huì)議服務(wù)器檢測接收到的語音信息的能量。
本實(shí)施例中,檢測語音信息的能量可以由多媒體會(huì)議服務(wù)器中的語音會(huì)議橋?qū)崿F(xiàn)。所述語音會(huì)議橋用于提供服務(wù)器側(cè)的語音會(huì)場,將各發(fā)言人的語音混音后送給每個(gè)與會(huì)者。
S220,多媒體會(huì)議服務(wù)器按照語音信息的能量由大到小的順序,確定前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人。
多媒體會(huì)議服務(wù)器通過檢測參加多媒體會(huì)議的與會(huì)者發(fā)送的語音信息的能量,按照能量由大到小進(jìn)行排序并依次確定出前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人。例如,所述預(yù)設(shè)數(shù)量可以是一個(gè),即將語音信息的能量最大的與會(huì)者確定為發(fā)言人;或者,所述預(yù)設(shè)數(shù)量可以是兩個(gè),即將語音信息的能量最大的兩個(gè)與會(huì)者確定為發(fā)言人。
需要說明的是,此種應(yīng)用場景下,如果發(fā)言人在不同時(shí)刻發(fā)出語音的能量不同,多媒體會(huì)議服務(wù)器根據(jù)語音信息的能量確定出的發(fā)言人可能不同。
S230,多媒體會(huì)議服務(wù)器向參加多媒體會(huì)議的與會(huì)者發(fā)送發(fā)言通知消息,所述發(fā)言通知消息攜帶發(fā)言人的用戶ID(Identification,身份標(biāo)識)。
其中,多媒體會(huì)議服務(wù)器可以通過廣播的形式將發(fā)言通知消息發(fā)送給所有參加多媒體會(huì)議的與會(huì)者的客戶端,并由與會(huì)者的客戶端根據(jù)發(fā)言通知消息中的用戶ID判斷本客戶端所對應(yīng)的與會(huì)者是否為發(fā)言人;也可以將發(fā)言通知消息一對一發(fā)送給該用戶ID所對 應(yīng)的與會(huì)者的客戶端,由其來根據(jù)用戶ID進(jìn)行判斷。
與會(huì)者的客戶端接收多媒體會(huì)議服務(wù)器的發(fā)言通知消息,由于該發(fā)言通知消息中含有用戶ID,與會(huì)者的客戶端可將該用戶ID與自身的用戶ID進(jìn)行比較,從而判斷自身客戶端所對應(yīng)的與會(huì)者是否是發(fā)言人。
S240,當(dāng)客戶端確定所述發(fā)言通知消息所攜帶的用戶ID與自身的用戶ID相同時(shí),確定本地與會(huì)者為發(fā)言人。
S250,發(fā)言人對應(yīng)的客戶端獲取發(fā)言人的發(fā)言語音信息,并將該發(fā)言語音信息發(fā)送給多媒體會(huì)議服務(wù)器。
S260,發(fā)言人對應(yīng)的客戶端將所述發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。
S270,發(fā)言人對應(yīng)的客戶端將所述發(fā)言文字信息發(fā)送給多媒體會(huì)議服務(wù)器。
S280,多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給其它與會(huì)者對應(yīng)的客戶端。
S290,所述其它與會(huì)者對應(yīng)的客戶端展示所述發(fā)言語音信息及所述發(fā)言文字信息。
本實(shí)施例提供的實(shí)現(xiàn)多媒體會(huì)議的方法,多媒體會(huì)議服務(wù)器檢測各個(gè)與會(huì)者發(fā)出語音信息的能量,并按照能量由大到小的順序,確定前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人,即只將能量最大的預(yù)設(shè)數(shù)量個(gè)與會(huì)者的發(fā)言內(nèi)容轉(zhuǎn)換成對應(yīng)的文字信息。該方法能夠避免將很多與會(huì)議無關(guān)的語音轉(zhuǎn)換成文字,導(dǎo)致很多與會(huì)議無關(guān)的文字顯示給與會(huì)者,對與會(huì)者造成的干擾現(xiàn)象出現(xiàn)。
在另一種應(yīng)用場景中,只需要主持人和主講人的發(fā)言內(nèi)容轉(zhuǎn)換成對應(yīng)的文字信息,忽略其它與會(huì)者的發(fā)言內(nèi)容。
圖4是本發(fā)明實(shí)施例示出的另一種實(shí)現(xiàn)多媒體會(huì)議的方法流程圖。本實(shí)施例中,只將具有發(fā)言權(quán)限的發(fā)言人的發(fā)言內(nèi)容轉(zhuǎn)換成文字信息。如圖4所示,該方法包括以下步驟:
S310,客戶端判斷本地與會(huì)者是否具有發(fā)言權(quán)限;如果所述本地與會(huì)者具有發(fā)言權(quán)限,則執(zhí)行S320;否則,結(jié)束本次流程。
在會(huì)議具有主持人和固定的主講人的應(yīng)用場景中,通常主講人和主持人具有發(fā)言權(quán)限。判斷與會(huì)者是否具有發(fā)言權(quán)限可以包括判斷與會(huì)者的身份屬性是否具有主講人權(quán)限或主持人權(quán)限。
S320,客戶端獲取本地與會(huì)者的發(fā)言語音信息,并將該發(fā)言語音信息發(fā)送給多媒體會(huì)議服務(wù)器。
S330,客戶端將所述發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。
其中,客戶端可以內(nèi)置語音識別引擎,客戶端利用語音識別引擎將本地與會(huì)者的發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。
S340,客戶端將發(fā)言文字信息發(fā)送給多媒體會(huì)議服務(wù)器。
客戶端可以在獲得本地與會(huì)者的發(fā)言語音信息后,就立即將所述發(fā)言語音信息發(fā)送給多媒體會(huì)議服務(wù)器,以使多媒體會(huì)議服務(wù)器及時(shí)將發(fā)言人的發(fā)言語音信息轉(zhuǎn)發(fā)給其它與會(huì)者,保證語音信息傳輸?shù)膶?shí)時(shí)性。當(dāng)然,如果發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息所需時(shí)間很短,一般在毫秒級,則可以將發(fā)言語音信息和發(fā)言文字信息一起發(fā)送給多媒體會(huì)議服務(wù)器,從而使其它與會(huì)者對應(yīng)的客戶端接播放發(fā)言語音信息和顯示的發(fā)言文字信息同步進(jìn)行。
S350,多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息及發(fā)言文字信息發(fā)送給其它與會(huì)者對應(yīng)的客戶端。
S360,其它與會(huì)者對應(yīng)的客戶端展示所述發(fā)言語音信息及所述發(fā)言文字信息。
本實(shí)施例提供的實(shí)現(xiàn)多媒體會(huì)議的方法,只將具有發(fā)言權(quán)限的與會(huì)者的發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,而不是將所有與會(huì)者的發(fā)言內(nèi)容轉(zhuǎn)換成對應(yīng)的文字信息。利用該方法能夠避免將多媒體會(huì)議中與會(huì)者發(fā)出的與會(huì)議無關(guān)的語音內(nèi)容轉(zhuǎn)換成相應(yīng)的文字 信息轉(zhuǎn)發(fā)給其它與會(huì)者,進(jìn)而避免其它與會(huì)者的客戶端顯示過多不重要的文字信息對與會(huì)者造成干擾的現(xiàn)象發(fā)生。
在又一種應(yīng)用場景中,只有主持人和主講人能夠發(fā)言,其它與會(huì)者不能發(fā)言,其它與會(huì)者的語音設(shè)備被關(guān)閉,且與會(huì)者自己不能開啟語音設(shè)備。當(dāng)與會(huì)者需要發(fā)言時(shí),與會(huì)者可以請求主持人開啟該與會(huì)者的語音設(shè)備。
圖5是本發(fā)明實(shí)施例示出的又一種實(shí)現(xiàn)多媒體會(huì)議的方法流程圖。該方法應(yīng)用于主持人指定發(fā)言人的應(yīng)用場景,該方法包括以下步驟:
S410,客戶端向多媒體會(huì)議服務(wù)器發(fā)送發(fā)言請求消息,所述發(fā)言請求消息攜帶所述客戶端對應(yīng)與會(huì)者的用戶身份識別ID。
除主持人和主講人之外的其它與會(huì)者需要發(fā)言時(shí),由該與會(huì)者對應(yīng)的客戶端向多媒體會(huì)議服務(wù)器發(fā)送發(fā)言請求消息。所述發(fā)言請求消息攜帶該與會(huì)者的用戶ID。
S420,多媒體會(huì)議服務(wù)器將該發(fā)言請求消息轉(zhuǎn)發(fā)給主持人所對應(yīng)的客戶端。
S430,主持人對應(yīng)的客戶端根據(jù)發(fā)言請求消息確定允許所述與會(huì)者發(fā)言時(shí),向多媒體會(huì)議服務(wù)器發(fā)送發(fā)言響應(yīng)消息。
主持人對應(yīng)的客戶端接收到所述發(fā)言請求消息后,根據(jù)發(fā)言請求消息攜帶的用戶ID判斷是否允許該與會(huì)者發(fā)言,如果允許該與會(huì)者發(fā)言,則產(chǎn)生發(fā)言響應(yīng)消息并發(fā)送給多媒體會(huì)議服務(wù)器。該發(fā)言響應(yīng)消息中也可以攜帶該與會(huì)者的用戶ID,以方便多媒體會(huì)議服務(wù)器識別該與會(huì)者。
其中,主持人對應(yīng)的客戶端可以根據(jù)預(yù)先設(shè)定的與會(huì)者的身份屬性判斷是否允許與會(huì)者發(fā)言。
S440,多媒體會(huì)議服務(wù)器根據(jù)所述發(fā)言響應(yīng)消息,生成語音設(shè)備開啟指令,并向發(fā)言人對應(yīng)的客戶端發(fā)送所述語音設(shè)備開啟指令。
多媒體會(huì)議服務(wù)器根據(jù)接收到發(fā)言響應(yīng)消息生成語音設(shè)備開啟指令,該語音設(shè)備開啟指令用于控制主持人允許發(fā)言的與會(huì)者對應(yīng)的語音設(shè)備開啟。
S450,當(dāng)發(fā)言人對應(yīng)的客戶端接收到所述語音設(shè)備開啟指令時(shí),利用語音設(shè)備獲取發(fā)言人的發(fā)言語音信息,并將該發(fā)言語音信息發(fā)送給多媒體會(huì)議服務(wù)器。
S460,發(fā)言人對應(yīng)的客戶端將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。
S470,發(fā)言人對應(yīng)的客戶端將發(fā)言文字信息發(fā)送給多媒體會(huì)議服務(wù)器。
S480,多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息和發(fā)言文字信息發(fā)送給除發(fā)言人之外的其它與會(huì)者對應(yīng)的客戶端。
S490,所述其它與會(huì)者對應(yīng)的客戶端展示所述發(fā)言語音信息及所述發(fā)言文字信息。
本實(shí)施例提供的實(shí)現(xiàn)多媒體會(huì)議的方法,除主持人或主講人之外的其它與會(huì)者需要發(fā)言時(shí),向主持人的客戶端發(fā)送發(fā)言請求消息,由主持人根據(jù)所述發(fā)言請求消息判斷是否允許所述與會(huì)者發(fā)言,若允許所述與會(huì)者發(fā)言,則向多媒體會(huì)議服務(wù)器發(fā)送允許所述與會(huì)者發(fā)言的發(fā)言響應(yīng)消息,多媒體會(huì)議服務(wù)器根據(jù)該發(fā)言響應(yīng)消息產(chǎn)生語音設(shè)備開啟指令,控制所述與會(huì)者對應(yīng)的語音設(shè)備開啟。由該與會(huì)者對應(yīng)的語音設(shè)備獲取該與會(huì)者的發(fā)言語音信息,由該與會(huì)者對應(yīng)的客戶端將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。該方法適用于正式會(huì)議或級別較高的會(huì)議場景,擴(kuò)大了多媒體會(huì)議實(shí)現(xiàn)方法的適用范圍。
圖6是本發(fā)明實(shí)施例示出的另一種實(shí)現(xiàn)多媒體會(huì)議的方法流程圖,如圖6所示,該方法包括以下步驟:
S510,客戶端獲取本地與會(huì)者的發(fā)言語音信息,并將該發(fā)言語音信息發(fā)送給多媒體會(huì)議服務(wù)器。
客戶端利用語音設(shè)備采集與會(huì)者的發(fā)言語音信息。
S520,多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。
多媒體會(huì)議服務(wù)器在將各個(gè)與會(huì)者發(fā)送的語音信息進(jìn)行混音之前,將接收到的發(fā)言語音信息利用語音識別引擎轉(zhuǎn)換為發(fā)言文字信息。
在本發(fā)明的一個(gè)實(shí)施例中,全部參加多媒體會(huì)議的與會(huì)者可以自由發(fā)言,任意一個(gè)與會(huì)者都能夠?qū)@得的本地與會(huì)者的發(fā)言語音信息發(fā)送給多媒體會(huì)議服務(wù)器。相應(yīng)地,多媒體會(huì)議服務(wù)器可以將任意一個(gè)與會(huì)者的發(fā)言文字信息轉(zhuǎn)換成發(fā)言文字信息。
在本發(fā)明的另一個(gè)實(shí)施例中,只有主持人和主講人可以發(fā)言,只有主持人和主講人可以將獲得的發(fā)言語音信息發(fā)送給多媒體會(huì)議服務(wù)器。多媒體會(huì)議服務(wù)器將接收到的發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。
S530,多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息及對應(yīng)的發(fā)言文字信息發(fā)送給參加多媒體會(huì)議的其它與會(huì)者的客戶端。所述其它與會(huì)者是所述多媒體會(huì)議的與會(huì)者中除所述本地與會(huì)者之外的其它與會(huì)者。
S540,所述其它與會(huì)者的客戶端展示所述發(fā)言語音信息及對應(yīng)的發(fā)言文字信息。
本實(shí)施例提供的實(shí)現(xiàn)多媒體會(huì)議的方法,與會(huì)者的客戶端獲得發(fā)言語音信息后發(fā)送給多媒體會(huì)議服務(wù)器,由多媒體會(huì)議服務(wù)器將發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,然后,再將發(fā)言語音信息及對應(yīng)的發(fā)言文字信息發(fā)送給參加多媒體會(huì)議的其它與會(huì)者對應(yīng)的客戶端。這樣,參加多媒體會(huì)議的與會(huì)者既能夠聽到發(fā)言人的發(fā)言語音信息,又能夠看到相應(yīng)的發(fā)言文字信息,能夠準(zhǔn)確理解發(fā)言人的發(fā)言內(nèi)容,提高多媒體會(huì)議的溝通效果。該方法由多媒體會(huì)議服務(wù)器將發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,不需要在各個(gè)客戶端上集成語音識別引擎,降低了客戶端的生產(chǎn)成本。
圖7是本發(fā)明實(shí)施例的另一種實(shí)現(xiàn)多媒體會(huì)議的方法的流程圖,本實(shí)施例根據(jù)與會(huì)者法語音信息的能量大小,確定能量最大的預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人,并將發(fā)言人的發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。如圖7所示,該方法可以包括以下步驟:
S610,多媒體會(huì)議服務(wù)器檢測客戶端發(fā)送的語音信息的能量。
S620,多媒體會(huì)議服務(wù)器按照語音信息的能量由大到小的順序,確定前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人。
S630,客戶端獲取本地與會(huì)者的發(fā)言語音信息并將該發(fā)言語音信息發(fā)送給多媒體會(huì)議服務(wù)器。
S640,多媒體會(huì)議服務(wù)器將確定出的發(fā)言人對應(yīng)的客戶端發(fā)送的發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。
S650,多媒體會(huì)議服務(wù)器將發(fā)言人對應(yīng)的客戶端發(fā)送的發(fā)言語音信息及對應(yīng)的發(fā)言文字信息,發(fā)送給參加多媒體會(huì)議的其它與會(huì)者的客戶端。
所述其它與會(huì)者是所述多媒體會(huì)議的與會(huì)者中除所述本地與會(huì)者之外的其它與會(huì)者。
S660,其它與會(huì)者的客戶端展示接收到的發(fā)言語音信息和對應(yīng)的發(fā)言文字信息。
本實(shí)施例提供的實(shí)現(xiàn)多媒體會(huì)議的方法,多媒體會(huì)議服務(wù)器檢測各個(gè)與會(huì)者發(fā)出語音信息的能量,并按照能量由大到小的順序,確定前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人。多媒體會(huì)議服務(wù)器只將確定出的發(fā)言人的發(fā)言內(nèi)容轉(zhuǎn)換成對應(yīng)的文字信息。該方法能夠避免將很多與會(huì)議無關(guān)的語音轉(zhuǎn)換成文字,導(dǎo)致很多與會(huì)議無關(guān)的文字顯示給與會(huì)者,對與會(huì)者造成的干擾現(xiàn)象出現(xiàn)。
圖8是本發(fā)明實(shí)施例示出的一種實(shí)現(xiàn)多媒體會(huì)議的裝置結(jié)構(gòu)示意圖,如圖8所示,該實(shí)現(xiàn)多媒體會(huì)議的裝置,用于客戶端,包括:獲取單元110、轉(zhuǎn)換單元120和發(fā)送單元130。
獲取單元110,用于獲取本地的發(fā)言語音信息。
本地與會(huì)者是指與客戶端處于同一地理空間的與會(huì)者,例如,與會(huì)者A使用客戶端a參加多媒體會(huì)議,對于客戶端a而言,與會(huì)者A即與客戶端a對應(yīng)的本地與會(huì)者。
所述獲取單元110可以使用語音設(shè)備獲取本地與會(huì)者的發(fā)言語音信息。該語音設(shè)備可以包括集成于客戶端上的語音信息采集硬件和控制該語音信息采集硬件的操作軟件。其中,所述語音信息采集硬件能夠?qū)崿F(xiàn)語音采集、語音編碼及語音解碼等功能。所述操 作軟件可以查詢本地語音信息采集硬件的數(shù)量和名稱,還可以開啟、關(guān)閉或者靜音該語音采集硬件。
本實(shí)施例中的實(shí)現(xiàn)多媒體的裝置可以適用于討論式會(huì)議應(yīng)用場景,每個(gè)與會(huì)者都可以發(fā)言,這樣,每個(gè)客戶端都能夠獲得與自身對應(yīng)的與會(huì)者的發(fā)言語音信息。如果客戶端通過語音設(shè)備獲取與會(huì)者的發(fā)言語音信息,則每個(gè)與會(huì)者對應(yīng)的語音設(shè)備都處于開啟狀態(tài)。
轉(zhuǎn)換單元120,用于將發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。
其中,轉(zhuǎn)換單元120利用語音識別技術(shù)將獲取的本地發(fā)言人的發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。
客戶端獲得的本地與會(huì)者的發(fā)言語音信息能量相對較強(qiáng),因此由發(fā)言人對應(yīng)的客戶端將發(fā)言語音信息轉(zhuǎn)換發(fā)言文字信息的準(zhǔn)確率較高。同時(shí),此種方式不需要其它與會(huì)者對應(yīng)的客戶端將發(fā)言人的發(fā)言語音信息轉(zhuǎn)換發(fā)言文字信息,節(jié)省了其它與會(huì)者對應(yīng)的客戶端的資源。
發(fā)送單元130,用于將發(fā)言語音信息及發(fā)言文字信息發(fā)送給多媒體會(huì)議服務(wù)器,以使所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息及發(fā)言文字信息發(fā)送給其它與會(huì)者對應(yīng)的客戶端。
其中,所述其它與會(huì)者是參加多媒體會(huì)議的全部與會(huì)者中除發(fā)言人之外的其它與會(huì)者。
客戶端將發(fā)言語音信息及發(fā)言文字信息發(fā)送多媒體會(huì)議服務(wù)器,以使多媒體會(huì)議服務(wù)器將其發(fā)送給參加本次多媒體會(huì)議的其它與會(huì)者對應(yīng)的客戶端,最終使得其它與會(huì)者對應(yīng)的客戶端展示接收到的發(fā)言語音信息及發(fā)言文字信息,從而有助于與會(huì)者快速理解發(fā)言人的發(fā)言內(nèi)容。
例如,參加本地多媒體會(huì)議的與會(huì)者包括A、B、C、D和E,其中,與會(huì)者A是發(fā)言人,則與會(huì)者B、C、D、E是其它與會(huì)者。多媒體會(huì)議服務(wù)器將與會(huì)者A的發(fā)言語音信息和發(fā)言文字信息發(fā)送給B、C、D、E。
可以在客戶端和多媒體會(huì)議服務(wù)器上都集成T.120協(xié)議標(biāo)準(zhǔn),從而在客戶端和多媒體會(huì)議服務(wù)器之間實(shí)現(xiàn)發(fā)言語音信息及發(fā)言文字信息的收發(fā)功能。其中,T.120標(biāo)準(zhǔn)包括T.120-T.127等一系列協(xié)議,該協(xié)議標(biāo)準(zhǔn)能夠?qū)崿F(xiàn)客戶端之間以及客戶端與多媒體會(huì)議服務(wù)器之間的信息傳輸?shù)目煽啃?,同時(shí),能夠提供點(diǎn)到多點(diǎn)的數(shù)據(jù)分發(fā)服務(wù),并選擇傳輸效率最佳的傳輸路徑傳輸數(shù)據(jù)。
該實(shí)施例示出的實(shí)現(xiàn)多媒體會(huì)議的裝置,由獲取單元獲取本地與會(huì)者的發(fā)言語音信息,并通過轉(zhuǎn)換單元將發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。然后通過發(fā)送單元將發(fā)言語音信息及發(fā)言文字信息發(fā)送給多媒體會(huì)議服務(wù)器,再由多媒體會(huì)議服務(wù)器轉(zhuǎn)發(fā)給參加多媒體會(huì)議的其它與會(huì)者對應(yīng)的客戶端,其它與會(huì)者對應(yīng)的客戶端展示接收到的發(fā)言語音信息及發(fā)言文字信息。利用本發(fā)明提供的實(shí)現(xiàn)多媒體會(huì)議的裝置,與會(huì)者既能夠聽到發(fā)言人的發(fā)言語音信息又能夠看到對應(yīng)的發(fā)言文字信息,這樣,與會(huì)者能夠結(jié)合發(fā)言文字信息和發(fā)言語音信息準(zhǔn)確理解發(fā)言人的發(fā)言內(nèi)容,因此提高了多媒體會(huì)議的溝通效果。
圖9是本發(fā)明實(shí)施例另一種實(shí)現(xiàn)多媒體會(huì)議的裝置的結(jié)構(gòu)示意圖,該裝置在圖8所示實(shí)施例的基礎(chǔ)上還可以包括:顯示單元140和存儲(chǔ)單元150。
顯示單元140,用于顯示發(fā)言文字信息。
存儲(chǔ)單元150,用于存儲(chǔ)所述發(fā)言文字信息。
可選地,通過增加存儲(chǔ)單元150,發(fā)言人對應(yīng)的客戶端還可以存儲(chǔ)發(fā)言文字信息,以便利用所述發(fā)言文字信息生成會(huì)議紀(jì)要。同理,參加多媒體會(huì)議的其它與會(huì)者對應(yīng)的客戶端也可以存儲(chǔ)接收到的發(fā)言文字信息,以便根據(jù)所述發(fā)言文字信息生成會(huì)議紀(jì)要。此外,發(fā)言人對應(yīng)的客戶端也可以顯示所述發(fā)言文字信息,從而方便發(fā)言人查看自己的發(fā)言內(nèi)容。
在一種應(yīng)用場景中,只需要主持人和主講人的發(fā)言內(nèi)容轉(zhuǎn)換成對應(yīng)的文字信息,忽略其它與會(huì)者的發(fā)言內(nèi)容。
圖10是本發(fā)明實(shí)施例示出的一種獲取單元110的結(jié)構(gòu)示意圖,該實(shí)現(xiàn)多獲取單元110適用于只需要主持人或者主講人的發(fā)言內(nèi)容轉(zhuǎn)換成對應(yīng)的文字信息,忽略其它與會(huì)者的發(fā)言內(nèi)容的應(yīng)用場景。如圖8所示,該獲取單元110可以包括第一判斷子單元1101和第一采集子單元1102:
第一判斷子單元1101,用于當(dāng)本地客戶端對應(yīng)的與會(huì)者需要發(fā)言時(shí),判斷所述與會(huì)者是否具有發(fā)言權(quán)限。
在會(huì)議具有主持人和固定的主講人的應(yīng)用場景中,通常只有主講人和主持人具有發(fā)言權(quán)限。判斷與會(huì)者是否具有發(fā)言權(quán)限可以包括判斷與會(huì)者的身份屬性是否具有主講人權(quán)限或主持人權(quán)限。
第一采集子單元1102,用于當(dāng)所述第一判斷單元1101判定所述本地與會(huì)者自身具有發(fā)言權(quán)限具有主講人權(quán)限或主持人權(quán)限時(shí),利用語音設(shè)備采集發(fā)言語音信息。
本實(shí)施例提供的實(shí)現(xiàn)多媒體會(huì)議的裝置中,只將具有發(fā)言權(quán)限的與會(huì)者的發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,而不是將所有與會(huì)者的發(fā)言內(nèi)容轉(zhuǎn)換成對應(yīng)的文字信息。利用該裝置能夠避免將多媒體會(huì)議中與會(huì)者發(fā)出的與會(huì)議無關(guān)的語音內(nèi)容轉(zhuǎn)換成相應(yīng)的文字信息轉(zhuǎn)發(fā)給其它與會(huì)者,進(jìn)而避免其它與會(huì)者的客戶端顯示過多不重要的文字信息對與會(huì)者造成干擾的現(xiàn)象發(fā)生。
在另一種應(yīng)用場景中,所有與會(huì)者都允許發(fā)言,例如,討論式會(huì)議。但是,如果將所有與會(huì)者發(fā)出的語音信息都轉(zhuǎn)換成相應(yīng)的文字信息,將會(huì)造成很多與會(huì)議無關(guān)的語音轉(zhuǎn)換成文字,并造成很多與會(huì)議無關(guān)的文字顯示給與會(huì)者,對與會(huì)者造成干擾。鑒于上述應(yīng)用場景,可以將語音能量較大的與會(huì)者確定為發(fā)言人,并將發(fā)言人的發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,其它語音能量較小的與會(huì)者的語音內(nèi)容被忽略。
圖11是本發(fā)明實(shí)施例示出的一種轉(zhuǎn)換單元120的結(jié)構(gòu)示意圖,該轉(zhuǎn)換單元120適用于與會(huì)人數(shù)較多,與會(huì)者均能夠發(fā)言的應(yīng)用場景。如圖11所示,該轉(zhuǎn)換單元120可以包括第一接收子單元1201、第二判斷子單元1202和第二采集子單元1203:
第一接收子單元1201,用于接收多媒體會(huì)議服務(wù)器發(fā)送的發(fā)言通知消息,由于該發(fā)言通知消息攜帶發(fā)言人的用戶身份識別信息ID,所述發(fā)言人由多媒體會(huì)議服務(wù)器根據(jù)參加多媒體會(huì)議的與會(huì)者發(fā)送的語音信息的能量,按照所述能量由大到小的順序依次確定出的前預(yù)設(shè)數(shù)量個(gè)與會(huì)者,與會(huì)者的客戶端可將該用戶ID與自身的用戶ID進(jìn)行比較,從而判斷自身客戶端所對應(yīng)的與會(huì)者是否是發(fā)言人。
第二判斷子單元1202,用于判斷所述發(fā)言通知消息所攜帶的用戶ID與所述本地與會(huì)者的用戶ID是否相同。
第二采集子單元1203,用于當(dāng)所述第二判斷子單元1202判定所述發(fā)言通知消息所攜帶的用戶ID與所述本地與會(huì)者的用戶ID相同時(shí),利用語音設(shè)備采集所述本地與會(huì)者的發(fā)言語音信息。
本實(shí)施例中,通過轉(zhuǎn)換單元120中的第一接收子單元接收多媒體會(huì)議服務(wù)器發(fā)送的發(fā)言通知消息,由于該發(fā)言通知消息攜帶發(fā)言人的用戶身份標(biāo)識信息ID,所述發(fā)言人可由多媒體會(huì)議服務(wù)器根據(jù)參加多媒體會(huì)議的與會(huì)者發(fā)送的語音信息的能量,按照由大到小的順序依次確定的前設(shè)數(shù)量個(gè)與會(huì)者,即客戶端只將能量最大的預(yù)設(shè)數(shù)量個(gè)與會(huì)者的發(fā)言內(nèi)容轉(zhuǎn)換成對應(yīng)的文字信息。能夠避免將很多與會(huì)議無關(guān)的語音轉(zhuǎn)換成文字,導(dǎo)致很多與會(huì)議無關(guān)的文字顯示給與會(huì)者,對與會(huì)者造成的干擾現(xiàn)象出現(xiàn)。
在又一種應(yīng)用場景中,只有主持人和主講人能夠發(fā)言,其它與會(huì)者不能發(fā)言,其它與會(huì)者的語音設(shè)備被關(guān)閉,且與會(huì)者自己不能開啟語音設(shè)備。當(dāng)與會(huì)者需要發(fā)言時(shí),與會(huì)者可以請求主持人開啟該與會(huì)者的語音設(shè)備。
圖12是本發(fā)明實(shí)施例示出的又一種獲取單元110的結(jié)構(gòu)示意圖。該獲取單元110應(yīng) 用于主持人指定發(fā)言人的應(yīng)用場景,如圖12所示,所述獲取單元110包括:第一發(fā)送子單元1103、第二接收子單元1104和第三采集子單元1105。
第一發(fā)送子單元1103,用于向多媒體會(huì)議服務(wù)器發(fā)送發(fā)言請求消息,所述發(fā)言請求消息攜帶所述本地與會(huì)者的用戶ID,以使所述多媒體會(huì)議服務(wù)器將所述發(fā)言請求消息發(fā)送給主持人。
除主持人和主講人之外的其它與會(huì)者需要發(fā)言時(shí),由該與會(huì)者對應(yīng)的客戶端向多媒體會(huì)議服務(wù)器發(fā)送發(fā)言請求消息。所述發(fā)言請求消息攜帶該與會(huì)者的用戶ID。
第二接收子單元1104,用于接收所述多媒體會(huì)議服務(wù)器發(fā)送的語音設(shè)備開啟指令,
該語音設(shè)備開啟指令由所述多媒體會(huì)議服務(wù)器在接收到主持人對應(yīng)的客戶端根據(jù)發(fā)言請求消息返回的發(fā)言響應(yīng)消息產(chǎn)生,具體地,主持人對應(yīng)的客戶端接收到所述發(fā)言請求消息后,根據(jù)發(fā)言請求消息攜帶的用戶ID判斷是否允許該與會(huì)者發(fā)言,如果允許該與會(huì)者發(fā)言,則主持人人對應(yīng)的客戶端將產(chǎn)生發(fā)言響應(yīng)消息并發(fā)送給多媒體會(huì)議服務(wù)器。該發(fā)言響應(yīng)消息中也可以攜帶該與會(huì)者的用戶ID,以方便多媒體會(huì)議服務(wù)器識別該與會(huì)者。
其中,主持人對應(yīng)的客戶端可以根據(jù)預(yù)先設(shè)定的與會(huì)者的身份屬性判斷是否允許與會(huì)者發(fā)言。
第三采集子單元1105,用于當(dāng)所述第二接收子單元1104接收到所述語音設(shè)備開啟指令時(shí),利用語音設(shè)備采集所述本地與會(huì)者的發(fā)言語音信息。
本實(shí)施例提供的獲取單元,除主持人或主講人之外的其它與會(huì)者需要發(fā)言時(shí),通過多媒體會(huì)議服務(wù)器向主持人的客戶端轉(zhuǎn)發(fā)言請求消息,由主持人根據(jù)所述發(fā)言請求消息判斷是否允許所述與會(huì)者發(fā)言,若被允許所述與會(huì)者發(fā)言,則主持人的客戶端向多媒體會(huì)議服務(wù)器發(fā)送允許所述與會(huì)者發(fā)言的發(fā)言響應(yīng)消息,以使多媒體會(huì)議服務(wù)器根據(jù)該發(fā)言響應(yīng)消息產(chǎn)生語音設(shè)備開啟指令,控制所述與會(huì)者對應(yīng)的語音設(shè)備開啟。由該與會(huì)者對應(yīng)的語音設(shè)備獲取該與會(huì)者的發(fā)言語音信息,由該與會(huì)者對應(yīng)的客戶端將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。該裝置適用于正式會(huì)議或級別較高的會(huì)議場景,擴(kuò)大了多媒體會(huì)議實(shí)現(xiàn)方法的適用范圍。
圖13是本發(fā)明實(shí)施例示出的又一種實(shí)現(xiàn)多媒體會(huì)議的裝置結(jié)構(gòu)示意圖,如圖13所示,該實(shí)現(xiàn)多媒體會(huì)議的裝置,用于多媒體會(huì)議服務(wù)器,如圖13所示,該裝置包括獲取單元210和第一發(fā)送單元220。
獲取單元210,用于獲取客戶端發(fā)送的發(fā)言語音信息及發(fā)言文字信息。
第一發(fā)送單元220,用于將所述發(fā)言語音信息及發(fā)言文字信息發(fā)送給其它與會(huì)者對應(yīng)的客戶端,以使所述其它與會(huì)者對應(yīng)的客戶端展示所述發(fā)言語音信息及所述發(fā)言文字信息;其中,所述其它與會(huì)者是參加所述多媒體會(huì)議的與會(huì)者中除發(fā)送所述發(fā)言語音信息及發(fā)言文字信息的與會(huì)者之外的與會(huì)者。
多媒體會(huì)議服務(wù)器將接收到發(fā)言語音信息及發(fā)言文字信息發(fā)送給參加本次多媒體會(huì)議的其它與會(huì)者對應(yīng)的客戶端。其它與會(huì)者對應(yīng)的客戶端展示接收到的發(fā)言語音信息及發(fā)言文字信息,從而有助于與會(huì)者快速理解發(fā)言人的發(fā)言內(nèi)容。
本實(shí)施例示出的應(yīng)用于多媒體會(huì)議服務(wù)器的實(shí)現(xiàn)多媒體會(huì)議的裝置,客戶端獲取本地與會(huì)者的發(fā)言語音信息并發(fā)送給多媒體會(huì)議服務(wù)器;然后,由多媒體會(huì)議服務(wù)器將發(fā)言語音信息及發(fā)言文字信息轉(zhuǎn)發(fā)給參加多媒體會(huì)議的其它與會(huì)者對應(yīng)的客戶端,以使所述其它與會(huì)者對應(yīng)的客戶端展示接收到的發(fā)言語音信息及發(fā)言文字信息。利用本發(fā)明提供的實(shí)現(xiàn)多媒體會(huì)議的裝置,與會(huì)者既能夠聽到發(fā)言人的發(fā)言語音信息又能夠看到對應(yīng)的發(fā)言文字信息,這樣,與會(huì)者能夠結(jié)合發(fā)言文字信息和發(fā)言語音信息準(zhǔn)確理解發(fā)言人的發(fā)言內(nèi)容,因此提高了多媒體會(huì)議的溝通效果。
在一種應(yīng)用場景中,所有與會(huì)者都允許發(fā)言,例如,討論式會(huì)議。但是,如果多媒體會(huì)議服務(wù)器將所有與會(huì)者發(fā)出的語音信息和文字信息都發(fā)送給其它與會(huì)者,將會(huì)造成 很多與會(huì)議無關(guān)的語音轉(zhuǎn)換成文字,并造成很多與會(huì)議無關(guān)的文字顯示給與會(huì)者,對與會(huì)者造成干擾。鑒于上述應(yīng)用場景,可以將語音能量較大的與會(huì)者確定為發(fā)言人,并將發(fā)言人的發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,其它語音能量較小的與會(huì)者的語音內(nèi)容被忽略。
圖14是本發(fā)明實(shí)施例示出的另一種實(shí)現(xiàn)多媒體會(huì)議的裝置的結(jié)構(gòu)示意圖,該實(shí)施例適用于與會(huì)者人數(shù)較多且與會(huì)者均能發(fā)言的應(yīng)用場景,該裝置在圖13所示的實(shí)施例的基礎(chǔ)上還可以包括檢測單元230、確定單元240和第二發(fā)送單元250。
檢測單元230,用于檢測客戶端發(fā)送的語音信息的能量。
多媒體會(huì)議服務(wù)器將接收參加多媒體會(huì)議的與會(huì)者的客戶端獲得的該與會(huì)者的語音信息,由多媒體會(huì)議服務(wù)器檢測接收到的語音信息的能量。
本實(shí)施例中,檢測語音信息的能量可以由多媒體會(huì)議服務(wù)器中的語音會(huì)議橋?qū)崿F(xiàn)。所述語音會(huì)議橋用于提供服務(wù)器側(cè)的語音會(huì)場,將各發(fā)言人的語音混音后送給每個(gè)與會(huì)者。
確定單元240,用于按照所述能量由大到小的順序確定前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人。
多媒體會(huì)議服務(wù)器通過檢測參加多媒體會(huì)議的與會(huì)者發(fā)送的語音信息的能量,按照能量由大到小進(jìn)行排序并依次確定出預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人。例如,所述預(yù)設(shè)數(shù)量可以是一個(gè),即將語音信息的能量最大的與會(huì)者確定為發(fā)言人;或者,所述預(yù)設(shè)數(shù)量可以是兩個(gè),即將語音信息的能量最大的兩個(gè)與會(huì)者確定為發(fā)言人。
需要說明的是,此種應(yīng)用場景下,如果發(fā)言人在不同時(shí)刻發(fā)出語音的能量不同,多媒體會(huì)議服務(wù)器根據(jù)語音信息的能量確定出的發(fā)言人可能不同。
第二發(fā)送單元250,用于向所述發(fā)言人對應(yīng)的客戶端發(fā)送發(fā)言通知消息,所述發(fā)言通知消息攜帶所述發(fā)言人的用戶身份識別信息ID,以使所述發(fā)言人對應(yīng)的客戶端獲取所述發(fā)言人的發(fā)言語音信息并將所述發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。
其中,多媒體會(huì)議服務(wù)器可以通過廣播的形式將發(fā)言通知消息發(fā)送給所有參加多媒體會(huì)議的與會(huì)者的客戶端,并由與會(huì)者的客戶端根據(jù)發(fā)言通知消息中的用戶ID判斷本客戶端所對應(yīng)的與會(huì)者是否為發(fā)言人;也可以將發(fā)言通知消息一對一發(fā)送給該用戶ID所對應(yīng)的與會(huì)者的客戶端,由客戶端根據(jù)用戶ID判斷自身是否是發(fā)言人。
與會(huì)者的客戶端接收多媒體會(huì)議服務(wù)器的發(fā)言通知消息,由于該發(fā)言通知消息中含有用戶ID,與會(huì)者的客戶端可將該用戶ID與自身的用戶ID進(jìn)行比較,從而判斷客戶端所對應(yīng)的與會(huì)者是否是發(fā)言人。
本實(shí)施例提供的實(shí)現(xiàn)多媒體會(huì)議的裝置,多媒體會(huì)議服務(wù)器檢測各個(gè)與會(huì)者發(fā)出語音信息的能量,并按照能量由大到小的順序,確定前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人,即只將能量最大的預(yù)設(shè)數(shù)量個(gè)與會(huì)者的發(fā)言內(nèi)容轉(zhuǎn)換成對應(yīng)的文字信息。該裝置能夠避免讓很多客戶端產(chǎn)生的與會(huì)議無關(guān)的語音轉(zhuǎn)換成文字,導(dǎo)致很多與會(huì)議無關(guān)的文字顯示給與會(huì)者,對與會(huì)者造成的干擾現(xiàn)象出現(xiàn)。
圖15是本發(fā)明實(shí)施例示出的又一種實(shí)現(xiàn)多媒體會(huì)議的裝置的結(jié)構(gòu)示意圖。該實(shí)現(xiàn)多媒體會(huì)議的裝置應(yīng)用于主持人指定發(fā)言人的應(yīng)用場景,該裝置在圖13中所示的實(shí)施例的基礎(chǔ)上還可以包括:第一接收單元260、第三發(fā)送單元270、第二接收單元280和第四發(fā)送單元290。
第一接收單元260,用于接收客戶端發(fā)送的發(fā)言請求消息,所述發(fā)言請求消息攜帶所述客戶端對應(yīng)的與會(huì)者的用戶ID。
第三發(fā)送單元270,用于將所述發(fā)言請求消息發(fā)送給主持人對應(yīng)的客戶端,以使所述主持人對應(yīng)的客戶端根據(jù)所述發(fā)言請求消息判斷發(fā)送發(fā)言請求消息的與會(huì)者是否具有發(fā)言權(quán)限。
第二接收單元280,用于接收所述主持人對應(yīng)的客戶端發(fā)送的發(fā)言響應(yīng)消息。
主持人對應(yīng)的客戶端接收到所述發(fā)言請求消息后,根據(jù)發(fā)言請求消息攜帶的用戶ID判斷是否允許該與會(huì)者發(fā)言。如果允許該與會(huì)者發(fā)言,則產(chǎn)生發(fā)言響應(yīng)消息,多媒體會(huì)議服務(wù)器將接收到該與會(huì)者的發(fā)言響應(yīng)消息。該發(fā)言響應(yīng)消息中也可以攜帶該與會(huì)者的用戶ID,以方便多媒體會(huì)議服務(wù)器識別該與會(huì)者。
其中,主持人對應(yīng)的客戶端可以根據(jù)預(yù)先設(shè)定的與會(huì)者的身份屬性判斷是否允許與會(huì)者發(fā)言。例如,在建立多媒體會(huì)議時(shí),主持人就可以根據(jù)與會(huì)者的與會(huì)身份判斷該與會(huì)者是否能夠發(fā)言,例如,會(huì)議的主講人允許發(fā)言。
第四發(fā)送單元290,用于向具有發(fā)言權(quán)限的與會(huì)者對應(yīng)的客戶端發(fā)送語音設(shè)備開啟指令,所述發(fā)言響應(yīng)消息由所述主持人對應(yīng)的客戶端確定發(fā)送所述發(fā)言請求消息的與會(huì)者具有發(fā)言權(quán)限時(shí)產(chǎn)生。
多媒體會(huì)議服務(wù)器根據(jù)接收到發(fā)言響應(yīng)消息生成語音設(shè)備開啟指令,該語音設(shè)備開啟指令用于控制主持人允許發(fā)言的與會(huì)者對應(yīng)的語音設(shè)備開啟。
本實(shí)施例提供的實(shí)現(xiàn)多媒體會(huì)議的裝置,除主持人或主講人之外的其它與會(huì)者需要發(fā)言時(shí),多媒體會(huì)議服務(wù)器將向主持人的客戶端轉(zhuǎn)發(fā)所述其它與會(huì)者的發(fā)言請求消息,由主持人根據(jù)所述發(fā)言請求消息判斷是否允許所述與會(huì)者發(fā)言,若允許所述與會(huì)者發(fā)言,則多媒體會(huì)議服務(wù)器將接收到主持人客戶端發(fā)送的允許所述與會(huì)者發(fā)言的發(fā)言響應(yīng)消息,多媒體會(huì)議服務(wù)器根據(jù)該發(fā)言響應(yīng)消息產(chǎn)生語音設(shè)備開啟指令,控制所述與會(huì)者對應(yīng)的語音設(shè)備開啟。開啟后,該與會(huì)者對應(yīng)的語音設(shè)備獲取該與會(huì)者的發(fā)言語音信息,由該與會(huì)者對應(yīng)的客戶端將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。該方法適用于正式會(huì)議或級別較高的會(huì)議場景,擴(kuò)大了多媒體會(huì)議實(shí)現(xiàn)方法的適用范圍。
相應(yīng)于上述的圖6~圖7所示的實(shí)現(xiàn)多媒體會(huì)議的方法實(shí)施例,本發(fā)明還提供了相應(yīng)的裝置實(shí)施例。
圖16是本發(fā)明實(shí)施例示出的一種應(yīng)用于客戶端的實(shí)現(xiàn)多媒體會(huì)議的裝置的結(jié)構(gòu)示意圖,該裝置包括:獲取單元310和發(fā)送單元320。
獲取單元310,用于獲取本地與會(huì)者的發(fā)言語音信息。
發(fā)送單元320,用于將所述發(fā)言語音信息發(fā)送給多媒體會(huì)議服務(wù)器,以使所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息,以及使所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給參加多媒體會(huì)議的其它與會(huì)者的客戶端
其中,所述其它與會(huì)者是所述多媒體會(huì)議的與會(huì)者中除所述本地與會(huì)者之外的其它與會(huì)者。
本實(shí)施例提供的實(shí)現(xiàn)多媒體會(huì)議的裝置,與會(huì)者的客戶端獲得發(fā)言語音信息后發(fā)送給多媒體會(huì)議服務(wù)器,由多媒體會(huì)議服務(wù)器將發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,然后,再將發(fā)言語音信息及對應(yīng)的發(fā)言文字信息發(fā)送給參加多媒體會(huì)議的其它與會(huì)者對應(yīng)的客戶端。這樣,參加多媒體會(huì)議的與會(huì)者既能夠聽到發(fā)言人的發(fā)言語音信息,又能夠看到相應(yīng)的發(fā)言文字信息,能夠準(zhǔn)確理解發(fā)言人的發(fā)言內(nèi)容,提高多媒體會(huì)議的溝通效果。該方法由多媒體會(huì)議服務(wù)器將發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,不需要在各個(gè)客戶端上集成語音識別引擎,降低了客戶端的生產(chǎn)成本。
圖17是本發(fā)明實(shí)施例示出的一種應(yīng)用于多媒體會(huì)議服務(wù)器的實(shí)現(xiàn)多媒體會(huì)議的裝置的結(jié)構(gòu)示意圖,該裝置包括:獲取單元410、轉(zhuǎn)換單元420和發(fā)送單元430。
獲取單元410,用于獲取客戶端發(fā)送的發(fā)言語音信息。
轉(zhuǎn)換單元420,用于將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。
在本發(fā)明一個(gè)實(shí)施例中,多媒體會(huì)議服務(wù)器根據(jù)與會(huì)者法語音信息的能量大小,確定能量最大的預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人,并將接收到的發(fā)言人的發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。該轉(zhuǎn)換單元420可以包括檢測子單元和轉(zhuǎn)換子單元。
所述檢測子單元,用于檢測客戶端發(fā)送的語音信息的能量,按照所述能量由大到小 的順序依次確定出前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人;所述轉(zhuǎn)換子單元,用于利用語音識別引擎將確定出的發(fā)言人發(fā)送的發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。
發(fā)送單元430,用于將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給其它與會(huì)者對應(yīng)的客戶端,以使所述其它與會(huì)者對應(yīng)的客戶端展示所述發(fā)言語音信息及所述發(fā)言文字信息。
其中,所述其它與會(huì)者是參加所述多媒體會(huì)議的與會(huì)者中除發(fā)送所述發(fā)言語音信息的與會(huì)者之外的與會(huì)者。
本實(shí)施例提供的實(shí)現(xiàn)多媒體會(huì)議的裝置,多媒體會(huì)議服務(wù)器檢測各個(gè)與會(huì)者發(fā)出語音信息的能量,并按照能量由大到小的順序,確定前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人。多媒體會(huì)議服務(wù)器只將確定出的發(fā)言人的發(fā)言內(nèi)容轉(zhuǎn)換成對應(yīng)的文字信息。該方法能夠避免將很多與會(huì)議無關(guān)的語音轉(zhuǎn)換成文字,導(dǎo)致很多與會(huì)議無關(guān)的文字顯示給與會(huì)者,對與會(huì)者造成的干擾現(xiàn)象出現(xiàn)。
相應(yīng)于圖8~圖12所示的應(yīng)用于客戶端的實(shí)現(xiàn)多媒體會(huì)議的裝置,本發(fā)明實(shí)施例還提供了一種實(shí)現(xiàn)多媒體會(huì)議的客戶端,請參見圖18,所述客戶端包括:處理器1411、發(fā)送器1412和存儲(chǔ)器1413;
存儲(chǔ)器1413內(nèi)存儲(chǔ)有處理器1411能夠執(zhí)行的操作指令,處理器1411讀取存儲(chǔ)器1413內(nèi)的操作指令用于實(shí)現(xiàn)以下功能:獲取本地與會(huì)者的發(fā)言語音信息,并將發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。
在本發(fā)明的實(shí)施例中,可以通過語音設(shè)備采集與會(huì)者的音頻信號進(jìn)行相應(yīng)的處理后提供給處理器1411,例如,所述語音設(shè)備可以是MIC。
在本發(fā)明的一個(gè)實(shí)施例中,處理器1411具體用于:判斷本地與會(huì)者是否具有發(fā)言權(quán)限;如果所述本地與會(huì)者具有發(fā)言權(quán)限,則采集所述本地與會(huì)者的發(fā)言語音信息。
所述發(fā)送器1412用于將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給多媒體會(huì)議服務(wù)器;以使所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給參加多媒體會(huì)議的其它與會(huì)者對應(yīng)的客戶端,其中所述其它與會(huì)者為參加多媒體會(huì)議的全部與會(huì)者中除發(fā)言人外的其它與會(huì)者。
在本發(fā)明的一個(gè)實(shí)施例中,多媒體會(huì)議服務(wù)器根據(jù)與會(huì)者法語音信息的能量大小,確定能量最大的預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人,再由客戶端將發(fā)言人的發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。本實(shí)施例中,實(shí)現(xiàn)多媒體會(huì)議的客戶端還可以包括接收器。
所述接收器,用于接收多媒體會(huì)議服務(wù)器發(fā)送的發(fā)言通知消息,所述發(fā)言通知消息攜帶發(fā)言人的用戶身份識別信息ID,所述發(fā)言人由多媒體會(huì)議服務(wù)器根據(jù)參加多媒體會(huì)議的與會(huì)者發(fā)送的語音信息的能量,按照所述能量有道到小的順序依次確定出的前設(shè)數(shù)量個(gè)與會(huì)者;
所述處理器1411,還用于判斷所述發(fā)言通知消息所攜帶的用戶ID與所述本地與會(huì)者的用戶ID是否相同,如果所述發(fā)言通知消息所攜帶的用戶ID與所述本地與會(huì)者的用戶ID相同,確定本地與會(huì)者為發(fā)言人,然后獲取本地與會(huì)者的發(fā)言語音信息。
在本發(fā)明的又一個(gè)實(shí)施例中,只有主持人和主講人能夠發(fā)言,其它與會(huì)者不能發(fā)言,其它與會(huì)者的語音設(shè)備被關(guān)閉,且與會(huì)者自己不能開啟語音設(shè)備。當(dāng)與會(huì)者需要發(fā)言時(shí),與會(huì)者可以請求主持人開啟該與會(huì)者的語音設(shè)備。
所述發(fā)送器1412還用于向多媒體會(huì)議服務(wù)器發(fā)送發(fā)言請求消息,所述發(fā)言請求消息攜帶所述本地與會(huì)者的用戶ID,以使多媒體會(huì)議服務(wù)器將所述發(fā)言請求消息發(fā)送給主持人。
所述接收器,還用于在接收到多媒體會(huì)議服務(wù)器發(fā)送的語音設(shè)備開啟指令,并將語音設(shè)備開啟指令提供給語音設(shè)備,以使語音設(shè)備采集本地與會(huì)者的發(fā)言語音信息,所述語音設(shè)備開啟指令由所述多媒體會(huì)議服務(wù)器接收到主持人對應(yīng)的客戶端根據(jù)發(fā)言請求消 息返回的發(fā)言響應(yīng)消息產(chǎn)生。
在本發(fā)明的另一個(gè)實(shí)施例中,所述實(shí)現(xiàn)多媒體會(huì)議的客戶端還可以包括顯示器。該顯示器,用于顯示所述發(fā)言文字信息。所述存儲(chǔ)器,還用于存儲(chǔ)所述發(fā)言文字信息,以便利用發(fā)言文字信息生成會(huì)議紀(jì)要。
本實(shí)施例提供的客戶端,由客戶端獲取本地與會(huì)者的發(fā)言語音信息,并將發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息。然后將發(fā)言語音信息及發(fā)言文字信息發(fā)送給多媒體會(huì)議服務(wù)器,再由多媒體會(huì)議服務(wù)器轉(zhuǎn)發(fā)給參加多媒體會(huì)議的其它與會(huì)者對應(yīng)的客戶端,其它與會(huì)者對應(yīng)的客戶端展示接收到的發(fā)言語音信息及發(fā)言文字信息。利用本發(fā)明提供的實(shí)現(xiàn)多媒體會(huì)議的方法,與會(huì)者既能夠聽到發(fā)言人的發(fā)言語音信息又能夠看到對應(yīng)的發(fā)言文字信息,這樣,與會(huì)者能夠結(jié)合發(fā)言文字信息和發(fā)言語音信息準(zhǔn)確理解發(fā)言人的發(fā)言內(nèi)容,因此提高了多媒體會(huì)議的溝通效果。
相應(yīng)于圖13~圖15所示的應(yīng)用于多媒體會(huì)議服務(wù)器的實(shí)現(xiàn)多媒體會(huì)議的裝置,本發(fā)明實(shí)施例還提供了一種多媒體會(huì)議服務(wù)器,請參考圖19,所述多媒體會(huì)議服務(wù)器包括:接收器1511和發(fā)送器1512。
所述接收器1511,用于獲取客戶端發(fā)送的發(fā)言語音信息及發(fā)言文字信息。
所述發(fā)送器1512,用于將所述發(fā)言語音信息及發(fā)言文字信息發(fā)送給其它與會(huì)者對應(yīng)的客戶端,以使其它與會(huì)者對應(yīng)的客戶端展示所述發(fā)言語音信息及所述發(fā)言文字信息,其中,所述其它與會(huì)者是參加所述多媒體會(huì)議的與會(huì)者中除發(fā)送所述發(fā)言語音信息及發(fā)言文字信息的與會(huì)者之外的與會(huì)者。
在本發(fā)明的一個(gè)具體的實(shí)施例中,如圖20所示,所述多媒體會(huì)議服務(wù)器還包括處理器1513。
其中,所述接收器1511,還用于獲取客戶端發(fā)送的語音信息能量。
所述處理器1513,用于按照語音信息的能量由大到小的順序,確定預(yù)設(shè)數(shù)量個(gè)與會(huì)者作為發(fā)言人。
所述發(fā)送器1512具體用于:向參加多媒體會(huì)議的與會(huì)者發(fā)送發(fā)言通知消息,其中,所述發(fā)言通知消息攜帶發(fā)言人的用戶ID,以使與會(huì)者的客戶端獲取多媒體會(huì)議服務(wù)器發(fā)送的發(fā)言語音信息。
在本發(fā)明的另一個(gè)實(shí)施例中,所述接收器1511,還用于接收客戶端發(fā)送的發(fā)言請求消息,所述發(fā)言請求消息攜帶所述客戶端對應(yīng)的與會(huì)者的用戶ID。
所述發(fā)送器1512,還用于將所述發(fā)言請求消息發(fā)送給主持人對應(yīng)的客戶端,以使所述主持人對應(yīng)的客戶端根據(jù)所述發(fā)言請求消息判斷發(fā)送發(fā)言請求消息的與會(huì)者是否具有發(fā)言權(quán)限;
所述接收器1511,還用于接收所述主持人對應(yīng)的客戶端發(fā)送的發(fā)言響應(yīng)消息,向具有發(fā)言權(quán)限的與會(huì)者對應(yīng)的客戶端發(fā)送語音設(shè)備開啟指令,所述發(fā)言響應(yīng)消息由所述主持人對應(yīng)的客戶端確定發(fā)送所述發(fā)言請求消息的與會(huì)者具有發(fā)言權(quán)限時(shí)產(chǎn)生。
本實(shí)施例提供的多媒體會(huì)議服務(wù)器,接收客戶端發(fā)送的客戶端獲取本地與會(huì)者的發(fā)言語音信息并發(fā)送給多媒體會(huì)議服務(wù)器;然后,由多媒體會(huì)議服務(wù)器將發(fā)言語音信息及發(fā)言文字信息轉(zhuǎn)發(fā)給參加多媒體會(huì)議的其它與會(huì)者對應(yīng)的客戶端,以使所述其它與會(huì)者對應(yīng)的客戶端展示接收到的發(fā)言語音信息及發(fā)言文字信息。利用本發(fā)明提供的實(shí)現(xiàn)多媒體會(huì)議的裝置,與會(huì)者既能夠聽到發(fā)言人的發(fā)言語音信息又能夠看到對應(yīng)的發(fā)言文字信息,這樣,與會(huì)者能夠結(jié)合發(fā)言文字信息和發(fā)言語音信息準(zhǔn)確理解發(fā)言人的發(fā)言內(nèi)容,因此提高了多媒體會(huì)議的溝通效果。
本發(fā)明還提供了一種多媒體會(huì)議系統(tǒng),包括圖18所示的客戶端和圖19-圖20所示的多媒體會(huì)議服務(wù)器。
所述客戶端,用于獲取本地與會(huì)者的發(fā)言語音信息并發(fā)送給多媒體會(huì)議服務(wù)器;以 及將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,并將所述發(fā)言文字信息發(fā)送給多媒體會(huì)議服務(wù)器;
所述多媒體會(huì)議服務(wù)器,用于將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給參加多媒體會(huì)議的其它與會(huì)者的客戶端;
其中,所述其它與會(huì)者是所述多媒體會(huì)議的與會(huì)者中除所述本地與會(huì)者之外的其它與會(huì)者。
在本發(fā)明一個(gè)實(shí)施例中,所述多媒體會(huì)議服務(wù)器,還用于檢測參加所述多媒體體會(huì)議的客戶端發(fā)送的語音信息的能量,按照所述能量由大到小的順序確定前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人,并向發(fā)言人對應(yīng)的客戶端發(fā)送發(fā)言通知消息,所述發(fā)言通知消息攜帶發(fā)言人的用戶身份識別信息ID。
所述客戶端,用于接收多媒體會(huì)議服務(wù)器發(fā)送的發(fā)言通知消息,并根據(jù)所述發(fā)言通知信息確定本地與會(huì)者是發(fā)言人時(shí),獲取本地與會(huì)者的發(fā)言語音信息并發(fā)送給所述多媒體會(huì)議服務(wù)器,以及將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,并將所述發(fā)言文字信息發(fā)送給所述多媒體會(huì)議服務(wù)器。
相應(yīng)于圖16所示的應(yīng)用于客戶端的實(shí)現(xiàn)多媒體會(huì)議的裝置,本發(fā)明還提供了一種實(shí)現(xiàn)多媒體會(huì)議的客戶端。如圖21所示,該客戶端包括:處理器1610和發(fā)送器1620。
處理器1610,用于獲取本地與會(huì)者的發(fā)言語音信息。
發(fā)送器1620,用于將所述發(fā)言語音信息發(fā)送給多媒體會(huì)議服務(wù)器,以使所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息轉(zhuǎn)換為發(fā)言文字信息,以及使所述多媒體會(huì)議服務(wù)器將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給參加多媒體會(huì)議的其它與會(huì)者的客戶端
其中,所述其它與會(huì)者是所述多媒體會(huì)議的與會(huì)者中除所述本地與會(huì)者之外的其它與會(huì)者。
本實(shí)施例提供的實(shí)現(xiàn)多媒體會(huì)議的客戶端,與會(huì)者的客戶端獲得發(fā)言語音信息后發(fā)送給多媒體會(huì)議服務(wù)器,由多媒體會(huì)議服務(wù)器將發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,然后,再將發(fā)言語音信息及對應(yīng)的發(fā)言文字信息發(fā)送給參加多媒體會(huì)議的其它與會(huì)者對應(yīng)的客戶端。這樣,參加多媒體會(huì)議的與會(huì)者既能夠聽到發(fā)言人的發(fā)言語音信息,又能夠看到相應(yīng)的發(fā)言文字信息,能夠準(zhǔn)確理解發(fā)言人的發(fā)言內(nèi)容,提高多媒體會(huì)議的溝通效果。該方法由多媒體會(huì)議服務(wù)器將發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,不需要在各個(gè)客戶端上集成語音識別引擎,降低了客戶端的生產(chǎn)成本。
相應(yīng)于圖17所示的應(yīng)用于多媒體會(huì)議服務(wù)器的實(shí)現(xiàn)多媒體會(huì)議的裝置,本發(fā)明還提供了多媒體會(huì)議服務(wù)器,如圖22所示,所述多媒體會(huì)議服務(wù)器包括:處理器1710和發(fā)送器1720。
處理器1710,用于獲取客戶端發(fā)送的發(fā)言語音信息,并將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。
發(fā)送器1720,用于將所述發(fā)言語音信息及所述發(fā)言文字信息發(fā)送給其它與會(huì)者對應(yīng)的客戶端,以使所述其它與會(huì)者對應(yīng)的客戶端展示所述發(fā)言語音信息及所述發(fā)言文字信息。
其中,所述其它與會(huì)者是參加所述多媒體會(huì)議的與會(huì)者中除發(fā)送所述發(fā)言語音信息的與會(huì)者之外的與會(huì)者。
本實(shí)施例提供的實(shí)現(xiàn)多媒體會(huì)議的裝置,多媒體會(huì)議服務(wù)器檢測各個(gè)與會(huì)者發(fā)出語音信息的能量,并按照能量由大到小的順序,確定前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人。多媒體會(huì)議服務(wù)器只將確定出的發(fā)言人的發(fā)言內(nèi)容轉(zhuǎn)換成對應(yīng)的文字信息。該方法能夠避免將很多與會(huì)議無關(guān)的語音轉(zhuǎn)換成文字,導(dǎo)致很多與會(huì)議無關(guān)的文字顯示給與會(huì)者,對與會(huì)者造成的干擾現(xiàn)象出現(xiàn)。
本發(fā)明還提供了另一種多媒體會(huì)議系統(tǒng),包括圖21所示的客戶端及圖22所示的多 媒體會(huì)議服務(wù)器。
所述客戶端,用于獲取本地與會(huì)者的發(fā)言語音信息,并發(fā)送給多媒體會(huì)議服務(wù)器;
所述多媒體會(huì)議服務(wù)器,用于將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息,并將所述發(fā)言語音信息及與所述發(fā)言語音信息對應(yīng)的發(fā)言文字信息發(fā)送給其它與會(huì)者對應(yīng)的客戶端;其中,所述其它與會(huì)者是參加所述多媒體會(huì)議的與會(huì)者中除發(fā)送所述發(fā)言語音信息的與會(huì)者之外的與會(huì)者。
所述其它與會(huì)者對應(yīng)的客戶端,還用于向用戶展示所述多媒體會(huì)議服務(wù)器發(fā)送的發(fā)言語音信息及發(fā)言文字信息。
在本發(fā)明一個(gè)實(shí)施例中,所述多媒體會(huì)議服務(wù)器,還用于檢測參加所述多媒體體會(huì)議的客戶端發(fā)送的語音信息的能量,按照所述能量由大到小的順序確定前預(yù)設(shè)數(shù)量個(gè)與會(huì)者為發(fā)言人,當(dāng)接收到的發(fā)言語音信息來自確定出的發(fā)言人時(shí),將所述發(fā)言語音信息轉(zhuǎn)換成發(fā)言文字信息。
通過以上的方法實(shí)施例的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:只讀存儲(chǔ)器(ROM)、隨機(jī)存取存儲(chǔ)器(RAM)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
本說明書中的各個(gè)實(shí)施例均采用遞進(jìn)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其它實(shí)施例的不同之處。尤其,對于裝置或系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。以上所描述的裝置及系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。
以上所述僅是本發(fā)明的具體實(shí)施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也應(yīng)視為本發(fā)明的保護(hù)范圍。