專(zhuān)利名稱:增強(qiáng)的媒介網(wǎng)關(guān)控制協(xié)議的制作方法
技術(shù)領(lǐng)域:
本發(fā)明整體涉及通信協(xié)議。
背景技術(shù):
現(xiàn)代的遠(yuǎn)程通信常常在包括一連串的由通信路徑相互連接的點(diǎn)或者節(jié)點(diǎn)的公用和專(zhuān)用的網(wǎng)絡(luò)之上進(jìn)行。數(shù)據(jù)經(jīng)由這些節(jié)點(diǎn)進(jìn)入和離開(kāi)該網(wǎng)絡(luò)。專(zhuān)用網(wǎng)絡(luò)通常是由商行及其他企業(yè)使用,以便于數(shù)據(jù)和資源共享,以及在員工之中數(shù)據(jù)通信(例如,電子郵件和文件傳送業(yè)務(wù))。本地電話公司(也稱為本地交換機(jī)運(yùn)營(yíng)商或者公用電話交換網(wǎng)(PSTN))和長(zhǎng)途通信業(yè)務(wù)提供者(也稱為中間交換運(yùn)營(yíng)商)是公共網(wǎng)絡(luò)的范例。
傳統(tǒng)的PSTN或者“傳統(tǒng)”的網(wǎng)絡(luò)通常被稱為電路交換網(wǎng)(CSN),因?yàn)樗鼈兝秒娐方粨Q,即,一種類(lèi)型的開(kāi)關(guān),其中用于一個(gè)特殊呼叫的該通信電路(或者路線)被專(zhuān)用于該通話參加者。傳統(tǒng)的網(wǎng)絡(luò)現(xiàn)在被以分組交換網(wǎng)代替。分組交換是一種數(shù)據(jù)傳送的方法,其使用相對(duì)小的呼叫“分組”數(shù)據(jù)單元,以基于一個(gè)包含在每個(gè)數(shù)據(jù)分組內(nèi)的目的地址經(jīng)由該網(wǎng)絡(luò)路由數(shù)據(jù)。
公用和專(zhuān)用網(wǎng)傳送包含語(yǔ)音及其他媒介(例如,視頻數(shù)據(jù))的許多類(lèi)型的數(shù)據(jù)。在公共網(wǎng)絡(luò)方面,當(dāng)前的趨勢(shì)是朝著“聚合式”通信網(wǎng)絡(luò)的方向發(fā)展,在聚合式網(wǎng)絡(luò)中,使用與數(shù)據(jù)應(yīng)用相同的傳送方法(諸如因特網(wǎng)業(yè)務(wù)),傳送音頻和視頻數(shù)據(jù)。逐漸地,這種傳送方法被分組轉(zhuǎn)換而不是基于電路。
但是,聚合式通信網(wǎng)絡(luò)必須與傳統(tǒng)的電路交換網(wǎng)絡(luò)配合。通常,不同網(wǎng)絡(luò)的用戶需要發(fā)送語(yǔ)音及其他媒介(在此處通常被稱為“數(shù)據(jù)”)給彼此。媒介網(wǎng)關(guān)可以被用于這個(gè)目的。
因特網(wǎng)工程任務(wù)組(IETF)和國(guó)際電信聯(lián)盟(ITU)標(biāo)準(zhǔn)團(tuán)體兩者已經(jīng)認(rèn)可對(duì)實(shí)際上和邏輯上分離的媒介網(wǎng)關(guān)結(jié)構(gòu)的需要,其中相對(duì)智能的媒介網(wǎng)關(guān)控制器(起“主”設(shè)備的作用)控制相對(duì)非智能的媒介網(wǎng)關(guān)(作為“從屬的”設(shè)備)。該媒介網(wǎng)關(guān)起一個(gè)在網(wǎng)絡(luò)之間代碼轉(zhuǎn)換器的作用。媒介網(wǎng)關(guān)和媒介網(wǎng)關(guān)控制器經(jīng)由一個(gè)控制協(xié)議相互進(jìn)行通信。IETF Megaco(媒介網(wǎng)關(guān)控制)工作小組和ITU SG16聯(lián)合地開(kāi)發(fā)了一種用于這個(gè)目的的Megaco/H.248協(xié)議。
附圖的詳細(xì)說(shuō)明
圖1是一個(gè)表示在示范的聚合式通信網(wǎng)絡(luò)中媒介網(wǎng)關(guān)和媒介網(wǎng)關(guān)控制器的示意圖;圖2是一個(gè)媒介網(wǎng)關(guān)上下文的示意圖,其中示出在該上下文(context)中的單個(gè)終端;圖3是一個(gè)媒介網(wǎng)關(guān)上下文的示意圖,其中示出在該上下文中的二個(gè)終端;和圖4是一個(gè)表示在示范的語(yǔ)音入口中媒介網(wǎng)關(guān)和媒介網(wǎng)關(guān)控制器的示意圖。
優(yōu)選實(shí)施例的詳細(xì)說(shuō)明H.248/Megaco規(guī)范和/或用于H.248協(xié)議的技術(shù)要求定義術(shù)語(yǔ)“媒介網(wǎng)關(guān)功能”,“媒介網(wǎng)關(guān)”(也被稱為“媒介網(wǎng)關(guān)單元”),“媒介網(wǎng)關(guān)控制器”(在說(shuō)明書(shū)的全文中稱為“MGC”),“媒介信源”,“終端”以及“音頻信源功能件”(在說(shuō)明書(shū)的全文中被稱為“ARF”),如它們?cè)谡f(shuō)明書(shū)全文中所用。
作為上述這些標(biāo)準(zhǔn)的公布結(jié)果,支持改進(jìn)的性能的很多媒介處理部件是當(dāng)前可用的。因此,最好提供媒介控制協(xié)議去充分地利用市場(chǎng)上可買(mǎi)到的媒介處理部件的全部性能。這些媒介控制協(xié)議對(duì)于提供媒介服務(wù)給專(zhuān)用和公共部分的遠(yuǎn)程通信業(yè)務(wù)提供者尤其是有用處的。
許多的這些市場(chǎng)上可買(mǎi)到的媒介處理部件遵守企業(yè)計(jì)算機(jī)電話論壇(ECTF)S.100媒介服務(wù)規(guī)范。通常,S.100框架提供一個(gè)媒介服務(wù)的擴(kuò)展定義,其包括播放和記錄音頻文件,并且包括語(yǔ)音識(shí)別和從文字到語(yǔ)音轉(zhuǎn)換技術(shù)。但是,一個(gè)按照H.248/Megaco技術(shù)要求實(shí)現(xiàn)的ARF并未提供足夠的媒介處理能力去供應(yīng)這些市場(chǎng)上可買(mǎi)到的媒介處理部件。
因此,本發(fā)明示范的實(shí)施例通過(guò)對(duì)于增強(qiáng)若干個(gè)H.248/MegacoARF的擴(kuò)展進(jìn)行限定,提供ECTF S.100,類(lèi)似用于H.248/Megaco控制的媒介網(wǎng)關(guān)和/或媒介服務(wù)器的功能,所述若干個(gè)H.248/MegacoARF在該協(xié)議內(nèi)是可允許的,以允許在一個(gè)媒介網(wǎng)關(guān)內(nèi)的終端進(jìn)一步改進(jìn)媒介的處理能力。
該H.248/Megaco規(guī)范被寫(xiě)入,以允許通過(guò)其被擴(kuò)展的協(xié)議提供基本功能。對(duì)于H.248/Megaco功能性的擴(kuò)展是通過(guò)被稱為“程序包”的協(xié)議定義提供的。提供增強(qiáng)功能性的協(xié)議定義的例子被包括在下面作為一組“程序包”。這些程序包定義用于實(shí)現(xiàn)一個(gè)ARF的終端的新參數(shù)、信號(hào)和事件,其可以由該Megaco/H.248協(xié)議控制。
通常,該S.100框架提供一個(gè)媒介服務(wù)的擴(kuò)展定義,其包括播放和記錄音頻數(shù)據(jù)文件,并且包括語(yǔ)音識(shí)別和從文字到語(yǔ)音的技術(shù)。這些程序包使MGC能夠控制能訪問(wèn)媒介功能(S.100遵循的媒介處理資源可用)的終端。
Megaco/H.248技術(shù)要求表明,一個(gè)ARF包括一個(gè)或多個(gè)功能模塊(例如,一個(gè)播放音頻組件(PAM),一個(gè)記錄音頻組件(RAM)或者一個(gè)從文字到語(yǔ)音播放音頻組件(TTSPAM)),其可以被部署在一個(gè)獨(dú)立的MG服務(wù)器IVR、智能外圍設(shè)備、語(yǔ)音/講話者識(shí)別單元、一個(gè)MG等等上。一個(gè)例如PAM的模塊是一個(gè)邏輯概念。音頻數(shù)據(jù)的實(shí)際播放例如可以通過(guò)使用該P(yáng)AM去控制數(shù)字信號(hào)處理(DSP)硬件來(lái)實(shí)現(xiàn),該數(shù)字信號(hào)處理硬件可以設(shè)置在該MG上或者設(shè)置在一個(gè)音頻信源服務(wù)器(ARS)上。在該P(yáng)AM的情況下,這個(gè)DSP硬件的功能響應(yīng)一個(gè)呼叫者的請(qǐng)求而播放出音頻數(shù)據(jù)。
按照本發(fā)明示范的實(shí)施例,媒介處理功能是通過(guò)增強(qiáng)的PAM、TTSPAM和RAM提供的。
圖1示出在聚合式通信網(wǎng)絡(luò)14中的媒介網(wǎng)關(guān)(MG)10、40和媒介網(wǎng)關(guān)控制器(MGC)28、34和42的簡(jiǎn)圖。如在圖1所示,該MG 10和信令網(wǎng)關(guān)(SG)12端接例如,由一個(gè)長(zhǎng)途交換公司管理或者提供的分組交換網(wǎng)14和一個(gè)CSN 16。該CSN 16可以代表一個(gè)本地電話公司(例如,本地交換公司)。該分組交換網(wǎng)14(例如,長(zhǎng)途運(yùn)營(yíng)商)可以配置以操作從CSN 16發(fā)送一個(gè)呼叫給CSN 18。CSN 18例如可以代表一個(gè)第二本地電話公司。
該MG 10可以轉(zhuǎn)換從CSN 16接收的電路切換語(yǔ)音數(shù)據(jù)為分成包的語(yǔ)音數(shù)據(jù),用于在該分組交換網(wǎng)14之上傳輸,反之亦然。該MG 10也可以將分成包的語(yǔ)音及其他的音頻數(shù)據(jù)傳送給該CSN 18,以完成一個(gè)從通信設(shè)備20到通信設(shè)備22的呼叫,其中通信設(shè)備20和通信設(shè)備22的兩者之一或者兩者都可以是電話機(jī)或者調(diào)制調(diào)解器,反之亦然。
該MG 10、40可以是實(shí)際的若干裝置或者若干組裝置,包括硬件和軟件兩者,它們提供在可能不同的網(wǎng)絡(luò)之間提供媒介映射和/或代碼轉(zhuǎn)換功能起作用,其中一個(gè)被假定為是基于網(wǎng)絡(luò)的數(shù)據(jù)分組、幀或者信元。例如,一個(gè)MG可以終止CSN設(shè)備(例如,中繼線、回路等等),如果沒(méi)有分成包,將該媒介數(shù)據(jù)流分成包,和/或傳送分成包的業(yè)務(wù)給一個(gè)分組網(wǎng)。該MG可以以對(duì)于從分組網(wǎng)流動(dòng)到CSN的媒介數(shù)據(jù)流相反的順序執(zhí)行這些功能。但是,MG不局限于提供在基于網(wǎng)絡(luò)的數(shù)據(jù)分組/幀/信元和CSN之間的轉(zhuǎn)換。由MG提供的媒介資源的其他例子包括帶有所有分組接口的會(huì)議橋路,交互式的語(yǔ)音識(shí)別單元(IVR),ARF,或者一個(gè)帶有信元接口、編解碼器、通告、音調(diào)、調(diào)制調(diào)解器等等的語(yǔ)音識(shí)別系統(tǒng)。MG也可以包括啟動(dòng)與SG有關(guān)的功能的軟件和硬件。
IETF和ITU已經(jīng)認(rèn)識(shí)到,一個(gè)MG可以包括許多類(lèi)型的媒介處理資源。該Megaco/H.248技術(shù)要求規(guī)范表明,一個(gè)MG被假定為包括下列功能具有提供預(yù)定和釋放資源的能力,具有提供資源狀態(tài),以及使用媒介資源的媒介處理。這些資源提供諸如代碼轉(zhuǎn)換、會(huì)議、IVR和ARF的業(yè)務(wù)。媒介資源可能或者可能不直接是其他資源的一部分。
MG 10和SG 12有利于在該分組交換網(wǎng)14和CSN 16之間通信和/或合作。這個(gè)合作允許適應(yīng)經(jīng)由例如SG 12的SG的呼叫信令協(xié)議,并且適應(yīng)經(jīng)由例如MG 10的MG的音頻數(shù)據(jù)(典型地以“數(shù)據(jù)流”的形式)。
一個(gè)音頻信源服務(wù)器(ARS)44可以提供在該分組交換網(wǎng)14上或者包括在該分組交換網(wǎng)14中,以允許通告或者其他的自動(dòng)或者半自動(dòng)化的音頻業(yè)務(wù),促進(jìn)長(zhǎng)途通信業(yè)務(wù)。例如,如果一個(gè)主叫用戶想要使用長(zhǎng)途呼叫卡支付在通信設(shè)備20和22之間的電話呼叫,該分組交換網(wǎng)14可以將該呼叫從該通信設(shè)備20傳送到ARS 44。該ARS 44可以被配置為使得使用通信設(shè)備20的該主叫用戶可以與該ARS 44的部件進(jìn)行交互,以準(zhǔn)備對(duì)于該電話呼叫付款。
在傳輸路徑24(從通信設(shè)備20到MG 10)上的音頻數(shù)據(jù)可以被電路轉(zhuǎn)換,并且在路徑26(從MG 10到ARS 44)上的音頻數(shù)據(jù)可以被分組轉(zhuǎn)換。當(dāng)使用通信設(shè)備20的該主叫用戶撥一個(gè)長(zhǎng)途電話號(hào)碼的時(shí)候,呼叫信令可以在CSN 16之上發(fā)送。該呼叫信令例如可以使用一個(gè)SS7協(xié)議。SG 12可以從該CSN 16接收呼叫信令,并且可以使用例如一個(gè)TCP/IP載波(或者其他合適的協(xié)議)發(fā)送該SS7信令給一個(gè)MGC28。該SG 12可以經(jīng)由分組交換網(wǎng)14發(fā)送這個(gè)信令給MGC 28,該分組交換網(wǎng)14可以例如是一個(gè)對(duì)于通信設(shè)備20提供長(zhǎng)途通信業(yè)務(wù)的長(zhǎng)途通信業(yè)務(wù)提供者。為了實(shí)現(xiàn)此功能,該呼叫信令數(shù)據(jù)可以在路徑30之上發(fā)送給MGC 28,該MGC 28可以被配置為起一個(gè)控制MG 10的主設(shè)備的作用。
數(shù)據(jù)可以在路徑32上按照Megaco/H.248協(xié)議在該MGC 28和MG 10之間發(fā)送。響應(yīng)該MGC 28從SG 12接收的信令數(shù)據(jù),該MGC 28可以與該MG 10通信,其中,通信設(shè)備20正在尋找到ARS 44的連接,以及該MGC 28具有必要的信令。作為響應(yīng),該MG 10可以終止或者連接路徑24和/或26,并且提供必需的代碼轉(zhuǎn)換,以將在路徑24上的電路切換音頻數(shù)據(jù)轉(zhuǎn)換為在路徑26上的分組轉(zhuǎn)換音頻數(shù)據(jù)。MG 10然后可以將該分組轉(zhuǎn)換的音頻數(shù)據(jù)傳送給該ARS 44的IP地址(假定網(wǎng)絡(luò)14使用TCP/IP協(xié)議)。
通過(guò)在路徑38上發(fā)送的、遵守該Megaco/H.248協(xié)議的命令,由MGC 34可以控制該ARS 44。MGC 28也可以使用路徑36發(fā)信號(hào)給MGC34,在該路徑36上ARS 44已經(jīng)輸入音頻數(shù)據(jù)。然后,該MGC 34可以命令該ARS 44去終止從該媒介網(wǎng)關(guān)10發(fā)送分組交換音頻數(shù)據(jù)到該ARS44。然后,該MGC 34可以命令該ARS 44,例如獨(dú)立于或者響應(yīng)從通信設(shè)備20發(fā)送的輸入信號(hào),以播放和/或記錄音頻數(shù)據(jù)。在該主叫用戶的信用卡或者其他的必要的商業(yè)交易數(shù)據(jù)被發(fā)送到ARS 44之后,該MGC 28、34可以從該ARS 44斷開(kāi)該通信設(shè)備20,并且該MGC 28、42可以分別地命令該MG 10、40去配合以在路徑43上發(fā)送分組交換的音頻數(shù)據(jù)。信令數(shù)據(jù)可以在路徑48之上被從MGC 28發(fā)送到MGC 42。MGC 42命令該MG 40在該CSN 18之上將電話呼叫傳遞給通信設(shè)備22。
駐留在該ARS 44上的ARF可以提供媒介服務(wù)給該主叫用戶。ARF是一個(gè)可以執(zhí)行指定功能(例如,媒介播放和/或媒介記錄)的邏輯單元。原理上,一個(gè)ARF可以被認(rèn)為是一個(gè)和硬件協(xié)同的算法集或者算法組,其基于接收的命令執(zhí)行某些功能。一個(gè)ARF包括一個(gè)或多個(gè)功能模塊,這些功能模塊可以配置在一個(gè)MG上或者在一個(gè)獨(dú)立的服務(wù)器上,諸如例如一個(gè)IVR,一個(gè)智能外圍設(shè)備,一個(gè)語(yǔ)音/講話者識(shí)別單元等等上。
如果MG執(zhí)行在以下ARF模塊的一個(gè)或多個(gè)中定義的任務(wù),MG可以有資格作為一個(gè)音頻啟動(dòng)網(wǎng)關(guān)(AEG)播放音頻,雙音多頻(DTMF)采集,記錄音頻,語(yǔ)音識(shí)別,說(shuō)話者驗(yàn)證/標(biāo)識(shí),聽(tīng)覺(jué)特征提取/識(shí)別,或者音頻會(huì)議。因此,在一個(gè)MG內(nèi)的若干終端可以實(shí)現(xiàn)一個(gè)ARF,如果其支持那些ARF模塊的一個(gè)或多個(gè)。
如在圖2中舉例說(shuō)明的,一個(gè)MG 51可以實(shí)現(xiàn)一個(gè)或多個(gè)終端50。兩個(gè)或更多的終端50可以經(jīng)由上下文52相互連接。上下文52是一個(gè)邏輯概念,并且表示其中一個(gè)或多個(gè)終端50被連接的間隔。終端50是媒介相對(duì)于該MG 51流動(dòng)的進(jìn)入和/或退出的點(diǎn)。圖2的單個(gè)的終端50可以表示,例如,一個(gè)與實(shí)時(shí)傳輸協(xié)議(RTP)分組數(shù)據(jù)流54有關(guān)的播放器性能,其與一個(gè)特定的媒介網(wǎng)關(guān)有關(guān),使得音頻數(shù)據(jù)可以被在該RTP數(shù)據(jù)流54上播放。在這種情況下,圖2表示作為該MG 51終端的特定的播放器的標(biāo)識(shí)。
當(dāng)一個(gè)MG被命令去互連兩個(gè)或更多個(gè)終端的時(shí)候,該MG了解進(jìn)入和離開(kāi)每個(gè)終端的流動(dòng)是如何彼此相關(guān)的。終端也被稱為“承載點(diǎn)”。H.248/Megaco定義網(wǎng)關(guān)、終端和上下文的基礎(chǔ)功能。
圖3是一個(gè)表示在單個(gè)上下文64中連接的二個(gè)終端56、58的簡(jiǎn)圖。圖3的RTP數(shù)據(jù)流60可以是,例如分成包的語(yǔ)音或者其他的音頻數(shù)據(jù)。該終端58可以是,例如來(lái)自CSN網(wǎng)絡(luò)或者信道62的語(yǔ)音數(shù)據(jù)。因此,圖3可以表示一個(gè)端接于CSN和分組交換網(wǎng)的MG 55。如果需要的話,一個(gè)諸如MG 55的MG可以提供一個(gè)代碼轉(zhuǎn)換(或者修改)功能。例如,如果二個(gè)相互連接的媒介數(shù)據(jù)流具有不同的參數(shù),可能需要一個(gè)代碼轉(zhuǎn)換功能。
通常,一個(gè)聚合式通信網(wǎng)絡(luò),諸如在圖1舉例說(shuō)明的網(wǎng)絡(luò)14需要去支持基于網(wǎng)絡(luò)的通告,或者去支持需要交互式的語(yǔ)音響應(yīng)的應(yīng)用(例如,對(duì)方付費(fèi)電話卡數(shù)量)。這可以通過(guò)一個(gè)ARF來(lái)實(shí)現(xiàn),該ARF或者駐留在一個(gè)設(shè)置在該聚合式通信網(wǎng)絡(luò)的某處上的集中ARS上,或者駐留在一個(gè)或多個(gè)媒介網(wǎng)關(guān)內(nèi)。
圖4也舉例說(shuō)明一個(gè)示范的聚合式通信網(wǎng)絡(luò)400,該通信網(wǎng)絡(luò)400包括二個(gè)Megaco/H.248媒介網(wǎng)關(guān)控制器MGC 428、434和一個(gè)Megaco/H.248控制的ARS 444。如圖4所示,一個(gè)在聚合式網(wǎng)絡(luò)400內(nèi)的語(yǔ)音入口70可用于經(jīng)由該通信設(shè)備420提供音頻數(shù)據(jù)給一個(gè)終端用戶。例如,如果一個(gè)終端用戶希望去尋找提供特定類(lèi)型食品的最靠近的飯店的位置,該用戶可以使用通信設(shè)備420,通過(guò)發(fā)送和接收音頻數(shù)據(jù)與該ARS 444交互。
該語(yǔ)音入口70可以包括該MG 410,一個(gè)或多個(gè)MGC 428、434和一個(gè)ARS 444,但是可以包括唯一的MGC 434和ARS 444。一個(gè)或多個(gè)ARF可以駐留在該ARS 444上。一個(gè)在該ARS 444上實(shí)施的ARF可以包括一個(gè)播放音頻組件,一個(gè)記錄音頻組件,一個(gè)語(yǔ)音識(shí)別組件,和/或一個(gè)從文字到語(yǔ)音的播放音頻組件。該第一個(gè)MGC 428可以與該SG412配合,以發(fā)送信號(hào)給控制ARS 444輸入/輸出操作的MGC 434,以表示該路徑426應(yīng)該在該ARS 444終止。
該MG 410可以轉(zhuǎn)換該CSN音頻數(shù)據(jù)為分組交換的音頻數(shù)據(jù),并且送該分成包的音頻數(shù)據(jù)給該ARS 444。借助于該ARF,該ARS 444可以包括許多的性能,例如包括,語(yǔ)音識(shí)別,播放通告性能,以及去記錄一個(gè)消息的記錄性能。
本發(fā)明示范的實(shí)施例提供和/或允許擴(kuò)展該H.248/Megaco ARF模塊部分,在該協(xié)議內(nèi)其是可允許的,以允許在一個(gè)媒介網(wǎng)關(guān)內(nèi)終端具有進(jìn)一步改進(jìn)的媒介處理性能。
在該H.248/Megaco協(xié)議的接口設(shè)計(jì)期間,IETF和ITU標(biāo)準(zhǔn)團(tuán)體已經(jīng)認(rèn)識(shí)到,該MG可以實(shí)現(xiàn)那些具有很大不同參數(shù)的終端。因此,通過(guò)允許終端去實(shí)現(xiàn)、實(shí)施和利用附加性能、事件、信號(hào)和作為不同“程序包”組執(zhí)行的統(tǒng)計(jì)數(shù)值,該Megaco/H.248協(xié)議已經(jīng)設(shè)計(jì)成是可擴(kuò)展的。因此,本發(fā)明示范的實(shí)施例提出新的程序包,該程序包提供具有改進(jìn)性能的ARF。
基于該H.248/Megaco協(xié)議,一個(gè)按照本發(fā)明示范的實(shí)施例設(shè)計(jì)的ARF具有許多的媒介性能。一個(gè)在MG內(nèi)實(shí)施ARF的終端可以支持一個(gè)執(zhí)行新的參數(shù)、事件、信號(hào)以及統(tǒng)計(jì)數(shù)值的程序包。上述的程序包的應(yīng)用現(xiàn)在被認(rèn)為是在ITU-T研究小組11中作為對(duì)于該標(biāo)準(zhǔn)有可能性的附件M。該提出的附件M對(duì)于標(biāo)準(zhǔn)IVR操作提供支持,例如,通告播放,數(shù)字采集以及音頻數(shù)據(jù)記錄。該提出的附件除對(duì)于使用音頻參數(shù)單純的和復(fù)雜的音頻的間接引用之外,也支持對(duì)于單純的音頻的直接引用,控制音頻的可中斷性,數(shù)字緩沖器控制,特定的鍵序列以及支持?jǐn)?shù)據(jù)采集期間的再提示。
按照本發(fā)明的第一個(gè)示范的實(shí)施例,一個(gè)增強(qiáng)的PAM被配置為能夠請(qǐng)求一個(gè)ARF MG去播放一個(gè)音頻數(shù)據(jù)流容件(container)的內(nèi)容,并且被配置為能夠指定某些播放參數(shù),例如,播放音量速度,循環(huán),在播放循環(huán)之間的時(shí)間間隔以及播放持續(xù)時(shí)間。一個(gè)音頻數(shù)據(jù)流容件是一個(gè)用于由PAM播放的音頻數(shù)據(jù)內(nèi)容的抽象概念,并且典型地是一個(gè)文件,但是并非必須是文件。
另外,該增強(qiáng)的PAM被配置為提供附加功能,包括具有或者經(jīng)由一個(gè)來(lái)自MGC的直接命令,或者經(jīng)由一個(gè)在檢測(cè)的事件內(nèi)嵌入的信號(hào),調(diào)整(或者“撥動(dòng)”)速度和一個(gè)音頻播放的音量的能力。因此,一個(gè)按照本發(fā)明示范的實(shí)施例設(shè)計(jì)的PAM,允許公布和實(shí)施H.248Megaco協(xié)議程序包,基于例如可以是來(lái)自DTMF按鍵電話的信號(hào),其可以調(diào)整或者撥動(dòng)音頻數(shù)據(jù)播放的速度和/或音量。
這個(gè)增強(qiáng)的PAM也可以經(jīng)由一個(gè)來(lái)自MGC的直接命令,或者經(jīng)由一個(gè)在檢測(cè)的事件內(nèi)嵌入的信號(hào),提供暫停和/或重新開(kāi)始一個(gè)音頻數(shù)據(jù)播放的能力。該增強(qiáng)的PAM可以在一個(gè)通告或者在一系列通告中,或者經(jīng)由一個(gè)來(lái)自MGC的直接命令,或者經(jīng)由一個(gè)在檢測(cè)的事件內(nèi)嵌入的信號(hào),進(jìn)一步提供向前或者向后跳躍一個(gè)指定的時(shí)間單位的能力。因此,在檢測(cè)的事件內(nèi)嵌入的信號(hào)可以提供該增強(qiáng)的PAM的運(yùn)行時(shí)間控制。該增強(qiáng)的PAM也可以提供用于該MGC的能力,以確定在該MG上由一個(gè)使PAM終端支持的編碼器類(lèi)型,和用于該MG的能力,去通告給MGC一個(gè)音頻播放終止的理由,例如,播放被一個(gè)事件或者置換信號(hào)中斷。
按照本發(fā)明示范的實(shí)施例,提供一個(gè)程序包的示例對(duì)應(yīng)于擴(kuò)展設(shè)計(jì)的PAM。關(guān)于該增強(qiáng)的PAM程序包可以如何被寫(xiě)入,以便實(shí)現(xiàn)該增強(qiáng)的PAM,這個(gè)例子將提供某些進(jìn)一步的指示。在下面定義的該P(yáng)AM程序包是基于企業(yè)計(jì)算機(jī)電話論壇(ECTF)S.100媒介服務(wù)技術(shù)要求。
對(duì)應(yīng)于增強(qiáng)的PAM的程序包可以定義用于實(shí)現(xiàn)一個(gè)音頻播放器的H.248/Megaco終端的參數(shù)、信號(hào)和事件。該播放音頻功能允許在一個(gè)MG上從單個(gè)音頻數(shù)據(jù)流容件傳輸媒介數(shù)據(jù)流,或者從一系列音頻數(shù)據(jù)流容件連續(xù)地傳輸媒介數(shù)據(jù)流到終端的媒介數(shù)據(jù)流的一個(gè)。一個(gè)音頻數(shù)據(jù)流容件是一個(gè)音頻數(shù)據(jù)的抽象表示,其具有一個(gè)相關(guān)的編碼類(lèi)型和時(shí)鐘頻率。該音頻數(shù)據(jù)流容件可以存儲(chǔ)在該MG上,但是,沒(méi)有照這樣的要求。一個(gè)音頻數(shù)據(jù)流容件具有默認(rèn)的速度和其數(shù)據(jù)將被播放的音量。由終端的音頻播放器支持的編碼器被定義為一個(gè)終端參數(shù)。
H.248/Megaco要求每個(gè)終端執(zhí)行某些組的程序包,而且該終端向一個(gè)相關(guān)的MGC通告這些程序包。執(zhí)行特定程序包(諸如例如,對(duì)應(yīng)于增強(qiáng)的PAM的程序包)的任何終端將具有對(duì)于程序包列舉的所有的參數(shù)。
與增強(qiáng)的PAM有關(guān)的程序包可以為執(zhí)行其的H.248/Megaco終端提供與一個(gè)邏輯音頻播放器有關(guān)的功能,具有暫停一個(gè)音頻數(shù)據(jù)播放的能力,然后在其被暫停的位置上重新開(kāi)始播放,以提高或者降低音頻播放的速度和/或音量,和/或在一個(gè)音頻數(shù)據(jù)流容件或者一系列音頻數(shù)據(jù)流容件內(nèi)向前或者向后跳躍。一個(gè)終端的邏輯音頻播放器(例如,在一個(gè)音頻數(shù)據(jù)流容件內(nèi)的音量/速度控制的范圍等等的能力)的性能是由該終端的參數(shù)定義的。
值得注意,上述的邏輯音頻播放器可以具有三個(gè)原理上的狀態(tài)空閑、暫停和工作。在空閑狀態(tài),該邏輯音頻播放器不發(fā)送任何的數(shù)據(jù),并且沒(méi)有與其有關(guān)的音頻數(shù)據(jù)流容件,因此等效于沒(méi)有任何的播放信號(hào)。該邏輯音頻播放器響應(yīng)一個(gè)播放信號(hào)轉(zhuǎn)換到暫?;蛘吖ぷ鳡顟B(tài)。如果該暫停信號(hào)也隨該播放信號(hào)包括在信號(hào)描述符內(nèi),該轉(zhuǎn)換被作用到暫停狀態(tài),否則,該轉(zhuǎn)換被作用到工作狀態(tài)。
在工作狀態(tài),該邏輯音頻播放器主動(dòng)地從該終端向外傳輸來(lái)自一個(gè)音頻數(shù)據(jù)流容件的數(shù)據(jù)。該邏輯音頻播放器在這個(gè)狀態(tài)延續(xù)直至(1)經(jīng)由一個(gè)從該MGC(或者經(jīng)由一個(gè)與檢測(cè)的事件有關(guān)的嵌入的信號(hào)描述符)接收的暫停信號(hào),其被命令去暫停;(2)收到一個(gè)替換信號(hào)描述符,而沒(méi)有播放信號(hào);(3)播放信號(hào)的信號(hào)持續(xù)時(shí)間期滿;或者(4)該邏輯音頻播放器到達(dá)其正在播放的音頻數(shù)據(jù)流容件的末尾(或者,如果該播放是一個(gè)順序信號(hào)表的一部分,在順序信號(hào)表中沒(méi)有另外的播放信號(hào))。
當(dāng)該邏輯音頻播放器是有效的時(shí)候,該MG可以接收請(qǐng)求調(diào)整當(dāng)前播放信號(hào)的速度或者音量的信號(hào)。做為選擇,該MG可以在當(dāng)前正在播放的音頻數(shù)據(jù)流容件中接收請(qǐng)求向前或者向后跳躍的信號(hào)。在這些情況的每一個(gè)中,信號(hào)描述符可以包括在其上具有保持有效標(biāo)志(在下面進(jìn)行描述)的原始播放信號(hào),或者如果播放功能被作為順序信號(hào)表編碼,具有相同的信號(hào)表ID。
在暫停狀態(tài),該邏輯音頻播放器不發(fā)送音頻數(shù)據(jù)流。該播放信號(hào)被掛起,未結(jié)束。該邏輯音頻播放器保留其在正在播放的音頻數(shù)據(jù)流容件中的位置,以便如果一個(gè)重新開(kāi)始信號(hào)被接收時(shí)能夠在同一位置重新開(kāi)始。
與增強(qiáng)的PAM有關(guān)的程序包可以具有不同的參數(shù)(即,可用于存儲(chǔ)信息的參數(shù)),包括作為參數(shù)的暫??刂啤⒉シ潘俣鹊淖畲笤黾?、播放速度的最大降低、播放音量的最大增加、播放音量的最大降低、跳轉(zhuǎn)控制、播放器編碼器類(lèi)型,以及音頻數(shù)據(jù)流容件偏移參數(shù)。這些參數(shù)的每一個(gè)被定義在終端狀態(tài)描述符中。H.248/Megaco將參數(shù)編排為群呼叫“描述符”。這些描述符包括在H.248/Megaco規(guī)范中定義的參數(shù)。新的參數(shù)可以在程序包中定義,以增加該H.248/Megaco定義的描述符。增加H.248/Megaco定義的描述符的參數(shù)被以程序包名稱和參數(shù)名稱的組合命名和參考,其遵循格式“程序包名稱/參數(shù)名稱”。
如果暫??刂茀?shù)被設(shè)置為一個(gè)“真實(shí)的”值,相應(yīng)的邏輯音頻播放器能夠被暫停。因此,該邏輯音頻播放器支持下列功能a)當(dāng)在信號(hào)描述符中伴隨著一個(gè)暫停信號(hào)的時(shí)候,在該暫停狀態(tài)一個(gè)播放信號(hào)可以開(kāi)始,和b)當(dāng)一個(gè)播放信號(hào)在進(jìn)行中的時(shí)候,分別地伴隨著或者一個(gè)暫停和重新開(kāi)始信號(hào),隨一個(gè)具有相同的播放信號(hào)(在其上帶有保持工作的標(biāo)志)的替換信號(hào)描述符,該音頻播放器可以被暫?;蛘咧匦麻_(kāi)始。如果該暫停控制參數(shù)被設(shè)置為“假的”值,該MGC知道使用程序包執(zhí)行的該增強(qiáng)的PAM不能被暫停,并且任何的暫停信號(hào)將被忽略。該參數(shù)是由MGC可讀的,但是不能由MGC改變。該參數(shù)使MGC能夠確定是否暫停被啟動(dòng)。
播放速度參數(shù)的最大增加表示播放速度可以調(diào)整到什么程度。一個(gè)調(diào)整速度信號(hào)可以修改音頻數(shù)據(jù)或者向上或者向下播出的速度。該速度可以調(diào)整的單位例如可以是從正常速度開(kāi)始的百分比變化。播放速度參數(shù)的最大增加值是在允許的播放速度中的最大增長(zhǎng)百分?jǐn)?shù)。對(duì)于不支持增加放出速度的邏輯音頻播放器,這個(gè)參數(shù)的值可以是0。播放速度參數(shù)的最大增加可以接受從一個(gè)默認(rèn)值或者正常放出速度開(kāi)始,在0至最大正偏差范圍內(nèi)的整數(shù)型值。
類(lèi)似地,在播放速度參數(shù)中的最大降低表示在播放速度中例如由從允許的默認(rèn)值放出速度開(kāi)始的最大百分比降低的最大降低。對(duì)于不支持降低速度的邏輯音頻播放器,該參數(shù)的值可以是0。這個(gè)參數(shù)是一個(gè)整數(shù)型,并且具有-100至0可允許的值。這些值例如可以表示在播放速度從非最大降低(對(duì)應(yīng)于0值)(對(duì)應(yīng)于-100值)進(jìn)入到播放的絕對(duì)停止規(guī)模上的極限值。
在播放音量參數(shù)的最大增加表示一個(gè)調(diào)整音量信號(hào)可以增加音頻數(shù)據(jù)放出的音量級(jí)到什么程度。該音量可以調(diào)整的單位可以是從正?;蛘吣J(rèn)值音量開(kāi)始的dB。對(duì)于不支持增加音量的邏輯音頻播放器,這個(gè)參數(shù)的值可以是0。
在播放音量參數(shù)的最大降低表示一個(gè)調(diào)整音量信號(hào)可以降低音頻數(shù)據(jù)放出的音量級(jí)到什么程度。該音量可以調(diào)整的單位可以是從正?;蛘吣J(rèn)值音量開(kāi)始的dB。對(duì)于不支持降低音量的邏輯音頻播放器,這個(gè)參數(shù)的值可以是0。
該跳躍控制參數(shù)使聽(tīng)取所播放之音頻數(shù)據(jù)的用戶能夠向前或者向后跳躍,以分別地或者跳過(guò)該音頻數(shù)據(jù)的一部分或者重復(fù)該音頻數(shù)據(jù)的一部分。一個(gè)按照本發(fā)明示范的實(shí)施例設(shè)計(jì)的增強(qiáng)的PAM也許能確定,在正在播放的容件內(nèi)相對(duì)于整個(gè)的音頻數(shù)據(jù),在特定時(shí)刻正在播放的該音頻數(shù)據(jù)的“位置”。
如果該跳躍控制參數(shù)被設(shè)置為“真實(shí)的”值,然后一個(gè)在該邏輯音頻播放器的工作或者暫停狀態(tài)接收的跳躍信號(hào)可以使得該播放器去在該音頻數(shù)據(jù)流容件內(nèi)從當(dāng)前位置或者向前或者向后移動(dòng),或者做為選擇,在正在播放的音頻數(shù)據(jù)流容件的順序信號(hào)表內(nèi)或者向前或者向后移動(dòng)。該模式、方向和單位改變被作為參數(shù)在該跳躍信號(hào)中指定。跳躍控制是一個(gè)可以被設(shè)置為或者真或假的值。如果該參數(shù)被設(shè)置為真的值,在一個(gè)有效或者暫停播放信號(hào)的期間,一個(gè)跳躍信號(hào)可以改變?cè)谝粋€(gè)音頻數(shù)據(jù)流容件內(nèi)的當(dāng)前位置。如果該參數(shù)被設(shè)置為假的值,當(dāng)起作用或者暫停的時(shí)候,一個(gè)播放信號(hào)無(wú)法使其位置改變。因此,當(dāng)該參數(shù)被設(shè)置為假的值的時(shí)候,任何跳躍信號(hào)將被忽略。
該播放器編碼器類(lèi)型參數(shù)可以定義一個(gè)終端的增強(qiáng)PAM支持的音頻數(shù)據(jù)流容件的編碼。該播放器編碼器類(lèi)型參數(shù)一個(gè)具有可允許的值的子表型,其是由因特網(wǎng)編號(hào)分配局(IANA)限定的RTP有效載荷類(lèi)型的子表。
該增強(qiáng)的PAM程序包定義許多的“事件”,包括一個(gè)播放開(kāi)始事件和一個(gè)播放結(jié)束事件。通常,一個(gè)“事件”是在MG上的分組交換或者電路交換的終端上檢測(cè)的任意的事件。例如,一個(gè)MG可用于直接端接一個(gè)按鍵式電話機(jī)(例如代替,使該按鍵式電話機(jī)經(jīng)由中繼線從一個(gè)PSTN間接地連接到該MG)。在這種情形下,可能的事件包括繼續(xù)聽(tīng)筒掛叉(選擇接收機(jī)),離開(kāi)聽(tīng)筒掛叉(掛起接收機(jī)),按下一個(gè)“拍叉簧業(yè)務(wù)”按鈕或者推動(dòng)一個(gè)DTMF鍵。作為另一個(gè)例子,如果一個(gè)ARF的增強(qiáng)的PAM被經(jīng)由一個(gè)分組交換或者電路交換的終端在MG上實(shí)現(xiàn),該MG可以檢測(cè)與該增強(qiáng)的PAM的性能有關(guān)的事件。
該播放開(kāi)始事件對(duì)應(yīng)于播出啟時(shí)的檢測(cè),從而允許MG知道何時(shí)一個(gè)增強(qiáng)的PAM已經(jīng)開(kāi)始播放,對(duì)于該MG被了解其可能是重要的,因?yàn)樵揌.248/Megaco協(xié)議定義和允許所稱的一個(gè)“嵌入的信號(hào)描述符”。換句話說(shuō),這個(gè)事件可用于觸發(fā)一個(gè)嵌入的信號(hào)描述符。為了了解一個(gè)嵌入的信號(hào)描述符,了解該H.248/Megaco協(xié)議定義一個(gè)作為可以被發(fā)送給外部世界的“信號(hào)”首先是必要的。產(chǎn)生從一個(gè)MG發(fā)送給用戶的電話的“振鈴音”是一個(gè)信號(hào)的例子。
通常,在MG中嵌入的信號(hào)描述符允許MG通過(guò)立即播放一個(gè)特殊的信號(hào)去響應(yīng)一個(gè)特殊的檢測(cè)事件。H.248/Megaco提供一種編碼指示特殊的事件給該MG的方法,以便何時(shí)該MG檢測(cè)該事件,通過(guò)播放一個(gè)適當(dāng)?shù)男盘?hào),該MG立即和直接響應(yīng)。這通常被稱為一個(gè)嵌入的信號(hào)描述符。使用一個(gè)嵌入的信號(hào)描述符,可以通過(guò)刪除MGC被該MG通知一個(gè)檢測(cè)的事件的要求,提供對(duì)某些事件的增長(zhǎng)的反應(yīng),并且只是在該MGC已經(jīng)命令其以后,該MG響應(yīng)該事件。這個(gè)后者的情形比前者嵌入的信號(hào)情形涉及更大的延遲。
例如,當(dāng)一個(gè)播放起動(dòng)事件被檢測(cè)的時(shí)候,一個(gè)嵌入的信號(hào)描述符可用于立即起動(dòng)一個(gè)記錄事件,去記錄正在由聽(tīng)取音頻數(shù)據(jù)的人所述的什么,同時(shí)該音頻數(shù)據(jù)正在被播放。沒(méi)有與這個(gè)事件有關(guān)的事件參數(shù),也沒(méi)有任何的與這個(gè)事件有關(guān)觀察的事件描述符參數(shù)。為了了解這個(gè)重要性,很清楚,通常,當(dāng)一個(gè)事件被檢測(cè)和通告的時(shí)候,這個(gè)信息被在呼叫觀察的事件描述符中發(fā)送。在該觀察的事件描述符中可能有一個(gè)或多個(gè)與每個(gè)事件有關(guān)的參數(shù),例如,一個(gè)表示何時(shí)一個(gè)音頻播放起動(dòng)時(shí)間的時(shí)間戳。這個(gè)參數(shù)于是將與在該觀察的事件描述符中描述的該事件有關(guān)。
類(lèi)似地,該播放結(jié)束事件對(duì)應(yīng)于檢測(cè)何時(shí)完成結(jié)束,從而允許該MGC去知道何時(shí)一個(gè)PAM已經(jīng)停止播放。該程序包可以定義參數(shù)給在觀察的事件描述符中通告的該播放結(jié)束事件。例如,一個(gè)音頻數(shù)據(jù)流容件參數(shù)可以指定在一個(gè)音頻播放順序信號(hào)表被停止或者中斷的一瞬間正在播放的該音頻數(shù)據(jù)流容件。類(lèi)似地,一個(gè)終止方法參數(shù)可能與播放結(jié)束事件有關(guān),并且可以具有例如,與一個(gè)在持續(xù)時(shí)間之外終止時(shí)間有關(guān)可允許的值,一個(gè)由檢測(cè)的事件產(chǎn)生的中斷,由一個(gè)新的信號(hào)描述符的停頓,作為另一個(gè)原因結(jié)果的非結(jié)束,一個(gè)遇到的數(shù)據(jù)結(jié)束,或者任何其他的為什么音頻數(shù)據(jù)放出可以停止的理由。適當(dāng)?shù)睦碛杀辉诎谟^察事件描述符中的播放結(jié)束事件中作為一個(gè)參數(shù)返回。該終止方法參數(shù)等效于在通用信號(hào)結(jié)束事件中的終止方法參數(shù)外加該數(shù)據(jù)結(jié)束理由。
該增強(qiáng)的PAM程序包也可以提供一個(gè)與播放結(jié)束事件有關(guān)的音頻數(shù)據(jù)流容件偏移參數(shù),其可以在正在播放的音頻數(shù)據(jù)流容件中指定何時(shí)一個(gè)音頻播放信號(hào)或者順序信號(hào)表停止的位置,例如,通過(guò)從放出最初開(kāi)始基于毫秒時(shí)間的偏移。另外,該程序包也可以提供一個(gè)中斷事件ID參數(shù),其可以表示哪個(gè)事件停止放出何時(shí)該終止方法是“EV”,表示該播放被一個(gè)事件中斷。
與該增強(qiáng)的PAM程序包結(jié)合的幾個(gè)信號(hào)可以被定義,例如,一個(gè)播放信號(hào),一個(gè)暫停信號(hào),一個(gè)重新開(kāi)始播放信號(hào),一個(gè)調(diào)整播放速度信號(hào),一個(gè)調(diào)整播放音量信號(hào),以及一個(gè)跳躍信號(hào)。
播放信號(hào)從一個(gè)音頻數(shù)據(jù)流容件中提取數(shù)據(jù),并且可以基于該音頻數(shù)據(jù)流容件的編碼和基于在終端的遠(yuǎn)程描述符中的信息,對(duì)于該數(shù)據(jù)施加一個(gè)適當(dāng)?shù)慕獯a/代碼轉(zhuǎn)換算法。該H.248遠(yuǎn)程的描述符包括描述該分成包的RTP媒介數(shù)據(jù)流的遠(yuǎn)端參數(shù)的信息。例如,該遠(yuǎn)端的參數(shù)可以包括IP地址、RTP端口數(shù),以及期望由遠(yuǎn)端接收的編碼類(lèi)型。如果該ARF不能解碼/譯碼該音頻數(shù)據(jù)流容件,然后該信號(hào)可能中斷,并且可能產(chǎn)生錯(cuò)誤代碼。
被播放的一系列音頻數(shù)據(jù)流容件可以被作為順序信號(hào)表編碼。通常,一個(gè)音頻數(shù)據(jù)流容件是一個(gè)提供給MG的名稱,并且對(duì)應(yīng)于一個(gè)用于要由PAM播放的音頻數(shù)據(jù)內(nèi)容的抽象概念。一個(gè)音頻數(shù)據(jù)流容件典型地是一個(gè)文件,但是其并非必須是文件。例如,這個(gè)文件可以被設(shè)置在該ARS上,或者同時(shí)駐留在該MG上,但是,該MG確定任意特定的容件的位置。
播放信號(hào)可以是二種類(lèi)型其可以是超時(shí)類(lèi)型或者是開(kāi)/關(guān)類(lèi)型(例如,默認(rèn)類(lèi)型)。這些信號(hào)類(lèi)型表示信號(hào)如何結(jié)束的H.248/Megaco描述。一個(gè)超時(shí)信號(hào)類(lèi)型表示在預(yù)定的時(shí)間內(nèi)施加相關(guān)的信號(hào)、然后該信號(hào)被停止。一個(gè)開(kāi)/關(guān)信號(hào)類(lèi)型被一個(gè)特定的開(kāi)信號(hào)接通,并且其保持在接通狀態(tài)直到一個(gè)關(guān)信號(hào)被發(fā)送明確地去關(guān)閉該信號(hào)為止。如果該播放繼續(xù)直至遇到數(shù)據(jù)結(jié)束,該開(kāi)/關(guān)信號(hào)可以被使用。
播放信號(hào)可以利用幾個(gè)附加參數(shù),例如,音頻數(shù)據(jù)流容件參數(shù),其指定音頻數(shù)據(jù)流容件應(yīng)該播放的信號(hào)。另外,該播放信號(hào)也利用一個(gè)偏移參數(shù),其起在開(kāi)始播放的音頻數(shù)據(jù)流容件(例如,以毫秒)上指定偏移的作用。該偏移參數(shù)可允許的值來(lái)自于0(默認(rèn)值)至以正常速度需要播放該音頻數(shù)據(jù)流容件的最大時(shí)間。
H.248定義一個(gè)信號(hào)描述符,其當(dāng)存在于一個(gè)命令之中的時(shí)候,命令該MG去播放一個(gè)或多個(gè)信號(hào)。在時(shí)間標(biāo)記的任一點(diǎn)上,該MGC可以發(fā)送另一個(gè)具有可能的不同的信號(hào)描述符的命令。這被稱為是一個(gè)替換信號(hào)描述符。如果相同的信號(hào)既出現(xiàn)在原始信號(hào)描述符中,又出現(xiàn)在該替換的信號(hào)描述符中這可以表示為或者(a)重新啟動(dòng)該信號(hào)(如果在該替換信號(hào)描述符中該保持工作的標(biāo)志不是開(kāi),出現(xiàn)之);或者(b)使該信號(hào)繼續(xù)(如果該保持工作的標(biāo)志是開(kāi),出現(xiàn)之)。該增強(qiáng)的PAM程序包也可以定義一個(gè)暫停信號(hào),其當(dāng)隨該原始播放信號(hào)(具有該保持工作的標(biāo)志開(kāi))存在于一個(gè)替換信號(hào)描述符之中的時(shí)候,可以表示該播放信號(hào)轉(zhuǎn)換到暫停狀態(tài),從而暫停音頻數(shù)據(jù)傳輸。
一個(gè)正如在基準(zhǔn)H.248/Megaco中的事件描述符所定義的保持工作的標(biāo)志,盡管在音頻數(shù)據(jù)播放期間一個(gè)事件被檢測(cè),可以表示保持音頻數(shù)據(jù)播放。更具體地說(shuō),典型地在音頻數(shù)據(jù)播出期間,該MG保持在去檢測(cè)事件的狀態(tài)中。當(dāng)一個(gè)事件被檢測(cè)到的時(shí)候,播出被默認(rèn)停止。但是,如果在該事件描述符中保持工作的標(biāo)志具有一個(gè)“開(kāi)”的值,伴隨檢測(cè)一個(gè)事件,播出將繼續(xù)。以類(lèi)似的方式,該H.248/Megaco信號(hào)描述符定義一個(gè)保持工作的標(biāo)志,當(dāng)一個(gè)替換信號(hào)描述符被接收的時(shí)候,其影響一個(gè)信號(hào)的處理。例如,如果一個(gè)包括原始音頻播放信號(hào)和暫停信號(hào)兩者的替換信號(hào)描述符被隨后接收時(shí),在運(yùn)行中給出音頻播放信號(hào),該MG的狀態(tài)取決于該保持工作的標(biāo)志的設(shè)置。如果該保持工作的標(biāo)志是開(kāi),該音頻數(shù)據(jù)播出被暫停,在被播放的該音頻數(shù)據(jù)流容件內(nèi)的當(dāng)前位置被保持。該播放信號(hào)沒(méi)有結(jié)束,但是被暫停,直至另一個(gè)包括該原始播放信號(hào)(具有該保持工作的標(biāo)志開(kāi))和重新開(kāi)始信號(hào)兩者的信號(hào)描述符被接收到為止,或者直至該播放信號(hào)持續(xù)時(shí)間期滿為止。但是,如果在該替換信號(hào)描述符中的該保持工作的標(biāo)志是關(guān),在該暫停狀態(tài),從該音頻數(shù)據(jù)流容件開(kāi)始,該MG將作為一個(gè)請(qǐng)求處置該播放信號(hào)到重新啟動(dòng)該播放信號(hào)。
如果該替換信號(hào)描述符包括暫停信號(hào)和具有相同的信號(hào)表ID作為電信號(hào)描述符的播放信號(hào)的順序表兩者,該暫停信號(hào)將暫停一個(gè)播放信號(hào)的順序表。一個(gè)暫停信號(hào)可以被忽略,如果(a)在該電信號(hào)描述符中沒(méi)有播放信號(hào)是有效的;(b)在該替換信號(hào)描述符中沒(méi)有播放信號(hào)被指定;(c)在電信號(hào)描述符中的該播放信號(hào)已經(jīng)處于暫停狀態(tài);或者(d)該暫??刂茀?shù)被設(shè)置為一個(gè)假的值。
當(dāng)在替換信號(hào)描述符中存在一個(gè)播放信號(hào)(具有保持有效標(biāo)志開(kāi))的時(shí)候,該重新開(kāi)始播放信號(hào)將轉(zhuǎn)換該播放信號(hào)到工作狀態(tài),在當(dāng)前位置重新啟動(dòng)數(shù)據(jù)從一個(gè)音頻數(shù)據(jù)流容件的音頻數(shù)據(jù)傳輸。如果該替換信號(hào)描述符包括重新開(kāi)始信號(hào)和具有相同的信號(hào)表ID作為電信號(hào)描述符的播放信號(hào)的順序表兩者,這個(gè)重新開(kāi)始播放信號(hào)可以包括一個(gè)播放信號(hào)的順序表。一個(gè)重新開(kāi)始信號(hào)可以被忽略,如果(a)在該電信號(hào)描述符中沒(méi)有播放信號(hào)是有效的;(b)在該替換信號(hào)描述符中沒(méi)有播放信號(hào)被指定;(c)在電信號(hào)描述符中的該播放信號(hào)已經(jīng)處于工作狀態(tài);或者(d)該暫??刂茀?shù)被設(shè)置為一個(gè)假的值。
當(dāng)在一個(gè)替換信號(hào)描述符中存在播放信號(hào)(具有保持工作的標(biāo)志開(kāi))的時(shí)候,該調(diào)整播放速度信號(hào)將調(diào)整該播放信號(hào)的速度。改變的值是通過(guò)速度改變參數(shù)指定的,并且是以離正常的單位偏差百分率表示的。這個(gè)信號(hào)也可以用于切換在正常和一個(gè)預(yù)先地調(diào)整值之間當(dāng)前的速度,或者去重新設(shè)置該速度為正常。一個(gè)調(diào)整播放速度信號(hào)可以被忽略,如果(a)在該電信號(hào)描述符中沒(méi)有播放信號(hào)是有效的;(b)在該替換信號(hào)描述符中沒(méi)有播放信號(hào)被指定;(c)該請(qǐng)求的速度調(diào)整將導(dǎo)致速度在由最大降低速度和最大增加速度參數(shù)限制的范圍外邊,或者(d)如果沒(méi)有先前的速度調(diào)整已經(jīng)生成給一個(gè)播放信號(hào),該速度調(diào)整類(lèi)型參數(shù)被設(shè)置為正?;蛘咔袚Q速度。
該調(diào)整播放速度信號(hào)可以具有包括速度調(diào)整類(lèi)型參數(shù)的不同的參數(shù),其通過(guò)例如表示加速、減速、切換速度或者正常速度指定速度調(diào)整的類(lèi)型。設(shè)置該速度調(diào)整類(lèi)型參數(shù)以加速或者減速導(dǎo)致速度變化,例如,作為離正常的偏差百分率。如果當(dāng)前位置在一個(gè)調(diào)整值,設(shè)置該速度調(diào)整類(lèi)型參數(shù)為切換速度使該速度去切換為正常,或者如果該當(dāng)前的速度是在正常,切換至過(guò)去的調(diào)整值。另一個(gè)與該調(diào)整速度信號(hào)有關(guān)的參數(shù)是一個(gè)速度變化參數(shù),當(dāng)該速度調(diào)整類(lèi)型參數(shù)被設(shè)置為加速或者減速的時(shí)候,其指定速度變化的值。如果該速度調(diào)整類(lèi)型參數(shù)被設(shè)置為切換速度或者正常速度時(shí),這個(gè)參數(shù)可以被忽略。
當(dāng)調(diào)整播放音量信號(hào)存在于替換信號(hào)描述符中并帶有播放信號(hào)(保持工作的標(biāo)志為開(kāi))的時(shí)候,該調(diào)整播放音量信號(hào)將調(diào)整播放信號(hào)的音量。其改變值是通過(guò)音量改變參數(shù)指定的,并且可以以偏移正常的單位dB表示。這個(gè)信號(hào)也可以用于在正常和一個(gè)預(yù)先地調(diào)整值之間切換該音量,或者用于重新設(shè)置至正常。一個(gè)調(diào)整音量信號(hào)可以被忽略,如果(a)在該電信號(hào)描述符中沒(méi)有播放信號(hào)是有效的;(b)在該替換信號(hào)描述符中沒(méi)有播放信號(hào)被指定;(c)該請(qǐng)求的音量調(diào)整將導(dǎo)致音量在由最大降低音量和最大增加音量參數(shù)限制的范圍外邊,或者(d)如果沒(méi)有先前的音量調(diào)整已經(jīng)生成給一個(gè)播放信號(hào),該音量調(diào)整類(lèi)型參數(shù)被設(shè)置為正?;蛘咔袚Q音量值。
該調(diào)整播放音量信號(hào)包括不同的參數(shù),例如,一個(gè)音量調(diào)整類(lèi)型參數(shù),其指定音量調(diào)整的類(lèi)型,并且可以具有下列值音量升高(以dB),音量下降(以dB),切換音量或者標(biāo)準(zhǔn)音量。如同上述,如果當(dāng)前在一個(gè)調(diào)整值,指定切換音量使該音量切換至標(biāo)準(zhǔn),或者如果當(dāng)前的音量是在標(biāo)準(zhǔn),切換至過(guò)去的調(diào)整值。當(dāng)該音量調(diào)整類(lèi)型參數(shù)被設(shè)置為音量向上或者向下值的時(shí)候,另一個(gè)參數(shù),音量改變指定音量調(diào)整的值,但是,如果該音量調(diào)整類(lèi)型參數(shù)被設(shè)置為一個(gè)切換或者標(biāo)準(zhǔn)音量值,其被忽略。
當(dāng)跳躍信號(hào)存在于替換信號(hào)描述符中并帶有播放信號(hào)(具有保持工作的標(biāo)志開(kāi))的時(shí)候,該跳躍信號(hào)表示在一個(gè)音頻數(shù)據(jù)流容件或者音頻數(shù)據(jù)流容件的順序信號(hào)表內(nèi)向前或者向后跳躍。該信號(hào)指定跳躍的方向,其中該跳躍的單位及其他參數(shù)被執(zhí)行。如果該替換信號(hào)描述符包括跳躍信號(hào)和具有相同的信號(hào)表ID作為電信號(hào)描述符的播放信號(hào)的順序表兩者,該跳躍信號(hào)可以表示一個(gè)在播放信號(hào)的順序表內(nèi)的跳躍。一個(gè)跳躍信號(hào)可以被忽略,如果(a)在當(dāng)前信號(hào)描述符中沒(méi)有播放信號(hào)是有效的;(b)在該替換信號(hào)描述符中沒(méi)有播放信號(hào)被指定;(c)該跳躍模式和/或跳躍單位值表示一個(gè)在順序播放信號(hào)表內(nèi)的跳躍,并且該當(dāng)前的播放信號(hào)不是一個(gè)順序信號(hào)表;或者(d)該跳躍控制參數(shù)被設(shè)置為一個(gè)假的值。
該跳躍信號(hào)具有各種參數(shù),例如,一個(gè)跳躍模式參數(shù),其可具有的值包括跳躍表(表示一個(gè)到順序信號(hào)播放表的開(kāi)始或者末尾的跳躍),跳躍ASC(表示一個(gè)到當(dāng)前的音頻數(shù)據(jù)流容件的開(kāi)始或者末尾的跳躍),或者跳躍單位(表示一個(gè)向前或者向后跳躍由跳躍單位類(lèi)型參數(shù)定義的一些單位數(shù)量,也被指定在該跳躍信號(hào)中)。如果其值是跳躍表,并且該音頻播放信號(hào)不是一個(gè)順序信號(hào)表,該跳躍模式參數(shù)被忽略。另一個(gè)跳躍信號(hào)參數(shù)是該跳躍方向參數(shù),其可以具有向前跳躍(其可以是一個(gè)缺省值)或者向后跳躍的值。
另外,該跳躍信號(hào)也可以與一個(gè)跳躍單位參數(shù)有關(guān),其可以具有不同的值,包括跳躍時(shí)間(其可以是一個(gè)缺省值并且例如是去跳躍許多毫秒)或者跳躍ASC(表示許多音頻數(shù)據(jù)流容件在一個(gè)順序播放信號(hào)表內(nèi)跳躍)。如果該跳躍模式參數(shù)的值不是跳躍單位,那么這個(gè)參數(shù)被忽略。與該跳躍單位參數(shù)的跳躍時(shí)間值結(jié)合,如果跳躍的長(zhǎng)度導(dǎo)致該音頻放出達(dá)到在順序信號(hào)表中當(dāng)前的播放信號(hào)的末端,該跳躍行為可以取決于在該順序信號(hào)表中下一個(gè)播放信號(hào)的該編碼類(lèi)型。如果下一個(gè)音頻數(shù)據(jù)流容件的編碼和當(dāng)前的編碼相配,那么,借助于該跳躍的長(zhǎng)度從一個(gè)音頻數(shù)據(jù)流容件積累到下一個(gè),該跳躍可以繼續(xù)進(jìn)入在順序信號(hào)表中的下一個(gè)播放信號(hào)仿佛它們是一個(gè)目標(biāo)。如果下一個(gè)播放信號(hào)是不同的編碼類(lèi)型,或者如果在順序信號(hào)表中的下一個(gè)信號(hào)不是一個(gè)播放信號(hào),那么該跳躍可以在當(dāng)前的播放信號(hào)的末端停止。如果該跳躍單位類(lèi)型參數(shù)是跳躍ASC,并且當(dāng)前的播放信號(hào)不是一個(gè)順序信號(hào)表,該跳躍信號(hào)可以被忽略。
該跳躍信號(hào)也利用一個(gè)跳躍單位值參數(shù)(具有一個(gè)從0(默認(rèn)值)至1000000單位的整數(shù)值),其可以是一個(gè)定義跳躍單位數(shù)量的可選參數(shù)。如果該跳躍模式參數(shù)沒(méi)有被設(shè)置為一個(gè)跳躍單位的值,那么這個(gè)參數(shù)可以被忽略。
通常,如果該跳躍控制參數(shù)被設(shè)置為一個(gè)真實(shí)的值,并且該增強(qiáng)的PAM使接收了一位跳躍信號(hào),該增強(qiáng)的PAM將跳躍。該跳躍信號(hào)的作用取決于該跳躍參數(shù)的值。例如,如果該增強(qiáng)的PAM正在播放一個(gè)音頻數(shù)據(jù)流容件,并且接收一個(gè)跳躍信號(hào),以及如果該跳躍模式參數(shù)的值是跳躍單位,音頻播放將向前或者向后跳躍若干單位。該跳躍方向是通過(guò)該跳躍方向參數(shù)值確定的,并且該播放跳躍量是通過(guò)該跳躍單位類(lèi)型參數(shù)的值和該跳躍單位值參數(shù)確定的。也應(yīng)該理解,一個(gè)增強(qiáng)的PAM可以具有幾個(gè)以特殊的播放緊接的存儲(chǔ)器,而且該跳躍信號(hào)參數(shù)可以被設(shè)置為允許容件上的跳躍。
增強(qiáng)的PAM程序包可用于在一個(gè)MG和相關(guān)的MGC之間提供一個(gè)接口的方式被在下面以幾個(gè)例子舉例說(shuō)明,其被以H.248/Megaco的文本版編寫(xiě)。該例子表示借助于信號(hào)代碼等級(jí)和實(shí)際的文字的值將被包括。該例子進(jìn)一步舉例說(shuō)明可以被在一個(gè)H.248/Megaco接口上發(fā)送的協(xié)議,例如在一個(gè)ARF內(nèi)提供播放音頻功能(或者其他的功能)。
在附錄中示出的例子1對(duì)應(yīng)于該MGC控制該MG以在一個(gè)終端上播放二個(gè)音頻數(shù)據(jù)流容件,并且該MG經(jīng)由一個(gè)事務(wù)應(yīng)答確認(rèn)該命令。為了清楚,在單引號(hào)(’)中的項(xiàng)目是說(shuō)明性的文本,而不是一個(gè)事務(wù)將具有的文字值。在附錄中示出的例子2舉例說(shuō)明使用該暫停信號(hào)如何暫停有效的播放信號(hào)。如在附錄的例子3中所示,為了重新開(kāi)始該播放,一個(gè)帶有該重新開(kāi)始信號(hào)的替換信號(hào)描述符被借助于原始播放信號(hào)的相同的信號(hào)表ID發(fā)送。在附錄中示出的例子4對(duì)應(yīng)于一個(gè)用于信號(hào)的結(jié)束事件。當(dāng)在該播放順序信號(hào)表中結(jié)束第二信號(hào)時(shí),用于原始播放信號(hào)的該結(jié)束事件被在一個(gè)報(bào)告命令中發(fā)送給該MGC。作為回報(bào),該MGC發(fā)送一個(gè)事務(wù)應(yīng)答。
附錄的例子5描述使用一個(gè)在事件描述符內(nèi)嵌入的信號(hào)描述符以提供在一個(gè)通告的參數(shù)之上測(cè)量運(yùn)行時(shí)間調(diào)整。這個(gè)例子具有的MG執(zhí)行帶有一個(gè)事件描述符的單個(gè)播放信號(hào),該事件描述符檢測(cè)DTMF數(shù)字(正如該H.248/Megaco DTMF數(shù)字程序包所定義的),其將改變?cè)摬シ判盘?hào)的特征,如同下述DTMF‘1’增加播放速度5%DTMF‘2’降低播放速度5%DTMF‘3’使播放回到正常速度。
DTMF‘4’增加播放音量2dB。
DTMF‘5’減少播放音量2dB。
DTMF‘6’使播放音量回到正常。
DTMF‘7’向前跳躍2秒。
DTMF‘8’向后跳躍2秒。
DTMF‘*’暫停該播放DTMF‘#’重新開(kāi)始該播放如相對(duì)于例子6舉例說(shuō)明的,當(dāng)播放結(jié)束的時(shí)候,一個(gè)信號(hào)完成觀察事件將被發(fā)送給該MGC。該MGC將對(duì)于該事務(wù)發(fā)送一個(gè)應(yīng)答。
按照本發(fā)明的第二個(gè)示范的實(shí)施例,一個(gè)增強(qiáng)的TTSPAM執(zhí)行在H.248/Megaco環(huán)境中的ECTF規(guī)約(其按照“語(yǔ)音API SDK微軟語(yǔ)音API”定義從文字到語(yǔ)音,版本1.0,1995年,微軟公司公布,被稱為“SAPI”)。因此,該增強(qiáng)的TTSPAM被配置為允許具有遵守該SAPI規(guī)約產(chǎn)生從文字到語(yǔ)音轉(zhuǎn)換的能力。因此,該增強(qiáng)TTSPAM具有各種各樣的性能,包括具有控制文字到語(yǔ)音轉(zhuǎn)換之音高的能力,及該SAPI規(guī)約提供的其它性能。
一個(gè)與該增強(qiáng)的TTSPAM有關(guān)的程序包可以提供與文字到語(yǔ)音音頻播放器有關(guān)的功能。該TTSPAM程序包定義用于H.248/Megaco終端的參數(shù)、信號(hào)和事件,執(zhí)行文字到語(yǔ)音音頻播放器,其支持以SAPI格式或者以用于聾的電話設(shè)備格式(TDD)編碼的媒介的文字到語(yǔ)音轉(zhuǎn)換。按照SAPI編碼的數(shù)據(jù)包括帶有嵌入的換碼序列的ASCII字符,其指定音量、速度、音高、模式(字母或者語(yǔ)音),或者特殊的字或者語(yǔ)音的強(qiáng)調(diào)。
與該增強(qiáng)的TTSPAM有關(guān)的程序包擴(kuò)展如上所述的該增強(qiáng)的PAM程序包。因此,如上所述,該擴(kuò)展的PAM程序包的描述也說(shuō)明該增強(qiáng)的TTSPAM程序包。因此,來(lái)自前面部分的所有的播放音頻定義(例如播放信號(hào),播放完成事件等)全部被包括在帶有下列的附加特性的該增強(qiáng)的TTSPAM程序包中,這些附加特性使這個(gè)程序包是獨(dú)特的。
該增強(qiáng)的TTSPAM程序包擴(kuò)展在增強(qiáng)的PAM程序包中該播放器編碼器類(lèi)型參數(shù),例如,在增強(qiáng)的PAM程序包中可允許的播放器編碼器表參數(shù)值被擴(kuò)展為包括符合SAPI換碼序列的SAPI統(tǒng)一的字符編碼標(biāo)準(zhǔn)(Unicode)文本。因此,在增強(qiáng)的PAM程序包中存在用于播放語(yǔ)音音頻指定的播放器編碼器類(lèi)型。該TTSPAM程序包通過(guò)提供新的值擴(kuò)展這個(gè)性能,例如,包括在SAPI內(nèi)的值。
該SAPI規(guī)約提供轉(zhuǎn)換文本為語(yǔ)音的能力。SAPI將換碼序列插入一個(gè)ASCII文本文件,其限定從該文本產(chǎn)生的語(yǔ)音的音高、速度和音量。因此,SAPI指定該文本的特征應(yīng)該如何“發(fā)聲”或者播出為語(yǔ)音。
該增強(qiáng)的TTSPAM程序包包括作為特性的以下內(nèi)容一個(gè)從文字到語(yǔ)音可裝載的詞典,從文字到語(yǔ)音可裝載的詞典表大小,從文字到語(yǔ)音加載的詞典,從文字到語(yǔ)音術(shù)語(yǔ),從文字到語(yǔ)音有效的詞典,以及一個(gè)從文字到語(yǔ)音播放器控制標(biāo)記屬性。這些參數(shù)的每一個(gè)被在終端狀態(tài)描述符中限定。
如果該從文字到語(yǔ)音音頻播放器支持可裝載的用戶詞典,指定該從文字到語(yǔ)音可裝載的詞典。如果一個(gè)終端的編碼器特性包括該SAPI值,這個(gè)特性只能被設(shè)置為一個(gè)真實(shí)的值。否則,該參數(shù)可以被設(shè)置為一個(gè)假的值。詞典加載進(jìn)該增強(qiáng)的TTSPAM是用一個(gè)加載的詞典屬性指定的。
從文字到語(yǔ)音可裝載的詞典表容量屬性指定可裝載詞典的數(shù)目,其可以被同時(shí)加載在TTS音頻播放器中。如果該終端的可裝載詞典屬性被設(shè)置為一個(gè)真實(shí)的值,這個(gè)屬性只能被設(shè)置為一個(gè)大于0的值。
從文字到語(yǔ)音加載的詞典屬性定義是否詞典被加載在該增強(qiáng)的TTSPAM中??梢酝瑫r(shí)加載的用戶詞典的數(shù)目不能超過(guò)該詞典表參數(shù)的值。如果是這樣的話,在錯(cuò)誤描述符中將返回一個(gè)錯(cuò)誤。加載的詞典不能自動(dòng)地啟動(dòng)。而是,只有在激活的詞典屬性中指定的那些詞典被激活。因而,該激活詞典屬性的值是該加載詞典屬性值的一個(gè)子集。這個(gè)詞典表屬性被在終端狀態(tài)描述符中定義,并且是一個(gè)讀寫(xiě)類(lèi)型屬性。該增強(qiáng)的TTSPAM程序包也定義一個(gè)從文字到語(yǔ)音加載詞典容量屬性,其定義被對(duì)于特殊的終端加載在該音頻播放器信源中由該詞典使用的字節(jié)長(zhǎng)度。
從文字到語(yǔ)音的語(yǔ)音屬性定義被加載在音頻播放器信源中由該詞典支持的語(yǔ)言用于特殊的終端。這個(gè)屬性被作為子表類(lèi)型定義,并且其可能的值是在ISO 639-2定義的所有語(yǔ)音的子表“用于表示語(yǔ)言名稱的代碼,α-3代碼”,國(guó)際標(biāo)準(zhǔn)化組織,TC37/SC2-TC46/SC4共同工作組(JWG)。
從文字到語(yǔ)音有效的詞典屬性定義被在增強(qiáng)的TTSPAM中對(duì)于特殊的終端加載和有效的詞典。只有那些在加載的詞典屬性中指定的詞典可以被作為對(duì)于這個(gè)屬性值而指定。如果一個(gè)不在該加載的詞典屬性中的值被指定,將返回一個(gè)錯(cuò)誤。
從文字到語(yǔ)音播放器控制標(biāo)記屬性表示可選擇的標(biāo)記是由該增強(qiáng)的TTSPAM支持的。該標(biāo)記本身是被嵌入在輸入文本數(shù)據(jù)流和用戶詞典中的標(biāo)記。每個(gè)標(biāo)記具有一個(gè)相應(yīng)的符號(hào),其在這個(gè)屬性值中的存在表示該標(biāo)記是支持的。這個(gè)屬性是一個(gè)子表類(lèi)型。這個(gè)屬性可能的值包括Corn(在該文本中插入一個(gè)注釋?zhuān)蛔⑨屖遣晦D(zhuǎn)換為語(yǔ)音的);Dim(以一個(gè)符號(hào)替換該換碼序列字符);Emp(強(qiáng)調(diào)下一個(gè)詞被說(shuō)出);Pau(暫停說(shuō)話指定的毫秒數(shù));Pit(以赫茲設(shè)置該從文字到語(yǔ)音模式的基準(zhǔn)音高為指定的值);Prn(表示通過(guò)傳送等于該播放器/記錄器信源的該語(yǔ)音如何去讀文字);Rst(重新設(shè)置所有的換碼序列為該播放器/記錄器信源的設(shè)置默認(rèn)值);Spd(設(shè)置該從文字到語(yǔ)音模式的基準(zhǔn)平均說(shuō)話速度為每分鐘指定的字?jǐn)?shù));Vol(設(shè)置對(duì)于該從文字到語(yǔ)音模式的基準(zhǔn)說(shuō)話音量);Chr(設(shè)置該語(yǔ)音的字符);Ctx(設(shè)置用于跟隨文字的上下文,其確定符號(hào)如何被說(shuō)出);Mrk(在該文字中表示一個(gè)書(shū)簽);Pro(激活和使詩(shī)體學(xué)規(guī)則無(wú)效,其與嵌入在該文字中的控制標(biāo)記無(wú)關(guān)影響詞的音高、說(shuō)話速度和音量;詩(shī)體學(xué)規(guī)則是由引擎施加的);Prt(表示下一個(gè)詞的詞性);以及Vce(命令該引擎去改變其說(shuō)話音頻為具有指定特征的那個(gè))。
與該增強(qiáng)的TTSPAM程序包有關(guān)的各種各樣的事件包括從文字到語(yǔ)音標(biāo)識(shí)事件。當(dāng)一個(gè)從文字到語(yǔ)音標(biāo)識(shí)已經(jīng)由該增強(qiáng)的TTSPAM傳到的時(shí)候,出現(xiàn)該從文字到語(yǔ)音標(biāo)識(shí)事件。沒(méi)有事件描述符參數(shù)或者觀察的事件描述符參數(shù)與這個(gè)事件有關(guān)。
由該增強(qiáng)的TTSPAM程序包定義的信號(hào)是對(duì)于該播放音頻跳躍信號(hào)的參數(shù)的擴(kuò)建部分。特定的,該跳躍模式參數(shù)被擴(kuò)展為附加參數(shù)值跳躍句子。該跳躍句子參數(shù)值使跳躍到當(dāng)前的正文句子的開(kāi)始或者末端。此外,該跳躍單位類(lèi)型參數(shù)被擴(kuò)展為附加一個(gè)跳躍句子值。這個(gè)參數(shù)指定去跳躍句子的數(shù)目。該跳躍單位類(lèi)型參數(shù)也被擴(kuò)展為附加一個(gè)跳躍詞值。該跳躍詞值表示去跳躍詞的數(shù)目。
在一個(gè)增強(qiáng)的TTSPAM中加載的從文字到語(yǔ)音的詞典被原理上作為一個(gè)堆棧設(shè)置。當(dāng)輸入文本被該增強(qiáng)的TTSPAM處理的時(shí)候,該詞典被以棧指令對(duì)于發(fā)音規(guī)則從頂端到底部搜索。一個(gè)播放器可能已經(jīng)同時(shí)加載的用戶詞典的數(shù)目是通過(guò)該詞典表屬性的值確定的。當(dāng)最初增加到加載的詞典屬性的時(shí)候,一個(gè)用戶詞典被停用,并且在其規(guī)則由該播放器使用之前必須被增加給該激活的詞典屬性。
按照本發(fā)明的第三個(gè)示范的實(shí)施例,一個(gè)增強(qiáng)的RAM被配置為能夠請(qǐng)求一個(gè)AEG(例如,一個(gè)MG)去記錄音頻數(shù)據(jù)。該增強(qiáng)的RAM被配置為允許現(xiàn)在的規(guī)范去等待用戶開(kāi)始說(shuō)話,跟隨用于記錄語(yǔ)音活動(dòng)最后的時(shí)間必要的靜噪量被認(rèn)為結(jié)束并且是記錄(包括或不包括前和后語(yǔ)音靜音)的最大可容許的長(zhǎng)度。
該增強(qiáng)的RAM(在一個(gè)ARF內(nèi))也可以允許具有經(jīng)由一個(gè)來(lái)自該MGC的直接命令,或者經(jīng)由一個(gè)在檢測(cè)的事件內(nèi)嵌入的信號(hào)暫停和重新開(kāi)始記錄的能力??梢杂稍撛鰪?qiáng)的RAM提供的其他的能力包括附加一個(gè)記錄到現(xiàn)有的音頻數(shù)據(jù)記錄的能力,對(duì)于一個(gè)MGC該記錄應(yīng)該生成索引的能力,消除經(jīng)由暫停壓縮語(yǔ)音不活動(dòng)性的時(shí)間的能力,產(chǎn)生一個(gè)或者是固定或者是可配置的提示音調(diào)(例如,嘟嘟響)的能力,以及指定一個(gè)記錄的數(shù)字編碼格式的能力。用于記錄的編碼類(lèi)型的例子典型地是與由該P(yáng)AM(例如,G.711,G.726,G.729等等)支持的編碼相同的。
該增強(qiáng)的RAM也可以提供給該MGC確定多少音頻數(shù)據(jù)被記錄和為什么該記錄停止的能力。記錄可以由于種種理由停止,例如包括,因?yàn)橐粋€(gè)預(yù)先確定的記錄時(shí)間期滿,由于語(yǔ)音不活動(dòng)性,或者因?yàn)橛涗浻闪硪粋€(gè)事件中斷。
一個(gè)對(duì)應(yīng)于按照本發(fā)明示范的實(shí)施例設(shè)計(jì)的擴(kuò)展的RAM的程序包的例子現(xiàn)在被提供。這個(gè)例子應(yīng)該提供某些進(jìn)一步的指示,用于該增強(qiáng)的RAM程序包可以如何被寫(xiě)入,以便實(shí)現(xiàn)該增強(qiáng)的RAM。在下面定義的該增強(qiáng)的RAM程序包是以企業(yè)計(jì)算機(jī)電話論壇(ECTF)S.100媒介服務(wù)規(guī)范為基礎(chǔ)的。
一個(gè)與該增強(qiáng)的RAM有關(guān)的程序包包括上述討論到的該增強(qiáng)的音頻記錄性能。這個(gè)增強(qiáng)的RAM程序包實(shí)際上可以用和該增強(qiáng)的PAM程序包一樣的方法使用。例如,如果一個(gè)特殊的終端(諸如一個(gè)ARS)已經(jīng)執(zhí)行該增強(qiáng)的RAM程序包,那么該終端(即,該ARS)具有記錄輸入分成包的語(yǔ)音的能力,并且輸入其進(jìn)入一個(gè)音頻數(shù)據(jù)流容件。此外,該終端也可以具有起動(dòng)一個(gè)記錄、暫停記錄、在一個(gè)現(xiàn)有記錄上附加一個(gè)記錄等等的能力。
增強(qiáng)的RAM程序包定義用于執(zhí)行一個(gè)音頻記錄器的H.248/Megaco終端的參數(shù)、信號(hào)和事件。該記錄音頻功能從該終端的媒介數(shù)據(jù)流的一個(gè)中捕捉媒介數(shù)據(jù)流,并且在一個(gè)音頻數(shù)據(jù)流容件中存儲(chǔ)它。該邏輯音頻記錄器也可以支持在開(kāi)始記錄之前立即產(chǎn)生一個(gè)提示音調(diào)的能力。
該增強(qiáng)的RAM程序包使一個(gè)邏輯音頻記錄器能夠(a)依據(jù)頻率和持續(xù)時(shí)間指定一個(gè)提示音調(diào);(b)暫停一個(gè)音頻記錄功能,并且在其被暫停的位置上再次重新開(kāi)始;(c)附加該捕捉的音頻數(shù)據(jù)流到一個(gè)現(xiàn)有音頻數(shù)據(jù)流容件的末端;(d)在該記錄的音頻數(shù)據(jù)流中壓縮靜噪(語(yǔ)音不活動(dòng)性的時(shí)間)的時(shí)間;和(e)基于一個(gè)指定的語(yǔ)音不活動(dòng)性的持續(xù)時(shí)間使一個(gè)記錄音頻信號(hào)停止。一個(gè)終端的邏輯音頻記錄器(例如,壓縮靜噪的能力,暫停/重新開(kāi)始記錄等等的能力)的性能被在該終端的屬性中規(guī)定。
如同該邏輯音頻播放器一樣,該邏輯音頻記錄器原理上具有三個(gè)狀態(tài)空閑、暫停和工作。在一個(gè)空閑狀態(tài),該邏輯音頻記錄器不捕捉任何的音頻數(shù)據(jù)流,并且相當(dāng)于沒(méi)有任何的記錄信號(hào)。該邏輯音頻記錄器響應(yīng)一個(gè)記錄信號(hào)轉(zhuǎn)換到暫?;蛘吖ぷ鳡顟B(tài)。如果該暫停信號(hào)也隨該記錄信號(hào)包括在信號(hào)描述符內(nèi),該轉(zhuǎn)換被作用到暫停狀態(tài),否則,該轉(zhuǎn)換被作用到工作狀態(tài)。
在工作狀態(tài),該邏輯音頻記錄器主動(dòng)地捕捉就要來(lái)到該終端的音頻數(shù)據(jù)流。其繼續(xù)在這個(gè)狀態(tài)直至(a)經(jīng)由一個(gè)來(lái)自該MGC(或者經(jīng)由一個(gè)與檢測(cè)的事件有關(guān)的嵌入的信號(hào)描述符)的暫停信號(hào),其被命令去暫停;(b)無(wú)需一個(gè)記錄信號(hào),一個(gè)替換信號(hào)描述符被接收;(c)用于該記錄信號(hào)的信號(hào)持續(xù)時(shí)間期滿;或者(d)該語(yǔ)音不活動(dòng)性的持續(xù)時(shí)間超出一個(gè)指定的閾值。為了暫停一個(gè)有效記錄信號(hào),該替換信號(hào)描述符必須包括帶有保持工作的標(biāo)志開(kāi)(或者如果該記錄功能被作為一個(gè)在順序信號(hào)表中的項(xiàng)目編碼,帶有相同的信號(hào)表ID)的該原始記錄信號(hào)。
在暫停狀態(tài),該邏輯音頻記錄器不捕捉音頻數(shù)據(jù)流。該記錄信號(hào)被掛起而未結(jié)束。該邏輯音頻記錄器保持其在該音頻數(shù)據(jù)流容件中的位置,以便如果一個(gè)重新開(kāi)始信號(hào)被接收時(shí)能夠在同一地方重新開(kāi)始。
與該增強(qiáng)的RAM有關(guān)的該程序包可以具有各種各樣的參數(shù)(即,一個(gè)可用于存儲(chǔ)信息的變量),包括暫??刂?、提示類(lèi)型、提示持續(xù)時(shí)間、提示頻率、添加、壓縮控制、壓縮啟動(dòng)、壓縮閾值、靜噪終端啟動(dòng)、靜噪終端閾值,以及記錄編碼器類(lèi)型參數(shù)。這些參數(shù)的每一個(gè)被在終端狀態(tài)描述符中限定。
該暫??刂茀?shù)表示是否該記錄信號(hào)可以被暫停和重新開(kāi)始。更具體地說(shuō),如果這個(gè)參數(shù)被設(shè)置為一個(gè)真實(shí)的值,那么以下的功能是支持的(a)當(dāng)在該信號(hào)描述符中伴隨著一個(gè)暫停信號(hào)的時(shí)候,在該暫停狀態(tài)一個(gè)記錄信號(hào)可以起動(dòng);和(b)當(dāng)一個(gè)記錄信號(hào)在進(jìn)行中的時(shí)候,當(dāng)接收一個(gè)分別地伴隨著或者一個(gè)暫停或者重新開(kāi)始信號(hào)的帶有相同的記錄信號(hào)(帶有該保持工作的標(biāo)志開(kāi))的替換信號(hào)描述符的時(shí)候,其可以被暫停或者重新開(kāi)始。
該提示類(lèi)型參數(shù)包括一個(gè)具有以下可能的值的列舉類(lèi)型值沒(méi)有(在該記錄之前沒(méi)有提示被產(chǎn)生),固定(在該記錄之前一個(gè)固定的提示音調(diào)被產(chǎn)生)以及配置(可配置的提示音調(diào)被產(chǎn)生)。這個(gè)參數(shù)表示是否該音頻記錄器可以在記錄之前立即產(chǎn)生一個(gè)提示音調(diào)。如果一個(gè)提示音調(diào)可以被產(chǎn)生,該參數(shù)經(jīng)由該提示持續(xù)時(shí)間和提示頻率參數(shù)進(jìn)一步限定是否該音調(diào)是固定的或者是否其是可配置的。
該提示持續(xù)時(shí)間參數(shù)指定該提示音調(diào)的持續(xù)時(shí)間,例如以毫秒。該提示頻率屬性以赫茲指定該提示音調(diào)的頻率。如果該提示類(lèi)型屬性被設(shè)置為一個(gè)不同于無(wú)的值,這個(gè)提示頻率屬性只能被設(shè)置為一個(gè)大于0的值。
該附加屬性表示是否該記錄音頻要附加到一個(gè)音頻數(shù)據(jù)流容件的末端,或者如果有的話,去替換該音頻數(shù)據(jù)流容件的內(nèi)容。當(dāng)一個(gè)已經(jīng)存在的指定音頻數(shù)據(jù)流容件的記錄信號(hào)被接收的時(shí)候,因此這個(gè)屬性指定一個(gè)音頻記錄器的行為。
該壓縮控制屬性指定是否該邏輯音頻記錄器支持靜音壓縮,其從該記錄除去說(shuō)話動(dòng)作中長(zhǎng)久的暫停。該壓縮啟動(dòng)屬性指定是否靜音壓縮被啟動(dòng)。如果該壓縮控制屬性被設(shè)置為一個(gè)真實(shí)的值,這個(gè)屬性只能被設(shè)置為一個(gè)真實(shí)的值。該壓縮閾值屬性指定在靜音壓縮被觸發(fā)之前的閾值(例如,單位是毫秒)。只是在該壓縮控制和壓縮啟動(dòng)屬性被設(shè)置為一個(gè)真值的時(shí)候,這個(gè)屬性的值才具有意義。
該靜音終止啟動(dòng)屬性指定當(dāng)一個(gè)語(yǔ)音靜止的具體期限被檢測(cè)到的時(shí)候,是否在一個(gè)記錄中的靜音可以導(dǎo)致一個(gè)記錄被終止。該靜音終止閾值指定在一個(gè)記錄被終止之前語(yǔ)音靜止的閾值(以毫秒)。只是在該靜音終止啟動(dòng)屬性被設(shè)置為一個(gè)真實(shí)的值的時(shí)候,這個(gè)屬性的值才具有意義。
該記錄器編碼器類(lèi)型屬性定義終端的音頻記錄器信源支持的編碼。這個(gè)參數(shù)起一個(gè)子表類(lèi)型參數(shù)的作用,并且其可能的值是作為在該RTP凈荷類(lèi)型的IANA表中定義的該編碼名稱的一個(gè)子表,該RTP凈荷類(lèi)型的IANA表最初在1996年1月,參考1890“用于音頻與視頻會(huì)議的Schulzrinne,H.RTP分布”中定義。
增強(qiáng)RAM程序包定義各種事件,包括一個(gè)記錄結(jié)束事件。該記錄結(jié)束事件檢測(cè)什么時(shí)候一個(gè)記錄信號(hào)結(jié)束。當(dāng)在該相關(guān)的事件描述符中加載用于檢測(cè)的時(shí)候,該事件沒(méi)有參數(shù)。當(dāng)該事件被檢測(cè)的時(shí)候,一個(gè)持續(xù)時(shí)間參數(shù)被包括在該觀察的事件描述符中,一個(gè)無(wú)符號(hào)整數(shù),其以毫秒表示該記錄的持續(xù)時(shí)間,不包括該記錄器處于暫停狀態(tài)的持續(xù)時(shí)間。另一個(gè)相關(guān)參數(shù),終止方法,接收一個(gè)列舉類(lèi)型,并且具有可能的值“TO”,表示由于一個(gè)定時(shí)器期滿該記錄終止;“EV”,表示一個(gè)由于事件的中斷;“SD”,其表示該信號(hào)被新的信號(hào)描述符暫停;“NC”,其表示該信號(hào)被作為其它的原因的結(jié)果終止,以及“ST”,其表示一個(gè)靜音終止。這個(gè)參數(shù)相當(dāng)于在該基準(zhǔn)H.248/Megaco通用信號(hào)結(jié)束事件中外加靜音終止理由的終止方法參數(shù)。
這個(gè)記錄結(jié)束事件也使用一個(gè)指定的中斷事件ID參數(shù),其接收一個(gè)標(biāo)識(shí)符類(lèi)型值,表示一種終止方法。值“EV”表示停止記錄信號(hào)的事件。
該增強(qiáng)的RAM程序包定義不同的信號(hào),包括一個(gè)記錄信號(hào),一個(gè)暫停信號(hào)以及一個(gè)重新開(kāi)始播放信號(hào)。
該記錄信號(hào)從一個(gè)進(jìn)入該終端的媒介數(shù)據(jù)流中捕捉數(shù)據(jù),并且將其放置到一個(gè)音頻數(shù)據(jù)流容件里。該音頻記錄功能使用在該終端的本地描述符(默認(rèn)狀態(tài))中定義的編碼捕捉該媒介數(shù)據(jù)流,或者使用一個(gè)指定的編碼算法自動(dòng)譯碼該媒介數(shù)據(jù)流。如果與該增強(qiáng)的RAM程序包有關(guān)的該邏輯音頻記錄器不能自動(dòng)譯碼該媒介數(shù)據(jù)流,該信號(hào)將以一個(gè)錯(cuò)誤中斷。
該記錄信號(hào)使用附加參數(shù),包括一個(gè)音頻數(shù)據(jù)流容件參數(shù),一個(gè)編碼器參數(shù),最小持續(xù)時(shí)間參數(shù),以及一個(gè)提示音調(diào)參數(shù)。該音頻數(shù)據(jù)流參數(shù)指定使用該音頻數(shù)據(jù)流容件去捕捉該就要來(lái)該終端中的媒介數(shù)據(jù)流。當(dāng)捕捉一個(gè)終端的輸入進(jìn)新生成的音頻數(shù)據(jù)流容件的媒介數(shù)據(jù)流的時(shí)候,該編碼器參數(shù)指定使用該編碼。如果這個(gè)參數(shù)的值不包含在該編碼器表屬性中,一個(gè)錯(cuò)誤被返回。如果該音頻數(shù)據(jù)流容件參數(shù)以捕捉的一個(gè)特殊的編碼類(lèi)型的音頻訪間一個(gè)音頻數(shù)據(jù)流容件,這個(gè)參數(shù)被忽略。
最小持續(xù)時(shí)間參數(shù)指定一個(gè)記錄操作捕捉一個(gè)媒介數(shù)據(jù)流以便有效的最少的時(shí)間。只有有效的記錄修改該音頻數(shù)據(jù)流容件的內(nèi)容。
該提示音調(diào)參數(shù)指定是否該記錄信號(hào)將放在一個(gè)提示音調(diào)之前,正如該提示持續(xù)時(shí)間和提示頻率屬性所定義的。如果在該記錄之前一個(gè)提示音調(diào)被播放,這個(gè)參數(shù)具有真實(shí)的值,并且如果沒(méi)有提示音調(diào)被播放,這個(gè)參數(shù)具有假的值。如果該提示類(lèi)型屬性被設(shè)置為無(wú),這個(gè)參數(shù)被忽略。
當(dāng)在一個(gè)替換信號(hào)描述符中存在一個(gè)記錄信號(hào)(帶有該保持有效標(biāo)志開(kāi))的時(shí)候,暫停信號(hào)將轉(zhuǎn)換該記錄信號(hào)為暫停狀態(tài),暫停捕捉該終端的輸入媒介音頻數(shù)據(jù)流。在該音頻數(shù)據(jù)流容件內(nèi)的當(dāng)前位置被保持。該記錄信號(hào)沒(méi)有結(jié)束,但是被掛起,直到包括該原始記錄信號(hào)(帶有該保持有效標(biāo)志開(kāi))和一個(gè)重新開(kāi)始信號(hào)兩者的另一個(gè)信號(hào)描述符被接收為止,或者直到該記錄信號(hào)持續(xù)時(shí)間期滿為止。如果(a)在該當(dāng)前的信號(hào)描述符中沒(méi)有記錄信號(hào)是有效的;(b)在該替換信號(hào)描述符中沒(méi)有記錄信號(hào)被指定;(c)在當(dāng)前的信號(hào)描述符中指定的該記錄信號(hào)已經(jīng)處于暫停狀態(tài);或者(d)該暫停控制屬性被設(shè)置為一個(gè)假的值,一個(gè)暫停信號(hào)被忽略。該暫停信號(hào)沒(méi)有附加參數(shù)。
當(dāng)在一個(gè)替換信號(hào)描述符中存在一個(gè)記錄信號(hào)(帶有該保持有效標(biāo)志開(kāi))的時(shí)候,該重新開(kāi)始播放信號(hào)將轉(zhuǎn)換該記錄信號(hào)為工作狀態(tài),在當(dāng)前位置重新開(kāi)始捕捉進(jìn)入指定的音頻數(shù)據(jù)流容件中的媒介數(shù)據(jù)流。如果(a)在該當(dāng)前的信號(hào)描述符中沒(méi)有記錄信號(hào)是有效的;(b)在該替換信號(hào)描述符中沒(méi)有記錄信號(hào)被指定;(c)在當(dāng)前的信號(hào)描述符中指定的該記錄信號(hào)已經(jīng)處于工作狀態(tài);或者(d)該暫??刂茖傩员辉O(shè)置為一個(gè)假的值,一個(gè)重新開(kāi)始信號(hào)被忽略。該重新開(kāi)始播放信號(hào)沒(méi)有附加參數(shù)。
雖然本發(fā)明已經(jīng)結(jié)合特定的實(shí)施例在上面進(jìn)行了描述,因此,對(duì)于本領(lǐng)域?qū)I(yè)技術(shù)人員來(lái)說(shuō)許多的替換、修改和變化將是顯而易見(jiàn)的。因此,作為在上面闡述的本發(fā)明的優(yōu)選實(shí)施例其意圖是說(shuō)明性的,而不是限制性的。無(wú)需脫離本發(fā)明的精神和范圍可以進(jìn)行各種各樣的改變。
附錄例1<pre listing-type="program-listing"><![CDATA[Megaco/1[123.123.92.45]2944;IP address/Port of MGC Transaction=55500{ Context=’ContextID1’{ Modify=’TerminationID1’{ Events=’EventRequestID1’{ playaudio/playcomplete{};Signal Completion } Signals{ SignalList=’SignalListID1’{ Playaudio/Play{ ASC=’AudioStreamContainer1’ } Playaudio/Play{ ASC=’AudioStreamContainer2’ } } } } } } Megaco/1[123.123.92.150]2944;IP Address/Port of MG Reply=55500{ Context=’Context ID1’{ Modify=’TerminationID1’{}} }]]></pre>例2<pre listing-type="program-listing"><![CDATA[ Megaco/1[123.123.92.45]2944 Transaction=55501 { Context=’ContextID1’{ Modify=’TerminationID1’{ Signals{ Playaudio/Pause{}, ?。籖eusing’SignalListID1’is the same as specifying keepActive SignalList=’SignalListID1’{ Playaudio/Play{ ASC=’AudioStreamContainer1’ } Playaudio/Play{ ASC=’AudioStreamContainer2’ } } } } } } Megaco/1[123.123.92.150]2944 Reply=55501{ Context=’ContextID1’{ Modify=’TerminationID1’{}} }]]></pre>例3<pre listing-type="program-listing"><![CDATA[ Megaco/1[123.123.92.45]2944 Transaction=55502{ Context=’ContextID1’{ Modify=’TerminationID1’{ Signals{ Playaudio/Resume{}, ??;Reusing SignalListID1 is the same as specifying keepActive. SignalList=’SignalListID1’{ Playaudio/Play{ ASC=’AudioStreamContainer1’ } Playaudio/Play{ ASC=’AudioStreamContainer2’ } } } } } } Megaco/1[123.123.92.150]2944 Reply=55502{ Context=’ContextID1’{ Modify=’TerminationID1’{} }}]]></pre>例4<pre listing-type="program-listing"><![CDATA[ Megaco/1[123.123.92.150]2944 Transaction=55503{ Context=’ContextID1’{ Notify=’TerminationID1’{ ObservedEvents=’EventRequestID1’{ 20000301T22020002PlayAudio/PlayComplete{;Timestamped event TermMethod=EOD, ASC=’AudioStreamContainer2’, Offset=10000;AudioStreamContainer2 played 10 sees of data } } } } } Megaco/1[123.123.92.45]2944 Reply=55503{ Context=’ContextID1’{ Notify=’TerminationID1’{} } }]]></pre>例5<pre listing-type="program-listing"><![CDATA[ Megaco/1[123.123.92.45]2944 Transaction=55600{ Context=’ContextID1’{Modify=’TerminationID1’{ Media{TerminationState{Buffer=Off}};Ensure no event buffering Events=’EventRequestID2’{ Playaudio/playcomplete{},;Play Completion Event dd/d1{;Detect DTMF Digit’1’Event Embed{;Speed up Current Play by 5% Signals{ playaudio/AdjustSpeed{ChangeType=SpeedUp,SpeedChange=5}, playaudio/Play{ASC=’AudioStreamContainer1’,keepActive} } } } dd/d2{;Detect DTMF Digit’2’Event Embed{;Slow down Current Play by 5% Signals{ playaudio/AdjustSpeed{ChangeType=SpeedDown, SpeedChange=5}, playaudio/Play{ASC=’AudioStreamContainer1’,keepActive} } } } dd/d3{;Detect DTMF Digit’3’Event Embed{;Return play to normal speed Signals{ playaudio/AdjustSpeed{ChangeType=NormalSpeed}, playaudio/Play{ASC=’AudioStreamContainer1’,keepActive}} } } dd/d4{;Detect DTMF Digit’4’Event Embed{;Increase play volume by 2dB Signals{ playaudio/AdjustVolume{ChangeType=VolumeUp,VolumeChange=2} , playaudio/Play{ASC=’AudioStreamContainer1’,keepActive} } } } dd/d5{;Detect DTMF Digit’5’Event Embed{;Decrease play volume by 2dB Signals{ playaudio/AdjustVolume{ChangeType=VolumeDown,VolumeChange ?。?}, playaudio/Play{ASC=’AudioStreamContainer1’,keepActive} } } } dd/d6{;Detect DTMF Digit’6’Event Embed{;Return to normal volume Signals{ playaudio/AdjustVolume{ChangeType=NormalVolume}, playaudio/Play{ASC=’AudioStreamContainer1’,keepActive} }} } dd/d7{;Detect DTMF Digit’7’Event Embed{;Jump ahead 2 seconds(specified in ms) Signals{ ;The default jump signal is to jump forward in time units playaudio/Jump{ JumpMode=JumpUnit,JumpDirection=Forward, JumpUnitType=JumpTime,JumpUnitValue=2000 }, playaudio/Play{ASC=’AudioStreamContainer1’,keepActive} } } } dd/d8{;Detect DTMF Digit’8’Event Embed{;Jump backward 2 seconds Signals{ playaudio/Jump{ JumpMode=JumpUnit,JumpDirection=JumpBackward, JumpUnitType=JumpTime,JumpUnitValue=2000}, playaudio/Play{ASC=’AudioStreamContainer1’,keepActive} } } } dd/ds{;Detect DTMF Digit’*’Event Embed{;Pause the play Signals{playaudio/Pause{}, playaudio/Play{ASC=’AudioStreamContainer1’,keepActive} } } } dd/do{;Detect DTMF Digit’#’Event Embed{;Resume the play Signals{ playaudio/Resume{}, playaudio/Play{ASC=’AudioStreamContainer1’,keepActive} } } } Signals{;Start the Play of TVMObject1 playaudio/Play { ASC=’AudioStreamContainer1’ } } } } } } Megaco/1[123.123.92.150]2944 Reply=55600{ Context=’ContextID1’{ Modify=’TerminationID1’{} }}]]></pre>例6<pre listing-type="program-listing"><![CDATA[ Megaco/1[123.123.92.150]2944 Transaction=55601{ Context=’ContextID1’{ Notify=’TerminationID1’{ ObservedEvents=’EventRequestID2’{ 20000301T22040002playaudio/playcomplete{;Timestamped event TermMethod=EOD,;Play terminated because of End of Data ASC=’AudioStreamContainer1’, Offset=60000;AudioStreamContainer1 played for 60 seconds } } } } } Megaco/1[123.123.92.45]2944 Reply=55601 { Context=’ContextID1’{ Notify=’TerminationID1’{} } }]]></pre>
權(quán)利要求
1.一種播放音頻組件,被包括在音頻信源功能件中,包括一個(gè)音頻播放處理模塊,用于響應(yīng)接收的信號(hào)以請(qǐng)求一個(gè)分離的媒介網(wǎng)關(guān)去播放音頻數(shù)據(jù)流,其中,基于至少一個(gè)在該播放音頻組件和該分離的媒介網(wǎng)關(guān)之間傳播的信號(hào)而改變?cè)撘纛l播放,以及按照其終止的理由分析作為結(jié)果而發(fā)生的播放。
2.如權(quán)利要求1所述的播放音頻組件,進(jìn)一步包括一個(gè)音量調(diào)節(jié)處理模塊,用于改變?cè)撘纛l數(shù)據(jù)流的音量。
3.如權(quán)利要求1所述的播放音頻組件,進(jìn)一步包括一個(gè)播放暫停和重新開(kāi)始處理模塊,用于響應(yīng)一個(gè)播放暫停請(qǐng)求去暫停音頻播放,并且其后響應(yīng)一個(gè)重新開(kāi)始播放請(qǐng)求去重新開(kāi)始該音頻播放。
4.如權(quán)利要求1所述的播放音頻組件,進(jìn)一步包括一個(gè)向前跳躍處理模塊,用于向前跳躍到在該音頻數(shù)據(jù)流中指定的位置,和一個(gè)向后跳躍處理模塊,用于向后跳躍到在該音頻數(shù)據(jù)流中指定的位置。
5.如權(quán)利要求1所述的播放音頻組件,進(jìn)一步包括一個(gè)編碼器處理模塊,用于允許該分離的媒介網(wǎng)關(guān)去指定或者確定由此支持的編碼器類(lèi)型。
6.如權(quán)利要求1所述的播放音頻組件,進(jìn)一步包括一個(gè)播放分析處理模塊,用于確定導(dǎo)致該音頻播放停止的條件,并且將該條件傳遞到該分離的媒介網(wǎng)關(guān)。
7.如權(quán)利要求1所述的播放音頻組件,進(jìn)一步包括一個(gè)文本轉(zhuǎn)換模塊,用于遵照SAPI規(guī)范產(chǎn)生從文字到語(yǔ)音的轉(zhuǎn)換。
8.一種記錄音頻組件,包括在音頻信源功能件中,包括一個(gè)音頻記錄處理模塊,用于響應(yīng)接收的信號(hào)以請(qǐng)求一個(gè)分離的媒介網(wǎng)關(guān)記錄一個(gè)音頻數(shù)據(jù)流,其中,基于至少一個(gè)在該記錄音頻組件和該分離的媒介網(wǎng)關(guān)之間傳播的信號(hào)而改變媒介記錄,以及按照其終止的理由分析作為結(jié)果而發(fā)生的媒介記錄。
9.如權(quán)利要求8所述的記錄音頻組件,進(jìn)一步包括一個(gè)記錄暫停和重新開(kāi)始處理模塊,用于響應(yīng)一個(gè)記錄暫停請(qǐng)求去暫停音頻記錄,并且其后響應(yīng)一個(gè)重新開(kāi)始記錄請(qǐng)求去重新開(kāi)始該音頻記錄。
10.如權(quán)利要求8所述的記錄音頻組件,進(jìn)一步包括一個(gè)附加處理模塊,用于附加一個(gè)記錄到一個(gè)現(xiàn)有的記錄。
11.如權(quán)利要求8所述的記錄音頻組件,進(jìn)一步包括一個(gè)格式指定處理模塊,用于指定一個(gè)記錄的數(shù)字編碼格式。
12.如權(quán)利要求8所述的記錄音頻組件,進(jìn)一步包括一個(gè)記錄位置處理模塊,用于使該分離的媒介網(wǎng)關(guān)能夠定位應(yīng)該生成該記錄的位置。
13.如權(quán)利要求8所述的記錄音頻組件,進(jìn)一步包括一個(gè)暫停壓縮處理模塊(也稱為靜音壓縮過(guò)程),用于從記錄中檢測(cè)和消除語(yǔ)音靜止的時(shí)間周期。
14.如權(quán)利要求8所述的記錄音頻組件,進(jìn)一步包括一個(gè)記錄提示音調(diào)產(chǎn)生處理模塊,用于產(chǎn)生固定的或者可配置的提示音調(diào)。
15.如權(quán)利要求8所述的記錄音頻組件,進(jìn)一步包括一個(gè)記錄分析處理模塊,用于確定所記錄音頻的長(zhǎng)度,并且識(shí)別導(dǎo)致記錄操作停止的記錄結(jié)束條件。
16.一種播放音頻數(shù)據(jù)流的方法,包括提供一個(gè)包括在一個(gè)音頻信源功能件中的播放音頻組件,其駐留在一個(gè)音頻信源服務(wù)器上,所述播放音頻組件具有播放音頻處理;將請(qǐng)求信號(hào)傳遞到該播放音頻處理;響應(yīng)傳遞給該播放音頻處理的該請(qǐng)求信號(hào),請(qǐng)求一個(gè)分離的媒介網(wǎng)關(guān)去播放一個(gè)音頻數(shù)據(jù)流;基于至少一個(gè)在該播放音頻組件和該分離的媒介網(wǎng)關(guān)之間傳播的信號(hào)而改變媒介播放;和按照其終止的理由分析一個(gè)作為結(jié)果而發(fā)生的播放。
17.如權(quán)利要求16所述的播放音頻數(shù)據(jù)流的方法,其中,該改變步驟包括提供一個(gè)音量調(diào)節(jié)處理,并且使該音量調(diào)節(jié)處理工作而改變?cè)撘纛l數(shù)據(jù)流的音量。
18.如權(quán)利要求16所述的播放音頻數(shù)據(jù)流的方法,其中,該改變步驟包括提供一個(gè)播放暫停和重新開(kāi)始處理,并且響應(yīng)一個(gè)播放暫停請(qǐng)求,使該播放暫停和重新開(kāi)始處理工作而暫停音頻播放,并且其后響應(yīng)一個(gè)重新開(kāi)始播放請(qǐng)求而重新開(kāi)始該音頻播放。
19.如權(quán)利要求16所述的播放音頻數(shù)據(jù)流的方法,其中該改變步驟包括提供一個(gè)向前跳躍處理,并且使該向前跳躍處理工作而向前跳躍到在該音頻數(shù)據(jù)流中一個(gè)指定的位置,和提供一個(gè)向后跳躍處理,并且使該向后跳躍處理工作而向后跳躍到在該音頻數(shù)據(jù)流中一個(gè)指定的位置。
20.如權(quán)利要求16所述的播放音頻數(shù)據(jù)流的方法,其中,該改變步驟包括提供一個(gè)編碼器處理,并且使該編碼器處理工作而指定或者確定由此支持的編碼器類(lèi)型。
21.如權(quán)利要求16所述的播放音頻數(shù)據(jù)流的方法,其中,該分析步驟包括提供一個(gè)播放分析處理,并且在操作中分析播放信號(hào)以確定導(dǎo)致該音頻播放停止的條件,并且將該條件傳遞到該分離的媒介網(wǎng)關(guān)。
22.如權(quán)利要求16所述的播放音頻數(shù)據(jù)流的方法,其中,該改變步驟包括提供一個(gè)文本轉(zhuǎn)換處理,并且遵照SAPI規(guī)范使該文本轉(zhuǎn)換處理工作而產(chǎn)生從文字到語(yǔ)音的轉(zhuǎn)換。
23.一種記錄音頻數(shù)據(jù)流的方法,包括提供一個(gè)包括在一個(gè)音頻信源功能件中的記錄音頻組件,其駐留在一個(gè)音頻信源服務(wù)器上,所述記錄音頻組件具有記錄音頻處理;將一個(gè)請(qǐng)求信號(hào)傳遞到該記錄音頻處理;響應(yīng)傳遞給該記錄音頻處理的該請(qǐng)求信號(hào),請(qǐng)求一個(gè)分離的媒介網(wǎng)關(guān)去記錄一個(gè)音頻數(shù)據(jù)流;基于至少一個(gè)在該記錄音頻組件和該分離的媒介網(wǎng)關(guān)之間傳遞的信號(hào)而改變媒介記錄;和按照其終止的理由分析一個(gè)作為結(jié)果而發(fā)生的記錄。
24.如權(quán)利要求23所述的記錄音頻數(shù)據(jù)流的方法,其中,該改變步驟包括響應(yīng)一個(gè)記錄暫停請(qǐng)求,提供一個(gè)記錄暫停和重新開(kāi)始處理,并且使該記錄暫停和重新開(kāi)始處理工作而暫停音頻記錄,以及其后響應(yīng)一個(gè)重新開(kāi)始記錄請(qǐng)求去重新開(kāi)始該音頻記錄。
25.如權(quán)利要求23所述的記錄音頻數(shù)據(jù)流的方法,其中該改變步驟包括提供一個(gè)附加處理,并且使該附加處理工作而附加一個(gè)記錄到一個(gè)現(xiàn)有的記錄。
26.如權(quán)利要求23所述的記錄音頻數(shù)據(jù)流的方法,其中,該改變步驟包括提供一個(gè)格式指定處理,并且使該格式指定處理工作而指定一個(gè)記錄的數(shù)字編碼格式。
27.如權(quán)利要求23所述的記錄音頻數(shù)據(jù)流的方法,其中,該改變步驟包括提供一個(gè)記錄位置處理,并且使該記錄位置處理工作而能夠定位應(yīng)該生成該記錄的位置。
28.如權(quán)利要求23所述的記錄音頻數(shù)據(jù)流的方法,其中,該改變步驟包括提供一個(gè)暫停壓縮處理,并且操作該暫停壓縮處理去從一個(gè)記錄中除去語(yǔ)音靜止的時(shí)間周期。
29.如權(quán)利要求23所述的記錄音頻數(shù)據(jù)流的方法,其中,該改變步驟包括提供一個(gè)記錄提示音調(diào)產(chǎn)生處理,并且操作該記錄提示音調(diào)產(chǎn)生處理,以產(chǎn)生一個(gè)固定的或者可配置的提示音調(diào)。
30.如權(quán)利要求23所述的記錄音頻數(shù)據(jù)流的方法,其中,該分析步驟包括提供一個(gè)記錄分析處理,并且操作該記錄分析處理以確定被記錄音頻的長(zhǎng)度。
31.如權(quán)利要求23所述的記錄音頻數(shù)據(jù)流的方法,其中,該分析步驟包括提供一個(gè)記錄分析處理,并且操作該記錄分析處理以識(shí)別一個(gè)導(dǎo)致記錄操作停止的記錄終止條件。
全文摘要
本發(fā)明示范的實(shí)施例通過(guò)對(duì)于若干個(gè)H.248/Megaco ARF擴(kuò)展進(jìn)行限定,提供類(lèi)似用于H.248/Megaco控制的媒介網(wǎng)關(guān)和/或媒介服務(wù)器的類(lèi)似ECTF S.100功能,在該協(xié)議內(nèi)它們是可允許的,以允許在一個(gè)媒介網(wǎng)關(guān)內(nèi)的終端進(jìn)一步改進(jìn)媒介處理能力。
文檔編號(hào)H04M3/53GK1575574SQ01822925
公開(kāi)日2005年2月2日 申請(qǐng)日期2001年12月21日 優(yōu)先權(quán)日2000年12月28日
發(fā)明者保羅·魯普西斯 申請(qǐng)人:英特爾公司