專利名稱:用于在電信網(wǎng)上傳輸消息的方法和系統(tǒng)及相關(guān)發(fā)送器終端的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電信網(wǎng)上消息的傳輸。
背景技術(shù):
例如按照UMTS標(biāo)準(zhǔn)(通用移動電信系統(tǒng))或GSM/GPRS標(biāo)準(zhǔn)(全球移動通信系統(tǒng)和通用分組無線電業(yè)務(wù)的縮寫)的新一代移動終端的引入使得能夠傳輸和在終端上顯示具有包括如文本、聲音、圖像、也可能還有運動圖像等的不同要素的多媒體內(nèi)容的消息。所述消息當(dāng)前被表示為MMS,即,多媒體消息傳送系統(tǒng)的縮寫。
發(fā)送所述消息的能力引起不同類型的問題。
第一方面,必須保證所述消息可以通過使用如移動電話的設(shè)備相對容易地被構(gòu)建,該設(shè)備由于減小的尺寸和處理能力,不能理想地適合于生成具有復(fù)雜內(nèi)容的消息。
第二方面,希望具有發(fā)送和接收MMS消息的能力的終端能夠與老的一代終端,諸如按照GSM標(biāo)準(zhǔn)運行的移動終端的并只能生成當(dāng)前稱為SMS-短消息業(yè)務(wù)的縮寫-的那種文本消息的老一代終端共存和交互。有理由認(rèn)為在所有當(dāng)前流行的終端被替代之前的相當(dāng)長的一段時間內(nèi)兩種技術(shù)肯定會共存。
發(fā)明內(nèi)容
本發(fā)明的目的是支持具有發(fā)送如SMS消息那樣的文本消息的能力的終端與能夠接收MMS消息的終端之間的共存和交互。
按照本發(fā)明,所述目的是由于其特征為在以下的權(quán)利要求中具體地闡述的方法而達(dá)到的。本發(fā)明還包括相關(guān)的系統(tǒng)以及相應(yīng)的發(fā)送器終端。
實際上,按照本發(fā)明的解決方案允許老一代終端--能夠發(fā)送SMS文本消息的--導(dǎo)致具有要到MMS終端的多媒體內(nèi)容的消息的生成。
在當(dāng)前的優(yōu)選實施例中,按照本發(fā)明的解決方案允許提供一種業(yè)務(wù),它把純文本消息自動變換成多媒體消息,從而變換成比起由純文本構(gòu)成的開始的消息”更豐富的”消息。
在當(dāng)前的優(yōu)選實施例中,按照本發(fā)明的解決方案提供了使用由同一個申請人制造的、并由注冊商標(biāo)JoeXpress標(biāo)識的基于文本或自然音頻來自動化一個三維人物的系統(tǒng)。
在這方面,查詢文件EP-A-0 991 023、EP-A-0 993 197、和WO-A-01/75805是有用的。所討論的系統(tǒng)能夠把文本或記錄的語音變換成講出處理的句子的人物的運動。所述運動也包括沒有與講的話、面部表情和身體運動聯(lián)系起來的運動。系統(tǒng)還能夠操縱其它要素,諸如人物外貌的個性(例如,頭發(fā)顏色、眼睛顏色、衣著方式等等)、人物所處的位置,觀察點的移動,背景音樂。所有這些都在從所提供的有限數(shù)目的輸入?yún)?shù)來構(gòu)建視頻剪輯時同時發(fā)生。
這樣,按照本發(fā)明的解決方案例如允許根據(jù)被包含在起始SMS消息中的內(nèi)容生成要到MMS終端的動畫。在這種情形下,結(jié)果是包括諸如場景描述部分(以”同步的多媒體集成語言”或SMIL表示)和包含要被插入消息中的多媒體對象的部分的不同的部分的MMS消息,在這些部分之間自動生成動畫。
第一代MMS終端受到對于消息內(nèi)容的相當(dāng)嚴(yán)格的約束限制具體地,不支持視頻且消息的最大尺寸是30千字節(jié)。按照本發(fā)明的解決方案的優(yōu)選實施例因此允許以生成的MMS語言引入具有小的尺寸的動畫。具體地,視頻被變換成按照GIF標(biāo)準(zhǔn)(用于圖形交換格式的縮寫)的圖像,這個圖像經(jīng)受使用相當(dāng)?shù)偷膭赢嫴蓸铀俾实膭赢?,即,約1Hz。
而且,原始的文本被在序列的各個幀之間子劃分。通過這樣做,利用尺寸例如約為100×80像素(當(dāng)前市場上的MMS終端的顯示單元的尺寸)的動畫,可以生成包含具有復(fù)雜的模型和場景的持續(xù)約15秒或在較簡單的模型的情況下更長的動畫的消息,這允許在動畫的GIF圖像內(nèi)更高的壓縮比。
如果消息的總的尺寸是有限的(例如,30千字節(jié))而使得同時發(fā)送視頻和音頻是成問題的,則在觀看動畫的GIF圖像期間有可能使得終端重現(xiàn)被插入在消息中的旋律,而不是語音消息這種類型的聲音(“振鈴聲”)能夠被包含在非常小數(shù)目的字節(jié)中。
在對于消息的尺寸存在不太嚴(yán)格的約束時,按照本發(fā)明的解決方案允許發(fā)送與由例如語音合成器生成的與動畫有關(guān)的音頻,而不是發(fā)送在幀里面的文本或甚至與其并行地發(fā)送。在這種形下,有可能甚至從自然音頻自動生成MMS消息,在這種情形下,動畫通過由語音識別器實行的處理的結(jié)果引導(dǎo)。能夠?qū)嵭猩鲜龉δ艿恼Z音合成器和語音識別器當(dāng)前在本領(lǐng)域是可得到的。
除了動畫以外,MMS消息還可以有利地考慮旨在于包含對插入例如所謂的“標(biāo)記”(logo)和/或廣告標(biāo)語有用的更多文本、旋律和圖像的部分。
現(xiàn)在參照附圖,完全作為非限制的例子來描述本發(fā)明,其中圖1在功能體系結(jié)構(gòu)級別上顯示能夠按照本發(fā)明運行的系統(tǒng)的結(jié)構(gòu),圖2是顯示按照本發(fā)明的用于發(fā)送消息的步驟的流程圖,以及圖3,其包括分別表示為3A和3B的兩個部分,重現(xiàn)顯示按照本發(fā)明的系統(tǒng)的安排的可能的形式的功能方框圖的兩個鄰近的部分。
具體實施例方式
這里提供的說明參照現(xiàn)在至少是對于本發(fā)明的可能的使用來說最有吸引力的一個的應(yīng)用情形,即,把在GSM移動終端中作為SMS消息生成的文本消息變換成將要在按照UMTS標(biāo)準(zhǔn)運行的網(wǎng)絡(luò)上傳輸?shù)腗MS消息。
無論如何,按照本發(fā)明的解決方案也可以應(yīng)用于不同地生成的、例如電子郵件消息的形式的文本消息,以及它可被使用來在諸如支持這樣的傳輸?shù)娜魏晤愋偷木W(wǎng)絡(luò)上發(fā)送MMS消息,因此不限于UMTS網(wǎng)絡(luò)。
在圖1上,標(biāo)號10統(tǒng)一表示具有MMS中繼/服務(wù)器的功能的模塊,以及為此包括具有中繼功能的子模塊,被表示為101;和具有服務(wù)器功能的子模塊,被表示為102,通過被表示為103的接口被互相連接。自然地,子模塊102和103也可以互相集成。
標(biāo)注數(shù)字11代替地表示MMS業(yè)務(wù)的用戶的數(shù)據(jù)庫。這基本上是其中為可獲得MMS業(yè)務(wù)的每個用戶記錄電話號碼(或等同的指示)和有關(guān)所討論的用戶采用的終端類型的信息的數(shù)據(jù)庫。
數(shù)據(jù)庫11通過接口111被連接到模塊10。
標(biāo)注數(shù)字12和13表示在網(wǎng)絡(luò)中被連接到模塊10(這可以典型地發(fā)生在UMTS網(wǎng)絡(luò))以便能夠接收MMS消息的兩個用戶。
被表示為12的用戶是被直接包括在其中連結(jié)有模塊10的網(wǎng)絡(luò)中的用戶。相關(guān)的連接因此是通過被表示為121的接口的直接類型。
而被表示為13的用戶是被標(biāo)稱地連結(jié)到另一個移動網(wǎng)的用戶。
在這種情形下,與模塊10的連接不是直接的,而是借助于被表示為131a和131b的相應(yīng)的接口通過基本上類似于接口10的附加模塊10’達(dá)到的。
用戶12和用戶13的不同表示,是為了強(qiáng)調(diào)在其中多個電信網(wǎng)絡(luò)以通用互聯(lián)網(wǎng)共同運行的情形或漫游情形中也應(yīng)用按照本發(fā)明的解決方案的可能性。
標(biāo)注數(shù)字14表示通過各個接口141被連接到模塊10,以便能夠作為MMS消息的接收者運行的服務(wù)器,諸如電子郵件服務(wù)器。
最后,標(biāo)注數(shù)字15表示通過各個接口151被連接到模塊10的用于對MMS消息業(yè)務(wù)的提供進(jìn)行記賬的系統(tǒng)。
這里描述的系統(tǒng)體系結(jié)構(gòu)和各種構(gòu)成的單元相應(yīng)于被認(rèn)為在本領(lǐng)域中全都知道的解決方案。這些解決方案已能被使用于在電信網(wǎng)絡(luò)內(nèi)發(fā)送MMS消息(這樣的新一代移動網(wǎng)絡(luò)按照UMTS標(biāo)準(zhǔn)運行)。這個事實使得在這里提供對于所討論的體系結(jié)構(gòu)和單元的更詳細(xì)的說明成為多余的。
按照本發(fā)明的解決方案的重要的特征是通過以下事實給出的、優(yōu)選地通過各個接口161,將能夠把諸如來自SMS消息管理中心17(通常稱為縮寫SMSC)的SMS消息的純文本消息變換成具有多媒體內(nèi)容的消息的模塊或子系統(tǒng)16與模塊10相聯(lián)系。在模塊10中進(jìn)行可能的進(jìn)一步處理后,所述消息可以由模塊10以要到諸如圖1所示的用戶12,13和14那樣的用戶的MMS消息的形式進(jìn)行廣播。
具體地,模塊10可被配置成允許確定的消息MMS傳輸?shù)蕉鄠€接收者或接收者列表。因此,雖然此后將幾乎僅僅參考從SMS消息生成被發(fā)送到單個接收者的MMS消息,但按照本發(fā)明的解決方案容易適合于允許把所討論的MMS消息廣播到例如借助于http請求或借助于被發(fā)送到模塊10的ftp請求規(guī)定的接收者列表。
如前所述,模塊16的核心是由用于創(chuàng)建由文本或自然的語音產(chǎn)生動畫的虛擬人物表示的多媒體內(nèi)容的系統(tǒng)組成的。這樣的系統(tǒng)的例子是上面提到的JoeXpress系統(tǒng)。
這樣的系統(tǒng)使得用戶能夠選擇虛擬人物,它的背景,任何個性,要產(chǎn)生的內(nèi)容的格式。選擇的參數(shù)被使用來用想要的情景和格式產(chǎn)生動畫。
圖2的流程圖顯示處理步驟,通過這些步驟,按照本發(fā)明的系統(tǒng)被在圖1上顯示為18的、起到”發(fā)送者”作用的用戶訪問。用戶18具有終端,該終端能夠把SMS消息發(fā)送到能夠處理這種類型的消息的相應(yīng)的中心,諸如在圖1上顯示為17的中心。
從被表示為200的起始步驟開始,標(biāo)注數(shù)字202表示其中用戶18在他/她的終端上編寫SMS消息(其特征在此后會更好地說明)的步驟把它發(fā)送到與業(yè)務(wù)有關(guān)的電話號碼,該電話號碼在給所述SMS消息提供MMS特征后轉(zhuǎn)發(fā)它。
所討論的業(yè)務(wù)主要由被表示為16的模塊實施,但某些功能可以由模塊10執(zhí)行,以及可能由模塊17執(zhí)行。
在圖2上被表示為204的步驟中,業(yè)務(wù)管理功能--因此基本上是模塊16--生成對發(fā)送相應(yīng)于接收的SMS消息的MMS消息的請求。正如此后更好地解釋的,除了消息本身以外,這樣的請求還包含用戶的識別號以及(可能地)有關(guān)接收終端的類型的信息。
在被表示為206的步驟中,模塊16處理接收的請求,生成適合于接收終端的圖形和處理能力特征的MMS消息。在被表示為208的步驟中,所述MMS消息被發(fā)送到相應(yīng)的MMS中心(諸如模塊10),相應(yīng)的MMS中心在以后的步驟208中,把消息轉(zhuǎn)發(fā)到接收終端,諸如終端12,13或14。
步驟210表示其中把所述消息按照MMS的顯示的典型的模式顯示給接收終端的步驟。一旦通過讀出MMS消息而完成傳輸,系統(tǒng)就移到被表示為212的結(jié)束步驟。
將要由用戶在步驟202撥打的與業(yè)務(wù)有關(guān)的電話號碼優(yōu)選地是通常稱為”大帳戶”的那種專用電話號碼。
由用戶發(fā)送的字符序列,除了消息的文本以外,還包含在報頭中的某些信息,諸如MMS消息的接收者的電話號碼(圖1上的用戶12、13,14)、將重現(xiàn)消息的虛擬人物和它被插入到的背景。
最后兩個信息項是任選的,所以可被忽略。在忽略的情形下,相應(yīng)的信息由模塊16自動選擇,例如作為隨機(jī)選擇或作為預(yù)定的選擇(缺省)。自然地,即使僅僅對于所述信息的一部分,這也是可應(yīng)用的例如,如果只規(guī)定人物,則模塊16自動選擇背景。
被發(fā)送到業(yè)務(wù)的字符序列因此通常具有以下形式<recipient telephone number>[<virtual character(<background>)]<text message>
在步驟202,消息的報頭可以人工地或借助于處在終端18中的腳本被編寫,這允許借助于菜單選擇虛擬人物和背景以及從地址簿中選擇接收者。
如果消息被人工地?fù)芴?,則字符序列會包含錯誤。例如,用戶會規(guī)定不存在的虛擬人物或背景的名稱。在這種情形下,業(yè)務(wù)通過自動選擇正確的而代替錯誤信息。
將會看到,所述腳本信息實際上相應(yīng)于在用于發(fā)送SMS消息的某些移動電話終端中提供的功能,其有可能由同一業(yè)務(wù)管理系統(tǒng)遠(yuǎn)程地把相關(guān)的軟件加載到各個終端18(具體地,加載到終端的用戶身份模塊或SIM)。
優(yōu)選地基于以上已經(jīng)幾次提到的JoeXpress系統(tǒng)的用于把SMS文本格式變換成MMS多媒體格式的模塊,優(yōu)選地在被稱為”文本動畫”的模式中被使用。
在這種情形下,SMS消息的文本由語音合成器進(jìn)行處理,語音合成器把文本變換成語音和提供定時的語音序列,然后該語音序列被使用于自動生成選擇的虛擬人物的發(fā)聲活動。
作為到SMS/MMS變換模塊的輸入提供的文本可包含對于最終得到的動畫有影響的元信息,這些元信息把表情和手勢加到虛擬人物上以及改變合成的語音。
所述元信息作為例如可以具有以下形式的字符的序列被插入到文本<tag><action_type>[<par1>][<par2>]...[<parn>]其中<tag>是對于區(qū)分元信息和要被合成的文本所必需的。
<action_type>規(guī)定要執(zhí)行哪個動作。動作的例子是語音音質(zhì)的改變、面部表情或身體運動的重現(xiàn)、觀察點的改變等等。
<par1-n>是修正動作的參數(shù),例如,面部表情的持續(xù)時間的改變。
較高級別上的另一個表示由所謂的”情緒標(biāo)記”組成,即,由在文本通信中在互聯(lián)網(wǎng)中通用的代表情緒狀態(tài)的字符序列組成。情緒標(biāo)記的例子是”;-)”、”-)”、”-o”,等等。
情緒標(biāo)記由系統(tǒng)通過使用上述的表示法被變換成語義上等價的形式。對于情緒標(biāo)記的支持由于它們被用戶所熟悉的和能簡單地插入到文本中而同時具有與低級別表示相同的靈活性的事實而被推動。
像JoeXpress系統(tǒng)那樣的系統(tǒng)產(chǎn)生三維模型的動畫,它們可以由系統(tǒng)轉(zhuǎn)換成不同的格式,這些格式可以取決于三維信息是否被保持而被分類成兩類。
屬于第一類的有,例如,MPEG-4面部和身體動畫參數(shù)序列、VRML動畫(虛擬現(xiàn)實模型語言的縮寫)、3D演播室最大動畫等等。
屬于第二類的有,視頻編碼格式,像MPEG-1、MPEG-2、MPEG-4視頻、動畫的GIF(雖然它在嚴(yán)格的意義上不是視頻編碼格式,但GIF-89a格式確實允許創(chuàng)建圖像序列)。
動畫的音頻可以連同視頻一起或分開地被編碼,正如在VRML或動畫GIF的情形下那樣。
由于傳輸網(wǎng)絡(luò)的終端的限制,多媒體內(nèi)容受到約束,諸如消息的最大尺寸、空間分辨率、時間分辨率、和動畫的編碼的類型。
為此,除了消息的文本和發(fā)送者的識別號以外,必須考慮多媒體消息要被傳送到的終端的類型。
終端類型實際上標(biāo)識終端的類別(本質(zhì)上,諸如存儲容量、顯示尺寸等的特征)和由于傳輸網(wǎng)絡(luò)引起的任何其它約束。
將要在按照本發(fā)明的系統(tǒng)中產(chǎn)生的MMS消息因此被調(diào)節(jié)為在施加的約束內(nèi)最有效地利用可用的資源。
這個要求可以以至少兩個不同的方式被滿足。
第一種方式規(guī)定在步驟204生成的創(chuàng)建MMS消息的請求除了消息的文本和發(fā)送者的識別號以外,還包含表示要被生成的消息必須屬于的類別的信息,即MMS消息要到的終端的類型以及進(jìn)而它的性能特征。將要綜合SMS文本消息的視頻內(nèi)容然后按照接收終端類型被生成,即,被這樣地生成以使得MMS消息(從通過綜合所述視頻內(nèi)容與SMS消息而得到的多媒體消息中得出)直接與將要接收多媒體消息的MMS終端的特征兼容。
當(dāng)這個解決方案被采用時,模塊16能夠根據(jù)接收者的識別號搜索被存儲在數(shù)據(jù)庫11中的終端類型信息。在模塊16與數(shù)據(jù)庫11之間的連接,按照圖1所涉及的準(zhǔn)則,可以是通過模塊10的直接或間接類型。
得到相同的結(jié)果的第二種方式規(guī)定多媒體視頻內(nèi)容(將要被加到SMS消息)由模塊16根據(jù)作為標(biāo)準(zhǔn)的準(zhǔn)則被生成,從而與消息將要被發(fā)送到的終端的類型無關(guān)。
從由SMS文本消息與所述標(biāo)準(zhǔn)多媒體視頻內(nèi)容之間的綜合得出的多媒體消息被模塊16轉(zhuǎn)發(fā)到模塊10,該模塊10從數(shù)據(jù)庫11讀出有關(guān)接收終端的信息后,將從多媒體消息得出的MMS消息”專門化”,使它適合于接收終端的特征。
采用一個還是另一個解決方案的選擇主要是由應(yīng)用考慮決定的。
第一個解決方案,至少在原理上,具有不需要生成在消息適合于接收終端的要求時將要被丟棄的信息的優(yōu)點。然而,這個優(yōu)點被保證模塊16能夠接收位于數(shù)據(jù)庫11中的有關(guān)終端的類型的信息的需要抵消。
第二解決方案具有這樣的優(yōu)點它利用通常已經(jīng)為當(dāng)前的MMS應(yīng)用提供的在模塊10的級別上的數(shù)據(jù)庫11的信息的可用性。在當(dāng)前的MMS應(yīng)用中,模塊10已經(jīng)能夠達(dá)到按照接收終端的特征轉(zhuǎn)發(fā)的MMS消息的專門化。然而,上述的優(yōu)點至少部分地被以下事實減弱這個解決方案需要由模塊16生成將要被丟棄的信息。
無論采用哪個解決方案,有可能從以下事實獲得好處相同的動畫可以在MMS消息中以基本上不同的方式表示。
例如,如上所述,可以利用每秒小數(shù)目的幀的動畫GIF圖像,在這種情形下,每個幀顯示由人物在該時刻發(fā)音的消息的文本。這個特別緊湊的表示非常適用于其中消息尺寸約束特別嚴(yán)格或當(dāng)接收終端不能顯示視頻時的情形。
替換地,可以通過壓縮音頻利用動畫的GIF圖像。在這種情形下,合成的語音,連同場情景音頻一起,也被包括在消息中。當(dāng)消息的尺寸足夠大能包含運動圖像和音頻軌道時,這是對于不支持視頻但能夠處理音頻的終端的有用的表示。
另外的替換例通過連同音頻一起的視頻剪輯表示。在這種情形下,得到的動畫由于通過視頻編碼提供的比動畫GIF圖像更高的壓縮比和動畫中經(jīng)常使用的更高數(shù)目的幀而在其運動方面更具有流動性。這種解決方案可以用于能夠支持視頻編碼的終端。
應(yīng)當(dāng)強(qiáng)調(diào),以上所述的把消息打包的方法僅僅是例子,它們完全不是按照本發(fā)明的解決方案提供的全部可能性。
現(xiàn)在參照圖3A和3B描述圖1上表示為16的模塊的可能的體系結(jié)構(gòu)安排。
方框或模塊300旨在于接收實際上由終端18發(fā)送的SMS消息作為其輸入,以及對其執(zhí)行從報頭提取信息的操作。
如前所述,文本的第一部分由報頭表示,該報頭包含接收終端(例如,參照圖1,終端12、終端13、或終端14)的數(shù)目以及任選地包含發(fā)送者用戶想要使用來生成視頻內(nèi)容的人物和背景的指示。這些數(shù)據(jù)通過分隔符字符從實際的消息中分隔出。消息可包含影響最終得到的動畫的、低或高級別元信息(例如,所謂的情緒標(biāo)記)。
作為這樣的文本的例子,可以考慮以下的字符串“3356121180 Morpheus Country@H1!I’m at the beach-)butI’m getting bored without you,\kyawn.150.”在該例子中,所使用的分隔符是字符@。
與所討論的消息有關(guān)的是發(fā)送者的識別號以及,可能地,表示接收終端模型的字符串。
標(biāo)注數(shù)字302表示模塊16的數(shù)據(jù)庫,它在基于JoeXpress系統(tǒng)的優(yōu)選實施方案中包含諸如可被使用來生成視頻內(nèi)容的字符表、與它們有關(guān)的語言、可得到的場景等等的信息。數(shù)據(jù)庫302也包含人物和背景的三維模型。
方框300與數(shù)據(jù)庫302共同運行,從消息中提取報頭信息,諸如接收者的識別號,以及被使用來創(chuàng)建視頻內(nèi)容的人物和背景。
方框300然后與包含字符表、語音、可得到的背景的數(shù)據(jù)庫302通信,以及如果這些信息在接收的SMS消息的報頭中是被省略或是錯誤的,則方框300自動選擇正確的任選項。
方框300在它的輸出端處輸出以下數(shù)據(jù)/信息--將要發(fā)送到其功能此后將更容易明白的附加方框302的不帶有報頭的消息文本(“H1!I’m at the beach-)but I’m getting boredwithout you,\kyawn.150.”);--人物P--動畫的主角--的名字(在這里示出的例子中,所述名字是”Morpheus”),--與人物有關(guān)的語言L(例如英語),--相應(yīng)于其中放置虛擬人物P的場景的背景A(在這里考慮的例子中,背景是”鄉(xiāng)村”背景),以及--接收者D的識別號(在所示的例子中,由號碼3356121180構(gòu)成)。
從方框300接收消息M的文本開始,方框320把情緒標(biāo)記變換成能夠被信息系統(tǒng)使用的元信息,信息系統(tǒng)同時確定哪個文本將被插入到組成構(gòu)成模塊16的輸出的MMS消息的動畫的幀中。
所以,方框302的輸出由具有低級別信息的文本TBS,即其中情緒標(biāo)記用低級別元信息代替的文本(“H1!I’m at the beach\ksmile butI’m getting bored without you,\kyawn.150.”),和其中所有低級別元信息被消除而只保持人物所說的加上情緒標(biāo)記的文本TE(“H1!I’m atthe beach-)but I’m getting bored without you.”)組成。
由方框302生成的文本TBS被發(fā)送到方框304,方框304旨在于提取在文本中包含的動作表以及準(zhǔn)備具有由語音合成器306使用的形式的文本,以便還得到與前述的動作有關(guān)的定時。
方框304把其中低級別元信息用語音合成器的”標(biāo)簽”代替(文本到語音)的文本TAG發(fā)送到合成器306。所述標(biāo)簽是由合成器標(biāo)識為專門信息的字符序列,以及被使用來改變合成的語音或從合成器306得到與在合成的句子中的標(biāo)簽有關(guān)的時刻。所述時刻被使用來確定動作的時序。
方框304也連同任意參數(shù)一起生成基本上相應(yīng)于被包含在文本中的動作表的信號TA作為附加輸出。
參照上面幾次提到的SMS消息,實際上包含有兩個動作,即--微笑,和--打呵欠,150。
參數(shù)150修正“打呵欠”動作相對于標(biāo)準(zhǔn)持續(xù)時間的持續(xù)時間。
語音合成器306通過使用由方框300生成的信號L識別的選擇的語言把從方框304接收的文本TAG變換成語音信號。
除了語音信號以外,方框306還產(chǎn)生定時的語音序列FT,被用作為構(gòu)成講話的運動的基礎(chǔ)。應(yīng)當(dāng)想到,定時的語音序列是構(gòu)成講出的句子的音素的序列,并被與音素被講出的時刻綜合在一起。
代替地,被表示為V的信號是實際合成的語音信號。
用標(biāo)注數(shù)字308和310表示的方框是監(jiān)管用于視頻內(nèi)容的人物的講話的動畫和相應(yīng)的面部和身體動畫的機(jī)器。
方框308接收語音序列FT作為輸入,把它變換成“面部表情標(biāo)記(visemic)”序列,即,變換成在講話時由面部產(chǎn)生的運動。為了得到現(xiàn)實的運動,動畫機(jī)考慮相鄰的音素的互相影響結(jié)果,所述共同清晰度現(xiàn)象。所產(chǎn)生的運動是三維的,以及相關(guān)的輸出信號AP由以三維方式和與人物無關(guān)地描述講話的運動的動畫參數(shù)構(gòu)成。這意味著,這樣的參數(shù)可接連地應(yīng)用于具有任何形狀和復(fù)雜性的人物,人等。
用作為面部和身體動畫機(jī)的方框310,根據(jù)相應(yīng)于由被集成在虛擬相加節(jié)點312中的方框304生成的信號TA的動作表用由合成器306生成的關(guān)于動作的時序的信息運行。
方框310以與包含與人物無關(guān)的動畫參數(shù)的形式的面部和身體運動的序列的附加數(shù)據(jù)庫314合作的方式運行,該動畫參數(shù)因此在這方面類似于由方框308輸出的參數(shù)。在本例中,序列”微笑”和”打呵欠”是從數(shù)據(jù)庫314取出的兩個運動。
面部和身體310動畫方框聯(lián)合相應(yīng)于人物必須執(zhí)行的各種運動的各個動作,創(chuàng)建單個動畫參數(shù)序列。各個運動根據(jù)與其有關(guān)的任何參數(shù)進(jìn)行改變。運動也經(jīng)受強(qiáng)度、持續(xù)時間、鏡面反射特征等方面的自動變化,以增強(qiáng)多樣性。最后,也加上由人物執(zhí)行的、但沒有明顯地表示的某些運動,諸如眨眼。
方框310的輸出由代表以三維方式與人物無關(guān)地描述講話的運動的動畫參數(shù)的信號AFC組成。所述參數(shù)因此可接連地應(yīng)用于具有任何形狀和復(fù)雜性的人物,人等,諸如動物。
被表示為316的接連的方框具有把講話的運動(信號AP)與其它運動(信號AFC)混合,以得到現(xiàn)實的結(jié)果的任務(wù)。方框316的運行是基于考慮到正在進(jìn)行對照的運動的優(yōu)先級的邏輯,諸如講出的爆破音素(諸如字母”p”)和打呵欠。最終得到的運動是三維的。
方框316的輸出信號由代表與人物無關(guān)的動畫的信號AIP組成。
信號AIP被饋送到方框318,方框318把獨立的動畫(信號AIP)變換成根據(jù)從方框300提取的信號P選擇的人物的運動。最終得到的運動取決于模型的拓?fù)?。正如以前看到的,與人物有關(guān)的模型被包含在數(shù)據(jù)庫302中。
方框318的輸出信號由識別所選擇的人物的運動序列的信號ADP組成。
所討論的信號ADP被饋送到方框320,方框320把具有來自方框300的背景信息A的信號ADP與關(guān)于直接從數(shù)據(jù)庫302取出的人物和背景的附加信息合并。
所有這些是為了也將可以在場景中顯示(信號A)并可以借助于文本中的元信息驅(qū)動的其余的動畫,作為物體的運動或拍攝鏡頭的觀察點的改變加到人物的動畫中。
方框320的輸出信號由最后的三維動畫信號TRD組成,該三維動畫信號TRD將要發(fā)送到任務(wù)為提供操作,即,任務(wù)為在屏幕上把由人物和背景組成的三維場景表示為像素矩陣的操作的方框322。以規(guī)則的時間間隔得到的所述像素矩陣的序列組成所述方框的輸出。提供方框322的輸出由被表示為FV的動畫的視頻幀序列組成。視頻幀的采樣速率是一個參數(shù),在優(yōu)選方式下它典型地被設(shè)置為25Hz。
信號FV被饋送到附加的方框324作為輸入,附加的方框也將要接收具有由方框302生成的情緒標(biāo)記TE的文本。
方框324在構(gòu)成產(chǎn)生的視頻動畫的各個幀之間分發(fā)文本。所述操作是任選的以及在生成不帶有音頻的MMS消息時,即,其中SMS消息以文本和動畫的形式被顯示的MMS消息時被執(zhí)行。
方框324的輸出由人物和場景的所有運動的組組成。所述信號FVT,實際上相應(yīng)于具有文本的視頻幀序列,被饋送到視頻編碼方框326,該視頻編碼方框326將要除了信號FVT以外,還接收有關(guān)合成的語音的信號V以及有關(guān)接收終端的類型的信息TV作為它的輸入。
圖3A和3B上顯示的實施例涉及其中所述信息在模塊16的級別上可得到的解決方案。所述信息總地表示接收終端的牌子和模型名稱(例如,Sony Ericsson T68i,Nokia 7650,等等)。
方框326在這種情形下通過以適合于從所討論的接收終端觀看的格式直接創(chuàng)建視頻剪輯而進(jìn)行。視頻剪輯對于確定的終端類型的適配,例如影響幀的空間與時間分辨率,影響音頻信道是否被插入等等。
這里參考的解決方案因此規(guī)定把SMS消息與這樣生成的視頻內(nèi)容進(jìn)行綜合,以使得由模塊16生成的、最終得到的多媒體消息具有適合于從所述終端觀看的格式。
然而,如前所述,按照本發(fā)明的解決方案也可以在其中模塊16(所以,在這里顯示的實施例中的方框326)不實行這種”專門化”的動作的條件下被實施。
在這種情形下,將要補充進(jìn)入的SMS文本消息的視頻剪輯,或一般地說,視頻內(nèi)容,以標(biāo)準(zhǔn)格式被生成,即,不考慮接收終端的特征。
將要使得最后的MMS消息實際上是由接收終端可看見的相關(guān)的格式變換然后留給具有MMS中繼/服務(wù)器功能的模塊10(圖1)。
在這里顯示的實施例中(它事實上是例子),來自方框326的輸出信號然后由基本上類似于以壓縮格式的視頻剪輯的信號VC組成。
所述信號被發(fā)送到方框328,該方框?qū)⒁脕韽脑谒妮斎攵颂幊休d的多媒體消息出發(fā),構(gòu)建相應(yīng)于MMS標(biāo)準(zhǔn)的消息。
為了這樣進(jìn)行,除了由方框326輸出的信號VC以外,方框328在它的輸入端也接收相應(yīng)于具有由方框302生成的情緒標(biāo)記的文本的信號TE,有關(guān)來自方框300的接收者D的信號,以及關(guān)于發(fā)送者S的信息后一個信息是從圖1的中心17按照已知的準(zhǔn)則得出的,這里不需要詳細(xì)說明。
為了生成將要被發(fā)送到模塊10的MMS消息,方框328把以前計算的視頻動畫插入在MMS消息中。這優(yōu)選地通過使用場景說明的SMIL語言和加入包括多個部分的單一形式的各個多媒體對象來進(jìn)行。
方框328也把有關(guān)發(fā)送者、接收者和對象的信息插入消息報頭中。該對象通過使用組成具有情緒標(biāo)記的文本的第一人物被自動構(gòu)成。
優(yōu)選地,方框328也將要與由要被插入到MMS消息作為“標(biāo)記”或廣告、或作為能夠被用作為用于場景的背景音樂或作為廣告的叮當(dāng)聲的一系列圖像組成的附加數(shù)據(jù)庫330共同運行。
自然地,在不改變本發(fā)明的原理的情況下,本發(fā)明的實施方案和實施例的細(xì)節(jié)可以相對于這里純粹作為例子描述和顯示的內(nèi)容充分地改變,而不會從而背離本發(fā)明的范圍。這對于應(yīng)用本發(fā)明以把除了由SMS生成的文本消息,例如,電子郵件消息的形式的文本消息,變換成MMS消息文本的可能性,以及對于應(yīng)用本發(fā)明以在不同于UMTS網(wǎng)絡(luò)上傳輸MMS消息的可能性來說,尤其如此,但并不具體限于此。
權(quán)利要求
1.用于在電信網(wǎng)上傳輸消息的方法,其特征在于,該方法包括以下步驟-從發(fā)送者終端(18)接收(17)文本消息,-綜合(16)所述文本消息與視頻內(nèi)容,以生成多媒體消息,以及-把所述多媒體消息以MMS消息的形式發(fā)送(10)到至少一個接收終端(12,13,14)。
2.如權(quán)利要求1所述的方法,其特征在于,它包括接收(17)SMS消息的形式的所述文本消息的步驟。
3.如權(quán)利要求1或2所述的方法,其特征在于,它包括以下步驟-通過識別所述接收終端的特征而識別能夠接收所述多媒體消息的接收終端(12,13,14)的類型,以及-使所述MMS消息適合(16,326;10)于所述接收終端(12,13,14)的特征。
4.如權(quán)利要求3所述的方法,其特征在于,它包括綜合所述文本消息與生成的視頻內(nèi)容(326),以使得所述多媒體消息適合于所述接收終端(12,13,14)的特征的步驟。
5.如權(quán)利要求3所述的方法,其特征在于,它包括以下步驟-用與接收終端(12,13,14)的特征無關(guān)地確定的視頻內(nèi)容補充所述文本消息,以及-使由此得到的多媒體消息適合(10)于所述接收終端(12,13,14)的特征。
6.如以前的權(quán)利要求的任一項所述的方法,其特征在于,它包括在由以下項目組成的組內(nèi)選擇所述視頻內(nèi)容的步驟-動畫的圖像,-背景圖像,以及-具有可變的觀察點的圖像。
7.如以前的權(quán)利要求的任一項所述的方法,其特征在于,它包括從所述文本消息合成能夠與所述多媒體消息內(nèi)的所述視頻內(nèi)容相聯(lián)系的語音信號(V)的步驟。
8.如權(quán)利要求7所述的方法,其特征在于,它包括生成所述動畫圖像(308,310)作為講出相應(yīng)于所述文本消息的合成的語音信號的人物的圖像的步驟。
9.如權(quán)利要求8所述的方法,其特征在于,它包括借助于文本動畫系統(tǒng)(308,310)生成所述人物的圖像的步驟。
10.如以前的權(quán)利要求的任一項所述的方法,其特征在于,它包括綜合(328)所述消息與背景音樂(330)的步驟。
11.如以前的權(quán)利要求的任一項所述的方法,其特征在于,它包括把動畫的GIF圖像包括在所述視頻內(nèi)容中的步驟。
12.如以前的權(quán)利要求6,8,9或11的任一項所述的方法,其特征在于,所述動畫的圖像是以Hz量級的動畫采樣速率得到的。
13.如以前的權(quán)利要求的任一項所述的方法,其特征在于,它包括鑒于所述文本消息的接收(17),把用于標(biāo)識在由以下項目組成的組內(nèi)選擇的所述視頻內(nèi)容的特征的至少一個字段與所述文本消息相聯(lián)系的步驟-被使用來顯示所述文本消息的虛擬人物(P),以及-所述多媒體內(nèi)容的背景(A)。
14.如以前的權(quán)利要求的任一項所述的方法,其特征在于,它包括在所述發(fā)送者終端(18)提供用于選擇所述視頻內(nèi)容和所述接收終端(12,13,14)的腳本功能的步驟。
15.如以前的權(quán)利要求的任一項所述的方法,其特征在于,它包括在所述發(fā)送者終端(18)提供用于自動校正可能被包含在所述文本消息中的任何錯誤的功能的步驟。
16.如以前的權(quán)利要求的任一項所述的方法,其特征在于,它包括把用于選擇地修正所述視頻內(nèi)容的特征的元信息與所述文本消息相聯(lián)系的步驟。
17.如以前的權(quán)利要求的任一項所述的方法,其特征在于,它包括把用于選擇地修正所述視頻內(nèi)容的特征的情緒標(biāo)記形式的附加信息與所述文本消息相聯(lián)系的步驟。
18.如以前的權(quán)利要求的任一項所述的方法,其特征在于,所述視頻內(nèi)容是從以下項目中選擇的-按幀排序的動畫的GIF圖像,所述文本消息的各個部分與其相聯(lián)系,-伴著壓縮的音頻的動畫的GIF圖像,以及-連同音頻一起的視頻剪輯。
19.用于在電信網(wǎng)上傳輸消息的系統(tǒng),其特征在于,系統(tǒng)包括-接收模塊(17),用于從發(fā)送者終端(18)接收文本消息,-處理組(16),具有視頻信息的至少一個數(shù)據(jù)庫(302,314,330)和用于綜合所述文本消息與視頻內(nèi)容以生成多媒體消息的至少一個綜合模塊(326,328),以及-發(fā)送模塊(10),用于把所述多媒體消息以MMS消息的形式發(fā)送到至少一個接收終端(12,13,14)。
20.如權(quán)利要求19所述的系統(tǒng),其特征在于,所述接收模塊(17)被配置成從所述發(fā)送者終端(18)接收以SMS消息的形式的文本消息。
21.如權(quán)利要求19或20所述的系統(tǒng),其特征在于,它包括-檢測模塊(300;10),用于通過識別所述接收終端的特征(TD)而檢測要作為所述多媒體消息的接收者的接收終端(12,13,14)的類型,以及-用于使所述MMS消息適合于所述接收終端(12,13,14)的特征的模塊(16,326;10)。
22.如權(quán)利要求21所述的系統(tǒng),其特征在于,所述綜合模塊(326,328)被配置成用于綜合所述文本消息與生成的視頻內(nèi)容(326),以使得所述多媒體消息適合于所述接收終端(12,13,14)的特征。
23.如權(quán)利要求21所述的系統(tǒng),其特征在于,所述集成模塊(326,328)被配置成綜合所述文本消息和與接收終端(12,13,14)的特征無關(guān)地確定的視頻內(nèi)容,以及系統(tǒng)具有與其相聯(lián)系的用于MMS消息(10)的傳輸?shù)哪K(10),所述MMS消息(10)被配置成使得所述多媒體消息經(jīng)受使其適合(10)于所述接收終端(12,13,14)的特征的步驟(10)。
24.如以前的權(quán)利要求19到23的任一項所述的系統(tǒng),其特征在于,它包括至少一個視頻生成器模塊(302,308,310),用來生成在以下項目內(nèi)選擇的視頻內(nèi)容-動畫的圖像,-背景圖像,以及-具有可變的觀察點的圖像。
25.如以前的權(quán)利要求19到24的任一項所述的系統(tǒng),其特征在于,它包括語音合成器(306),用來從所述文本消息合成能夠與所述多媒體消息內(nèi)的所述視頻內(nèi)容相聯(lián)系(326)的語音信號(V)。
26.如權(quán)利要求25所述的系統(tǒng),其特征在于,將至少一個運動生成模塊(308,310)與所述視頻生成模塊(302,308,310)和所述語音合成器(306)相聯(lián)系,以生成所述動畫圖像作為講出相應(yīng)于所述文本信號的合成的語音信號的人物的圖像。
27.如權(quán)利要求26所述的系統(tǒng),其特征在于,所述運動生成模塊(308,310)是諸如JoeXpress系統(tǒng)那樣的文本動畫系統(tǒng)。
28.如以前的權(quán)利要求19到27的任一項所述的系統(tǒng),其特征在于,它包括背景音樂的數(shù)據(jù)庫(330),與所述至少一個綜合模塊(326,328)共同運行,以綜合所述MMS消息與背景音樂。
29.如以前的權(quán)利要求19到28的任一項所述的系統(tǒng),其特征在于,所述綜合模塊(326,328)被配置成把動畫的GIF圖像包括在所述視頻內(nèi)容中。
30.如以前的權(quán)利要求24,26,27或29的任一項所述的系統(tǒng),其特征在于,所述綜合模塊(326,328)被配置成把具有Hz量級的動畫采樣速率的動畫的圖像包括在所述視頻內(nèi)容中。
31.如以前的權(quán)利要求19到30的任一項所述的系統(tǒng),其特征在于,所述接收模塊(17)包括信息提取方框(300),用于從所述發(fā)送者終端(18)接收的所述文本消息中提取標(biāo)識在由以下項目內(nèi)選擇的所述視頻內(nèi)容的特征的至少一個字段-被使用來顯示所述文本消息的虛擬人物(P),以及-所述多媒體內(nèi)容的背景(A)。
32.如以前的權(quán)利要求19到31的任一項所述的系統(tǒng),其特征在于,具有所述至少一個視頻信息的數(shù)據(jù)庫(302,314,330)和用來綜合所述文本消息與視頻內(nèi)容的所述至少一個綜合模塊(326,328)的所述處理組(16)被配置成生成在以下項目內(nèi)選擇的多媒體消息-按幀排序的動畫的GIF圖像,所述文本消息的各個部分與其相聯(lián)系,-伴有壓縮的音頻的動畫的GIF圖像,以及-連同音頻一起的視頻剪輯。
33.用于如以前的權(quán)利要求19到32的任一項所述的系統(tǒng)的發(fā)送者終端,其特征在于,所述發(fā)送者終端(18)被提供有用于選擇所述視頻內(nèi)容和所述接收終端(12,13,14)的腳本功能。
34.用于如以前的權(quán)利要求19到32的任一項所述的系統(tǒng)的發(fā)送者終端,其特征在于,所述發(fā)送者終端(18)被提供有用于自動校正可能被包含在所述文本消息中的任何錯誤的功能。
35.用于如以前的權(quán)利要求19到32的任一項所述的系統(tǒng)的發(fā)送者終端,其特征在于,所述發(fā)送者終端(18)被提供有用于把選擇地修正所述視頻內(nèi)容的特征的元信息與所述文本消息相聯(lián)系的功能。
36.用于如以前的權(quán)利要求19到32的任一項所述的系統(tǒng)的發(fā)送者終端,其特征在于,所述發(fā)送者終端(18)被提供有用于把選擇地修正所述視頻內(nèi)容的特征的情緒標(biāo)記形式的附加信息與所述文本消息相聯(lián)系的功能。
全文摘要
本方法包括以下步驟從發(fā)送者終端(18)接收(17)文本消息,諸如SMS消息,綜合(16)所述文本消息與視頻內(nèi)容,以生成多媒體消息,以及把所述多媒體消息以MMS消息的形式發(fā)送(10)到至少一個接收終端(12,13,14)。由此保證傳統(tǒng)的移動終端(例如,GSM)與新一代移動終端(例如,UMTS)的可能的共存和互操作。
文檔編號G06F13/00GK1685686SQ03822752
公開日2005年10月19日 申請日期2003年8月4日 優(yōu)先權(quán)日2002年8月14日
發(fā)明者吉安尼·L.·古格利厄米, 吉安盧卡·弗蘭希尼, 克勞迪奧·蘭德, 盧卡·鮑索尼圖 申請人:意大利電信股份公司