專利名稱:有限確認的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及多媒體數(shù)據(jù)處理,更具體來說,涉及根據(jù)語義描述的多媒體數(shù)據(jù)處理。
背景技術(shù):
動畫專家組(MPEG)開發(fā)關(guān)于視聽內(nèi)容的標(biāo)準(zhǔn)。MPEG標(biāo)準(zhǔn)方案的一個組成部分包括MPEG-7標(biāo)準(zhǔn),其目的是提供用戶可能感興趣的視聽內(nèi)容的描述。特別地,開發(fā)MPEG-7標(biāo)準(zhǔn)是為了標(biāo)準(zhǔn)化描述視聽內(nèi)容的信息。MPEG-7標(biāo)準(zhǔn)可被用于各種領(lǐng)域,包括視聽事項(items)的存儲和從數(shù)據(jù)庫的檢索,廣播媒體選擇,遠程購物,多媒體表示、因特網(wǎng)上的個性化新聞服務(wù),等等。
按照MPEG-7標(biāo)準(zhǔn),視聽內(nèi)容的描述由描述符(descriptors)和描述規(guī)則(description schemes)組成。描述符表示視聽內(nèi)容的特征,并定義每個特征表示的語法和語義。描述規(guī)則(DS)規(guī)定它們的組成部分(components)之間的關(guān)系的結(jié)構(gòu)和語義。這些組成部分既可以是描述符也可以是描述規(guī)則??梢栽谝粋€樹中或在一個圖(graph)中組織一個描述規(guī)則的概念方面(conceptual aspects)。該圖結(jié)構(gòu)由一個代表一個描述規(guī)則的各元素(elements)的節(jié)點集合和一個規(guī)定各節(jié)點之間關(guān)系的邊集合定義。
視聽內(nèi)容的描述(即描述符和描述規(guī)則)被劃分為分段(segment)描述和語義(semantic)描述。分段描述從視聽內(nèi)容的結(jié)構(gòu)的角度描述視聽內(nèi)容。就是說,這些描述是圍繞代表視聽內(nèi)容的物理的空間、時間或時空的組成部分的分段構(gòu)造的。每個分段可以由基于信號的特征(顏色、紋理、形狀、運動、聲頻特征等等)和一些初級(elementary)語義信息描述。
語義描述從概念的觀點描述視聽內(nèi)容,就是說,語義描述描述視聽內(nèi)容的實際含義而不是它的結(jié)構(gòu)。分段描述和語義描述由一個連接(links)集合聯(lián)系起來,這允許在內(nèi)容結(jié)構(gòu)和語義這二者一起的基礎(chǔ)上對視聽內(nèi)容進行描述。這些連接將不同的語義概念與由分段描述所描述的視聽內(nèi)容內(nèi)的實例(instances)聯(lián)系起來。
當(dāng)前的語義描述的描述能力有限,因為它們描述特定的語義實體(entities),而不標(biāo)識這些特定的語義實體與其它有關(guān)的語義實體之間的關(guān)系。例如,當(dāng)前的語義描述的模型包括各種語義實體的多個描述規(guī)則,這些語義實體諸如是事件、對象、狀態(tài)、抽象概念等。一個事件DS描述一個有意義的時間定位(temporal localization)。例如,一個事件DS可以與現(xiàn)實世界或媒體中的一個具體實例(例如婚禮)相關(guān)聯(lián)。一個對象DS在語義上描述一個特定對象(例如一個在一個圖像中表示的汽車)。一個狀態(tài)DS標(biāo)識(例如一個對象或事件的)實體在給定的空間位置中或在給定的媒體位置中在給定的時間的語義特性(semantic properties)。一個概念DS描述不是通過從具體對象和事件中抽象(abstraction)而生成的抽象元素(abstract elements)。諸如自由或神秘等概念是概念描述所描述的實體的典型例子。
以上描述規(guī)則描述特定實體。然而,一個描述如果只由它自己描述一個個別實體,則不可能是完整的。多數(shù)人類描述和通信都是通過把信息集中在一起而完成的,在任何交流中,信息都很少得到完全的描述。言談中存在著暗示,使雙方建立適度相容的或相似的心態(tài)(mentalmodels),在這個上下文中討論所要討論的信息。所以,一個描述要精確地和完全地描述內(nèi)容,必須含有各種與該內(nèi)容相關(guān)的額外信息。這個額外信息可包括背景信息、上下文信息、標(biāo)識所描述的內(nèi)容與其它實體之間的關(guān)系的信息、等等。
此外,當(dāng)前不存在用于產(chǎn)生暗喻和比喻的描述的機制。一個傳統(tǒng)的意見是,語義描述只應(yīng)描述視聽內(nèi)容,因此不需要產(chǎn)生暗喻描述。然而,人類一直在用暗喻和比喻而沒有意識到在這樣用。諸如“feelinglike a fish out of water”(覺得如虎行平地)、“getting close tothe deadline”(接近期限)、“flying like a bird”(如鳥飛翔)之類的暗喻和比喻是人類溝通中固有的。因此,把暗喻和比喻的描述從可能的描述清單中排除是不合乎要求的。
此外,當(dāng)前的語義描述是靜態(tài)的。當(dāng)由一個現(xiàn)有的語義描述所描述的材料改變時,就必須重新執(zhí)行產(chǎn)生一個描述的過程,以生成一個描述該改變的材料的新的語義描述。
因此,需要一種用于生成能夠完整、準(zhǔn)確地描述視聽的或其它的任何語義情景的語義描述的工具。這樣一個工具也應(yīng)能生成動態(tài)地反映被描述的材料的變化的描述。
發(fā)明內(nèi)容
說明一種用于處理視聽內(nèi)容的描述的方法和設(shè)備。按照一個實施例,創(chuàng)建視聽內(nèi)容的一個描述,并定義關(guān)于該描述的重用(reuse)的信息。進一步將該視聽內(nèi)容的描述和對應(yīng)的重用信息存儲在一個描述數(shù)據(jù)的儲存庫中,使這個描述隨后能被重用。
通過各附圖中圖示的例子非限定性地解釋本發(fā)明。附圖中相同的標(biāo)注號指類似的元件。
圖1和2是用于生成精神空間(mental spaces)的現(xiàn)有技術(shù)實施例;圖3表示視聽內(nèi)容的語義描述的各種結(jié)構(gòu)形式的層次(hierarchy);圖4是用于處理視聽內(nèi)容的語義描述的系統(tǒng)的一個實施例的框圖;圖5是用于提供視聽內(nèi)容的分布式描述的一個實施例的流程圖;圖6是用于重用視聽內(nèi)容的描述的一個實施例的流程圖;圖7是視聽內(nèi)容的描述的動態(tài)重用的一個實施例的流程圖;圖8表示一個示例性的語義鑲嵌組合體(semantic mosaic);和圖9是一個計算機系統(tǒng)的一個實施例的框圖。
具體實施例方式
說明一種用于處理視聽內(nèi)容的描述的方法和設(shè)備。在以下詳細說明中,為了能徹底理解本發(fā)明,陳述了許多具體的細節(jié)。然而,對于所屬技術(shù)領(lǐng)域的熟練人員來說,顯然也可以脫離這些具體細節(jié)而實施本發(fā)明。在有些例子中,對眾所周知的結(jié)構(gòu)和裝置用框圖的形式表示,而不是詳細地表示,以免不突出本發(fā)明。
接下來的詳細說明的有些部分,是以對計算機存儲器內(nèi)的數(shù)據(jù)位的操作的算法和符號表示的形式給出的。這些算法說明和表示,是數(shù)據(jù)處理技術(shù)領(lǐng)域中的熟練人員用來最有效地向該領(lǐng)域中的其他熟練人員傳達他們的工作實質(zhì)的工具。這里,算法一般被設(shè)想成一個產(chǎn)生一個期望的結(jié)果的自相容的(self-consistent)步驟序列。步驟是那些要求對物理量進行物理操作的步驟。一般來說,盡管并非必要,這些量采取的是能被存儲、傳送、組合、比較和以其它方式被操作的電或磁信號的形式。已經(jīng)證明,主要是為了普通使用,將這些信號稱為位、值、元素(elements)、符號、字符、項(terms)、數(shù)字等等是方便的。
不過應(yīng)當(dāng)記住,所有這些或類似的術(shù)語應(yīng)當(dāng)要與適當(dāng)?shù)奈锢砹肯嚓P(guān)聯(lián),并且僅僅是應(yīng)用于這些量的方便標(biāo)記。在以下討論中除非另外地特別聲明或顯而易見,假設(shè)在整個說明書中,使用了諸如“處理”或“計算”或“確定”或“顯示”等等的術(shù)語的討論,指的是計算機系統(tǒng)或類似的電子計算裝置的操作(action)或過程,該操作或過程處理在計算機系統(tǒng)的寄存器或存儲器內(nèi)的以物理(電子)量表現(xiàn)的數(shù)據(jù)并將其轉(zhuǎn)換成在計算機系統(tǒng)存儲器或寄存器或其它的這種信息存儲、傳輸或顯示裝置內(nèi)的以物理(電子)量類似表現(xiàn)的其它數(shù)據(jù)。
本發(fā)明也涉及用于執(zhí)行本文中所述操作的設(shè)備。這個設(shè)備可以按照所需用途被專門地構(gòu)造,也可以包含一個通用計算機,該通用計算機被存儲在該計算機中的計算機程序有選擇地啟動或重新配置。這樣一個計算機程序可以被存儲在一個計算機可讀存儲介質(zhì)中,例如一但不限于一任何類型的盤中,包括軟盤、光盤CD-ROMs和磁光盤(magnetic-optical disks)、只讀存儲器(ROMs)、隨機存取存儲器(RAMs)、EPROMs,EEPROMs、磁或光卡、或任何類型的適合存儲電子指令的介質(zhì),它們各自連接到一個計算機系統(tǒng)總線。
本文中介紹的算法和顯示器(displays)并不是固有地與任何特定的計算機或其它設(shè)備有關(guān)的??梢允褂脦в邪凑毡疚慕虒?dǎo)的程序的各種通用計算機,構(gòu)造執(zhí)行所要求的方法步驟的更專用的設(shè)備可能也很方便。各種這些系統(tǒng)所需的結(jié)構(gòu)將在以下說明中出現(xiàn)。此外,本發(fā)明并不是參照任何特定程序設(shè)計語言進行說明的。應(yīng)當(dāng)知道,可以用各種程序設(shè)計語言來實現(xiàn)本文中所述的本發(fā)明的教導(dǎo)。
本發(fā)明涉及生成視聽內(nèi)容描述的方方面面。如上所述,目前的描述工具缺少生成能以完整、準(zhǔn)確的方式描述視聽內(nèi)容的描述的能力。這種局限是由目前的語義描述的特定于實體的(entity-specific)性質(zhì)引起的。就是說,每個語義描述描述一個特定實體,描述方式獨立于與這個特定實體有關(guān)的上下文和背景信息。然而,這種方法同支配是語義描述的原型的語言的感知和解釋的規(guī)則相矛盾。這些規(guī)則有些是以使用所屬領(lǐng)域中眾所周知的精神空間(mental space)理論為基礎(chǔ)的。
精神空間通過引入不包含在語言中的許多信息而為溝通(communication)提供上下文,由此提供一種用語言解釋語義內(nèi)容的機制。這個信息是用映象(maps)引進的。這些映象通過使用(即″吸收”(recruiting))代表用于解釋的預(yù)定構(gòu)造的框架(frames)、從一個精神空間向另一個投射(projecting)結(jié)構(gòu)以及從多于一個的其它精神空間集成或抽象(abstracting)引入的材料而起作用。相應(yīng)地,每個精神空間可代表一個包含實體、關(guān)系和框架的擴展描述。為了正確地定義描述中的所有實體,幾個精神空間可以立即是活動的(active)。這些精神空間互相成為關(guān)系的一部分。因為精神空間互相借用結(jié)構(gòu)和實體,這些精神空間的映射(mappings)是必需的。整個復(fù)合體構(gòu)成被表達的描述的一個背景,并完成向有關(guān)實體附加語義意義的過程。
圖1和2是用于創(chuàng)建精神空間的現(xiàn)有技術(shù)實施例。參看圖1,通過吸收(recruiting)一些框架10并從已有精神空間20和30借用結(jié)構(gòu)而生成一個新的精神空間50。參看圖2,通過混合或集成兩個現(xiàn)有的精神空間62和64而創(chuàng)建一個新的精神空間70。然后可以通過對全部三個精神空間(新的精神空間70以及現(xiàn)有的精神空間62和64)的概括(abstracting)而創(chuàng)建一個類屬(generic)空間66。類屬空間66包括對于精神空間62、64和70來說是共同的結(jié)構(gòu)。
本發(fā)明用精神空間模型,以便能創(chuàng)建能夠完全描述任何語義情形的語義描述。在一個實施例中,用于創(chuàng)建整個語義描述的工具是以多個描述范疇(categories)為基礎(chǔ)的。這些范疇可包括對象、事件、狀態(tài)、情節(jié)(episodes)、框架、描述結(jié)構(gòu)和精神空間。這里所用的術(shù)語“對象”指的是一個真實(real)對象的描述,或若干個真實對象的復(fù)合體或抽象的描述。對象含有狀態(tài)。每個狀態(tài)是附屬于對象和關(guān)系的屬性的一個集合。通過擴展,狀態(tài)可以是精神空間的屬性集合。對象可以有子對象,對象狀態(tài)可以有子狀態(tài)。一個狀態(tài)變化就是一個事件。因此,一個事件可以是對象或關(guān)系的(包括代表精神空間的)描述中的諸要素中的任何要素的變化。因為狀態(tài)可以有子狀態(tài),所以事件可以有子事件。
也可以使?fàn)顟B(tài)附屬于情節(jié),一個事件可以是情節(jié)的描述中的諸要素中的任何要素的變化。一個情節(jié)是一個語義上重要的時間范圍(timespan)。情節(jié)可以與對象的行為相符、與事件的發(fā)生相符、與關(guān)系的變化或被用于向?qū)ο蟆⑹录完P(guān)系提供上下文的精神空間相符。如果語義上重要的時間范圍被適當(dāng)?shù)匕谝粋€情節(jié)中,則它們是子情節(jié)(subepisodes)一個框架就是一個用于解釋或描述一個語義對象集合的假定的或重新定義的規(guī)則集合。就此而論,框架本身就可以是原型的描述,或者它們可以是規(guī)則集合、定義集合和描述結(jié)構(gòu)集合。描述結(jié)構(gòu)是對象、情節(jié)、狀態(tài)和關(guān)系的抽象。一個精神空間就是許多對象、關(guān)系和框架,加上嵌置來自描述或來自其它精神空間的描述結(jié)構(gòu)的映射的集合。
語義內(nèi)容的一個完整描述可以由上述各范疇的描述的任何組合組成。此外,該完整描述應(yīng)當(dāng)包括在被包括在該語義內(nèi)容的完整描述中的語義實體之間的關(guān)系(relationships)的描述。實體之間的關(guān)系或者是一種聯(lián)系(relation),或者是一種映射。因為聯(lián)系可被表達為映射的合成(compositions),所以也能用術(shù)語”映射”來還可標(biāo)識一個聯(lián)系。關(guān)系可以是各種類型的,例如蘊含(inclusion)、容納(containment)、相似(similarity)、相對位置、等等。
對象之間的關(guān)系構(gòu)成結(jié)構(gòu)。此外,對象、狀態(tài)和事件向一個情節(jié)的映射也是結(jié)構(gòu)。構(gòu)成根本的精神空間的映射是結(jié)構(gòu)。狀態(tài)可以被表示為從被狀態(tài)描述的實體到屬性值的空間的映象。甚至對象也能被描述成結(jié)構(gòu)對象與從任何點集(point set)到對象本身的映射、或者與從對象本身到一個點集的任何映射,是一一對應(yīng)的。因此,結(jié)構(gòu)是語義描述構(gòu)造的一個固有部分。
結(jié)構(gòu)可采取各種各樣的形式,包括射(morphisms)、圖(graphs)、范疇(categories)、函子(functors)、自然變換(naturaltransformations)等等。射是一個范疇中的對象之間的箭頭。一個范疇由兩個集合組成一個對象集合和一個射集合,它們遵從以下兩個規(guī)則1)對于每個對象,必定有一個向其自己的射,稱作“身份”(identity)射;2)如果f是一個從A向B的射,g是一個從B向C的射,則必定有一個從A向C的射(通常寫成(gof)的形式),這相當(dāng)于首先確定f,然后確定g。
有可能定義范疇之間的映射。范疇之間的映射必須是從對象向?qū)ο蟮暮蛷纳湎蛏涞?。范疇之間的映射也需要是按照該映射從任何射的源和目標(biāo)到其圖像的源和目標(biāo)的(這是一個定義圖的范疇的射的規(guī)則)。范疇之間的映射必須滿足兩個約束,即范疇約束(categoricalconstraints)1)它們必須從身份映象(identity maps)映射到身份映象;和2)它們必須保留合成,即,如果F把A映射到X,把B映射到Y(jié),把C映射到Z,并且把f映射到h和把g映射到p,則F必須把(gof)映射到(poh)。任何服從上述約束的映射(map)都被稱作是“范疇的”(categorical)。
兩個范疇之間的范疇映射被叫做函子(functor)。函子在范疇之間映射,例如F映射范疇C到范疇D。有可能以C和D像對象一樣、F像箭頭一樣(射)地來看這個映射。如果G映射范疇H到范疇J,則我們能作出一種新映射,即把C映射到H,把D映射到J,以及把F映射到H。如果這個新映射服從范疇約束,則它被稱作自然變換。
圖3表示視聽內(nèi)容的語義描述的各種結(jié)構(gòu)形式的層次。射302是一種在兩個對象304之間的映射。每個范疇310由一個對象集合(例如包括對象340)和一個射集合(例如包括射302)組成。函子306是一種在范疇310之間的映射。自然變換308是一種在函子之間的映射。自然變換之間不需要進行映射,因為該層次可以用“函子范疇”(functorcategories)繼續(xù)。
這樣,視聽內(nèi)容的一個完整描述就可以包括各種語義實體(例如對象、事件、狀態(tài)、情節(jié)、框架、描述結(jié)構(gòu)和精神空間)的描述,加上表達該完整描述的結(jié)構(gòu)的描述。盡管這個方法提供了能夠以完整、準(zhǔn)確的方式描述任何語義描述的語義描述,它可能向作為結(jié)果的語義描述增加顯著程度的復(fù)雜性。本發(fā)明的一個實施例通過分配視聽內(nèi)容的已有描述來解決這個復(fù)雜性問題。在這個實施例中,已有描述能被存檔,然后被重用,以創(chuàng)建新的描述,如下文將要詳細說明的那樣。
圖4是用于處理視聽內(nèi)容的描述的系統(tǒng)100的一個實施例的框圖。系統(tǒng)100包含一個或多個服務(wù)器計算機112,它們與諸如客戶機112的一個或多個客戶機計算機相連。客戶機112與服務(wù)器102的通信,可以通過任何有線或無線通信連接,例如包括諸如因特網(wǎng)的公共網(wǎng)絡(luò),諸如以太網(wǎng)、內(nèi)部網(wǎng)或局域網(wǎng)(LAN)的局部網(wǎng)絡(luò),或者各種網(wǎng)絡(luò)的組合。客戶機112和服務(wù)器102的每一個都可以是任何類型的計算裝置,諸如臺式電腦、工作站、膝上型電腦、大型機等等。
在一個實施例中,服務(wù)器102含有存儲視聽內(nèi)容的各種描述的數(shù)據(jù)儲存庫104。在一個實施例中,數(shù)據(jù)儲存庫104只含有視聽內(nèi)容的語義描述,即描述視聽內(nèi)容的實際意義的描述。作為選擇,數(shù)據(jù)儲存庫104除了語義描述,還存儲其它類型的描述(例如分段描述)。描述是與它們描述的視聽內(nèi)容獨立地被存儲的。在一個實施例中,每個描述都與相關(guān)聯(lián)的重用信息被存儲,而重用信息指明這個描述如何能被重用、用于創(chuàng)建視聽內(nèi)容的其它描述。重用信息的功能將在下文更詳細地說明。
客戶機112包括一個用于通過重用視聽內(nèi)容的已有描述創(chuàng)建新描述的工具。在一個實施例中,這個工具包括重用模塊106、描述處理器108和重用信息創(chuàng)建器110。在一個實施例中,客戶機112也包括一個數(shù)據(jù)儲存庫114,用于在本地存儲視聽內(nèi)容的描述。
重用模塊106負責(zé)尋找為創(chuàng)建視聽內(nèi)容的新描述而能被重用的已有描述數(shù)據(jù)。在一個實施例中,這個描述數(shù)據(jù)駐留在一個或多個服務(wù)器102的數(shù)據(jù)儲存庫104中。作為選擇,這個描述數(shù)據(jù)的一些或全部可在本地駐留在數(shù)據(jù)儲存庫114中。已有描述數(shù)據(jù)可包括視聽數(shù)據(jù)的描述的部分或全部。如上所述,每個描述都是與相關(guān)聯(lián)的重用信息存儲。重用模塊106負責(zé)分析這個重用信息,以確定對于該特定描述來說,哪類重用是允許的。
描述處理器108負責(zé)用已有描述數(shù)據(jù)和相關(guān)聯(lián)的重用信息創(chuàng)建視聽內(nèi)容的新描述。重用信息創(chuàng)建器119負責(zé)為新創(chuàng)建的視聽內(nèi)容的描述定義重用信息。在一個實施例中,該新描述被存儲在本地數(shù)據(jù)儲存庫114中。作為選擇,將該新描述傳送到服務(wù)器102,在數(shù)據(jù)儲存庫104中存儲。無論在哪一個實施例中,新描述都是與相關(guān)聯(lián)的重用信息一起存儲的,以便能在以后重用這個描述。
圖5是用于提供視聽內(nèi)容的分布式描述的一個實施例的流程圖。在處理塊504,一個新的視聽內(nèi)容的描述被創(chuàng)建。在一個實施例中,該新的描述是通過重用一個或多個已有的描述被創(chuàng)建的,如下文結(jié)合圖6更詳細地說明的那樣。作為選擇,通過從多個已有的描述中概括一即抽取已有描述中的共同屬性一而創(chuàng)建一個新的描述。在一個實施例中,新的描述是一個描述符。作為選擇,新的描述是一個描述規(guī)則(DS)。如上所述,描述符代表是視聽內(nèi)容的特征,并定義每個特征表示的語法和語義。描述規(guī)則規(guī)定它們的組成部分之間的關(guān)系的結(jié)構(gòu)和語義。這些組成部分既可以是描述符也可以是描述規(guī)則。在一個實施例中,新的描述是一個語義描述。一個語義描述可以描述諸如事件、對象、狀態(tài)、關(guān)系、情節(jié)、描述結(jié)構(gòu)和精神空間等語義實體、或者上述語義實體的任何組合。
在處理塊506,定義關(guān)于所創(chuàng)建的描述的隨后的重用的信息。這個信息指示對于這個描述來說哪種重用是允許的。例如,重用信息可以指示,是否這個描述能被嵌置在另一個描述中而不改變這個描述的本來的意思,或者是否能將這個描述再次劃分成當(dāng)為重用而被抽取時保持它們的意思的各個組成部分。重用信息也可以指示是否能轉(zhuǎn)換該描述,以便能重用這個描述。例如,重用信息可以規(guī)定,是否能鏡反射(mirror)一個眼睛的描述,以產(chǎn)生另一個眼睛的描述。此外,重用信息還可指出當(dāng)該描述被重用時該描述是否能保持其傳遞(transitive)能力。例如,重用信息可以規(guī)定當(dāng)這個描述被嵌置到一個更大的描述中時該描述是否將起一個子集的作用。
在處理塊508,將描述和相關(guān)聯(lián)的重用信息存儲在一個描述數(shù)據(jù)儲存庫中,以便以后能重用這個描述。重用信息可以以與各種重用類型相關(guān)聯(lián)的一個標(biāo)志集合的形式、以規(guī)定該描述所允許的重用類型的組合的一個數(shù)目的形式、或者以任何其它形式被存儲。在一個實施例中,該描述被存儲在網(wǎng)絡(luò)服務(wù)器上,并可以被多個客戶機計算機通過網(wǎng)絡(luò)(例如因特網(wǎng)或局部網(wǎng))訪問。作為選擇,該描述也可被存儲在本地的客戶機計算機上并可以被客戶機計算機的用戶訪問。無論在哪一個實施例中,該描述都能在以后被重用,以根據(jù)與這個描述相關(guān)聯(lián)的重用信息創(chuàng)建新的描述。
圖6是重用視聽內(nèi)容的描述的一個實施例的流程圖。在處理塊604,尋找應(yīng)當(dāng)被包括在新描述中的已有描述性數(shù)據(jù)。在一個實施例中,已有的描述性數(shù)據(jù)包括從存儲在網(wǎng)絡(luò)服務(wù)器上的多個描述中選擇的一個或多個視聽內(nèi)容描述(或描述的各部分)。例如,一個描述提供者可創(chuàng)建多個可能潛在地有廣泛用途的描述,并在網(wǎng)站上公布它們,供將來重用。在另一個例子中,在網(wǎng)站上公布的描述可以是通過從各種已有的描述中抽取共同的特征而創(chuàng)建的概括(或模板)。在這個例子中,這樣的描述可以與一個說明這個描述是個概括的標(biāo)志(indicator)一起被存儲。在另一個例子中,從一個本地描述數(shù)據(jù)儲存庫中選擇已有描述性數(shù)據(jù)或其各部分。
在處理塊606,分析與所選擇的描述性數(shù)據(jù)相關(guān)聯(lián)的重用信息,以確定如何能重用所選擇的描述性數(shù)據(jù)。如上所述,重用信息可以指示是否所選擇的描述性數(shù)據(jù)能被包含、細分或變換,或者是否所選擇的描述性數(shù)據(jù)是過渡的。
在處理塊608,用所選擇的描述性數(shù)據(jù)和相關(guān)聯(lián)的重用信息創(chuàng)建一個新描述。在一個實施例中,新描述包括一個對所選擇的描述性數(shù)據(jù)的引用,而不是數(shù)據(jù)本身,由此避免創(chuàng)建一個大而復(fù)雜的描述。由于描述性數(shù)據(jù)可包含多個描述(或它們的各部分),該描述可包括對多個描述的引用。例如,一個新的DS可包括對諸如對象描述規(guī)則、事件描述規(guī)則、狀態(tài)描述規(guī)則、關(guān)系描述規(guī)則、情節(jié)描述規(guī)則、描述性結(jié)構(gòu)描述規(guī)則和精神空間描述規(guī)則等描述規(guī)則的引用。根據(jù)重用的形式,需要從每個已有描述向一個新的描述的映射。在一個實施例中,這樣的映射在每次需要創(chuàng)建一個新描述時被定義。作為選擇,在一個新描述中引用一個歸檔版本的映射。
在一個實施例中,創(chuàng)建一個新描述的方法是,將已有描述性數(shù)據(jù)轉(zhuǎn)換成一個描述的一部分,然后將這個部分描述映射到一個新描述。例如,在當(dāng)前的MPEG-7標(biāo)準(zhǔn)下,完整的語義描述可包括多個對象描述規(guī)則、時間描述規(guī)則和概念描述規(guī)則。概念描述規(guī)則是用來允許封裝復(fù)雜的概括,本身又可以包含對象描述規(guī)則、時間描述規(guī)則和概念描述規(guī)則。由于概念描述規(guī)則能被包含在對象和事件的描述中,創(chuàng)建一個對象或事件的新描述就要求將已有概念描述規(guī)則轉(zhuǎn)換成新描述的一部分,然后將這個概念描述規(guī)則映射到新描述。
在另一個實施例中,創(chuàng)建一個新描述的方法是,訪問已有描述的一部分,將這個部分描述映射成新的描述,由此使得能夠重用已有描述的一部分,而不是整個已有描述。例如,可以訪問已有概念描述規(guī)則內(nèi)含有的對象描述規(guī)則并將其映射成視聽材料的新描述。在一個實施例中,從已有描述中抽取部分描述,將其轉(zhuǎn)換成獨立的描述,然后嵌置到新描述內(nèi)。
在另一個實施例中,創(chuàng)建一個新描述的方法是,選擇各種已有描述(或它們的部分),用組合描述的規(guī)則詞典(dictionary)中的組合規(guī)則組合它們。已有描述被映射到詞典條目,然后執(zhí)行規(guī)則,以創(chuàng)建一個新描述。然后,將對應(yīng)的對象用新描述的各部分標(biāo)識。規(guī)則和描述可位于本地機器上、在一個數(shù)據(jù)儲存庫中,或在幾個數(shù)據(jù)儲存庫中,并可被描述處理器執(zhí)行。數(shù)據(jù)儲存庫可以有用于形成描述的規(guī)則以及要使用的已有描述,它們都被整理在詞典中。
在一個實施例中,用現(xiàn)有技術(shù)中任何能夠執(zhí)行不同視聽數(shù)據(jù)的描述之間的圖運算(graph operations)的機制將已有描述或者已有描述的各部分映射到一個新描述。作為選擇,為此可以使用面向?qū)ο蟮睦^承(inheritance)機制。例如,私人繼承(private inheritance)允許屬性和方法的繼承而不要獲得數(shù)據(jù)類型關(guān)系。相應(yīng)地,私人繼承能被用來例如將已有描述的一部分映射到一個新描述。公共繼承(Publicinheritance)提供一種生成范疇結(jié)構(gòu)(categorical structure)的機制。因此,公共繼承本能被用來例如將一個被轉(zhuǎn)換成一個新描述的一部分的已有描述,映射到該新描述。此外,私人繼承和公共繼承二者都能被用來把已有描述映射到新描述。例如,這兩種類型的繼承都可以被用來把已有描述映射成概括(abstractions),然后進一步將各概括映射成一個綜合這些概括的新描述。
在一個實施例中,描述的多重重用使得能夠按范疇對描述進行實際的(de facto)標(biāo)準(zhǔn)化(與純粹的(pure)標(biāo)準(zhǔn)化相對)。就是說,與在不可能知道在MPEG-7標(biāo)準(zhǔn)被采納后在應(yīng)用中出現(xiàn)的范疇的MPEG-7的開頭強加的純粹標(biāo)準(zhǔn)化成對比,可以通過-通過多重重用—標(biāo)識那些有最多應(yīng)用和用途的范疇來自然地創(chuàng)建標(biāo)準(zhǔn)。
按照本發(fā)明的一個實施例,視聽內(nèi)容的描述的創(chuàng)建是在視聽內(nèi)容的創(chuàng)建的同時通過動態(tài)地重用已有描述而進行的。例如,在連續(xù)報道國家災(zāi)難(national disaster)的同時描述一個專注于國家災(zāi)難的新聞節(jié)目時,可以動態(tài)地更新該新聞節(jié)目的描述,以創(chuàng)建演變的內(nèi)容的新描述。
圖7是視聽內(nèi)容的描述的動態(tài)重用的一個實施例的流程圖。在處理塊704,視聽內(nèi)容的第一描述被創(chuàng)建。在處理塊706,如上文更詳細說明的那樣定義與第一描述相關(guān)聯(lián)的重用信息。在一個實施例中,第一描述和相關(guān)聯(lián)的重用信息然后被存儲在本地數(shù)據(jù)儲存庫中。
在處理塊708,重用第一描述,以根據(jù)重用信息創(chuàng)建被修改了的視聽內(nèi)容的第二描述。第二描述是在被修改的視聽內(nèi)容的創(chuàng)建的同事被創(chuàng)建的。在一個實施例中,通過更新第一描述的參數(shù)值而創(chuàng)建第二描述。在另一個實施例中,通過組合第一描述與其它新的或已有的描述數(shù)據(jù)而創(chuàng)建第二描述。在另一個實施例中,通過重用第一描述一些部分并丟棄第一描述的不再適用的其它部分而創(chuàng)建第二描述。例如,在一個在線情節(jié)(online episode)的描述期間,情節(jié)的對象之間的關(guān)系以及描述它們所需的結(jié)構(gòu)都可能變化。于是,當(dāng)前的描述可能需要修改,修改方式是更新其參數(shù)值,引入新描述或新部分描述以描述出現(xiàn)的行為,丟棄當(dāng)前描述的不再需要的部分。
在一個實施例中,動態(tài)重用是利用諸如IBMTM的系統(tǒng)對象模型(SOM)的面向?qū)ο蟮慕_M行的。SOM是一種允許二進制對象被不同應(yīng)用共享的體系結(jié)構(gòu),它使得一個結(jié)構(gòu)的描述、關(guān)系、屬性在該結(jié)構(gòu)演變期間能被動態(tài)改變。
本發(fā)明的一個實施例用語義鑲嵌組合體來創(chuàng)建視聽內(nèi)容的新描述。語義鑲嵌組合體利用相鄰描述之間的相互關(guān)系被混合在一起的各種描述的集合。圖8表示一個示例性的語義鑲嵌組合體800。鑲嵌組合體800由包括描述1-18的多個視聽內(nèi)容描述組成。創(chuàng)建鑲嵌組合體800時,互相相關(guān)的描述被混合。例如,描述1和2有一個它們在該處攜帶相同信息的點。這個點被用來將描述2和1混合在一起。描述2也可與描述3有另一個共同點。這另一點可被用來混合描述2與描述3。第三個共同點可被用來將描述2與描述5混合在一起,如此等等。結(jié)果,描述2被與所有與描述2相關(guān)但是可能互相之間沒有任何關(guān)系的描述1、3、4、5混合。因此,語義鑲嵌組合體800給出一個不是特定地描述任何語義材料、但是包括代表各種語義內(nèi)容的描述的本地片斷(local pieces)的描述。本地片斷可組合若干表述以描述某個語義實體。視上下文而定,被包括在某個本地片斷中的描述的數(shù)量可以有變化。例如,在一個上下文中,描述5、10和11的組合可以提供視聽內(nèi)容的一個完整描述。在另一個上下文中,可能需要描述5、、9、10、12和13的組合才能提供視聽內(nèi)容的一個完整描述。在創(chuàng)建一個新描述時,可以重用適當(dāng)?shù)谋镜仄瑪鄟韯?chuàng)建新描述。在每個本地片斷中含有的描述有以前定義的關(guān)系。因此,僅僅從語義鑲嵌組合體中抽取適當(dāng)?shù)谋镜仄瑪嗑涂梢詣?chuàng)建新描述。作為選擇,也可以將本地片斷與其它描述性數(shù)據(jù)組合,以形成新描述。
圖9是一個計算機系統(tǒng)900的一個實施例的框圖。在該計算機系統(tǒng)900內(nèi)可以執(zhí)行一個指令集合,以使機器執(zhí)行以上討論過的任何一個方法。在替代性實施例中,機器可包含網(wǎng)絡(luò)路由器、網(wǎng)絡(luò)交換器、網(wǎng)絡(luò)橋接器、個人數(shù)字助理(PDA)、蜂窩電話、Web設(shè)備或任何能執(zhí)行一個規(guī)定由機器采取的行動的指令序列的機器。
計算機系統(tǒng)900包括處理器902、主存儲器904和靜態(tài)存儲器906,它們通過總線908互相通信。計算機系統(tǒng)900可進一步包括視頻顯示單元910(例如液晶顯示器(LCD)或陰極射線管(CRT))。計算機系統(tǒng)900也包括數(shù)字字母輸入裝置912(例如鍵盤)、光標(biāo)控制裝置914(例如鼠標(biāo)器)、盤驅(qū)動單元916、信號生成裝置920(例如揚聲器)和網(wǎng)絡(luò)接口裝置922。
盤驅(qū)動單元916包括一個計算機可讀介質(zhì)924,上面存儲有一個體現(xiàn)以上討論過的任何一個或所有方法的指令集合(即軟件)926。圖中也顯示軟件926全部或部分駐留在主存儲器904和/或處理器902內(nèi)。軟件926可進一步通過網(wǎng)絡(luò)接口裝置922被傳送或接收。就本說明書來說,術(shù)語“計算機可讀介質(zhì)”應(yīng)被認為包括任何能夠存儲或解碼一個用于由計算機執(zhí)行的、使計算機執(zhí)行本發(fā)明的任何一個方法的指令序列。術(shù)語“計算機可讀介質(zhì)”應(yīng)因此被認為包括一但不僅僅限于一固態(tài)存儲器、光盤或磁盤、以及載波信號。
至此已經(jīng)說明了用于處理視聽內(nèi)容的描述的方法和設(shè)備。盡管是參照具體的典型實施例對本發(fā)明進行說明的,顯然在不偏離本發(fā)明更廣義的精神和范圍的情況下可以做出各種修改和改變。因此說明書和附圖應(yīng)被認為是示例性的而非限制性的。
權(quán)利要求
1.一種處理視聽內(nèi)容的描述的方法,該方法包含創(chuàng)建視聽內(nèi)容的一個第一描述(504);定義關(guān)于第一描述的重用的信息(506);和將第一描述和關(guān)于第一描述的重用的信息存儲(508)在一個描述性數(shù)據(jù)儲存庫(104)中,以便隨后能重用第一描述。
2.權(quán)利要求1的方法,其中,第一描述是語義描述。
3.權(quán)利要求1的方法,其中,第一描述是描述規(guī)則。
4.權(quán)利要求1的方法,其中,關(guān)于第一描述的重用的信息指示是否第一描述能被嵌置到視聽內(nèi)容的一個第二描述中而不改變第一描述原來的意思。
5.權(quán)利要求1的方法,其中,關(guān)于第一描述的重用的信息指示是否第一描述能被劃分成多個部分描述,該多個部分描述的每個都適合隨后的重用。
6.權(quán)利要求1的方法,其中,關(guān)于第一描述的重用的信息指示是否第一描述能在被重用以創(chuàng)建視聽內(nèi)容的一個第二描述時被轉(zhuǎn)換。
7.權(quán)利要求1的方法,其中,關(guān)于第一描述的重用的信息指示,如果第一描述被重用以創(chuàng)建視聽內(nèi)容的一個第二描述,是否第一描述能保持過渡能力。
8.權(quán)利要求1的方法,進一步包含重用(708)存儲在一個或多個描述性數(shù)據(jù)的儲存庫(104)中的多個描述,以提供該多個描述的按范疇的實際的標(biāo)準(zhǔn)化。
9.一種重用視聽內(nèi)容的描述的方法,該方法包含尋找(604)應(yīng)當(dāng)被包括在視聽內(nèi)容的一個新描述中的已有描述性數(shù)據(jù);分析(606)與描述性數(shù)據(jù)相關(guān)聯(lián)的重用信息;和用已有描述性數(shù)據(jù)和相關(guān)聯(lián)的重用信息創(chuàng)建新描述(608)。
10.權(quán)利要求9的方法,其中,新描述是語義描述。
11.權(quán)利要求9的方法,其中,新描述是描述規(guī)則。
12.權(quán)利要求9的方法,其中,描述性數(shù)據(jù)是視聽內(nèi)容的一個或多個已有描述的至少一部分。
13.權(quán)利要求9的方法,進一步包含從一個或多個描述性數(shù)據(jù)的儲存庫(104)中檢索描述性數(shù)據(jù)。
14.權(quán)利要求9的方法,其中,創(chuàng)建新描述進一步包含將已有描述性數(shù)據(jù)轉(zhuǎn)換成一個部分描述;和將該部分描述映射到新描述。
15.權(quán)利要求9的方法,其中,創(chuàng)建新描述進一步包含訪問一個描述性數(shù)據(jù)儲存庫(104)中的已有描述性數(shù)據(jù)的一部分;和將該已有描述性數(shù)據(jù)的部分映射到新描述。
16.權(quán)利要求9的方法,其中,創(chuàng)建新描述進一步包含進行已有描述性數(shù)據(jù)中的對象向新描述中的對應(yīng)對象的詞典映射。
17.權(quán)利要求9的方法,其中,創(chuàng)建新描述進一步包含把一個對已有描述性數(shù)據(jù)的引用包括到新描述中。
18.權(quán)利要求9的方法,其中,新描述是用一種執(zhí)行圖運算的機制創(chuàng)建的。
19.權(quán)利要求9的方法,其中,新描述是用一種面向?qū)ο蟮睦^承機制創(chuàng)建的。
20.權(quán)利要求9的方法,其中,創(chuàng)建新描述進一步包含從一個集成多個相關(guān)描述的語義鑲嵌組合體中抽取已有描述性數(shù)據(jù)。
21一種動態(tài)地重用視聽內(nèi)容的描述的方法,該方法包含創(chuàng)建視聽內(nèi)容的一個第一描述(704);定義與第一描述相關(guān)聯(lián)的重用信息(706);和根據(jù)重用信息重用第一描述,以創(chuàng)建被修改視聽內(nèi)容的一個第二描述(708),該重用是與被修改視聽內(nèi)容的創(chuàng)建同時地進行的。
22.一種用于處理視聽內(nèi)容的描述的系統(tǒng),該系統(tǒng)包含用于創(chuàng)建視聽內(nèi)容的一個第一描述的裝置(108);用于定義關(guān)于第一描述的重用的信息的裝置(110);和用于一將第一描述和關(guān)于第一描述的重用的信息存儲(508)在一個描述性數(shù)據(jù)儲存庫(104)中、以便隨后能重用第一描述一的裝置。
23.一種設(shè)備,包含描述處理器(108),用于創(chuàng)建視聽內(nèi)容的一個第一描述;重用信息創(chuàng)建器(110),用定義關(guān)于第一描述的重用的信息;和描述性數(shù)據(jù)儲存庫(104),用于存儲第一描述和關(guān)于第一描述的重用的信息,以便隨后能重用第一描述。
24.權(quán)利要求23的設(shè)備,其中,第一描述是語義描述。
25.權(quán)利要求23的設(shè)備,其中,第一描述是描述規(guī)則。
26.權(quán)利要求23的設(shè)備,其中,關(guān)于第一描述的重用的信息指示是否第一描述能被嵌置到視聽內(nèi)容的一個第二描述中而不改變第一描述原來的意思。
27.權(quán)利要求23的設(shè)備,其中,關(guān)于第一描述的重用的信息指示是否第一描述能被劃分成多個部分描述,該多個部分描述的每個都適合隨后的重用。
28.權(quán)利要求23的設(shè)備,其中,關(guān)于第一描述的重用的信息指示是否第一描述能在被重用以創(chuàng)建視聽內(nèi)容的一個第二描述時被轉(zhuǎn)換。
29.權(quán)利要求23的設(shè)備,其中,關(guān)于第一描述的重用的信息指示,如果第一描述被重用以創(chuàng)建視聽內(nèi)容的一個第二描述,是否第一描述能保持過渡能力。
30.一種用于重用視聽內(nèi)容的描述的系統(tǒng),該系統(tǒng)包含用于尋找應(yīng)當(dāng)被包括在視聽內(nèi)容的一個新描述中的已有描述性數(shù)據(jù)的裝置(106);用于分析與描述性數(shù)據(jù)相關(guān)聯(lián)的重用信息的裝置(106);和用于用已有描述性數(shù)據(jù)和相關(guān)聯(lián)的重用信息創(chuàng)建新描述的裝置(108)。
31.一種設(shè)備,包含重用模塊(106),用于尋找應(yīng)當(dāng)被包括在視聽內(nèi)容的一個新描述中的已有描述性數(shù)據(jù)并用于分析與描述性數(shù)據(jù)相關(guān)聯(lián)的重用信息;和描述處理器(108),用于用已有描述性數(shù)據(jù)和相關(guān)聯(lián)的重用信息創(chuàng)建新描述。
32.權(quán)利要求31的設(shè)備,其中,新描述是語義描述。
33.權(quán)利要求31的設(shè)備,其中,新描述是描述規(guī)則。
34.權(quán)利要求31的設(shè)備,其中,描述性數(shù)據(jù)是視聽內(nèi)容的一個或多個已有描述的至少一部分。
35.權(quán)利要求31的設(shè)備,其中,新描述是用一種執(zhí)行圖運算的機制創(chuàng)建的。
36.權(quán)利要求31的設(shè)備,其中,新描述是用一種面向?qū)ο蟮睦^承機制創(chuàng)建的。
37.一種用于動態(tài)地重用視聽內(nèi)容的描述的系統(tǒng),該系統(tǒng)包含用于創(chuàng)建視聽內(nèi)容的一個第一描述的裝置(108);用于定義與第一描述相關(guān)聯(lián)的重用信息的裝置(110);和用于根據(jù)重用信息重用第一描述,以創(chuàng)建被修改視聽內(nèi)容的一個第二描述裝置(108),該重用是與被修改視聽內(nèi)容的創(chuàng)建同時地進行的。
38.一種設(shè)備,包含描述處理器(108),用于創(chuàng)建視聽內(nèi)容的一個第一描述;和重用信息創(chuàng)建器(110),用于定義與第一描述相關(guān)聯(lián)的重用信息,描述處理器(108),用于根據(jù)重用信息重用第一描述,以創(chuàng)建被修改視聽內(nèi)容的一個第二描述,該重用是與被修改視聽內(nèi)容的創(chuàng)建同時地進行的。
39.一種提供指令的計算機可讀介質(zhì),當(dāng)指令在處理器上被執(zhí)行時,使所述處理器執(zhí)行包含下列步驟的操作創(chuàng)建視聽內(nèi)容的一個第一描述(504);定義關(guān)于第一描述的重用的信息(506);和將第一描述和關(guān)于第一描述的重用的信息存儲(508)在一個描述性數(shù)據(jù)儲存庫(104)中,以便隨后能重用第一描述。
40.一種提供指令的計算機可讀介質(zhì),當(dāng)指令在處理器上被執(zhí)行時,使所述處理器執(zhí)行包含下列步驟的操作尋找(604)應(yīng)當(dāng)被包括在視聽內(nèi)容的一個新描述中的已有描述性數(shù)據(jù);分析(606)與描述性數(shù)據(jù)相關(guān)聯(lián)的重用信息;和用已有描述性數(shù)據(jù)和相關(guān)聯(lián)的重用信息創(chuàng)建新描述(608)。
41.一種提供指令的計算機可讀介質(zhì),當(dāng)指令在處理器上被執(zhí)行時,使所述處理器執(zhí)行包含下列步驟的操作創(chuàng)建視聽內(nèi)容的一個第一描述(704);定義與第一描述相關(guān)聯(lián)的重用信息(706);和根據(jù)重用信息重用第一描述,以創(chuàng)建被修改視聽內(nèi)容的一個第二描述(708),該重用是與被修改視聽內(nèi)容的創(chuàng)建同時地進行的。
全文摘要
說明了一種用于處理視聽內(nèi)容的描述的方法和設(shè)備(圖4)。按照一個實施例,創(chuàng)建視聽內(nèi)容的一個描述(104),定義關(guān)于該視聽內(nèi)容的描述的重用的信息。進一步,將該視聽內(nèi)容的描述和重用信息存儲在一個描述性數(shù)據(jù)儲存庫(104)中,以便隨后能重用這個描述。
文檔編號G11B27/00GK1618232SQ02827597
公開日2005年5月18日 申請日期2002年12月3日 優(yōu)先權(quán)日2001年12月3日
發(fā)明者H·K·里辛三世, A·塔巴塔拜 申請人:索尼電子有限公司