專利名稱::可用于iptv的多媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明屬于寬帶通訊、互聯(lián)網(wǎng)和電視領(lǐng)域,涉及IP網(wǎng)絡(luò)電視上的多種媒體內(nèi)容的聯(lián)合搜索與關(guān)聯(lián)算法和弓I擎及其實現(xiàn)方法。
背景技術(shù):
:IPTV作為近幾年全球迅猛發(fā)展的一種新興業(yè)務(wù),其集IP和TV技術(shù)的大成于一身,不僅為電視業(yè)務(wù)重新詮釋了內(nèi)涵,而且為IP技術(shù)的發(fā)展重新找到了基于應(yīng)用的原動力。與傳統(tǒng)的通過無線或同軸電纜播出電視節(jié)目不同,IPTV系統(tǒng)通過寬帶IP網(wǎng)絡(luò)直接向顧客提供高質(zhì)量的電視節(jié)目和視頻內(nèi)容,其本質(zhì)是一個多媒體,多業(yè)務(wù)的服務(wù)平臺,它融合了傳統(tǒng)的廣播電視業(yè)務(wù),互聯(lián)網(wǎng)上的各種應(yīng)用,以及新興的通信業(yè)務(wù),為用戶提供直播電視,時移電視,點播電視,廣播節(jié)目預(yù)訂(PVR),信息瀏覽與查詢,音樂/卡拉0K,互動廣告,游戲,通信等多種服務(wù)。通過一個單一的機頂盒,將這些業(yè)務(wù)集成在一起,使用戶得到更及時,方便,豐富的體驗。IPTV擴展了"看電視"的概念,"看電視"已不再是原來意義上被動地觀看,觀眾可以互動地選擇和控制收視內(nèi)容,享受新的體驗,得到個性化的節(jié)目內(nèi)容服務(wù)。通過互動關(guān)聯(lián)技術(shù),我們可以將IPTV平臺上眾多的內(nèi)容和信息以及其它多種媒體資產(chǎn)(包括直播節(jié)目,點播節(jié)目,信息,廣告,圖像,音樂,游戲等等),根據(jù)其相關(guān)屬性和內(nèi)在的聯(lián)系機制進行自動搜索和關(guān)聯(lián),使用戶方便地根據(jù)當(dāng)前正在觀看的節(jié)目或信息,瀏覽和查找系統(tǒng)中所有自己感興趣的與正在觀看的內(nèi)容相關(guān)的其他內(nèi)容、信息和廣告等,獲得更好的業(yè)務(wù)體驗。在IPTV互動關(guān)聯(lián)平臺中,最核心的就是基于多種媒體內(nèi)容的聯(lián)合搜索與關(guān)聯(lián)引擎,只有真正合適的關(guān)聯(lián)和搜索算法,再結(jié)合負(fù)載均衡等技術(shù),才能快速有效的為用戶提供相關(guān)內(nèi)容服務(wù),信息服務(wù)和信息搜索服務(wù)。
發(fā)明內(nèi)容本發(fā)明的目的在于在IPTV系統(tǒng)里,提供一個基于多種媒體內(nèi)容的聯(lián)合搜索與關(guān)聯(lián)引擎,能夠?qū)⒏鞣N節(jié)目內(nèi)容、信息內(nèi)容等融合和關(guān)聯(lián)起來,幫助用戶能夠更方便的瀏覽和查找IPTV系統(tǒng)中所有自己感興趣的內(nèi)容,獲得更好的業(yè)務(wù)體驗。為了達到上述目的,本發(fā)明解決的方案是可用于IPTV的多媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎,該系統(tǒng)能夠根據(jù)IPTV系統(tǒng)內(nèi)的各種內(nèi)容和信息的元數(shù)據(jù),進行智能搜索和自動關(guān)聯(lián),并根據(jù)門戶的請求,響應(yīng)和返回響應(yīng)的關(guān)聯(lián)和搜索結(jié)果。包括媒體XML預(yù)處理系統(tǒng),通過預(yù)處理,將相應(yīng)的字段自動組織到數(shù)據(jù)庫中;對各種內(nèi)容及其原始數(shù)據(jù)庫進行分析,對內(nèi)容和標(biāo)簽進行索引和分類的索引和分類器;根據(jù)標(biāo)簽對各種內(nèi)容和信息進行搜索,確定各種信息的關(guān)聯(lián)程度及排序、以及根據(jù)相關(guān)規(guī)則進行智能替換和排序的關(guān)聯(lián)和搜索器;能根據(jù)廣告管理、節(jié)目和用戶信息等生成相應(yīng)的搜索和替換規(guī)則的規(guī)則器;多媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎的關(guān)聯(lián)和搜索流程;多媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎的數(shù)據(jù)同步流程及數(shù)據(jù)同步算法。所述的索引及分類器,包括-內(nèi)容索引和分類的主模塊,根據(jù)原始數(shù)據(jù)庫生成相應(yīng)的內(nèi)容索引庫和標(biāo)簽索引庫;用于存放內(nèi)容索引結(jié)果的內(nèi)容索引數(shù)據(jù)庫;用于存放標(biāo)簽索引結(jié)果的標(biāo)簽索引數(shù)據(jù)庫;用于存放直播頻道節(jié)目及其時間映射表的直播頻道節(jié)目單庫;內(nèi)容索引和標(biāo)簽索引的數(shù)據(jù)模型和數(shù)據(jù)結(jié)構(gòu);對于沒有標(biāo)簽的內(nèi)容,采用缺省標(biāo)簽的方法。所述的關(guān)聯(lián)和搜索器,包括內(nèi)容關(guān)聯(lián)和搜索的主模塊,完成對內(nèi)容的預(yù)先關(guān)聯(lián),根據(jù)規(guī)則器的各種規(guī)則對關(guān)聯(lián)和搜索結(jié)果進行智能的替換和排序,根據(jù)門戶的請求返回關(guān)聯(lián)和搜索結(jié)果;用于存放對內(nèi)容進行預(yù)先關(guān)聯(lián)結(jié)果的關(guān)聯(lián)數(shù)據(jù)庫;為了提高搜索和關(guān)聯(lián)速度以及性能的、在內(nèi)容關(guān)聯(lián)和搜索模塊中的緩存數(shù)據(jù)庫;關(guān)聯(lián)結(jié)果的數(shù)據(jù)模型和數(shù)據(jù)結(jié)構(gòu);內(nèi)容的關(guān)聯(lián)和搜索算法。所述的規(guī)則器能完成對各種規(guī)則的管理,其管理的規(guī)則包括a)廣告規(guī)則包括人工和自動的廣告規(guī)則等;b)節(jié)目規(guī)則包括上載時間、點播頻度、人工指定的節(jié)目規(guī)則等;C)用戶行為規(guī)則包括用戶喜歡的節(jié)目類型,用戶喜歡的廣告類型等。所述的負(fù)載均衡方案,關(guān)聯(lián)和搜索器采用負(fù)載均衡的方式,而索引和分類器則采用主備模式的高可靠性方案。所述的內(nèi)容索引、分類、關(guān)聯(lián)和搜索流程,具體流程如下XML解析器接受媒資管理系統(tǒng)送過來的Media認(rèn)L,解析成原始數(shù)據(jù)并存入數(shù)據(jù)庫中;索引和分類器讀取原始數(shù)據(jù)庫及其更新;索引和分類器將直播頻道節(jié)目單存入數(shù)據(jù)庫,供關(guān)聯(lián)和搜索器使用;索引和分類器根據(jù)原始數(shù)據(jù)進行索引和分類,結(jié)果存入內(nèi)容索引和標(biāo)簽索引數(shù)據(jù)庫;關(guān)聯(lián)和搜索器向索引和分類器請求索弓I和分類數(shù)據(jù);關(guān)聯(lián)和搜索器向規(guī)則器請求節(jié)目和廣告規(guī)則;規(guī)則器向關(guān)聯(lián)和搜索器返回節(jié)目和廣告規(guī)則;關(guān)聯(lián)和搜索器根據(jù)索引和分類數(shù)據(jù)、節(jié)目和廣告規(guī)則等進行內(nèi)容的關(guān)聯(lián)并將結(jié)果存入關(guān)聯(lián)數(shù)據(jù)庫;門戶向關(guān)聯(lián)和搜索器請求內(nèi)容關(guān)聯(lián)和搜索;關(guān)聯(lián)和搜索器根據(jù)關(guān)聯(lián)請求查找關(guān)聯(lián)結(jié)果;關(guān)聯(lián)和搜索器根據(jù)內(nèi)容和用戶信息向規(guī)則器請求廣告和用戶規(guī)則;規(guī)則器向關(guān)聯(lián)和搜索器返回廣告和用戶規(guī)則;關(guān)聯(lián)和搜索器根據(jù)査找到的關(guān)聯(lián)結(jié)果、規(guī)則器返回的廣告和用戶規(guī)則,重組關(guān)聯(lián)結(jié)果;關(guān)聯(lián)和搜索器將最終的關(guān)聯(lián)結(jié)果返回給門戶展示。所述的多媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎的數(shù)據(jù)同步流程,包括-XML解析器更新原始數(shù)據(jù)庫;XML解析器通知索引和分類器進行數(shù)據(jù)更新,帶上需要更新的MediaID;索引和分類器根據(jù)原始數(shù)據(jù)庫,更新內(nèi)容索引庫和節(jié)目單庫、標(biāo)簽索引庫;索引和分類器通知關(guān)聯(lián)和搜索器進行數(shù)據(jù)更新,帶上需要更新的MediaID;關(guān)聯(lián)和搜索器更新關(guān)聯(lián)數(shù)據(jù)庫。所述的多媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎的數(shù)據(jù)同步算法,具體算法如下如果增加一個點播、直播節(jié)目或其他內(nèi)容,索引和分類器將其對應(yīng)的MediaID通知關(guān)聯(lián)和搜索器,關(guān)聯(lián)和搜索器搜索計算該MediaID對應(yīng)的關(guān)聯(lián)信息,將結(jié)果增加到關(guān)聯(lián)數(shù)據(jù)庫中。另外將結(jié)果中的節(jié)目類關(guān)聯(lián)信息取出,將該MediaID與這些節(jié)目的關(guān)聯(lián)關(guān)系插入到這些節(jié)目預(yù)處理結(jié)果中。如果刪除一個點播或者直播節(jié)目,索引和分類器將其對應(yīng)的MediaID通知關(guān)聯(lián)和搜索器,關(guān)聯(lián)和搜索器先查到該MediaID對應(yīng)的關(guān)聯(lián)結(jié)果,將其中的節(jié)目類關(guān)聯(lián)信息取出,然后將該MediaID與這些節(jié)目的關(guān)聯(lián)關(guān)系從這些節(jié)目預(yù)處理結(jié)果中刪除,最后刪除該MediaID的關(guān)聯(lián)結(jié)果。所述的數(shù)據(jù)模型;內(nèi)容索引表MediaTypeMediaIDTitleIconlIcon2TagListSortNameStoreTime(4)(8)(50)(8)(8)(10)(4)其中標(biāo)簽列表為nTag(l)TaglD(4)TaglD(4)Tag歸)MediaType:媒體分類的類別MediaID:Media的唯一標(biāo)識Title:內(nèi)容名稱Iconl:節(jié)目高亮圖標(biāo)IDIcon2:節(jié)目灰顯圖標(biāo)IDTagList:節(jié)目對應(yīng)的TAGID列表SortName:排序字母StoreTime:上架時間直播頻道節(jié)目單結(jié)構(gòu)如下Cha加elID(4)StartTime(4)EndTime(4)MediaType(4)MediaID(8)Title(50)Iconl(8)Icon2(8)TagUstSortName(10)StartTimeEndTimeMediaTypeMediaIDTitleIconlIcon2TagUstSortNamenull其中標(biāo)簽列表為<table>tableseeoriginaldocumentpage9</column></row><table>ChannelID:頻道號(ChannelNumber)StartTime:節(jié)目起始時間,以秒為單位(減去1970)EndTime:節(jié)目終止時間,以秒為單位(減去1970)MediaID:Media的唯一標(biāo)識,表示頻道中的節(jié)目ID在直播頻道節(jié)目單的情況下,節(jié)目的上架時間就等于StartTime標(biāo)簽索引表<table>tableseeoriginaldocumentpage9</column></row><table>TagID:Tag對應(yīng)的ID,內(nèi)部計算使用TAG:Tag名稱MediaType:媒體分類的類別MediaID:整個IPTV系統(tǒng)中Media的唯一標(biāo)識Location:TAG在該信息中的排序位置。所述缺省標(biāo)簽處理方法對于XML描述里沒有標(biāo)簽的內(nèi)容,我們采用缺省標(biāo)簽的方式。缺省的標(biāo)簽為內(nèi)容的分類、標(biāo)題中的關(guān)鍵字、導(dǎo)演和主演等。缺省標(biāo)簽將自動轉(zhuǎn)換到其標(biāo)簽列表中。所述的數(shù)據(jù)模型-關(guān)聯(lián)數(shù)據(jù)模型<table>tableseeoriginaldocumentpage9</column></row><table>MediaID:Media的唯一標(biāo)識MediaType:用來一級排名的類別nMedia:該節(jié)目相關(guān)聯(lián)出來的同類信息數(shù)目RMedialD:被關(guān)聯(lián)Media的唯一標(biāo)識Weight:該信息與節(jié)目的關(guān)聯(lián)度值。所述的關(guān)聯(lián)算法-關(guān)聯(lián)和搜索器排名算法如下第一步計算關(guān)聯(lián)度TAG與信息間的關(guān)聯(lián)度由如下公式表示R(N)=1-N*10%N二LL=1,2,3......9息TAG序列中的順序位置10D二IO(當(dāng)位置大于等于10時,關(guān)聯(lián)度為0)L代表該TAG在信信息與信息間的關(guān)聯(lián)度由如下公式表示R(A,B)二E(R(An)*R(Bn))n二1,2,3……表示信息A和信息B的相同TAG數(shù)目;An和Bn分別表示相同TAG在信息A和信息B中的位置;,二步,在上步權(quán)值相同的情況下,按照點擊量排序,點擊量越大,排名越靠前;j三步,在上步權(quán)值相同的情況下,再根據(jù)上傳時間,時間越近的信息排名越前;第四步,在上步權(quán)值相同的情況下,再按字母順序或拼音字母順序;類別排名算法如下S(C)=£(R(A,B,n))A表示主體關(guān)聯(lián)信息,B'n表示同類被關(guān)聯(lián)出來的信息.關(guān)聯(lián)^ni索器的排序結(jié)果索引結(jié)構(gòu)統(tǒng)一以MedialD做為索引。所述的關(guān)聯(lián)輸出及其定義,輸出只包括MediaID、標(biāo)題、導(dǎo)演、主演,對于其他所需的信息,門戶的服務(wù)器從其自身的數(shù)據(jù)庫中獲取。IPTV多媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎,是一個以XML為數(shù)據(jù)核心,類似于互聯(lián)網(wǎng)搜索引擎架構(gòu),能夠提供對視頻點播節(jié)目、直播電視節(jié)目、時移電視節(jié)目、廣告、信息、音樂、游戲、文本等多種媒體內(nèi)容的搜索。能夠?qū)PTV系統(tǒng)里面海量的而又雜亂無章的內(nèi)容,通過各種標(biāo)簽、關(guān)鍵字等有機的組織和關(guān)聯(lián)起來,能夠為用戶提供既快速又便捷的節(jié)目和信息內(nèi)容搜索服務(wù)。同時,它還能根據(jù)外部輸入的內(nèi)容的點播頻度,用戶的偏好等進行有目的的搜索最新的熱點節(jié)目、用戶最喜歡的內(nèi)容和用戶感興趣的廣告,總體架構(gòu)如圖l所示。通過本互動搜索與關(guān)聯(lián)引擎,結(jié)合媒體資產(chǎn)管理系統(tǒng),網(wǎng)頁服務(wù)器,流媒體服務(wù)器和機頂盒等,即可為IPTV用戶提供各種內(nèi)容的互動關(guān)聯(lián)服務(wù)。即系統(tǒng)根據(jù)用戶觀看的內(nèi)容,對節(jié)目內(nèi)容和信息以及其它多種媒體資產(chǎn)根據(jù)其相關(guān)屬性進行自動搜索和關(guān)聯(lián),推薦用戶感興趣的相關(guān)節(jié)目或信息,為用戶提供相關(guān)內(nèi)容服務(wù),信息服務(wù)和信息搜索服務(wù),同時為運營提供一個后臺內(nèi)容、信息、廣告自動關(guān)聯(lián)處理平臺(互動關(guān)聯(lián)平臺),以便運營商推薦促銷相關(guān)內(nèi)容、信息、廣告等業(yè)務(wù)。圖1為本發(fā)明一種實施例的IPTV多種媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎總體架構(gòu)圖;圖2為內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎的負(fù)載均衡與可靠性圖;圖3為內(nèi)容關(guān)聯(lián)與搜索的業(yè)務(wù)流程圖;圖4為索引和分類器數(shù)據(jù)同步流程示意圖。具體實施方式以下結(jié)合附圖所示實施例對本發(fā)明作進一步的說明。索引和分類器在內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎中,XML解析器接受媒資管理系統(tǒng)送過來的媒體XML,解析成原始數(shù)據(jù)并存入數(shù)據(jù)庫中。索引和分類器對每一個內(nèi)容,包括所有的直播和點播節(jié)目、信息、廣告、圖片、游戲和音樂等多種媒體,根據(jù)原始數(shù)據(jù)庫中其相應(yīng)的字段和元數(shù)據(jù)和標(biāo)簽,提取關(guān)鍵詞并形成內(nèi)容索引數(shù)據(jù)庫和直播頻道節(jié)目單。在內(nèi)容索引庫里,所有的內(nèi)容都被分別歸入各種類別,比如點播類,直播和時移類,信息類,廣告類,圖片類,音樂類,游戲類和其他類型等。而在每一大類下,又分為若干子類,如點播可以分為動作類,言情類,動畫片類等,信息可以分為國內(nèi),國際,體育,娛樂和財經(jīng)等。同時,索引和分類器在內(nèi)容索引庫的基礎(chǔ)上,針對每一個標(biāo)簽詞,產(chǎn)生一個標(biāo)簽索引表,這個表記錄與該關(guān)鍵詞相關(guān)的所有的內(nèi)容。索引和分類器另外還有一個功能是與原始數(shù)據(jù)庫保持同步和增量計算。對于XML描述里沒有標(biāo)簽的內(nèi)容,我們采用缺省標(biāo)簽的方式。缺省的標(biāo)簽為內(nèi)容的分類、標(biāo)題中的關(guān)鍵字、導(dǎo)演和主演等。索引和分類器的主要數(shù)據(jù)模型和數(shù)據(jù)結(jié)構(gòu)如下內(nèi)容索引表<table>tableseeoriginaldocumentpage11</column></row><table>其中標(biāo)簽列表為<table>tableseeoriginaldocumentpage11</column></row><table>MediaType:媒體分類的類別MediaID:Media的唯一標(biāo)識Title:Iconl:Icon2:TagList:SortName:StoreTime直播頻道節(jié)目單結(jié)構(gòu)如下內(nèi)容名稱節(jié)目高亮圖標(biāo)ID節(jié)目灰顯圖標(biāo)ID節(jié)目對應(yīng)的TAGID列表排序字母上架時間<table>tableseeoriginaldocumentpage11</column></row><table>其中標(biāo)簽列表為<table>tableseeoriginaldocumentpage11</column></row><table>ChannelID:頻道號(ChannelNumber)StartTime:節(jié)目起始時間,以秒為單位(減去1970)EndTime:節(jié)目終止時間,以秒為單位(減去1970)MediaID:Media的唯一標(biāo)識,表示頻道中的節(jié)目ID在Schedule的情況下,節(jié)目的上架時間就等于StartTime。標(biāo)簽索引表-<table>tableseeoriginaldocumentpage12</column></row><table>TagID:Tag對應(yīng)的ID,內(nèi)部計算使用TAG:Tag名稱MediaType:媒體分類的類別MedialD:整個IPTV系統(tǒng)中Media的唯一標(biāo)識Location:TAG在該信息中的排序位置1.關(guān)聯(lián)和搜索器關(guān)聯(lián)和搜索器主要有兩個功能,一是對內(nèi)容進行關(guān)聯(lián)和搜索,二是響應(yīng)門戶的關(guān)聯(lián)和搜索請求。它的工作原理如下關(guān)聯(lián)和搜索器首先從索引和分類器獲取要預(yù)處理的MediaID,然后從索引和分類器請求MedialD對應(yīng)的內(nèi)容索引表,根據(jù)內(nèi)容索引表中的標(biāo)簽列表,從索引和分類器獲取標(biāo)簽對應(yīng)的標(biāo)簽索引表,最后對關(guān)聯(lián)內(nèi)容進行歸類和排序。關(guān)聯(lián)和搜索器還將緩存自定義關(guān)聯(lián)規(guī)則,對客觀排名做相應(yīng)的調(diào)整。關(guān)聯(lián)和搜索器接收門戶的關(guān)聯(lián)請求后,以MedialD或者ChannelID和時間標(biāo)簽做為查詢條件從緩存中查出MedialD,再以MedialD做為査詢條件從關(guān)聯(lián)數(shù)據(jù)庫中獲取歸類排序后的關(guān)聯(lián)信息ID,然后以關(guān)聯(lián)信息ID為參數(shù)從索引和分類器中獲取信息的摘要,最后將歸類排序后的信息摘要返回給門戶。關(guān)聯(lián)和搜索器還可以根據(jù)門戶的搜索請求,以輸入的標(biāo)簽或關(guān)鍵字從索引和分類器中查找和匹配相關(guān)的內(nèi)容,歸類和排序后返回搜索結(jié)果。另外,關(guān)聯(lián)和搜索器要與索引和分類器中的數(shù)據(jù)保持同步,實現(xiàn)數(shù)據(jù)重載和增量同步。為了提高關(guān)聯(lián)和搜索的速度,對節(jié)目和內(nèi)容的關(guān)聯(lián)都是采用預(yù)先關(guān)聯(lián)的方式,結(jié)果存入關(guān)聯(lián)數(shù)據(jù)庫中,同時也在關(guān)聯(lián)和搜索的內(nèi)存中存一份緩存。關(guān)聯(lián)和搜索器排名方法如下第一步計算關(guān)聯(lián)度TAG與信息間的關(guān)聯(lián)度由如下公式表示R(N)=1-N*10%其中N二L,當(dāng)L=1,2,3......9時,L代表該TAG在信息TAG序列中的順序位置;N二IO,當(dāng)L〉二10時;(也就是說,當(dāng)位置大于等于10時,關(guān)聯(lián)度為0)信息與信息間的關(guān)聯(lián)度由如下公式表示R(A,B)二S(R(An)*R(Bn))n=1,2,3……表示信息A和信息B的相同TAG數(shù)目。An和Bn分別表示相同TAG在信息A和信息B中的位置。第二步,在上步權(quán)值相同的情況下,按照點擊量排序,點擊量越大,排名越罪刖;第三步,在上步權(quán)值相同的情況下,再根據(jù)上傳時間,時間越近的信息排名越前;第四步,在上步權(quán)值相同的情況下,再按字母順序或拼音字母順序。類別排名方法如下A表示主體關(guān)聯(lián)信息,B'n表示同類被關(guān)聯(lián)S(C)=S(R(A,B,n))出來的信息。關(guān)聯(lián)和搜索器的排序結(jié)果索引結(jié)構(gòu)統(tǒng)一以MediaID做為索引關(guān)聯(lián)數(shù)據(jù)模型-MedialD(8)MediaType(4)nMedia(4)RMedUID(8)Weight(2)RMedUID(8)Weight(2)MediaTypenMediaRMedia歸)Weight(2)RMedia卿)Weight(2)NullMedialD:Media的唯一標(biāo)識MediaType:用來一級排名的類別nMedia:該節(jié)目相關(guān)聯(lián)出來的同類信息數(shù)目RMediaID:被關(guān)聯(lián)Media的唯一標(biāo)識Weight:該信息與節(jié)目的關(guān)聯(lián)度值關(guān)聯(lián)和搜索器的輸出結(jié)果主要有以下字段MediaID、標(biāo)題、導(dǎo)演、主演、海報圖片的MediaID,對于其他所需的信息,門戶的服務(wù)器可以根據(jù)輸出內(nèi)容的MediaID,從其自身的數(shù)據(jù)庫中查找并獲取。2.規(guī)則器在內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎中,還有一個規(guī)則器,該模塊管理各種規(guī)則,是給運營商手工調(diào)整信息間或信息和標(biāo)簽或標(biāo)簽間的關(guān)聯(lián)關(guān)系,同時也能夠根據(jù)基于用戶的關(guān)聯(lián)規(guī)則,調(diào)整關(guān)聯(lián)引擎的最后輸出結(jié)果。運營商可以調(diào)整的內(nèi)容有廣告的管理規(guī)則修改標(biāo)簽所在位置的權(quán)重節(jié)目促銷規(guī)則用戶的偏好規(guī)則關(guān)聯(lián)和搜索器根據(jù)這些規(guī)則,對其關(guān)聯(lián)和搜索結(jié)果,能夠根據(jù)人工排名規(guī)則,廣告策略,用戶策略,點擊量等進行部分結(jié)果進行智能替換和排序;同時能夠根據(jù)基于用戶偏好分析的關(guān)聯(lián)規(guī)則,智能地選擇最匹配的搜索結(jié)果,智能的加上基于用戶的定向廣告,去掉用處不大的冗余信息,重新組織形成新的數(shù)據(jù)結(jié)構(gòu),便于門戶展示和業(yè)務(wù)訂購。3.負(fù)載均衡方案在總體架構(gòu)的設(shè)計中,我們充分考慮了系統(tǒng)的可靠性和大容量的性能要求,設(shè)計了內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎的負(fù)載均衡方案,如圖2所示。關(guān)聯(lián)和搜索器可以平行部署多臺服務(wù)器,每臺Searcher提供相同服務(wù),其可靠性由LoadBalance保證,單點發(fā)生故障時,還有其它同等服務(wù)器提供服務(wù),而且關(guān)聯(lián)和搜索器可以無縫增加新的服務(wù)器進行擴容。索引和分類器我們則采用主備模式的高可靠性方案,當(dāng)主設(shè)備出現(xiàn)宕機后,備用設(shè)備能夠馬上接管服務(wù),使得服務(wù)能夠不中斷地繼續(xù)下去。4.關(guān)聯(lián)和搜索流程關(guān)聯(lián)和搜索的具體流程如下XML解析器接受媒資管理系統(tǒng)送過來的MediaXML,解析成原始數(shù)據(jù)并存入數(shù)據(jù)庫中索弓I和分類i讀取原始數(shù)據(jù)庫及其更新;索弓I和分類器將直播頻道節(jié)目單存入數(shù)據(jù)庫,供關(guān)聯(lián)和搜索器使用;索引和分類器根據(jù)原始數(shù)據(jù)進行索引和分類,結(jié)果存入內(nèi)容索引和標(biāo)簽索引數(shù)據(jù)庫;關(guān)聯(lián)和搜索器向索引和分類器請求索弓I和分類數(shù)據(jù);關(guān)聯(lián)和搜索器向規(guī)則器請求節(jié)目和廣告規(guī)則;規(guī)則器向關(guān)聯(lián)和搜索器返回節(jié)目和廣告規(guī)則;關(guān)聯(lián)和搜索器根據(jù)索引和分類數(shù)據(jù)、節(jié)目和廣告規(guī)則等進行內(nèi)容的關(guān)聯(lián)并將結(jié)果存入關(guān)聯(lián)數(shù)據(jù)庫;門戶向關(guān)聯(lián)和搜索器請求內(nèi)容關(guān)聯(lián)和搜索;關(guān)聯(lián)和搜索器根據(jù)關(guān)聯(lián)請求查找關(guān)聯(lián)結(jié)果;關(guān)聯(lián)和搜索器根據(jù)內(nèi)容和用戶信息向規(guī)則器請求廣告和用戶規(guī)則;規(guī)則器向關(guān)聯(lián)和搜索器返回廣告和用戶規(guī)則;關(guān)聯(lián)和搜索器根據(jù)查找到的關(guān)聯(lián)結(jié)果、規(guī)則器返回的廣告和用戶規(guī)則,重組關(guān)聯(lián)結(jié)果;關(guān)聯(lián)和搜索器將最終的關(guān)聯(lián)結(jié)果返回給門戶展示。5.數(shù)據(jù)同步流程及方法總體數(shù)據(jù)同步流程如下(如圖4所示)XML解析器更新原始數(shù)據(jù)庫;XML解析器通知索引和分類器進行數(shù)據(jù)更新,帶上需要更新的MediaID;索引和分類器根據(jù)原始數(shù)據(jù)庫,更新內(nèi)容索引庫和節(jié)目單庫、標(biāo)簽索引庫;索引和分類器通知關(guān)聯(lián)和搜索器進行數(shù)據(jù)更新,帶上需要更新的MediaID;關(guān)聯(lián)和搜索器更新關(guān)聯(lián)數(shù)據(jù)庫。索引和分類器與關(guān)聯(lián)和搜索器間增量同步方法如下如果增加一個點播、直播節(jié)目或其他內(nèi)容,索引和分類器將其對應(yīng)的MediaID通知關(guān)聯(lián)和搜索器,關(guān)聯(lián)和搜索器搜索計算該MediaID對應(yīng)的關(guān)聯(lián)信息,將結(jié)果增加到關(guān)聯(lián)數(shù)據(jù)庫中。另外將結(jié)果中的節(jié)目類關(guān)聯(lián)信息取出,將該MediaID與這些節(jié)目的關(guān)聯(lián)關(guān)系插入到這些節(jié)目預(yù)處理結(jié)果中。如果刪除一個點播或者直播節(jié)目,索引和分類器將其對應(yīng)的MediaID通知關(guān)聯(lián)和搜索器,關(guān)聯(lián)和搜索器先查到該MediaID對應(yīng)的關(guān)聯(lián)結(jié)果,將其中的節(jié)目類關(guān)聯(lián)信息取出,然后將該MediaID與這些節(jié)目的關(guān)聯(lián)關(guān)系從這些節(jié)目預(yù)處理結(jié)果中刪除,最后刪除該MediaID的關(guān)聯(lián)結(jié)果。上述的對實施例的描述是為便于該
技術(shù)領(lǐng)域:
的普通技術(shù)人員能理解和使用本發(fā)明。熟悉本領(lǐng)域技術(shù)的人員顯然可以很快地對這些實施例做出各種修改,并把在此說明的一般原理應(yīng)用到其他實施例中而不必經(jīng)過創(chuàng)造性的勞動。因此,本發(fā)明不限于這里的實施例,本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明的揭示,對于本發(fā)明做出的改進和修改都應(yīng)該在本發(fā)明的保護范圍之內(nèi)。權(quán)利要求1.可用于IPTV的多媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),其特征在于該系統(tǒng)根據(jù)IPTV系統(tǒng)內(nèi)的各種內(nèi)容和信息的元數(shù)據(jù),進行智能搜索和自動關(guān)聯(lián),并根據(jù)門戶的請求,響應(yīng)和返回響應(yīng)的關(guān)聯(lián)和搜索結(jié)果。2、根據(jù)權(quán)利要求l所述的聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),其特征在于包括媒體XML預(yù)處理系統(tǒng),通過預(yù)處理,將相應(yīng)的字段自動組織到數(shù)據(jù)庫巾-'對各種內(nèi)容及其原始數(shù)據(jù)庫進行分析,對內(nèi)容和標(biāo)簽進行索引和分類的索引和分類器;根據(jù)標(biāo)簽對各種內(nèi)容和信息進行搜索,確定各種信息的關(guān)聯(lián)程度及排序、以及根據(jù)相關(guān)規(guī)則進行智能替換和排序的關(guān)聯(lián)和搜索器;根據(jù)廣告管理、節(jié)目和用戶信息等生成相應(yīng)的搜索和替換規(guī)則的規(guī)則器;多媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎的關(guān)聯(lián)和搜索流程;多媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎的數(shù)據(jù)同步流程及數(shù)據(jù)同步算法。3、根據(jù)權(quán)利要求2所述的聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),其特征在于所述的索引及分類器,包括內(nèi)容索引和分類的主模塊,根據(jù)原始數(shù)據(jù)庫生成相應(yīng)的內(nèi)容索引庫和標(biāo)簽索引庫;用于存放內(nèi)容索引結(jié)果的內(nèi)容索引數(shù)據(jù)庫;用于存放標(biāo)簽索引結(jié)果的標(biāo)簽索引數(shù)據(jù)庫;用于存放直播頻道節(jié)目及其時間映射表的直播頻道節(jié)目單庫;內(nèi)容索引和標(biāo)簽索引的數(shù)據(jù)模型和數(shù)據(jù)結(jié)構(gòu);對于沒有標(biāo)簽的內(nèi)容,采用缺省標(biāo)簽。4、根據(jù)權(quán)利要求2所述的聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),其特征在于所述的關(guān)聯(lián)和搜索器,包括內(nèi)容關(guān)聯(lián)和搜索的主模塊,完成對內(nèi)容的預(yù)先關(guān)聯(lián),根據(jù)規(guī)則器的各種規(guī)則對關(guān)聯(lián)和搜索結(jié)果進行智能的替換和排序,根據(jù)門戶的請求返回關(guān)聯(lián)和搜索結(jié)果;用于存放對內(nèi)容進行預(yù)先關(guān)聯(lián)結(jié)果的關(guān)聯(lián)數(shù)據(jù)庫;為了提高搜索和關(guān)聯(lián)速度以及性能的、在內(nèi)容關(guān)聯(lián)和搜索模塊中的緩存數(shù)據(jù)庫;關(guān)聯(lián)結(jié)果的數(shù)據(jù)模型和數(shù)據(jù)結(jié)構(gòu);內(nèi)容的關(guān)聯(lián)和搜索算法。5、根據(jù)權(quán)利要求2所述的聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),其特征在于所述的規(guī)則器完成對各種規(guī)則的管理,其管理的規(guī)則包括廣告規(guī)則包括人工和自動的廣告規(guī)則;節(jié)目規(guī)則包括上載時間、點播頻度、人工指定的節(jié)目規(guī)則;用戶行為規(guī)則包括用戶喜歡的節(jié)目類型,用戶喜歡的廣告類型。6、根據(jù)權(quán)利要求2所述的聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),其特征在于所述的負(fù)載均衡方案,關(guān)聯(lián)和搜索器采用負(fù)載均衡的方式,而索引和分類器則采用主備模式的高可靠性方案。7、根據(jù)權(quán)利要求2所述的聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),其特征在于所述的內(nèi)容索引、分類、關(guān)聯(lián)和搜索流程,包括XML解析器接受媒資管理系統(tǒng)送過來的MediaXML,解析成原始數(shù)據(jù)并存入數(shù)據(jù)庫中.索引和分k器讀取原始數(shù)據(jù)庫及其更新;索引和分類器將直播頻道節(jié)目單存入數(shù)據(jù)庫,供關(guān)聯(lián)和搜索器使用;索引和分類器根據(jù)原始數(shù)據(jù)進行索引和分類,結(jié)果存入內(nèi)容索引和標(biāo)簽索引數(shù)據(jù)庫;關(guān)聯(lián)和搜索器向索引和分類器請求索引和分類數(shù)據(jù);關(guān)聯(lián)和搜索器向規(guī)則器請求節(jié)目和廣告規(guī)則;規(guī)則器向關(guān)聯(lián)和搜索器返回節(jié)目和廣告規(guī)則;關(guān)聯(lián)和搜索器根據(jù)索引和分類數(shù)據(jù)、節(jié)目和廣告規(guī)則等進行內(nèi)容的關(guān)聯(lián)并將結(jié)果存入關(guān)聯(lián)數(shù)據(jù)庫;門戶向關(guān)聯(lián)和搜索器請求內(nèi)容關(guān)聯(lián)和搜索;關(guān)聯(lián)和搜索器根據(jù)關(guān)聯(lián)請求查找關(guān)聯(lián)結(jié)果;關(guān)聯(lián)和搜索器根據(jù)內(nèi)容和用戶信息向規(guī)則器請求廣告和用戶規(guī)則;規(guī)則器向關(guān)聯(lián)和搜索器返回廣告和用戶規(guī)則;關(guān)聯(lián)和搜索器根據(jù)查找到的關(guān)聯(lián)結(jié)果、規(guī)則器返回的廣告和用戶規(guī)則,重組關(guān)聯(lián)結(jié)果;關(guān)聯(lián)和搜索器將最終的關(guān)聯(lián)結(jié)果返回給門戶展示。8、根據(jù)權(quán)利要求2所述的聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),其特征在于所述的多媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎的數(shù)據(jù)同步流程,包括XML解析器更新原始數(shù)據(jù)庫;XML解析器通知索引和分類器進行數(shù)據(jù)更新,帶上需要更新的MediaID;索引和分類器根據(jù)原始數(shù)據(jù)庫,更新內(nèi)容索引庫和節(jié)目單庫、標(biāo)簽索引庫;索引和分類器通知關(guān)聯(lián)和搜索器進行數(shù)據(jù)更新,帶上需要更新的MediaID;關(guān)聯(lián)和搜索器更新關(guān)聯(lián)數(shù)據(jù)庫。9、根據(jù)權(quán)利要求2所述的聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),其特征在于所述的多媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎的數(shù)據(jù)同步算法,包括如果增加一個點播、直播節(jié)目或其他內(nèi)容,索引和分類器將其對應(yīng)的MediaID通知關(guān)聯(lián)和搜索器,關(guān)聯(lián)和搜索器搜索計算該MediaID對應(yīng)的關(guān)聯(lián)信息,將結(jié)果增加到關(guān)聯(lián)數(shù)據(jù)庫中;另外將結(jié)果中的節(jié)目類關(guān)聯(lián)信息取出,將該MediaID與這些節(jié)目的關(guān)聯(lián)關(guān)系插入到這些節(jié)目預(yù)處理結(jié)果中;如果刪除一個點播或者直播節(jié)目,索引和分類器將其對應(yīng)的MediaID通知關(guān)聯(lián)和搜索器,關(guān)聯(lián)和搜索器先查到該MediaID對應(yīng)的關(guān)聯(lián)結(jié)果,將其中的節(jié)目類關(guān)聯(lián)信息取出,然后將該MediaID與這些節(jié)目的關(guān)聯(lián)關(guān)系從這些節(jié)目預(yù)處理結(jié)果中刪除,最后刪除該MediaID的關(guān)聯(lián)結(jié)果。10、根據(jù)權(quán)利要求3所述的聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),其特征在于:所述的數(shù)據(jù)模型內(nèi)容索弓表:<table>tableseeoriginaldocumentpage4</column></row><table>TagID:Tag對應(yīng)的ID,內(nèi)部計算使用TAG:Tag名稱MediaType:媒體分類的類別MedialD:整個IPTV系統(tǒng)中Media的唯一標(biāo)識Location:TAG在該信息中的排序位置。11、根據(jù)權(quán)利要求3所述的聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),其特征在于:所述缺省標(biāo)簽處理方法對于XML描述里沒有標(biāo)簽的內(nèi)容,采用缺省標(biāo)簽的方式;缺省的標(biāo)簽包括內(nèi)容的分類、標(biāo)題中的關(guān)鍵字、導(dǎo)演和主演;缺省標(biāo)簽將自動轉(zhuǎn)換到其標(biāo)簽列表中。12、根據(jù)權(quán)利要求4所述的聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),其特征在于所述的數(shù)據(jù)模型關(guān)聯(lián)數(shù)據(jù)模型-<table>tableseeoriginaldocumentpage5</column></row><table>MediaID:Media的唯一標(biāo)識MediaType:用來一級排名的類別nMedia:該節(jié)目相關(guān)聯(lián)出來的,類信息數(shù)目RMedialD:被關(guān)聯(lián)Media的唯一標(biāo)識Weight:該信息與節(jié)目的關(guān)聯(lián)度值。13、根據(jù)權(quán)利要求4所述的聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),其特征在于所述的關(guān)聯(lián)算法關(guān)聯(lián)和搜索器排名算法如下第一步計算關(guān)聯(lián)度TAG與信息間的關(guān)聯(lián)度由如下公式表示R(N)=1-N*10%N=LL二1,2,3......9L代表該TAG在信息TAG序列中的順序位置;10L〉=10當(dāng)位置大于等于10時,關(guān)聯(lián)度為O;信息與信息間的關(guān)聯(lián)度由如下公式表示R(A,B)二£(R(An)*R(Bn))n二1,2,3……表示信息A和信息B的相同TAG數(shù)目;An和Bn分別表示相同TAG在信息A和信息B中的位置;第二步,在上步權(quán)值相同的情況下,按照點擊量排序,點擊量越大,排名越罪目ij;第三步,在上步權(quán)值相同的情況下,再根據(jù)上傳時間,時間越近的信息排名越前;第四步,在上步權(quán)值相同的情況下,再按字母順序或拼音字母順序;類別排名算法如下S(C)二E(R(A,B,n))A表示主體關(guān)聯(lián)信息,B,n表示同類被關(guān)聯(lián)出來的信息.關(guān)聯(lián)和4i器的排序結(jié)果索引結(jié)構(gòu)統(tǒng)一以MedialD做為索引。14、根據(jù)權(quán)利要求4所述的聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),其特征在于所述的關(guān)聯(lián)輸出及其定義,輸出只包括MediaID、標(biāo)題、導(dǎo)演、主演,對于其他所需的信息,門戶的服務(wù)器從其自身的數(shù)據(jù)庫中獲取。全文摘要一種可用于IPTV的多媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),包括媒體XML預(yù)處理系統(tǒng),通過預(yù)處理,將相應(yīng)的字段自動組織到數(shù)據(jù)庫中,索引和分類器對各種內(nèi)容及其原始數(shù)據(jù)庫進行分析,實現(xiàn)對內(nèi)容和標(biāo)簽進行索引和分類;還包括關(guān)聯(lián)和搜索器,可以根據(jù)標(biāo)簽對各種內(nèi)容和信息進行搜索,確定各種信息的關(guān)聯(lián)程度及排序、以及根據(jù)相關(guān)規(guī)則進行智能替換和排序,并根據(jù)門戶的請求,響應(yīng)和返回響應(yīng)的關(guān)聯(lián)和搜索結(jié)果。通過該多媒體內(nèi)容聯(lián)合搜索與關(guān)聯(lián)引擎系統(tǒng),能夠提供既快速又便捷的節(jié)目和信息內(nèi)容搜索服務(wù),可以幫助用戶能夠更方便的瀏覽和查找IPTV系統(tǒng)中所有自己感興趣的內(nèi)容,獲得更好的業(yè)務(wù)體驗。文檔編號H04N7/173GK101271454SQ200710038348公開日2008年9月24日申請日期2007年3月23日優(yōu)先權(quán)日2007年3月23日發(fā)明者謙游,顧建燦,黃繼華,黃勝明,文黎申請人:百視通網(wǎng)絡(luò)電視技術(shù)發(fā)展有限責(zé)任公司