專利名稱:Iptv系統(tǒng)及其節(jié)目信息搜索系統(tǒng)與方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字電視節(jié)目信息搜索方法,尤其是涉及一種在IPTV系統(tǒng)中基于拼音搜索 定位節(jié)目的數(shù)字電視節(jié)目信息搜索方法和節(jié)目信息搜索系統(tǒng)。
背景技術(shù):
IPTV是以"電視機(jī)+機(jī)頂盒"為主要終端設(shè)備、通過IP數(shù)據(jù)網(wǎng)絡(luò)向用戶提供交互式電
視和多媒體服務(wù)的數(shù)據(jù)增值業(yè)務(wù)。
由于IPTV有很強(qiáng)的與用戶的交互能力,其為改善TV用戶的業(yè)務(wù)體驗(yàn)提供了良好的基礎(chǔ)。
在這個(gè)基礎(chǔ)上,衍生出各種豐富多彩的增值業(yè)務(wù),改變了原有業(yè)務(wù)的提供模式,用戶由原來 的被動(dòng)接收節(jié)目,變?yōu)榭梢灾鲃?dòng)點(diǎn)播自己想看的節(jié)目,可以自由支配節(jié)目播放的時(shí)間。
用戶在使用IPTV業(yè)務(wù)時(shí),可以通過在媒體服務(wù)器對(duì)節(jié)目源進(jìn)行分類羅列,用戶根據(jù)自 己的喜好,可以逐層選擇,在海量節(jié)目中瀏覽、查找節(jié)目片源。
現(xiàn)有的IPTV系統(tǒng)提供對(duì)節(jié)目標(biāo)題、演員、導(dǎo)演、節(jié)目介紹等內(nèi)容的搜索定位功能,但 是由于用戶需要通過遙控器輸入搜索關(guān)鍵字,故媒體服務(wù)器將節(jié)目信息以目錄方式提供定位 搜索。當(dāng)節(jié)目信息較多時(shí),目錄定位的方式難以適應(yīng)用戶的需求,用戶需要多次翻頁才能找 到目標(biāo)的節(jié)目。
因此,針對(duì)IPTV用戶不能快速搜索到其感興趣的節(jié)目信息,有必要為IPTV系統(tǒng)開發(fā)一 種新的搜索方式來適用當(dāng)前當(dāng)前龐大的節(jié)目信息搜索。
發(fā)明內(nèi)容
本發(fā)明提出一種在IPTV系統(tǒng)中基于拼音搜索定位節(jié)目的數(shù)字電視節(jié)目信息搜索方法和 節(jié)目信息搜索系統(tǒng),以解決當(dāng)前IPTV系統(tǒng)采用節(jié)目目錄定位搜索節(jié)目信息存在效率低和不 便于用戶使用的技術(shù)問題。
為解決本發(fā)明的技術(shù)問題,本發(fā)明公開一種IPTV系統(tǒng)中的節(jié)目信息搜索系統(tǒng),其包括
數(shù)據(jù)庫;
數(shù)據(jù)采集單元,用于從IPTV系統(tǒng)中的流媒體服務(wù)器采集其提供的節(jié)目源的節(jié)目特征信 息并保存至數(shù)據(jù)庫;
漢字轉(zhuǎn)拼音單元,用于利用ASCII碼表將節(jié)目特征信息的漢字轉(zhuǎn)換為拼音;
具有搜索引擎程序的搜索引擎單元,用于將節(jié)目特征信息對(duì)應(yīng)的拼音索引為搜索引擎程 序的數(shù)據(jù),根據(jù)IPTV系統(tǒng)的用戶輸入的搜索拼音啟動(dòng)搜索,將搜索結(jié)果返回給用戶,并將 用戶根據(jù)搜索結(jié)果作出的用戶選擇請(qǐng)求轉(zhuǎn)發(fā)至流媒體服務(wù)器以獲取對(duì)應(yīng)的節(jié)目。
其中,所述漢字轉(zhuǎn)拼音單元按多音字拼音組合規(guī)則、模糊音拼音組合規(guī)則和地區(qū)性習(xí)慣 發(fā)音規(guī)則,將節(jié)目特征信息中的一個(gè)漢字或漢字詞組轉(zhuǎn)換成對(duì)應(yīng)的多組拼音。
其中,所述IPTV系統(tǒng)中的節(jié)目信息搜索系統(tǒng)還包括拼音選擇單元,用于統(tǒng)計(jì)同一個(gè)
漢字或漢字詞組對(duì)應(yīng)的多組拼音的搜索概率,將檢索概率大的一組或幾組拼音優(yōu)先索引在搜 索引擎單元的搜索引擎中。
其中,所述搜索結(jié)果通過超文本文檔HTML文件的形式以超文本傳輸HTTP協(xié)議返回用戶。另外,本發(fā)明公開一種IPTV系統(tǒng),包括用戶終端設(shè)備和媒體服務(wù)器,為戶終端設(shè)備對(duì) 流媒體服務(wù)器中的節(jié)目信息提供基于拼音搜索的節(jié)目搜索系統(tǒng);
該節(jié)目搜索系統(tǒng)包括數(shù)據(jù)庫;數(shù)據(jù)采集單元,用于從流媒體服務(wù)器采集其提供的節(jié)目 源的節(jié)目特征信息并保存至數(shù)據(jù)庫;漢字轉(zhuǎn)拼音單元,用于利用ASCII碼表將節(jié)目特征信息 的漢字轉(zhuǎn)換為拼音;具有搜索引擎程序的搜索引擎單元,用于將節(jié)目特征信息對(duì)應(yīng)的拼音索 引為搜索引擎程序的數(shù)據(jù),根據(jù)用戶終端設(shè)備輸入的搜索拼音啟動(dòng)搜索,將搜索結(jié)果返回給 用戶終端設(shè)備,并將用戶終端設(shè)備根據(jù)搜索結(jié)果作出的用戶選擇請(qǐng)求轉(zhuǎn)發(fā)至流媒體服務(wù)器; 由流媒體服務(wù)器根據(jù)用戶選擇請(qǐng)求為用戶終端設(shè)備提供對(duì)應(yīng)的節(jié)目。 再者,本發(fā)明公開一種IPTV系統(tǒng)中的節(jié)目信息搜索方法,其包括 從IPTV系統(tǒng)中的流媒體服務(wù)器采集其提供的節(jié)目源的節(jié)目特征信息并保存至數(shù)據(jù)庫; 利用ASCII碼表將節(jié)目特征信息的漢字轉(zhuǎn)換為拼音并索引為搜索引擎單元中搜索引擎 程序的數(shù)據(jù);
由用戶終端設(shè)備接收用戶輸入的搜索拼音,生成搜索請(qǐng)求發(fā)送給搜索引擎單元啟動(dòng)搜
索;
搜索引擎單元將搜索結(jié)果返回給用戶,并將用戶根據(jù)搜索結(jié)果作出的用戶選擇請(qǐng)求轉(zhuǎn)發(fā) 至流媒體服務(wù)器;
由流媒體服務(wù)器根據(jù)用戶選擇請(qǐng)求為用戶終端設(shè)備提供對(duì)應(yīng)的節(jié)目。 與現(xiàn)有技術(shù)相比,本發(fā)明具有如下有益效果
本發(fā)明考慮遙控器輸入的限制,提供了一種用戶使用遙控器輸入拼音即可快速搜索節(jié)目 信息,方便了用戶搜索和定位節(jié)目。另外,本發(fā)明通過對(duì)多音字采取用戶適應(yīng)的策略處理, 簡便的解決了多音字的問題,通過對(duì)模糊音的處理,使得不同地域的用戶可以得到更為精確 的搜索結(jié)果。
圖l是本發(fā)明的結(jié)構(gòu)示意圖。
具體實(shí)施例方式
為了使本發(fā)明實(shí)施例的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例, 對(duì)本發(fā)明實(shí)施例進(jìn)行進(jìn)一步詳細(xì)說明。
本發(fā)明考慮遙控器輸入的限制,提供了一種用戶使用遙控器輸入拼音即可快速搜索節(jié)目 信息,其通過對(duì)多音字采取用戶適應(yīng)的策略處理,簡便的解決了多音字的問題,通過對(duì)模糊 音的處理,使得不同地域的用戶可以得到更為精確的搜索結(jié)果,方便了用戶搜索和定位節(jié)目。
如圖1所示,本發(fā)明實(shí)施例的IPTV系統(tǒng)包括多個(gè)接入的用戶終端設(shè)備1; 一個(gè)或多 個(gè)流媒體服務(wù)器2;以及連接流媒體服務(wù)器2,且為戶終端設(shè)備1對(duì)流媒體服務(wù)器2中的節(jié) 目信息提供基于拼音搜索的節(jié)目搜索系統(tǒng)3。
其中,節(jié)目搜索系統(tǒng)3包括數(shù)據(jù)庫31和面向數(shù)據(jù)庫31進(jìn)行搜索的搜索模塊32。搜 索模塊32包括數(shù)據(jù)采集單元321、漢字轉(zhuǎn)拼音單元322、拼音選擇單元323、具有搜索引 擎程序的搜索引擎單元324。
數(shù)據(jù)采集單元321通過采用網(wǎng)絡(luò)爬蟲程序從流媒體服務(wù)器2采集其提供的節(jié)目源的節(jié)目 特征信息,將節(jié)目特征信息保存至數(shù)據(jù)庫31,且該節(jié)目特征信息可以是節(jié)目名稱、導(dǎo)演、
5演員,甚至節(jié)目介紹內(nèi)容等信息。
漢字轉(zhuǎn)拼音單元322先對(duì)節(jié)目特征信息進(jìn)行分詞處理,再利用ASCII碼表將漢字轉(zhuǎn)換為 拼音。由于漢字在計(jì)算機(jī)系統(tǒng)中以ASCII碼表示,只需要利用計(jì)算機(jī)系統(tǒng)中已有的或用戶自 己建立的每個(gè)拼音與每個(gè)ASCII碼對(duì)應(yīng)關(guān)系,即可實(shí)現(xiàn)將漢字轉(zhuǎn)換成全拼。此轉(zhuǎn)換處理由計(jì) 算機(jī)程序?qū)崿F(xiàn),具體的程序代碼可使用Java、(:語言或0++等編程語言實(shí)現(xiàn),且互聯(lián)網(wǎng)上都 有公開此類編程語言實(shí)現(xiàn)的漢字轉(zhuǎn)換拼音的程序源代碼,故在此不再詳述。
漢字轉(zhuǎn)拼音單元322在利用ASCII碼表進(jìn)行漢字轉(zhuǎn)換為拼音時(shí),由于漢字中存在多音字 的情況,因此對(duì)同一個(gè)詞組,可能會(huì)出現(xiàn)多組拼音結(jié)果,當(dāng)詞組里包含的多音字更多時(shí),這 個(gè)組合還會(huì)擴(kuò)大。為了既能采取正確的拼音組合,又能照顧到用戶的個(gè)人情況(對(duì)多音字的 辨認(rèn)能力),我們使用適應(yīng)用戶的方法。從用戶的角度出發(fā),我們認(rèn)為一個(gè)詞組的拼音發(fā)音, 不但存在正確的發(fā)音,還存在用戶的習(xí)慣性發(fā)音,這兩者都可以被認(rèn)為是有效的拼音組合, 而正確的發(fā)音往往包含在用戶的習(xí)慣性發(fā)音中,因此這種方法的描述如下對(duì)一個(gè)存在多音 字的詞組的多種拼音組合,將其全部納入搜索引擎單元324的搜索引擎的搜索范圍;由拼音 選擇單元323在一定的時(shí)間內(nèi)對(duì)同一詞組的各種拼音組合的搜索頻率進(jìn)行統(tǒng)計(jì),選取被用戶 搜索最為頻繁的一個(gè)或幾個(gè)拼音組合,丟棄其他的拼音組合。
以電影《和平戰(zhàn)士》為例,電影名稱信息"和平戰(zhàn)士"存儲(chǔ)在數(shù)據(jù)庫31中,由漢字轉(zhuǎn) 拼音單元322將"和平戰(zhàn)士"這三個(gè)字轉(zhuǎn)換為"hepingzhanshi"和"huo ping zhan shi" 兩種拼音組合,然后索引在搜索引擎單元324的搜索引擎中。在一定的時(shí)間后,拼音選擇單 元323檢査這兩種拼音組合的搜索概率,將檢索概率大的一項(xiàng)或者幾項(xiàng)作為正確的拼音組 合,索引在搜索引擎單元324的搜索引擎中,例如,假設(shè)在本例中為"he ping zhan shi"。
另外,漢字轉(zhuǎn)拼音單元322還對(duì)漢字可以在多音字的處理階段結(jié)束后進(jìn)行模糊音的處 理,由于在多音字處理階段已經(jīng)得到了正確的拼音組合,因此可以根據(jù)此拼音組合,以及南 方模糊音的規(guī)則生成模糊音拼音組合。
對(duì)模糊音進(jìn)行處理,針對(duì)模糊音ing => in、 zh=>z以及sh=〉s的情況,在搜索引擎中 添加"he pin zhan shi"、 "he pin zan shi"、 "he pin zan si"等8種組合。由于各地方 言情況不同,因此由運(yùn)營商來設(shè)定模糊音轉(zhuǎn)換的規(guī)則,能有效的減少數(shù)據(jù)的冗余,提高搜索 的準(zhǔn)確度。
由搜索引擎單元324將轉(zhuǎn)換為拼音的節(jié)目特征信息索引為搜索引擎的數(shù)據(jù);用戶終端設(shè) 備1提供用戶輸入搜索拼音并生成搜索請(qǐng)求,用戶終端設(shè)備1將搜索請(qǐng)求發(fā)送給搜索引擎單 元324啟動(dòng)搜索,搜索引擎單元324可將搜索到相應(yīng)的節(jié)目信息后,生成HTML文件通過HTTP 協(xié)議返回給用戶終端設(shè)備1;并將用戶終端設(shè)備1對(duì)搜索結(jié)果的選擇請(qǐng)求轉(zhuǎn)發(fā)給流媒體服務(wù) 器2,由流媒體服務(wù)器2向用戶終端設(shè)備1提供對(duì)應(yīng)的節(jié)目,用戶終端設(shè)備1接收流媒體服 務(wù)器2提供該節(jié)目的數(shù)據(jù)流進(jìn)行播放處理。
綜上,本發(fā)明考慮遙控器輸入的限制,提供了一種用戶使用遙控器輸入拼音即可快速搜 索節(jié)目信息,方便了用戶搜索和定位節(jié)目。另外,本發(fā)明通過對(duì)多音字采取用戶適應(yīng)的策略 處理,簡便的解決了多音字的問題,通過對(duì)模糊音的處理,使得不同地域的用戶可以得到更 為精確的搜索結(jié)果。
權(quán)利要求
1、一種IPTV系統(tǒng)中的節(jié)目信息搜索系統(tǒng),其特征在于,包括數(shù)據(jù)庫;數(shù)據(jù)采集單元,用于從IPTV系統(tǒng)中的流媒體服務(wù)器獲取節(jié)目源的節(jié)目特征信息并保存至數(shù)據(jù)庫;漢字轉(zhuǎn)拼音單元,用于利用ASCII碼表將節(jié)目特征信息的漢字轉(zhuǎn)換為拼音;具有搜索引擎程序的搜索引擎單元,用于將節(jié)目特征信息對(duì)應(yīng)的拼音索引為搜索引擎程序的數(shù)據(jù),根據(jù)IPTV系統(tǒng)的用戶輸入的搜索拼音啟動(dòng)搜索,將搜索結(jié)果返回給用戶,并將用戶根據(jù)搜索結(jié)果作出的用戶選擇請(qǐng)求轉(zhuǎn)發(fā)至流媒體服務(wù)器以獲取對(duì)應(yīng)的節(jié)目。
2、 根據(jù)權(quán)利要求1所述IPTV系統(tǒng)中的節(jié)目信息搜索系統(tǒng),其特征在于,所述漢字轉(zhuǎn)換 為拼音是按多音字拼音組合規(guī)則、模糊音拼音組合規(guī)則和地區(qū)性習(xí)慣發(fā) 音規(guī)則,將節(jié)目特征 信息中的一個(gè)漢字或漢字詞組轉(zhuǎn)換成對(duì)應(yīng)的多組拼音。
3、 根據(jù)權(quán)利要求2所述IPTV系統(tǒng)中的節(jié)目信息搜索系統(tǒng),其特征在于,還包括拼音 選擇單元,用于統(tǒng)計(jì)同一個(gè)漢字或漢字詞組對(duì)應(yīng)的多組拼音的搜索概率,將檢索概率大的一 組或幾組拼音優(yōu)先索引在搜索引擎單元的搜索引擎中。
4、 根據(jù)權(quán)利要求1所述IPTV系統(tǒng)中的節(jié)目信息搜索系統(tǒng),其特征在于,所述搜索結(jié)果 通過超文本文檔HTML文件的形式以超文本傳輸HTTP協(xié)議返回用戶。
5、 一種IPTV系統(tǒng),包括用戶終端設(shè)備和媒體服務(wù)器,其特征在于,還包括為戶終端 設(shè)備對(duì)流媒體服務(wù)器中的節(jié)目信息提供基于拼音搜索的節(jié)目搜索系統(tǒng);該節(jié)目搜索系統(tǒng)包括數(shù)據(jù)庫;數(shù)據(jù)采集單元,用于從流媒體服務(wù)器采集其提供的節(jié)目 源的節(jié)目特征信息并保存至數(shù)據(jù)庫;漢字轉(zhuǎn)拼音單元,用于利用ASCII碼表將節(jié)目特征信息 的漢字轉(zhuǎn)換為拼音;具有搜索引擎程序的搜索引擎單元,用于將節(jié)目特征信息對(duì)應(yīng)的拼音索 引為搜索引擎程序的數(shù)據(jù),根據(jù)用戶終端設(shè)備輸入的搜索拼音啟動(dòng)搜索,將搜索結(jié)果返回給 用戶終端設(shè)備,并將用戶終端設(shè)備根據(jù)搜索結(jié)果作出的用戶選擇請(qǐng)求轉(zhuǎn)發(fā)至流媒體服務(wù)器;由流媒體服務(wù)器根據(jù)用戶選擇請(qǐng)求為用戶終端設(shè)備提供對(duì)應(yīng)的節(jié)目。
6、 根據(jù)權(quán)利要求5所述IPTV系統(tǒng),其特征在于,所述漢字轉(zhuǎn)換為拼音是按多音字拼音 組合規(guī)則、模糊音拼音組合規(guī)則和地區(qū)性習(xí)慣發(fā)音規(guī)則,將節(jié)目特征信息中的一個(gè)漢字或漢 字詞組轉(zhuǎn)換成對(duì)應(yīng)的多組拼音。
7、 根據(jù)權(quán)利要求6所述IPTV系統(tǒng),其特征在于,還包括拼音選擇單元,用于統(tǒng)計(jì)同 一個(gè)漢字或漢字詞組對(duì)應(yīng)的多組拼音的搜索概率,將檢索概率大的一組或幾組拼音優(yōu)先索引在搜索引擎單元的搜索引擎中。
8、 一種IPTV系統(tǒng)中的節(jié)目信息搜索方法,其特征在于,包括從IPTV系統(tǒng)中的流媒體服務(wù)器采集其提供的節(jié)目源的節(jié)目特征信息并保存至數(shù)據(jù)庫; 利用ASCII碼表將節(jié)目特征信息的漢字轉(zhuǎn)換為拼音并索引為搜索引擎單元中搜索引擎 程序的數(shù)據(jù);由用戶終端設(shè)備接收用戶輸入的搜索拼音,生成搜索請(qǐng)求發(fā)送給搜索引擎單元啟動(dòng)搜索;搜索引擎單元將搜索結(jié)果返回給用戶,并將用戶根據(jù)搜索結(jié)果作出的用戶選擇請(qǐng)求轉(zhuǎn)發(fā) 至流媒體服務(wù)器;由流媒體服務(wù)器根據(jù)用戶選擇請(qǐng)求為用戶終端設(shè)備提供對(duì)應(yīng)的節(jié)目。
9、 根據(jù)權(quán)利要求8所述IPTV系統(tǒng)中的節(jié)目信息搜索方法,其特征在于,按多音字拼音 組合規(guī)則、模糊音拼音組合規(guī)則和地區(qū)性習(xí)慣發(fā)音規(guī)則,將節(jié)目特征信息中的一個(gè)漢字或漢 字詞組轉(zhuǎn)換成對(duì)應(yīng)的多組拼音。
10、 根據(jù)權(quán)利要求9所述IPTV系統(tǒng)中的節(jié)目信息搜索方法,其特征在于,統(tǒng)計(jì)同一個(gè) 漢字或漢字詞組對(duì)應(yīng)的多組拼音的搜索概率,將檢索概率大的一組或幾組拼音優(yōu)先索引在搜 索引擎單元的搜索引擎中。
全文摘要
本發(fā)明公開一種IPTV系統(tǒng)及其節(jié)目信息搜索系統(tǒng)與方法。其中,該節(jié)目信息搜索系統(tǒng)包括數(shù)據(jù)庫;數(shù)據(jù)采集單元,用于從IPTV系統(tǒng)中的流媒體服務(wù)器采集其提供的節(jié)目源的節(jié)目特征信息并保存至數(shù)據(jù)庫;漢字轉(zhuǎn)拼音單元,用于利用ASCII碼表將節(jié)目特征信息的漢字轉(zhuǎn)換為拼音;具有搜索引擎程序的搜索引擎單元,用于將節(jié)目特征信息對(duì)應(yīng)的拼音索引為搜索引擎程序的數(shù)據(jù),根據(jù)用戶輸入的搜索拼音啟動(dòng)搜索,將搜索結(jié)果返回給用戶,并將用戶根據(jù)搜索結(jié)果作出的用戶選擇請(qǐng)求轉(zhuǎn)發(fā)至流媒體服務(wù)器以獲取對(duì)應(yīng)的節(jié)目。本發(fā)明考慮遙控器輸入的限制,提供了一種用戶使用遙控器輸入拼音即可快速搜索和定位節(jié)目信息,從而方便了用戶。
文檔編號(hào)H04N7/173GK101610393SQ20091010877
公開日2009年12月23日 申請(qǐng)日期2009年7月17日 優(yōu)先權(quán)日2009年7月17日
發(fā)明者李昌盛 申請(qǐng)人:深圳創(chuàng)維數(shù)字技術(shù)股份有限公司