本發(fā)明涉及終端設(shè)備技術(shù)領(lǐng)域,尤其涉及一種智能電視用戶行為數(shù)據(jù)別名合并的方法及系統(tǒng)。
背景技術(shù):
通常在海量數(shù)據(jù)處理中,數(shù)據(jù)雖然在設(shè)計(jì)上已經(jīng)規(guī)定具體的格式和規(guī)范,按照約定的格式傳輸和存儲(chǔ),一般系統(tǒng)在開(kāi)發(fā)的時(shí)候,都進(jìn)行了良好的設(shè)計(jì)和規(guī)劃,但也不能保證在所有情況下,所存放數(shù)據(jù)的質(zhì)量都能滿足用戶的要求。對(duì)于智能電視用戶觀看行為數(shù)據(jù)來(lái)說(shuō),觀眾的收視行為分析是核心指標(biāo),而電視臺(tái)的收視統(tǒng)計(jì)更是重中之重,在終端上傳用戶觀看行為數(shù)據(jù)時(shí),電視臺(tái)名稱作為重要數(shù)據(jù),各個(gè)區(qū)域根據(jù)自己的習(xí)慣對(duì)同一電視臺(tái)的稱呼可能會(huì)不同,因此,獲取到的電視臺(tái)名稱數(shù)據(jù)會(huì)出現(xiàn)數(shù)據(jù)格式不同,但語(yǔ)義一致的現(xiàn)象,同一電視臺(tái)的不同稱呼會(huì)影響電視臺(tái)的收視統(tǒng)計(jì)。
因此,現(xiàn)有技術(shù)還有待于改進(jìn)和發(fā)展。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明要解決的技術(shù)問(wèn)題在于,針對(duì)現(xiàn)有技術(shù)的上述缺陷,提供一種智能電視用戶行為數(shù)據(jù)別名合并的方法及系統(tǒng),以解決現(xiàn)有技術(shù)中獲取到的用戶觀看行為數(shù)據(jù)中電視臺(tái)名稱語(yǔ)義一致但數(shù)據(jù)格式不一致的技術(shù)問(wèn)題。
本發(fā)明解決技術(shù)問(wèn)題所采用的技術(shù)方案如下:
一種智能電視用戶行為數(shù)據(jù)別名合并的方法,其中,其包括:
當(dāng)接收到終端設(shè)備上報(bào)的攜帶用戶觀看行為的數(shù)據(jù)時(shí),解析所述數(shù)據(jù)并獲取所述用戶觀看行為所對(duì)應(yīng)的電視臺(tái)名稱;
將所述電視臺(tái)名稱與預(yù)設(shè)的若干個(gè)別名參照表進(jìn)行一一匹配,分別獲取所述電視臺(tái)名稱相對(duì)于每個(gè)別名參照表的權(quán)重;
根據(jù)所述權(quán)重確定所述電視臺(tái)名稱對(duì)應(yīng)的別名參照表,并將所述別名參照表的名稱確定為所述數(shù)據(jù)的電視臺(tái)名稱。
所述智能電視用戶行為數(shù)據(jù)別名合并的方法,其中,所述當(dāng)接收到終端設(shè)備發(fā)送的攜帶用戶觀看行為的數(shù)據(jù)時(shí),解析所述數(shù)據(jù)并獲取所述用戶觀看行為所對(duì)應(yīng)的電視臺(tái)名稱之前還包括:
預(yù)先為每個(gè)電視臺(tái)建立一個(gè)別名參照表,所述別名參照表內(nèi)攜帶有與此電視臺(tái)相關(guān)的所有電視臺(tái)名稱的別名;
為每個(gè)別名參照表內(nèi)的每個(gè)別名預(yù)先設(shè)置權(quán)重。
所述智能電視用戶行為數(shù)據(jù)別名合并的方法,其中,所述將所述電視臺(tái)名稱與預(yù)設(shè)的若干個(gè)別名參照表進(jìn)行一一匹配,分別獲取所述電視臺(tái)名稱對(duì)應(yīng)每個(gè)別名參照表的權(quán)重具體包括:
將所述電視臺(tái)名稱依次與每個(gè)別名參照表進(jìn)行比較;
分別獲取所述別名參照表內(nèi)與所述電視臺(tái)名稱的字符相匹配的別名對(duì)應(yīng)的權(quán)重;
通過(guò)將所述各權(quán)重求和以獲得所述電視臺(tái)名稱相對(duì)于別名參照表的權(quán)重。
所述智能電視用戶行為數(shù)據(jù)別名合并的方法,其中,所述根據(jù)所述權(quán)重確定所述電視臺(tái)名稱對(duì)應(yīng)的別名參照表,并將所述別名參照表的名稱確定為所述數(shù)據(jù)的電視臺(tái)名稱具體包括:
將電視臺(tái)名稱相對(duì)于各別名參照表的權(quán)重進(jìn)行排序,獲取最大權(quán)重對(duì)應(yīng)的別名參照表;
將所述別名參照表確定為所述電視臺(tái)名稱的對(duì)應(yīng)的別名參照表,并將所述別名參照表的名稱確定為所述數(shù)據(jù)的電視臺(tái)名稱。
所述智能電視用戶行為數(shù)據(jù)別名合并的方法,其中,所述當(dāng)接收到終端設(shè)備發(fā)送的攜帶用戶觀看行為的數(shù)據(jù)時(shí),解析所述數(shù)據(jù)并獲取所述用戶觀看行為所對(duì)應(yīng)的電視臺(tái)名稱之前還包括:
當(dāng)終端設(shè)備播放電視節(jié)目時(shí),通過(guò)終端設(shè)備獲取用戶觀看行為,其中,所述用戶觀看行為至少包含電視臺(tái)名稱;
將所述用戶觀看行為生成用戶觀看行為數(shù)據(jù),并上報(bào)所述用戶觀看行為數(shù)據(jù)。
一種智能電視用戶行為數(shù)據(jù)別名合并的系統(tǒng),其中,其包括:用于上報(bào)用戶觀看行為數(shù)據(jù)的終端設(shè)備、及服務(wù)器端,所述服務(wù)器端包括解析模塊、匹配模塊以及確定模塊;
所述解析模塊用于當(dāng)接收到終端設(shè)備上報(bào)的攜帶用戶觀看行為的數(shù)據(jù)時(shí),解析所述數(shù)據(jù)并獲取所述用戶觀看行為所對(duì)應(yīng)的電視臺(tái)名稱;
所述匹配模塊用于將所述電視臺(tái)名稱與預(yù)設(shè)的若干個(gè)別名參照表進(jìn)行一一匹配,分別獲取所述電視臺(tái)名稱相對(duì)于每個(gè)別名參照表的權(quán)重;
所述確定模塊,用于根據(jù)所述權(quán)重確定所述電視臺(tái)名稱對(duì)應(yīng)的別名參照表,并將所述別名參照表的名稱確定為所述數(shù)據(jù)的電視臺(tái)名稱。
所述智能電視用戶行為數(shù)據(jù)別名合并的系統(tǒng),其中,其還包括:
建立模塊,用于預(yù)先為每個(gè)電視臺(tái)建立一個(gè)別名參照表,所述別名參照表內(nèi)存儲(chǔ)有與此電視臺(tái)相關(guān)的所有電視臺(tái)名稱的別名;
預(yù)設(shè)模塊,用于為每個(gè)別名參照表內(nèi)的每個(gè)別名預(yù)先設(shè)置權(quán)重。
所述智能電視用戶行為數(shù)據(jù)別名合并的系統(tǒng),其中,所述匹配模塊具體包括:
比較單元,用于將所述電視臺(tái)名稱依次與每個(gè)別名參照表進(jìn)行比較;
獲取單元,用于分別獲取所述別名參照表內(nèi)與所述電視臺(tái)名稱的字符相匹配的別名對(duì)應(yīng)的權(quán)重;
計(jì)算單元,用于通過(guò)將所述各權(quán)重求和以獲得所述電視臺(tái)名稱相對(duì)于別名參照表的權(quán)重。
所述智能電視用戶行為數(shù)據(jù)別名合并的系統(tǒng),其中,所述確定模塊具體包括:
排序單元,用于將電視臺(tái)名稱對(duì)應(yīng)各別名參照表的權(quán)重進(jìn)行排序,獲取最大權(quán)重對(duì)應(yīng)的別名參照表;
確定單元,用于將將所述別名參照表確定為所述電視臺(tái)名稱的對(duì)應(yīng)的別名參照表,并將所述別名參照表的名稱確定為所述數(shù)據(jù)的電視臺(tái)名稱。
所述智能電視用戶行為數(shù)據(jù)別名合并的系統(tǒng),其中,所述終端設(shè)備包括:
獲取模塊,用于當(dāng)終端設(shè)備播放電視節(jié)目時(shí),通過(guò)終端設(shè)備獲取用戶觀看行為,其中,所述用戶觀看行為至少包含電視臺(tái)名稱;
上報(bào)模塊,用于將所述用戶觀看行為生成用戶觀看行為數(shù)據(jù),并上報(bào)所述用戶觀看行為數(shù)據(jù)。
有益效果:與現(xiàn)有技術(shù)相比,本發(fā)明將與別名參照表對(duì)應(yīng)的電視臺(tái)名稱使用此別名參照表的唯一別名標(biāo)識(shí)來(lái)表示,從而將終端設(shè)備上報(bào)至服務(wù)器端的用戶觀看行為數(shù)據(jù)中的電視臺(tái)名稱進(jìn)行統(tǒng)一規(guī)范,使得服務(wù)器端獲取到語(yǔ)義一致,格式也一致的用戶觀看行為數(shù)據(jù),提高電視臺(tái)收視率統(tǒng)計(jì)的準(zhǔn)確性和有效性。
附圖說(shuō)明
圖1是本發(fā)明所述智能電視用戶行為數(shù)據(jù)別名合并的方法的較佳實(shí)施例的流程圖;
圖2是本發(fā)明所述智能電視用戶行為數(shù)據(jù)別名合并的系統(tǒng)的較佳實(shí)施例的功能原理框圖。
具體實(shí)施方式
本發(fā)明提供的一種智能電視用戶行為數(shù)據(jù)別名合并的方法及系統(tǒng),為使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚、明確,以下參照附圖并舉實(shí)施例對(duì)本發(fā)明進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限定本發(fā)明。
下面結(jié)合附圖,通過(guò)對(duì)實(shí)施例的描述,對(duì)發(fā)明內(nèi)容作進(jìn)一步說(shuō)明。
請(qǐng)參見(jiàn)圖1,圖1是本發(fā)明所述智能電視用戶行為數(shù)據(jù)別名合并的方法的較佳實(shí)施例的流程圖。所述智能電視用戶行為數(shù)據(jù)別名合并的方法包括:
步驟S100、當(dāng)接收到終端設(shè)備上報(bào)的攜帶用戶觀看行為的數(shù)據(jù)時(shí),解析所述數(shù)據(jù)并獲取所述用戶觀看行為所對(duì)應(yīng)的電視臺(tái)名稱。
步驟S100之前包括:
當(dāng)終端設(shè)備播放電視節(jié)目時(shí),通過(guò)終端設(shè)備獲取用戶觀看行為,其中,所述用戶觀看行為至少包含電視臺(tái)名稱;
將所述用戶觀看行為生成用戶觀看行為數(shù)據(jù),并上報(bào)所述用戶觀看行為數(shù)據(jù)。
較佳的,所述終端設(shè)備為智能電視機(jī)。智能電視機(jī)接收用戶的操作指令播放電視節(jié)目時(shí),將用戶觀看行為記錄下來(lái),并將記錄下來(lái)的用戶觀看行為數(shù)據(jù)實(shí)時(shí)上傳給服務(wù)器端,其中,用戶觀看行為至少包括當(dāng)前用戶收看節(jié)目所屬的電視臺(tái)的名稱。較佳的,預(yù)先為每個(gè)終端設(shè)備設(shè)置唯一標(biāo)識(shí)ID,所述用戶觀看行為包括:終端設(shè)備唯一標(biāo)識(shí)(ID)、節(jié)目收看時(shí)間、當(dāng)前收看節(jié)目所屬電視臺(tái)的名稱。
所述用戶觀看行為生成用戶觀看行為的數(shù)據(jù),且以字段——值的形式保存至一數(shù)據(jù)集合,從而將此數(shù)據(jù)集合上傳至服務(wù)器端。較佳的實(shí)施例,終端設(shè)備1(ID=1)接收用戶操作指令后在下午1點(diǎn)播放中央1臺(tái)的電視節(jié)目,則根據(jù)用戶觀看行為生成的數(shù)據(jù)為:
ID——1;
TIME——1PM;
TVStation——中央1臺(tái)
其中,TIME是指當(dāng)前電視臺(tái)播放的起始時(shí)間。
步驟S100之前還包括:
預(yù)先為每個(gè)電視臺(tái)建立一個(gè)別名參照表,所述別名參照表內(nèi)存儲(chǔ)有與此電視臺(tái)相關(guān)的所有電視臺(tái)名稱的別名;
為每個(gè)別名參照表內(nèi)的每個(gè)別名預(yù)先設(shè)置權(quán)重。
由于地域不同,每個(gè)地域用戶對(duì)電視臺(tái)的稱呼不同,因此,不同終端設(shè)備上報(bào)至服務(wù)器端的電視臺(tái)名稱也會(huì)不一致。在服務(wù)器端預(yù)先為每個(gè)電視臺(tái)建立一個(gè)個(gè)別名參照表,所述別名參照表內(nèi)存儲(chǔ)有與此電視臺(tái)相關(guān)的所有電視臺(tái)名稱的別名,所述別名參照表的個(gè)數(shù)與終端設(shè)備所能播放的電視臺(tái)個(gè)數(shù)相等。
每個(gè)別名參照表均對(duì)應(yīng)一個(gè)別名標(biāo)識(shí)(即別名參照表的名稱),別名標(biāo)識(shí)用于標(biāo)識(shí)此別名列表中包含哪個(gè)電視臺(tái)的所有別名名稱,別名標(biāo)識(shí)可以為別名參照表中的一個(gè)電視臺(tái)別名,也可以為一個(gè)代碼(如0001)。
較佳的實(shí)施例一,別名參照表(別名標(biāo)識(shí)為中央一臺(tái)/0001),包括如下電視臺(tái)別名:CCTV-1,cctv-1,中央一套,中央1臺(tái),中央一臺(tái),央視1臺(tái),央視一臺(tái),央視一套,央視1套,中央1,央視,1臺(tái),1套,一套,1,一。
預(yù)先為每個(gè)別名參照表中的每個(gè)別名設(shè)置權(quán)重,同時(shí),每個(gè)別名參照表內(nèi)的所有別名均按權(quán)重由高到低排列,較佳的,生活中稱呼幾率最高的別名,其權(quán)重最高,稱呼幾率最低的別名,其權(quán)重最低;其中,同一別名參照表中的若干個(gè)別名的權(quán)重可以相同,如預(yù)先將別名參照表(別名標(biāo)識(shí)為中央一臺(tái)/0001)中CCTV-1和cctv-1的權(quán)重均設(shè)置為1.0;中央1和央視的權(quán)重均設(shè)置為0.7;1臺(tái)和一套的權(quán)重均設(shè)置為0.3;1和一的權(quán)重均設(shè)置為0.2。
終端設(shè)備記錄包含用戶觀看行為的數(shù)據(jù)并將數(shù)據(jù)放入集合后,獲取服務(wù)器端的地址和端口,將包含用戶觀看行為的數(shù)據(jù)集合上報(bào)至服務(wù)器端,服務(wù)器端接收數(shù)據(jù)集合后,對(duì)此數(shù)據(jù)集合進(jìn)行解析,從中獲取所述用戶觀看行為所對(duì)應(yīng)的電視臺(tái)的名稱,即獲取TVStation字段所對(duì)應(yīng)的值。
步驟S200、將所述電視臺(tái)名稱與每個(gè)別名參照表進(jìn)行一一匹配,分別獲取所述電視臺(tái)名稱相對(duì)于每個(gè)別名參照表的權(quán)重。
將解析得到的所述電視臺(tái)名稱與每個(gè)別名參照表依次進(jìn)行匹配。由于數(shù)據(jù)采集和上報(bào)過(guò)程中會(huì)有不可預(yù)測(cè)的情況,存在部分?jǐn)?shù)據(jù)格式變化的情況,即服務(wù)器端解析出的所述電視臺(tái)名稱與所有的別名參照表依次匹配后,可能出現(xiàn)在所有的別名參照表中匹配不到所述電視臺(tái)名稱的情況,因此,服務(wù)器端在解析所述用戶觀看行為數(shù)據(jù)時(shí),會(huì)進(jìn)行數(shù)據(jù)清洗,即將別名參照表中無(wú)法匹配得到的電視臺(tái)名稱清除,向?qū)?yīng)的終端設(shè)備發(fā)送用戶觀看行為數(shù)據(jù)格式錯(cuò)誤的提示,同時(shí)服務(wù)器端會(huì)對(duì)此終端設(shè)備進(jìn)行標(biāo)記,方便后續(xù)利用別名統(tǒng)計(jì)各個(gè)電視臺(tái)收視情況時(shí)人工核對(duì)。
步驟S200具體包括:
將所述電視臺(tái)名稱依次與每個(gè)別名參照表進(jìn)行比較,即服務(wù)器端將所述電視臺(tái)名稱依次與各個(gè)別名參照表中所包含的所有別名進(jìn)行一一匹配。
分別獲取所述別名參照表內(nèi)與所述電視臺(tái)名稱的字符相匹配的別名對(duì)應(yīng)的權(quán)重。所述電視臺(tái)名稱與所述別名參照表內(nèi)的別名按照字符進(jìn)行匹配,從而獲取到與所述電視臺(tái)名稱的字符相匹配的所有別名對(duì)應(yīng)的權(quán)重。具體匹配判斷過(guò)程如下:
當(dāng)所述別名參照表中別名的字符個(gè)數(shù)小于所述電視臺(tái)名稱的字符個(gè)數(shù)時(shí),判斷所述電視臺(tái)名稱中是否包含此別名的所有字符,若包含,則判斷此別名中字符順序與電視臺(tái)名稱中對(duì)應(yīng)的字符順序是否相同,若相同,則獲取此別名對(duì)應(yīng)的權(quán)重;當(dāng)所述別名參照表中別名的字符個(gè)數(shù)等于所述電視臺(tái)名稱的字符個(gè)數(shù)時(shí),判斷所述電視臺(tái)名稱中所有字符與別名中所有字符是否完全相等,若完全相等,則獲取此別名對(duì)應(yīng)的權(quán)重;當(dāng)所述別名參照表中別名的字符大于所述電視臺(tái)名稱的字符時(shí),判斷此別名中是否包含所述電視臺(tái)名稱中的所有字符,若包含,則判斷所述電視臺(tái)名稱中字符順序與此別名中對(duì)應(yīng)的字符順序是否相同,若相同,則獲取此別名對(duì)應(yīng)的權(quán)重。
通過(guò)將所述各權(quán)重求和以獲得所述電視臺(tái)名稱相對(duì)于別名參照表的權(quán)重,即將別名參照表中滿足上述匹配判斷過(guò)程的所有別名對(duì)應(yīng)的權(quán)重求和。較佳的實(shí)施例二,服務(wù)器端解析所述用戶觀看行為數(shù)據(jù)得到所述電視臺(tái)名稱為中央1臺(tái),別名參照表為兩個(gè):別名參照表(別名標(biāo)識(shí)為中央一臺(tái)/0001),包括如下電視臺(tái)別名:CCTV-1,cctv-1,CCTV 1,中央一套,中央1臺(tái),中央一臺(tái),央視1臺(tái),央視一臺(tái),央視一套,央視1套,中央1,央視,1臺(tái),1套,一套,1,一;CCTV-1和cctv-1的權(quán)重均設(shè)置為1.0;中央1臺(tái)的權(quán)重設(shè)置為0.8;中央1和央視的權(quán)重均設(shè)置為0.7;1和一套的權(quán)重均設(shè)置為0.3;1和一的權(quán)重均設(shè)置為0.2。別名參照表(別名標(biāo)識(shí)為中央二臺(tái)/0002),包括如下電視臺(tái)別名:CCTV-2,cctv-2,CCTV 2,中央二套,中央2臺(tái),央視二臺(tái),央視二套,2臺(tái),2,二;CCTV-2和cctv-2的權(quán)重均設(shè)置為1.0;中央2臺(tái)和央視二臺(tái)的權(quán)重均設(shè)置為0.7;2臺(tái),2和二的權(quán)重均設(shè)置為0.2。
服務(wù)器端解析到終端設(shè)備(ID=1)的所述用戶觀看行為數(shù)據(jù)中TVStation字段值為中央1,則所述電視臺(tái)名稱為中央1,所述電視臺(tái)名稱與別名參照表(別名標(biāo)識(shí)為中央一臺(tái)/0001)匹配時(shí),獲取此別名參照表內(nèi)與所述電視臺(tái)名稱的字符相匹配的別名對(duì)應(yīng)的權(quán)重分別為:中央1臺(tái)對(duì)應(yīng)權(quán)重0.8,中央1對(duì)應(yīng)權(quán)重0.7,1對(duì)應(yīng)權(quán)重0.3,此時(shí),所述電視臺(tái)名稱中央1相對(duì)于別名參照表(別名標(biāo)識(shí)為中央一臺(tái)/0001)的權(quán)重為0.8+0.7+0.3=1.8;所述電視臺(tái)名稱中央1相對(duì)于別名參照表(別名標(biāo)識(shí)為中央二臺(tái)/0002)的權(quán)重為0。
步驟S300、根據(jù)所述權(quán)重確定所述電視臺(tái)名稱對(duì)應(yīng)的別名參照表,并將所述別名參照表的名稱確定為所述數(shù)據(jù)的電視臺(tái)名稱。
步驟S300具體包括:
將所述電視臺(tái)名稱相對(duì)于各個(gè)別名參照表的權(quán)重進(jìn)行排序,獲取最大權(quán)重對(duì)應(yīng)的別名參照表。如較佳的實(shí)施例二中,將所述電視臺(tái)名稱中央1相對(duì)于所有別名參照表的權(quán)重進(jìn)行由大到小排序,獲取最大權(quán)重對(duì)應(yīng)的別名參照表(別名標(biāo)識(shí)為中央一臺(tái)/0001)。
將所述別名參照表確定為所述電視臺(tái)名稱對(duì)應(yīng)的別名參照表,并將所述別名名參照表的名稱確定為所述數(shù)據(jù)的電視臺(tái)名稱。由于每一個(gè)別名參照表均設(shè)置有唯一別名標(biāo)識(shí),因此,可將與別名參照表對(duì)應(yīng)的電視臺(tái)名稱使用此別名參照表的名稱即唯一別名標(biāo)識(shí)來(lái)表示,從而將終端設(shè)備上報(bào)至服務(wù)器端的用戶觀看行為數(shù)據(jù)中的電視臺(tái)名稱進(jìn)行統(tǒng)一規(guī)范,使得服務(wù)器端獲取到語(yǔ)義一致,格式也一致的用戶觀看行為數(shù)據(jù),提高電視臺(tái)收視率統(tǒng)計(jì)的準(zhǔn)確性和有效性。較佳的實(shí)施例,別名參照表“CCTV-1,cctv-1,CCTV 1,中央一套,中央1臺(tái),中央一臺(tái),央視1臺(tái),央視一臺(tái),央視一套,央視1套,中央1,央視,1臺(tái),1套,一套,1,一”使用別名“中央一臺(tái)”作為其唯一標(biāo)識(shí),則如較佳的實(shí)施例二中,所述電視臺(tái)名稱“中央1”對(duì)應(yīng)的別名即為“中央一臺(tái)”,終端設(shè)備(ID=1)的所述用戶觀看行為數(shù)據(jù)別名也確定為“中央一臺(tái)”。
較佳的,終端設(shè)備還可以每隔一預(yù)定時(shí)間將采集記錄的用戶觀看行為數(shù)據(jù)上傳至服務(wù)器端,以節(jié)省能耗。服務(wù)器端可以根據(jù)所述預(yù)定時(shí)間中用戶的觀看行為,通過(guò)所述智能電視用戶行為數(shù)據(jù)別名合并的方法,判定終端設(shè)備上傳的用戶觀看行為數(shù)據(jù)別名,計(jì)算預(yù)定時(shí)間內(nèi)各個(gè)別名出現(xiàn)的概率,對(duì)各個(gè)電視臺(tái)的收視情況進(jìn)行統(tǒng)計(jì):預(yù)定時(shí)間內(nèi)某個(gè)別名出現(xiàn)的次數(shù)/預(yù)定時(shí)間內(nèi)服務(wù)器端接收到的所有不重復(fù)的數(shù)據(jù)別名的個(gè)數(shù),即為某個(gè)別名對(duì)應(yīng)的電視臺(tái)在預(yù)定時(shí)間內(nèi)被用戶收看的概率。
本發(fā)明還提供一種智能電視用戶行為數(shù)據(jù)別名合并的系統(tǒng),其包括:用于上報(bào)用戶觀看行為數(shù)據(jù)的終端設(shè)備、及服務(wù)器端,所述服務(wù)器端包括解析模塊10、匹配模塊20以及確定模塊30;
所述解析模塊10,用于當(dāng)接收到終端設(shè)備上報(bào)的攜帶用戶觀看行為的數(shù)據(jù)時(shí),解析所述數(shù)據(jù)并獲取所述用戶觀看行為所對(duì)應(yīng)的電視臺(tái)名稱,具體如上所述;
所述匹配模塊20,用于將所述電視臺(tái)名稱與預(yù)設(shè)的若干個(gè)別名參照表進(jìn)行一一匹配,分別獲取所述電視臺(tái)名稱相對(duì)于每個(gè)別名參照表的權(quán)重,具體如上所述;
所述確定模塊30,用于根據(jù)所述權(quán)重確定所述電視臺(tái)名稱對(duì)應(yīng)的別名參照表,并將所述別名參照表的名稱確定為所述數(shù)據(jù)的電視臺(tái)名稱,具體如上所述。
所述智能電視用戶行為數(shù)據(jù)別名合并的系統(tǒng)還包括:
建立模塊,用于預(yù)先為每個(gè)電視臺(tái)建立一個(gè)別名參照表,所述別名參照表內(nèi)攜帶有與此電視臺(tái)相關(guān)的所有電視臺(tái)名稱的別名,具體如上所述;
預(yù)設(shè)模塊,用于為每個(gè)別名參照表內(nèi)的每個(gè)別名預(yù)先設(shè)置權(quán)重,具體如上所述。
所述匹配模塊具體包括:
比較單元,用于將所述電視臺(tái)名稱依次與每個(gè)別名參照表進(jìn)行比較,具體如上所述;
獲取單元,用于分別獲取所述別名參照表內(nèi)與所述電視臺(tái)名稱的字符相匹配的別名對(duì)應(yīng)的權(quán)重,具體如上所述;
計(jì)算單元,用于通過(guò)將所述各權(quán)重求和以獲得所述電視臺(tái)名稱相對(duì)于別名參照表的權(quán)重,具體如上所述。
所述確定模塊具體包括:
排序單元,用于將電視臺(tái)名稱對(duì)應(yīng)各別名參照表的權(quán)重進(jìn)行排序,獲取最大權(quán)重對(duì)應(yīng)的別名參照表,具體如上所述;
確定單元,用于將所述別名參照表確定為所述電視臺(tái)名稱的對(duì)應(yīng)的別名參照表,并將所述別名參照表的名稱確定為所述數(shù)據(jù)的電視臺(tái)名稱,具體如上所述。
所述終端設(shè)備包括:
獲取模塊,用于當(dāng)終端設(shè)備播放電視節(jié)目時(shí),通過(guò)終端設(shè)備獲取用戶觀看行為,其中,所述用戶觀看行為至少包含電視臺(tái)名稱,具體如上所述;
上報(bào)模塊,用于將所述用戶觀看行為生成用戶觀看行為數(shù)據(jù),并上報(bào)所述用戶觀看行為數(shù)據(jù),具體如上所述。
綜上所述,本發(fā)明所提供了一種智能電視用戶行為數(shù)據(jù)別名合并的方法及系統(tǒng),其包括:當(dāng)接收到終端設(shè)備上報(bào)的攜帶用戶觀看行為的數(shù)據(jù)時(shí),解析所述數(shù)據(jù)并獲取所述用戶觀看行為所對(duì)應(yīng)的電視臺(tái)的名稱;將所述電視臺(tái)名稱與預(yù)設(shè)的若干個(gè)別名參照表進(jìn)行一一匹配,分別獲取所述電視臺(tái)名稱相對(duì)于每個(gè)別名參照表的權(quán)重;根據(jù)所述權(quán)重確定所述電視臺(tái)名稱對(duì)應(yīng)的別名參照表,并將所述別名參照表對(duì)應(yīng)的名稱確定為所述數(shù)據(jù)的電視臺(tái)名稱。本發(fā)明將與別名參照表對(duì)應(yīng)的電視臺(tái)名稱使用此別名參照表的唯一別名標(biāo)識(shí)來(lái)表示,從而將終端設(shè)備上報(bào)至服務(wù)器端的用戶觀看行為數(shù)據(jù)中的電視臺(tái)名稱進(jìn)行統(tǒng)一規(guī)范,使得服務(wù)器端獲取到語(yǔ)義一致,格式也一致的用戶觀看行為數(shù)據(jù),提高電視臺(tái)收視率統(tǒng)計(jì)的準(zhǔn)確性和有效性。
應(yīng)當(dāng)理解的是,本發(fā)明的應(yīng)用不限于上述的舉例,對(duì)本領(lǐng)域普通技術(shù)人員來(lái)說(shuō),可以根據(jù)上述說(shuō)明加以改進(jìn)或變換,所有這些改進(jìn)和變換都應(yīng)屬于本發(fā)明所附權(quán)利要求的保護(hù)范圍。