r>[0063] 步驟S202中,還是W第i傳播跳數(shù)為6、第i共現(xiàn)跳數(shù)為3為例,郝么所確定出的 商值為0.5。
[0064] 步驟S203a中,第一預(yù)設(shè)闊值可W設(shè)置的任意值,比如;0. 4、0. 6、0. 8等等,本發(fā)明 實(shí)施例不作限制,通??蒞由用戶根據(jù)需要或者經(jīng)驗(yàn)自行設(shè)定,其中如果第一預(yù)設(shè)闊值為 0. 4,則由于0. 5大于0. 4,則可W確定第i特征詞匯為群體特征詞匯;而如果第一預(yù)設(shè)闊值 為0. 8,則由于0. 5小于0. 8,郝么則可W確定第i特征詞匯不為群體特征詞匯。
[0065] 由于在上述方案中,在確定某特征詞匯是否為群體特征詞匯時(shí),綜合考了該特征 詞匯的傳播跳數(shù)與共現(xiàn)跳數(shù),而不同的用戶群體所包含的用戶數(shù)量具有較大的差異,從而 特征詞匯的傳播跳數(shù)也存在較大差異,故而通過(guò)上述所確定的群體特征詞匯更加準(zhǔn)確,更 加滿足特定用戶群體的使用需求。例如:在用戶群體的人數(shù)較少的情況下,特征詞匯的傳播 固徽也較小,在送種情況下,較小的共現(xiàn)跳數(shù)就能夠確定該特征詞匯為群體特征詞匯;而在 用戶群體的人數(shù)較多的情況下,特征詞匯的傳播跳數(shù)也較多,在送種情況下,較大的共現(xiàn)跳 數(shù)才能夠確定該特征詞匯為群體特征詞匯。
[0066] 第二種,判斷特征詞匯中的任一特征詞匯是否為用戶所在特定用戶群體的群體特 征詞匯,具體包括:
[0067] 判斷特征詞匯中任一特征詞匯的共現(xiàn)跳數(shù)是否大于預(yù)設(shè)闊值,在大于預(yù)設(shè)闊值 時(shí),則確定其為群體特征詞匯。
[006引該預(yù)設(shè)闊值可W為任意值,比如10、15等等,本發(fā)明實(shí)施例不作限制,由于在上述 方案中,僅僅需要考慮特征詞匯的共現(xiàn)跳數(shù),故而具有提高電子設(shè)備的處理速度的技術(shù)效 果。
[0069] 作為進(jìn)一步的優(yōu)選實(shí)施例,在判斷N個(gè)特征詞匯中的任一特征詞匯是否為用戶所 在特定用戶群體的群體特征詞匯之前,請(qǐng)參考圖4,方法還包括:
[0070] 步驟S401 ;依次取i為1至N的整數(shù),確定N個(gè)特征詞匯中第i個(gè)特征詞匯的第i 傳播跳數(shù)和第i共現(xiàn)跳數(shù),第i傳播跳數(shù)具體為:第i個(gè)特征詞匯從第一次出現(xiàn)到傳輸至電 子設(shè)備所經(jīng)過(guò)的節(jié)點(diǎn)數(shù)量,第i共現(xiàn)跳數(shù)具體為:第i個(gè)特征詞匯在傳播過(guò)程中,將第i個(gè) 特征詞匯作為特征詞匯的節(jié)點(diǎn)數(shù)量;
[0071] 步驟S402 ;判斷第i傳播跳數(shù)減去第i共現(xiàn)跳數(shù)的差值是否大于第Η預(yù)設(shè)闊值;
[0072] 步驟S403a ;在差值大于第Η預(yù)設(shè)闊值時(shí),將第i個(gè)特征詞匯從Ν個(gè)特征詞匯中去 除,進(jìn)而在i等于N時(shí),獲得用戶的L個(gè)特征詞匯,L為小于等于N的正整數(shù);
[0073] 步驟S403b ;在差值小于第Η預(yù)設(shè)闊值時(shí),則將第i個(gè)特征詞匯保留。
[0074] 進(jìn)而步驟S102中,判斷N個(gè)特征詞匯中的任一特征詞匯是否為用戶所在特定用戶 群體的群體特征詞匯,具體為:
[00巧]逐一判斷L個(gè)特征詞匯中的任一特征詞匯是否為群體特征詞匯。
[0076] 步驟S401中,對(duì)于確定確定第i特征詞匯的第i傳播跳數(shù)和第i共現(xiàn)跳數(shù),在前 面已作介紹,故而在此不再賞述。
[0077] 步驟S402中,還是W第i傳播跳數(shù)為6、第i共現(xiàn)跳數(shù)為3為例,郝么所確定的差 值為3,第Η預(yù)設(shè)闊值可W為任意值,例如;10、20等等,通常情況下為用戶根據(jù)經(jīng)驗(yàn)或者需 求設(shè)置;
[007引步驟S403a中,通常在第i傳播跳數(shù)大于第i共現(xiàn)跳數(shù)時(shí),則說(shuō)明第i特征詞匯僅 僅為該特定用戶群體中少數(shù)用戶的特征詞匯,而并非大部分用戶的常用詞匯,故而其并不 會(huì)成為該特定用戶群體的常用特征詞匯,故而可W將第i個(gè)特征詞匯從N個(gè)特征詞匯中去 除,從而獲得L特特征詞匯。
[0079] 進(jìn)而,在后續(xù)判斷N個(gè)特征詞匯是否為群體特征詞匯時(shí),由于前面已經(jīng)篩選掉部 分特征詞匯,故而一來(lái)可W降低特征詞匯在多個(gè)節(jié)點(diǎn)之間的傳播負(fù)擔(dān),二來(lái),只需要從L個(gè) 特征詞匯中確定出群體特征詞匯,也提高了處理效率。
[0080] 在具體實(shí)施過(guò)程中,步驟S103中可W通過(guò)多種方式對(duì)用戶的用戶詞典進(jìn)行更新, 下面列舉其中的兩種進(jìn)行介紹,當(dāng)然,在具體實(shí)施過(guò)程中,不限于W下兩種情況。
[0081] 第一種,通過(guò)Μ個(gè)群體特征詞匯對(duì)電子設(shè)備的用戶詞典進(jìn)行更新,請(qǐng)參考圖5,具 體包括:
[0082] 步驟S501 ;取j為1至Μ的整數(shù),確定Μ個(gè)群體特征詞匯中的第j個(gè)特征詞匯的 源節(jié)點(diǎn)與電子設(shè)備的第j距離值;
[0083] 步驟S502 ;判斷第j距離值是否小于預(yù)設(shè)距離值;
[0084] 步驟S503a ;在第j距離值小于預(yù)設(shè)距離值時(shí),將第j個(gè)特征詞匯加入用戶詞典; [00財(cái)步驟S503b ;否則,不將第j個(gè)特征詞匯加入用戶詞典。
[0086] 步驟S501中,對(duì)每個(gè)特征詞匯可W根據(jù)其屬性計(jì)算其源節(jié)點(diǎn)與當(dāng)前電子設(shè)備之 間的距離值,其計(jì)算方法例如為:特征詞匯的詞匯W與其屬性可W形成一個(gè)向量,送樣每一 個(gè)特征詞匯W都是一個(gè)向量,向量中的每一維都有自己的權(quán)重,送些權(quán)重事先設(shè)定,默認(rèn)都 為1(當(dāng)然也可W為其它值,本發(fā)明實(shí)施例不作限制),節(jié)點(diǎn)的所有特征詞匯集合Η是一個(gè)向 量集合,不同節(jié)點(diǎn)的距離用其特征詞匯的集合之間的距離計(jì)算。兩個(gè)向量集合的距離的計(jì) 算方法:分別計(jì)算兩個(gè)向量集合的中也點(diǎn),然后用計(jì)算兩個(gè)中也點(diǎn)的距離,計(jì)算中也點(diǎn)的距 離的方法例如為:歐式距離、馬氏距離、余弦距離等。
[0087] 另外,在具體實(shí)施過(guò)程中,特征詞匯W用向量表示只是一種形式,也可W用集合或 圖的方式來(lái)表示,本發(fā)明實(shí)施例不作限制。
[0088] 步驟S502中,預(yù)設(shè)距離值可W為任意值,通常為經(jīng)驗(yàn)值,與第i特征詞匯所在源節(jié) 點(diǎn)的用戶群體的用戶數(shù)量呈正相關(guān),可W由用戶預(yù)先設(shè)定。
[0089] 步驟S503a中,由于第j距離值大于預(yù)設(shè)距離值,通常表明第i特征詞匯已經(jīng)傳播 至與其源節(jié)點(diǎn)不同的另一用戶群體,例如:第i特征詞匯的源節(jié)點(diǎn)所在的用戶群體為從事 法律行業(yè)的用戶群體,而當(dāng)前電子設(shè)備所在用戶群體為從事IT行業(yè)的用戶的群體,通常送 兩個(gè)行業(yè)的用戶所需要的特征詞匯并不相同而如果第j距離值小于預(yù)設(shè)距離值的話,則表 明第i特征詞匯的源節(jié)點(diǎn)與當(dāng)前電子設(shè)備位于相同的特定用戶群體,故而將其加入用戶的 用戶詞典。
[0090] 步驟S503b中,由于第i特征詞匯已經(jīng)傳輸至于其源節(jié)點(diǎn)不同的另一用戶群體,貝U 不需要將其加入電子設(shè)備的用戶詞典,
[0091] 由于在上述方案中,能夠篩選掉屬于另一特定用戶群體的用戶的特征詞匯,一方 面能夠降低當(dāng)前電子設(shè)備的存儲(chǔ)負(fù)擔(dān),另一方面,由于減少了干擾詞匯的數(shù)量,故而所確定 的用戶詞典更方便用戶進(jìn)入輸入操作。
[0092] 第二種,通過(guò)Μ個(gè)群體特征詞匯對(duì)電子設(shè)備的用戶詞典進(jìn)行更新,具體為:
[0093] 將Μ個(gè)群體特征詞匯加入用戶的用戶詞典。
[0094] 具體來(lái)講,也就是只要確定第i共現(xiàn)跳數(shù)除W第i傳播跳數(shù)的商值大于第一預(yù)設(shè) 闊值,則將其加入用戶的特征詞匯,由于在上述方案中,不需要再對(duì)Μ個(gè)群體特征進(jìn)行篩選 操作,故而降低了電子設(shè)備的處理負(fù)擔(dān)。
[0095] 作為進(jìn)一步的優(yōu)選實(shí)施例,在從Ν個(gè)特征詞匯中確定出Μ個(gè)群體特征詞匯之后,方 法還包括:
[0096] 將Μ個(gè)群體特征詞匯發(fā)送至電子設(shè)備的鄰居節(jié)點(diǎn),Μ個(gè)群體特征詞匯用于對(duì)鄰居 節(jié)點(diǎn)的用戶詞典進(jìn)行更新。
[0097] 通常情況下,為了提高傳輸速率,送Μ個(gè)群體特征詞匯通過(guò)點(diǎn)對(duì)點(diǎn)方式發(fā)送至電 子設(shè)備的鄰居節(jié)點(diǎn),由于群體特征詞匯通常為電子設(shè)備所在用戶的特定用戶群體中至少兩 個(gè)用戶的特征詞匯,說(shuō)明群體特征詞匯為該特定用戶群體的常用詞匯,故而將其發(fā)送至鄰 居節(jié)點(diǎn),并用于對(duì)鄰居節(jié)點(diǎn)的用戶詞典進(jìn)行更新的話,首先提高了群體特征詞匯的更新速 率,其次及時(shí)對(duì)鄰居節(jié)點(diǎn)的用戶詞典進(jìn)行更新,從而也提高了用戶的輸入效率。
[0098] 第二方面,基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例提供一種電子設(shè)備,請(qǐng)參考圖6,具體 包括:
[0099] 獲得模塊60,用于獲得電子設(shè)備的用戶的Ν個(gè)特征詞匯,Ν為正整數(shù);
[0100] 第一判斷模塊61,用于判斷Ν個(gè)特征詞匯中的任一特征詞匯是否為用戶所在特定 用戶群體的群體特征詞匯,進(jìn)而從Ν個(gè)特征詞匯中確定出Μ個(gè)群體特征詞匯,其中,群體特 征詞匯為特定用戶群體中的至少兩個(gè)用戶的特征詞匯,Μ為小于等于Ν的正整數(shù);
[0101] 更新模塊62,用于通過(guò)Μ個(gè)群體特征詞匯對(duì)電子設(shè)備的用戶詞典進(jìn)行更新。
[0102] 可選的,第一判斷模塊61,具體包括:
[0103] 第一確定單元,用于依次取i為1至Ν的整數(shù),確定Ν個(gè)特征詞匯