国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種視頻推薦方法及裝置的制造方法

      文檔序號:10534854閱讀:755來源:國知局
      一種視頻推薦方法及裝置的制造方法
      【專利摘要】本發(fā)明實(shí)施例公開了一種視頻推薦方法及裝置,應(yīng)用于服務(wù)器,方法包括:獲得用戶輸入的文本串,并識別出該文本串中所包括的至少一個分詞;基于識別出的每個分詞的自身文本信息,確定每個分詞對應(yīng)的文本系數(shù);分別判斷每一分詞是否與預(yù)設(shè)的加權(quán)詞庫中的歷史搜索詞相同,如果判斷結(jié)果為是,利用與該分詞相同的歷史搜索詞所對應(yīng)的加權(quán)系數(shù),對該分詞對應(yīng)的文本系數(shù)加權(quán),得到該分詞對應(yīng)的推薦系數(shù);如果判斷結(jié)果為否,利用預(yù)定加權(quán)系數(shù),對該分詞對應(yīng)文本系數(shù)加權(quán),得到該分詞對應(yīng)的推薦系數(shù);歸一化每個分詞的推薦系數(shù);基于歸一化得到的各個分詞所對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù),按照預(yù)設(shè)方式向用戶推薦視頻。本發(fā)明實(shí)施例推薦視頻更加準(zhǔn)確,用戶感受更佳。
      【專利說明】
      一種視頻推薦方法及裝置
      技術(shù)領(lǐng)域
      [0001] 本發(fā)明涉及視頻應(yīng)用系統(tǒng),特別涉及一種視頻推薦方法及裝置。
      【背景技術(shù)】
      [0002] 現(xiàn)在視頻網(wǎng)站常設(shè)置有向用戶推薦視頻的功能,該功能可以提供給用戶更多的相 關(guān)視頻的選擇,進(jìn)一步增加了視頻網(wǎng)站的點(diǎn)擊量和關(guān)注度。
      [0003] 現(xiàn)有技術(shù)推薦視頻時,是利用用戶在搜索框中輸入的文本串的自身文本信息進(jìn)行 推薦,具體的一種實(shí)現(xiàn)方式為:首先,獲得用戶輸入的文本串;其次,利用詞頻-逆向文件頻 率(TF-IDF)算法確定該文本串中的每個分詞的第一權(quán)重;再次,參考該文本串中的每個分 詞的詞性,在上述第一權(quán)重基礎(chǔ)上對每個分詞加權(quán),得到文本系數(shù);最后,將該文本系數(shù)直 接作為視頻的推薦系數(shù),并按照該推薦系數(shù)的大小向用戶推薦視頻。在上述具體實(shí)現(xiàn)方式 中,一般默認(rèn)名詞的加權(quán)系數(shù)大于動詞或者形容詞的加權(quán)系數(shù),但是當(dāng)用戶輸入的文本串 中既有名詞又有動詞,且動詞的預(yù)期權(quán)重大于名詞時,例如:"密碼的破解"這個文本串,用 戶所希望的主要是"破解",即動詞"破解"的預(yù)期權(quán)重大于名詞"密碼",按照上述具體實(shí)現(xiàn) 方式,詞性加權(quán)與用戶預(yù)期不吻合,導(dǎo)致最后得到的推薦系數(shù)不準(zhǔn)確,進(jìn)而向用戶推薦的視 頻也不準(zhǔn)確,用戶感受不佳。

      【發(fā)明內(nèi)容】

      [0004] 基于上述問題,本發(fā)明實(shí)施例公開了一種視頻推薦方法及裝置,以使得推薦的視 頻更加準(zhǔn)確。技術(shù)方案如下:
      [0005] 本發(fā)明實(shí)施例提供了一種視頻推薦方法,應(yīng)用于服務(wù)器,可以包括:
      [0006] 獲得用戶輸入的文本串,并識別出所述文本串中所包括的至少一個分詞;
      [0007] 基于識別出的每個分詞的自身文本信息,確定每個分詞對應(yīng)的文本系數(shù);
      [0008] 分別判斷每一分詞是否與預(yù)設(shè)的加權(quán)詞庫中的歷史搜索詞相同,如果判斷結(jié)果為 是,利用與所述分詞相同的歷史搜索詞所對應(yīng)的加權(quán)系數(shù),對所述分詞對應(yīng)的文本系數(shù)加 權(quán),得到所述分詞對應(yīng)的推薦系數(shù);如果判斷結(jié)果為否,利用預(yù)定加權(quán)系數(shù),對所述分詞對 應(yīng)文本系數(shù)加權(quán),得到所述分詞對應(yīng)的推薦系數(shù),其中,所述歷史搜索詞所對應(yīng)的加權(quán)系數(shù) 大于所述預(yù)定加權(quán)系數(shù);
      [0009] 對每個分詞的推薦系數(shù)進(jìn)行歸一化處理,得到每個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù);
      [0010] 基于各個分詞所對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù),按照預(yù)設(shè)方式向用戶推薦視頻。
      [0011] 可選的,預(yù)設(shè)的加權(quán)詞庫的形成過程,包括:
      [0012] 獲取多個歷史搜索詞以及每個歷史搜索詞對應(yīng)的搜索量;
      [0013] 將每個歷史搜索詞對應(yīng)的搜索量進(jìn)行歸一化處理,以得到每個歷史搜索詞對應(yīng)的 加權(quán)系數(shù),將每個歷史搜索詞及其對應(yīng)的加權(quán)系數(shù)的集合作為加權(quán)詞庫。
      [0014] 可選的,所述將每個歷史搜索詞對應(yīng)的搜索量進(jìn)行歸一化處理,以得到每個歷史 搜索詞對應(yīng)的加權(quán)系數(shù),包括:
      [0015] 采用min-max標(biāo)準(zhǔn)化方法,將每個歷史搜索詞對應(yīng)的搜索量映射到0. 0~1. 0范 圍內(nèi),得到初級加權(quán)系數(shù);
      [0016] 采用sigmoid函數(shù)將所述初級加權(quán)系數(shù)映射到0. 5~1. 0范圍內(nèi),得到每個歷史 搜索詞對應(yīng)的加權(quán)系數(shù)。
      [0017] 可選的,所述預(yù)定加權(quán)系數(shù)為大于0且小于0. 5的范圍內(nèi)的指定值。
      [0018] 可選的,所述對每個分詞的推薦系數(shù)進(jìn)行歸一化處理,得到每個分詞對應(yīng)的標(biāo)準(zhǔn) 推薦系數(shù),包括:
      [0019] 以所有分詞的推薦系數(shù)的平方和開方的值作為分母,以每個分詞的推薦系數(shù)作為 分子,經(jīng)計(jì)算得到每個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù)。
      [0020] 本發(fā)明實(shí)施例還提供了一種視頻推薦裝置,應(yīng)用于服務(wù)器,可以包括:識別單元、 確定單元、加權(quán)單元、歸一化單元和推薦單元;其中,
      [0021] 所述識別單元,用于獲得用戶輸入的文本串,并識別出所述文本串中所包括的至 少一個分詞;
      [0022] 所述確定單元,用于基于所述識別單元識別出的每個分詞的自身文本信息,確定 每個分詞對應(yīng)的文本系數(shù);
      [0023] 所述加權(quán)單元,用于分別判斷每一分詞是否與預(yù)設(shè)的加權(quán)詞庫中的歷史搜索詞相 同,如果判斷結(jié)果為是,利用與所述分詞相同的歷史搜索詞所對應(yīng)的加權(quán)系數(shù),對所述分詞 對應(yīng)的文本系數(shù)加權(quán),得到所述分詞對應(yīng)的推薦系數(shù);如果判斷結(jié)果為否,利用預(yù)定加權(quán)系 數(shù),對所述分詞對應(yīng)文本系數(shù)加權(quán),得到所述分詞對應(yīng)的推薦系數(shù),其中,所述歷史搜索詞 所對應(yīng)的加權(quán)系數(shù)大于所述預(yù)定加權(quán)系數(shù);
      [0024] 所述歸一化單元,用于對所述加權(quán)單元得到的每個分詞的推薦系數(shù)進(jìn)行歸一化處 理,得到每個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù);
      [0025] 所述推薦單元,用于基于各個分詞所對應(yīng)的所述歸一化單元所得到的標(biāo)準(zhǔn)推薦系 數(shù),按照預(yù)設(shè)方式向用戶推薦視頻。
      [0026] 可選的,還包括:詞庫形成單元,其中,所述詞庫形成單元,包括:獲取子單元和形 成子單元,
      [0027] 所述獲取子單元,用于獲取多個歷史搜索詞以及每個歷史搜索詞對應(yīng)的搜索量;
      [0028] 所述形成子單元,用于將每個歷史搜索詞對應(yīng)的搜索量進(jìn)行歸一化處理,以得到 每個歷史搜索詞對應(yīng)的加權(quán)系數(shù),將每個歷史搜索詞及其對應(yīng)的加權(quán)系數(shù)的集合作為加權(quán) 詞庫。
      [0029] 可選的,所述形成子單元,包括:第一映射模塊、第二映射模塊;其中,
      [0030] 所述第一映射模塊,用于采用min-max標(biāo)準(zhǔn)化方法,將每個歷史搜索詞對應(yīng)的搜 索量映射到〇. 〇~1. 〇范圍內(nèi),得到初級加權(quán)系數(shù);
      [0031] 所述第二映射模塊,用于采用sigmoid函數(shù)將所述初級加權(quán)系數(shù)映射到0. 5~1. 0 范圍內(nèi),得到每個歷史搜索詞對應(yīng)的加權(quán)系數(shù),將每個歷史搜索詞及其對應(yīng)的加權(quán)系數(shù)的 集合作為加權(quán)詞庫。
      [0032] 可選的,所述預(yù)定加權(quán)系數(shù)為大于0且小于0. 5的范圍內(nèi)的指定值。
      [0033] 可選的,所述歸一化單元,具體用于:以所有分詞的推薦系數(shù)的平方和開方的值作 為分母,以每個分詞的推薦系數(shù)作為分子,經(jīng)計(jì)算得到每個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù)。
      [0034] 本發(fā)明實(shí)施例中,服務(wù)器獲得用戶輸入的文本串,并識別出所述文本串中所包括 的至少一個分詞;基于識別出的每個分詞的自身文本信息,確定每個分詞對應(yīng)的文本系數(shù); 分別判斷每一分詞是否與預(yù)設(shè)的加權(quán)詞庫中的歷史搜索詞相同,如果判斷結(jié)果為是,利用 與所述分詞相同的歷史搜索詞所對應(yīng)的加權(quán)系數(shù),對所述分詞對應(yīng)的文本系數(shù)加權(quán),得到 所述分詞對應(yīng)的推薦系數(shù);如果判斷結(jié)果為否,利用預(yù)定加權(quán)系數(shù),對所述分詞對應(yīng)文本系 數(shù)加權(quán),得到所述分詞對應(yīng)的推薦系數(shù);歸一化每個分詞的推薦系數(shù);基于歸一化得到的 各個分詞所對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù),按照預(yù)設(shè)方式向用戶推薦視頻。與現(xiàn)有技術(shù)相比,本發(fā) 明實(shí)施例在用戶輸入的文本串對應(yīng)的部分分詞的文本系數(shù)基礎(chǔ)上,按照加權(quán)庫中的加權(quán)系 數(shù),對文本系數(shù)加權(quán),另一部分分詞按照預(yù)定系數(shù)加權(quán),進(jìn)而根據(jù)加權(quán)后的推薦系數(shù)進(jìn)行推 薦視頻。因?yàn)榧訖?quán)庫中的加權(quán)系數(shù)是根據(jù)眾多用戶的歷史搜索量等因素確定的,所以,相對 現(xiàn)有技術(shù)直接將分詞的文本系數(shù)確定為推薦系數(shù),加權(quán)后的推薦系數(shù)更加真實(shí),能夠更準(zhǔn) 確的反映分詞的熱度。利用這樣的推薦系數(shù)推薦的視頻也就更加準(zhǔn)確,更加符合用戶的意 愿,用戶感受更佳。
      【附圖說明】
      [0035] 為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以 根據(jù)這些附圖獲得其他的附圖。
      [0036] 圖1為本發(fā)明實(shí)施例所提供的一種視頻推薦方法的流程圖;
      [0037] 圖2為初級加權(quán)系數(shù)的大致映射分布圖;
      [0038] 圖3為加權(quán)系數(shù)的大致映射分布圖;
      [0039] 圖4為本發(fā)明實(shí)施例所提供的一種視頻推薦裝置的一種結(jié)構(gòu)示意圖;
      [0040] 圖5為本發(fā)明實(shí)施例所提供的一種視頻推薦裝置的另一種結(jié)構(gòu)示意圖;
      [0041] 圖6為本發(fā)明實(shí)施例所提供的一種視頻推薦裝置的另一種結(jié)構(gòu)示意圖。
      【具體實(shí)施方式】
      [0042] 下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完 整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;?本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他 實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
      [0043] 本發(fā)明實(shí)施例提供了一種視頻推薦方法及裝置,應(yīng)用于服務(wù)器,所述方法包括以 下步驟:
      [0044] 獲得用戶輸入的文本串,并識別出所述文本串中所包括的至少一個分詞;
      [0045] 基于識別出的每個分詞的自身文本信息,確定每個分詞對應(yīng)的文本系數(shù);分別判 斷每一分詞是否與預(yù)設(shè)的加權(quán)詞庫中的歷史搜索詞相同,如果判斷結(jié)果為是,利用與所述 分詞相同的歷史搜索詞所對應(yīng)的加權(quán)系數(shù),對所述分詞對應(yīng)的文本系數(shù)加權(quán),得到所述分 詞對應(yīng)的推薦系數(shù);如果判斷結(jié)果為否,利用預(yù)定加權(quán)系數(shù),對所述分詞對應(yīng)文本系數(shù)加 權(quán),得到所述分詞對應(yīng)的推薦系數(shù),其中,所述歷史搜索詞所對應(yīng)的加權(quán)系數(shù)大于所述預(yù)定 加權(quán)系數(shù);
      [0046] 對每個分詞的推薦系數(shù)進(jìn)行歸一化處理,得到每個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù);
      [0047] 基于各個分詞所對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù),按照預(yù)設(shè)方式向用戶推薦視頻。
      [0048] 需要說明的是,本發(fā)明實(shí)施例所提供的一種視頻推薦方法應(yīng)用于服務(wù)器,用戶一 般通過搜索引擎、視頻網(wǎng)站等軟件的搜索框輸入文本串,上述服務(wù)器即為搜索引擎、網(wǎng)站等 軟件對應(yīng)的服務(wù)器,該文本串可以是影視劇的名稱或者標(biāo)簽,也可以是對影視劇的描述。
      [0049] 與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例在用戶輸入的文本串對應(yīng)的部分分詞的文本系數(shù) 基礎(chǔ)上,按照加權(quán)庫中的加權(quán)系數(shù),對文本系數(shù)加權(quán),另一部分分詞按照預(yù)定系數(shù)加權(quán),進(jìn) 而根據(jù)加權(quán)后的推薦系數(shù)進(jìn)行推薦視頻,因?yàn)榧訖?quán)庫中的加權(quán)系數(shù)是根據(jù)眾多用戶的歷史 搜索量等因素確定的,所以,相對現(xiàn)有技術(shù)直接將分詞的文本系數(shù)確定為推薦系數(shù),加權(quán)后 的推薦系數(shù)更加真實(shí),能夠更準(zhǔn)確的反映分詞的熱度,利用這樣的推薦系數(shù)推薦的視頻也 就更加準(zhǔn)確,更加符合用戶的意愿,用戶感受更佳。
      [0050] 圖1為本發(fā)明實(shí)施例所提供的一種視頻推薦方法的一種流程圖,該方法應(yīng)用于服 務(wù)器,可以包括以下步驟:
      [0051] S101,獲得用戶輸入的文本串,并識別出所述文本串中所包括的至少一個分詞;
      [0052] 需要說明的是,上述的用戶輸入的文本串可以是單字、詞語,還可以是描述性質(zhì)的 一段話,該文本串可以被分成至少一個分詞,其中,該至少一個分詞的詞性可以為名詞、動 詞或形容詞。
      [0053] 具體的,當(dāng)用戶通過帶有搜索功能的軟件的搜索框輸入文本串時,該帶有搜索功 能的軟件接收用戶輸入的文本串,并將該文本串發(fā)送給服務(wù)器,然后按照相應(yīng)的分詞方法 對該文本串分割成若干詞語。常用的一種分詞方法是:將該文本串與本地存儲的詞庫中的 分詞去比較,得到該文本串對應(yīng)的若干個分詞;當(dāng)然,也可以利用本領(lǐng)域技術(shù)人員所公知的 其他分詞方法,本發(fā)明實(shí)施例并不對此進(jìn)行限定。如果文本串中只是一個單字或者單個詞 語,服務(wù)器識別出的只是一個分詞;如果文本串是一段描述,服務(wù)器識別出的則是若干個分 。
      [0054] S102,基于識別出的每個分詞的自身文本信息,確定每個分詞對應(yīng)的文本系數(shù);
      [0055] 需要說明的是,上述自身文本信息指的是對于分詞的多維度的表達(dá)信息,比如可 以利用分詞詞性這個維度表達(dá)該分詞,也可以利用分詞詞意這個維度表達(dá)該分詞,當(dāng)然,還 可以利用其它維度的特征表達(dá)該分詞。分詞的自身文本信息只跟分詞本身有關(guān),與分詞所 處的語境、出處等無關(guān)。
      [0056] 具體的,S101步驟中,識別出文本串所包括的至少一個分詞后,每個分詞的自身文 本信息可輕易得知,利用每個分詞的自身文本信息,可確定每個分詞對應(yīng)的文本系數(shù)。該文 本系數(shù)可以是基于分詞的自身文本信息預(yù)先計(jì)算好的,在需要時直接調(diào)用,也可以臨時計(jì) 算得出。確定文本系數(shù)的方式很多,這里簡單介紹一種:利用詞頻-逆向文件頻率(TF-IDF) 算法和詞性加權(quán)的方法,確定每個分詞的文本系數(shù)。
      [0057] 其中,詞頻_逆向文件頻率(TF-IDF)算法是一種統(tǒng)計(jì)方法,用以評估一個字詞對 于一個文件集或一個語料庫中的其中一份文件的重要程度。字詞的重要性隨著它在文件中 出現(xiàn)的次數(shù)成正比增加,但同時會隨著它在語料庫中出現(xiàn)的頻率成反比下降。詞性即為分 詞的性質(zhì),比如:名詞性質(zhì)的分詞、動詞性質(zhì)的分詞等。
      [0058] 為了方便描述,這里以任意一個分詞來說明確定其文本系數(shù)的過程,該分詞是與 視頻內(nèi)容有關(guān)的一個分詞。利用詞頻-逆向文件頻率(TF-IDF)算法和詞性加權(quán)的方法,確 定任意一個分詞的文本系數(shù)的具體步驟為:對于識別出的文本串中任意一個分詞,統(tǒng)計(jì)其 在預(yù)設(shè)的一個視頻文本中的出現(xiàn)次數(shù),然后除以該視頻文本的所有詞語總數(shù),得到該分詞 在該視頻文本中的概率,即為TF ;統(tǒng)計(jì)在預(yù)設(shè)的視頻文本集中,出現(xiàn)該分詞的視頻文本數(shù) 量,由該視頻文本集中的所有視頻文本除以出現(xiàn)該分詞的視頻文本數(shù)量,然后對商取對數(shù), 得到的數(shù)值為IDF ;最后TF乘以IDF即為該分詞的TF-IDF系數(shù);按照預(yù)設(shè)的詞性加權(quán)系數(shù) 對得到的TF-IDF系數(shù)加權(quán),得到的結(jié)果為該分詞的文本系數(shù)。其他分詞的文本系數(shù)也可以 由上述方法得到,這里不再贅述。
      [0059] 當(dāng)然,上述詞頻-逆向文件頻率(TF-IDF)算法和詞性加權(quán)的方法只是確定分詞文 本系數(shù)的一種常用方法,本領(lǐng)域技術(shù)人員還可以利用其他公知方法確定分詞的文本系數(shù), 本發(fā)明實(shí)施例并不對此進(jìn)行限定。
      [0060] S103,分別判斷每一分詞是否與預(yù)設(shè)的加權(quán)詞庫中的歷史搜索詞相同,如果判斷 結(jié)果為是,執(zhí)行S104步驟;如果判斷結(jié)果為否,執(zhí)行S105步驟;
      [0061] S104,利用與所述分詞相同的歷史搜索詞所對應(yīng)的加權(quán)系數(shù),對所述分詞對應(yīng)的 文本系數(shù)加權(quán),得到所述分詞對應(yīng)的推薦系數(shù);
      [0062] S105,利用預(yù)定加權(quán)系數(shù),對所述分詞對應(yīng)文本系數(shù)加權(quán),得到所述分詞對應(yīng)的推 薦系數(shù);
      [0063] 其中,所述歷史搜索詞所對應(yīng)的加權(quán)系數(shù)大于所述預(yù)定加權(quán)系數(shù);
      [0064] 需要說明的是,上述加權(quán)詞庫中至少包括以下內(nèi)容:歷史搜索詞和其對應(yīng)的加權(quán) 系數(shù),該歷史搜索詞是用戶在歷史時間段內(nèi)的搜索詞,加權(quán)系數(shù)為根據(jù)歷史搜索詞的搜索 量歸一化后的系數(shù)。該加權(quán)詞庫會實(shí)時更新,提供給用戶最準(zhǔn)確的數(shù)值,且用戶搜索過的大 部分詞語會出現(xiàn)在該加權(quán)詞庫中,當(dāng)然,大部分詞語的加權(quán)系數(shù)是不一樣的。
      [0065] 具體的,S101步驟識別出的每個分詞與該加權(quán)庫中的歷史搜索詞進(jìn)行比較,判斷 該加權(quán)庫中是否存在和識別出的分詞相同的歷史搜索詞,判斷結(jié)束后,對于存在相同的歷 史搜索詞的分詞,按照相同的歷史搜索詞對應(yīng)的加權(quán)系數(shù)對由S102步驟確定的文本系數(shù) 加權(quán),得到該類分詞的推薦系數(shù);對于不存在相同的歷史搜索詞的分詞,按照預(yù)定加權(quán)系數(shù) 對由S102步驟確定的文本系數(shù)加權(quán),得到該類分詞的推薦系數(shù)。一般情況下,在加權(quán)詞庫 中的歷史搜索詞是用戶搜索頻率比較高的詞語,所以歷史搜索詞對應(yīng)的加權(quán)系數(shù)大于預(yù)定 加權(quán)系數(shù)。
      [0066] 下面對加權(quán)詞庫的形成過程進(jìn)行詳細(xì)描述。預(yù)設(shè)的加權(quán)詞庫的形成過程,可以包 括以下步驟:
      [0067] 獲取多個歷史搜索詞以及每個歷史搜索詞對應(yīng)的搜索量;
      [0068] 將每個歷史搜索詞對應(yīng)的搜索量進(jìn)行歸一化處理,以得到每個歷史搜索詞對應(yīng)的 加權(quán)系數(shù),將每個歷史搜索詞及其對應(yīng)的加權(quán)系數(shù)的集合作為加權(quán)詞庫。
      [0069] 需要說明的是,用戶的歷史搜索詞存儲于特定文件中,相應(yīng)的歷史搜索詞對應(yīng)的 搜索量可被統(tǒng)計(jì)并存儲于該特定文件中,當(dāng)然,歷史搜索詞對應(yīng)的搜索量也可以不存儲,而 是在需要時被臨時計(jì)算。服務(wù)器可直接從該特定文件中獲取該歷史搜索詞,得到對應(yīng)的搜 索量。對于百度用戶搜索記錄來說,歷史搜索詞會定期寫入龍?jiān)吹臄?shù)據(jù)表中,服務(wù)器可實(shí)時 從該龍?jiān)吹臄?shù)據(jù)表中獲取歷史搜索詞,得到對應(yīng)的搜索量,也可以通過定時任務(wù)從該龍?jiān)?的數(shù)據(jù)表中定期獲取歷史搜索詞,得到對應(yīng)的搜索量。
      [0070] 具體的,獲取多個歷史搜索詞以及每個歷史搜索詞對應(yīng)的搜索量,然后對每個歷 史搜索詞對應(yīng)的搜索量進(jìn)行歸一化處理,得到每個歷史搜索詞對應(yīng)的加權(quán)系數(shù),這些獲取 的所有歷史搜索詞以及對應(yīng)的加權(quán)系數(shù)共同構(gòu)成加權(quán)詞庫。
      [0071] 實(shí)際中,歷史搜索詞可能是在不同領(lǐng)域中的詞語,所以對應(yīng)的搜索量就可能具有 不同的量綱,這樣不利于比較和分析,所以常將歷史搜索詞對應(yīng)的搜索量進(jìn)行歸一化,歸一 化的方法眾多,常用的有兩種:min-max標(biāo)準(zhǔn)化法和z-score標(biāo)準(zhǔn)化方法,因?yàn)檫@兩種方法 是本領(lǐng)域技術(shù)人員所公知的技術(shù),所以這里只對min-max標(biāo)準(zhǔn)化法簡單介紹下,Z-score標(biāo) 準(zhǔn)化方法不再介紹,可參照相關(guān)技術(shù)文檔獲知。
      [0072] 利用min-max標(biāo)準(zhǔn)化法,將歸一化處理分為數(shù)據(jù)預(yù)處理和sigmoid函數(shù)歸一化兩 個步驟進(jìn)行。則在預(yù)設(shè)的加權(quán)詞庫的形成過程的第二步驟:所述將每個歷史搜索詞對應(yīng)的 搜索量進(jìn)行歸一化處理,以得到每個歷史搜索詞對應(yīng)的加權(quán)系數(shù),可以包括以下步驟:
      [0073] a采用min-max標(biāo)準(zhǔn)化方法,將每個歷史搜索詞對應(yīng)的搜索量映射到0. 0~1. 0范 圍內(nèi),得到初級加權(quán)系數(shù);
      [0074] b采用sigmoid函數(shù)將所述初級加權(quán)系數(shù)映射到0. 5~1. 0范圍內(nèi),得到每個歷史 搜索詞對應(yīng)的加權(quán)系數(shù)。
      [0075] 具體的,在a步驟中,采用公式(1)對歷史搜索詞對應(yīng)的搜索量進(jìn)行計(jì)算,將搜索 量映射到〇. 〇~1. 〇范圍內(nèi),得到初級加權(quán)系數(shù);
      (1)
      [0077] 其中x為歷史搜索詞對應(yīng)的搜索量,m為得到的初級加權(quán)系數(shù)。
      [0078] 在b步驟中,采用公式(2)對a步驟得到的初級加權(quán)系數(shù)進(jìn)行計(jì)算,將初級加權(quán)系 數(shù)映射到〇. 5~1. 0范圍內(nèi),得到每個歷史搜索詞對應(yīng)的加權(quán)系數(shù)。

      [0080] 其中m為初級加權(quán)系數(shù),n為最后得到的加權(quán)系數(shù)。
      [0081] 舉例說明,服務(wù)器特定文件中,存在四對歷史搜索詞和對應(yīng)的搜索量,分別如下所 示:
      [0082] 奔跑吧兄弟 4034940 今日說法 87116 死不瞑目 1254 聲音魔術(shù)師 128
      [0083] 其中,左列為歷史搜索詞,右列為對應(yīng)的搜索量。
      [0084] 經(jīng)過a步驟后得到的初級加權(quán)系數(shù)的大致映射分布圖如圖2所示,其中,橫軸表示 搜索量,縱軸為經(jīng)過min-max標(biāo)準(zhǔn)化后得到的初級加權(quán)系數(shù)。經(jīng)過b步驟后得到的加權(quán)系 數(shù)的大致映射分布圖如圖3所示,其中,橫軸表示初級加權(quán)系數(shù),縱軸為經(jīng)過sigmoid函數(shù) 歸一化后得到的加權(quán)系數(shù)。
      [0085] 經(jīng)過上述步驟,形成的加權(quán)詞庫包括以下內(nèi)容:
      [0086] 奔跑吧兄弟 0.9933 今丨_1說法 0.9591 死不瞑目 0.7534 聲音魔術(shù)師 0.5057
      [0087] 其中,左列為歷史搜索詞,右列為對應(yīng)的加權(quán)系數(shù)。這樣就將歷史搜索詞對應(yīng)的搜 索量歸一到0. 5~1.0范圍內(nèi)了,從而得到加權(quán)次數(shù)。
      [0088] -般情況下,在加權(quán)詞庫中的歷史搜索詞是用戶搜索頻率比較高的詞語,所以歷 史搜索詞對應(yīng)的加權(quán)系數(shù)大于預(yù)定加權(quán)系數(shù)。上述加權(quán)系數(shù)在〇. 5~1. 0范圍內(nèi),故可以設(shè) 定所述預(yù)定加權(quán)系數(shù)為大于〇且小于〇. 5的范圍內(nèi)的指定值。假設(shè)預(yù)定加權(quán)系數(shù)為0. 4,那 么則是對與歷史搜索詞相同的分詞,按照加權(quán)詞庫中對應(yīng)的加權(quán)系數(shù)加權(quán),該加權(quán)系數(shù)都 是在0. 5~1. 0之間的數(shù)值,而其他查找不到與歷史搜索詞相同的分詞,則按照0. 4加權(quán)。
      [0089] S106,對每個分詞的推薦系數(shù)進(jìn)行歸一化處理,得到每個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系 數(shù);
      [0090] 具體的,S103步驟得到分詞對應(yīng)的推薦系數(shù),該推薦系數(shù)是在文本系數(shù)基礎(chǔ)上乘 以對應(yīng)的加權(quán)系數(shù)后的數(shù)值?;诜衷~自身文本信息得到的文本系數(shù)不具有統(tǒng)一性,相應(yīng) 的,推薦系數(shù)也不具有統(tǒng)一性,無法進(jìn)行直接比較。因此這時常常對它們進(jìn)行歸一化,以使 得推薦系數(shù)能夠處于同一數(shù)量級,這樣更有可比性,歸一化后可得到每個分詞對應(yīng)的標(biāo)準(zhǔn) 推薦系數(shù)。
      [0091] 下面對一種歸一化方法進(jìn)行簡述,則該步驟中,對每個分詞的推薦系數(shù)進(jìn)行歸一 化處理,得到每個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù),可以包括:
      [0092] 以所有分詞的推薦系數(shù)的平方和開方的值作為分母,以每個分詞的推薦系數(shù)作為 分子,經(jīng)計(jì)算得到每個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù)。
      [0093] 具體的,以所有分詞的推薦系數(shù)的平方和開方的值作為分母,以每個分詞的推薦 系數(shù)作為分子,即可得出每個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù)。舉例說明,文本串對應(yīng)的所有分 詞的推薦系數(shù)依次是:〇. 5,1. 2,那么按照該歸一化方法后得到的標(biāo)準(zhǔn)推薦系數(shù)則依次為:
      即依次約等于:0.4,0.9。
      [0094] S107,基于各個分詞所對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù),按照預(yù)設(shè)方式向用戶推薦視頻。
      [0095] 具體的,S106步驟得到標(biāo)準(zhǔn)推薦系數(shù)后,按照預(yù)設(shè)方式向用戶推薦視頻。該預(yù)設(shè)方 式為對標(biāo)準(zhǔn)推薦系數(shù)按照預(yù)定的規(guī)則選取的方法,推薦視頻時,可以選取最大標(biāo)準(zhǔn)推薦系 數(shù)對應(yīng)的分詞去推薦視頻,也可以按照大小排列的前幾名標(biāo)準(zhǔn)推薦系數(shù)對應(yīng)的分詞共同決 定推薦的視頻。例如:文本串對應(yīng)的分詞的標(biāo)準(zhǔn)推薦系數(shù)依次為:〇. 51,0. 49,0. 54,0. 88, 〇, 78,如果預(yù)設(shè)方式為選取最大的標(biāo)準(zhǔn)推薦系數(shù)推薦視頻,則該例子中,則是按照0. 88對 應(yīng)的分詞推薦視頻。
      [0096] 本發(fā)明實(shí)施例中,服務(wù)器獲得用戶輸入的文本串,并識別出所述文本串中所包括 的至少一個分詞;基于識別出的每個分詞的自身文本信息,確定每個分詞對應(yīng)的文本系數(shù); 分別判斷每一分詞是否與預(yù)設(shè)的加權(quán)詞庫中的歷史搜索詞相同,如果判斷結(jié)果為是,利用 與所述分詞相同的歷史搜索詞所對應(yīng)的加權(quán)系數(shù),對所述分詞對應(yīng)的文本系數(shù)加權(quán),得到 所述分詞對應(yīng)的推薦系數(shù);如果判斷結(jié)果為否,利用預(yù)定加權(quán)系數(shù),對所述分詞對應(yīng)文本系 數(shù)加權(quán),得到所述分詞對應(yīng)的推薦系數(shù);歸一化每個分詞的推薦系數(shù);基于歸一化得到的 各個分詞所對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù),按照預(yù)設(shè)方式向用戶推薦視頻。與現(xiàn)有技術(shù)相比,本發(fā) 明實(shí)施例在用戶輸入的文本串對應(yīng)的部分分詞的文本系數(shù)基礎(chǔ)上,按照加權(quán)庫中的加權(quán)系 數(shù),對文本系數(shù)加權(quán),另一部分分詞按照預(yù)定系數(shù)加權(quán),進(jìn)而根據(jù)加權(quán)后的推薦系數(shù)進(jìn)行推 薦視頻。因?yàn)榧訖?quán)庫中的加權(quán)系數(shù)是根據(jù)眾多用戶的歷史搜索量等因素確定的,所以,相對 現(xiàn)有技術(shù)直接將分詞的文本系數(shù)確定為推薦系數(shù),加權(quán)后的推薦系數(shù)更加真實(shí),能夠更準(zhǔn) 確的反映分詞的熱度。利用這樣的推薦系數(shù)推薦的視頻也就更加準(zhǔn)確,更加符合用戶的意 愿,用戶感受更佳。
      [0097] 對應(yīng)于上述方法實(shí)施例,本發(fā)明實(shí)施例還提供了一種視頻推薦裝置,如圖4所示, 該裝置可以包括:識別單元210、確定單元220、加權(quán)單元230、歸一化單元220和推薦單元 250 ;其中,
      [0098] 所述識別單元210,用于獲得用戶輸入的文本串,并識別出所述文本串中所包括的 至少一個分詞;
      [0099] 所述確定單元220,用于基于所述識別單元210識別出的每個分詞的自身文本信 息,確定每個分詞對應(yīng)的文本系數(shù);
      [0100] 所述加權(quán)單元230,用于分別判斷每一分詞是否與預(yù)設(shè)的加權(quán)詞庫中的歷史搜索 詞相同,如果判斷結(jié)果為是,利用與所述分詞相同的歷史搜索詞所對應(yīng)的加權(quán)系數(shù),對所述 分詞對應(yīng)的文本系數(shù)加權(quán),得到所述分詞對應(yīng)的推薦系數(shù);如果判斷結(jié)果為否,利用預(yù)定加 權(quán)系數(shù),對所述分詞對應(yīng)文本系數(shù)加權(quán),得到所述分詞對應(yīng)的推薦系數(shù),其中,所述歷史搜 索詞所對應(yīng)的加權(quán)系數(shù)大于所述預(yù)定加權(quán)系數(shù);
      [0101] 所述歸一化單元240,用于對所述加權(quán)單元230得到的每個分詞的推薦系數(shù)進(jìn)行 歸一化處理,得到每個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù);
      [0102] 所述推薦單元250,用于基于各個分詞所對應(yīng)的所述歸一化單元240所得到的標(biāo) 準(zhǔn)推薦系數(shù),按照預(yù)設(shè)方式向用戶推薦視頻。
      [0103] 本發(fā)明實(shí)施例中,服務(wù)器獲得用戶輸入的文本串,并識別出所述文本串中所包括 的至少一個分詞;基于識別出的每個分詞的自身文本信息,確定每個分詞對應(yīng)的文本系數(shù); 分別判斷每一分詞是否與預(yù)設(shè)的加權(quán)詞庫中的歷史搜索詞相同,如果判斷結(jié)果為是,利用 與所述分詞相同的歷史搜索詞所對應(yīng)的加權(quán)系數(shù),對所述分詞對應(yīng)的文本系數(shù)加權(quán),得到 所述分詞對應(yīng)的推薦系數(shù);如果判斷結(jié)果為否,利用預(yù)定加權(quán)系數(shù),對所述分詞對應(yīng)文本系 數(shù)加權(quán),得到所述分詞對應(yīng)的推薦系數(shù);歸一化每個分詞的推薦系數(shù);基于歸一化得到的 各個分詞所對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù),按照預(yù)設(shè)方式向用戶推薦視頻。與現(xiàn)有技術(shù)相比,本發(fā) 明實(shí)施例在用戶輸入的文本串對應(yīng)的部分分詞的文本系數(shù)基礎(chǔ)上,按照加權(quán)庫中的加權(quán)系 數(shù),對文本系數(shù)加權(quán),另一部分分詞按照預(yù)定系數(shù)加權(quán),進(jìn)而根據(jù)加權(quán)后的推薦系數(shù)進(jìn)行推 薦視頻。因?yàn)榧訖?quán)庫中的加權(quán)系數(shù)是根據(jù)眾多用戶的歷史搜索量等因素確定的,所以,相對 現(xiàn)有技術(shù)直接將分詞的文本系數(shù)確定為推薦系數(shù),加權(quán)后的推薦系數(shù)更加真實(shí),能夠更準(zhǔn) 確的反映分詞的熱度。利用這樣的推薦系數(shù)推薦的視頻也就更加準(zhǔn)確,更加符合用戶的意 愿,用戶感受更佳。
      [0104] 如圖5所示,為本發(fā)明實(shí)施例所提供的一種視頻推薦裝置的另一種結(jié)構(gòu)示意圖, 與圖4所示裝置相比,圖5所示裝置還包括:詞庫形成單元,其中,所述詞庫形成單元,包括: 獲取子單元310a和形成子單元310b,
      [0105] 所述獲取子單元310a,用于獲取多個歷史搜索詞以及每個歷史搜索詞對應(yīng)的搜索 量;
      [0106] 所述形成子單元310b,用于將每個歷史搜索詞對應(yīng)的搜索量進(jìn)行歸一化處理,以 得到每個歷史搜索詞對應(yīng)的加權(quán)系數(shù),將每個歷史搜索詞及其對應(yīng)的加權(quán)系數(shù)的集合作為 加權(quán)詞庫。
      [0107] 如圖6所示,為本發(fā)明實(shí)施例所提供的一種視頻推薦裝置的另一種結(jié)構(gòu)示意圖, 在圖6所示裝置中,圖5所示裝置中的形成子單元310b,可以包括:第一映射模塊310bl、第 二映射模塊310b2 ;其中,
      [0108] 所述第一映射模塊310bl,用于采用min-max標(biāo)準(zhǔn)化方法,將每個歷史搜索詞對應(yīng) 的搜索量映射到〇. 〇~1. 〇范圍內(nèi),得到初級加權(quán)系數(shù);
      [0109] 所述第二映射模塊310b2,用于采用sigmoid函數(shù)將所述初級加權(quán)系數(shù)映射到 0. 3~1. 0范圍內(nèi),得到每個歷史搜索詞對應(yīng)的加權(quán)系數(shù),將每個歷史搜索詞及其對應(yīng)的加 權(quán)系數(shù)的集合作為加權(quán)詞庫。
      [0110] 在圖6所示實(shí)施例基礎(chǔ)上,所述預(yù)定加權(quán)系數(shù)為大于0且小于0. 5的范圍內(nèi)的指 定值。
      [0111] 在圖4所示實(shí)施例基礎(chǔ)上,所述歸一化單元240,具體用于:以所有分詞的推薦系 數(shù)的平方和開方的值作為分母,以每個分詞的推薦系數(shù)作為分子,經(jīng)計(jì)算得到每個分詞對 應(yīng)的標(biāo)準(zhǔn)推薦系數(shù)。
      [0112] 對于系統(tǒng)或裝置實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡 單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
      [0113] 需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個實(shí) 體或者操作與另一個實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存 在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語"包括"、"包含"或者其任何其他變體意在涵 蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要 素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備 所固有的要素。在沒有更多限制的情況下,由語句"包括一個……"限定的要素,并不排除 在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
      [0114] 本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述方法實(shí)施方式中的全部或部分步驟是可 以通過程序來指令相關(guān)的硬件來完成,所述的程序可以存儲于計(jì)算機(jī)可讀取存儲介質(zhì)中, 這里所稱得的存儲介質(zhì),如:R0M/RAM、磁碟、光盤等。
      [0115] 以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在 本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍
      【主權(quán)項(xiàng)】
      1. 一種視頻推薦方法,其特征在于,應(yīng)用于服務(wù)器,包括: 獲得用戶輸入的文本串,并識別出所述文本串中所包括的至少一個分詞; 基于識別出的每個分詞的自身文本信息,確定每個分詞對應(yīng)的文本系數(shù); 分別判斷每一分詞是否與預(yù)設(shè)的加權(quán)詞庫中的歷史搜索詞相同,如果判斷結(jié)果為是, 利用與所述分詞相同的歷史搜索詞所對應(yīng)的加權(quán)系數(shù),對所述分詞對應(yīng)的文本系數(shù)加權(quán), 得到所述分詞對應(yīng)的推薦系數(shù);如果判斷結(jié)果為否,利用預(yù)定加權(quán)系數(shù),對所述分詞對應(yīng)文 本系數(shù)加權(quán),得到所述分詞對應(yīng)的推薦系數(shù),其中,所述歷史搜索詞所對應(yīng)的加權(quán)系數(shù)大于 所述預(yù)定加權(quán)系數(shù); 對每個分詞的推薦系數(shù)進(jìn)行歸一化處理,得到每個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù); 基于各個分詞所對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù),按照預(yù)設(shè)方式向用戶推薦視頻。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,預(yù)設(shè)的加權(quán)詞庫的形成過程,包括: 獲取多個歷史搜索詞以及每個歷史搜索詞對應(yīng)的搜索量; 將每個歷史搜索詞對應(yīng)的搜索量進(jìn)行歸一化處理,以得到每個歷史搜索詞對應(yīng)的加權(quán) 系數(shù),將每個歷史搜素詞及其對應(yīng)的加權(quán)系數(shù)的集合作為加權(quán)詞庫。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述將每個歷史搜索詞對應(yīng)的搜索量進(jìn) 行歸一化處理,以得到每個歷史搜索詞對應(yīng)的加權(quán)系數(shù),包括: 采用min-max標(biāo)準(zhǔn)化方法,將每個歷史搜索詞對應(yīng)的搜索量映射到0.0 ~1.0 范圍內(nèi), 得到初級加權(quán)系數(shù); 采用sigmoid函數(shù)將所述初級加權(quán)系數(shù)映射到0. 5~I. 0范圍內(nèi),得到每個歷史搜索 詞對應(yīng)的加權(quán)系數(shù)。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述預(yù)定加權(quán)系數(shù)為大于0且小于0. 5的 范圍內(nèi)的指定值。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對每個分詞的推薦系數(shù)進(jìn)行歸一化 處理,得到每個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù),包括: 以所有分詞的推薦系數(shù)的平方和開方的值作為分母,以每個分詞的推薦系數(shù)作為分 子,經(jīng)計(jì)算得到每個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù)。6. -種視頻推薦裝置,其特征在于,應(yīng)用于服務(wù)器,包括:識別單元、確定單元、加權(quán)單 元、歸一化單元和推薦單元;其中, 所述識別單元,用于獲得用戶輸入的文本串,并識別出所述文本串中所包括的至少一 個分詞; 所述確定單元,用于基于所述識別單元識別出的每個分詞的自身文本信息,確定每個 分詞對應(yīng)的文本系數(shù); 所述加權(quán)單元,用于分別判斷每一分詞是否與預(yù)設(shè)的加權(quán)詞庫中的歷史搜索詞相同, 如果判斷結(jié)果為是,利用與所述分詞相同的歷史搜索詞所對應(yīng)的加權(quán)系數(shù),對所述分詞對 應(yīng)的文本系數(shù)加權(quán),得到所述分詞對應(yīng)的推薦系數(shù);如果判斷結(jié)果為否,利用預(yù)定加權(quán)系 數(shù),對所述分詞對應(yīng)文本系數(shù)加權(quán),得到所述分詞對應(yīng)的推薦系數(shù),其中,所述歷史搜索詞 所對應(yīng)的加權(quán)系數(shù)大于所述預(yù)定加權(quán)系數(shù); 所述歸一化單元,用于對所述加權(quán)單元得到的每個分詞的推薦系數(shù)進(jìn)行歸一化處理, 得到每個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù); 所述推薦單元,用于基于各個分詞所對應(yīng)的所述歸一化單元所得到的標(biāo)準(zhǔn)推薦系數(shù), 按照預(yù)設(shè)方式向用戶推薦視頻。7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,還包括:詞庫形成單元,其中,所述詞庫形 成單元,包括:獲取子單元和形成子單元, 所述獲取子單元,用于獲取多個歷史搜索詞以及每個歷史搜索詞對應(yīng)的搜索量; 所述形成子單元,用于將每個歷史搜索詞對應(yīng)的搜索量進(jìn)行歸一化處理,以得到每個 歷史搜索詞對應(yīng)的加權(quán)系數(shù),將每個歷史搜索詞及其對應(yīng)的加權(quán)系數(shù)的集合作為加權(quán)詞 庫。8. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述形成子單元,包括:第一映射模塊、第 二映射模塊;其中, 所述第一映射模塊,用于采用min-max標(biāo)準(zhǔn)化方法,將每個歷史搜索詞對應(yīng)的搜索量 映射到0.0 ~1.0 范圍內(nèi),得到初級加權(quán)系數(shù); 所述第二映射模塊,用于采用sigmoid函數(shù)將所述初級加權(quán)系數(shù)映射到0. 5~I. 0范 圍內(nèi),得到每個歷史搜索詞對應(yīng)的加權(quán)系數(shù),將每個歷史搜索詞及其對應(yīng)的加權(quán)系數(shù)的集 合作為加權(quán)詞庫。9. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述預(yù)定加權(quán)系數(shù)為大于0且小于0. 5的 范圍內(nèi)的指定值。10. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述歸一化單元,具體用于:以所有分詞 的推薦系數(shù)的平方和開方的值作為分母,以每個分詞的推薦系數(shù)作為分子,經(jīng)計(jì)算得到每 個分詞對應(yīng)的標(biāo)準(zhǔn)推薦系數(shù)。
      【文檔編號】G06F17/30GK105893397SQ201510379649
      【公開日】2016年8月24日
      【申請日】2015年6月30日
      【發(fā)明人】孫國宇, 周燕紅
      【申請人】北京愛奇藝科技有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
      1