一種熱點概念的推薦方法和裝置的制造方法
【專利摘要】本發(fā)明提供了一種熱點概念的推薦方法和裝置,其中方法包括:從用戶歷史行為數(shù)據(jù)中,提取用戶針對各對象的行為特征;依據(jù)用戶針對各對象的行為特征,確定用戶對各對象的關注度;確定關注度滿足預設條件的對象所關聯(lián)的熱點概念;依據(jù)確定出的熱點概念,形成向用戶推薦的熱點推薦集合。也就是說,本發(fā)明基于用戶對對象的潛在興趣以及對象與熱點概念之間的關聯(lián)關系,確定出用戶可能感興趣的熱點概念以向用戶推薦,這種推薦方式更加有針對性和個性化。
【專利說明】
一種熱點概念的推薦方法和裝置
【技術領域】
[0001]本發(fā)明涉及計算機應用技術領域,特別涉及一種熱點概念的推薦方法和裝置。【【背景技術】】
[0002]概念指的是某些行業(yè)、版塊、領域、事件、政策等在某時期被廣泛關注所形成的集合,具有鮮明的特性,諸如“兩會”、“奧運”、“網(wǎng)絡電視”、“新媒體”等等。在一些特定領域,諸如金融領域,熱點概念對于投資者、股民等而言具有非常重要的意義,因此在很多客戶端上對一些熱點概念向用戶進行推薦。
[0003]現(xiàn)有的熱點概念推薦方式大多是依據(jù)大眾對新聞資訊的關注程度,向用戶推薦最受大眾關注的熱點概念。但這種方式對于所有用戶而言,推薦的熱點概念均是相同的,缺乏個性化和針對性。
【
【發(fā)明內(nèi)容】
】
[0004]有鑒于此,本發(fā)明提供了一種熱點概念的推薦方法和裝置,以便于實現(xiàn)有針對性的個性化推薦。
[0005]具體技術方案如下:
[0006]本發(fā)明提供了一種熱點概念的推薦方法,該方法包括:
[0007]從用戶歷史行為數(shù)據(jù)中,提取用戶針對各對象的行為特征;
[0008]依據(jù)用戶針對各對象的行為特征,確定用戶對各對象的關注度;
[0009]確定關注度滿足預設條件的對象所關聯(lián)的熱點概念;
[0010]依據(jù)確定出的熱點概念,形成向用戶推薦的熱點推薦集合。
[0011]根據(jù)本發(fā)明一優(yōu)選實施方式,所述用戶針對各對象的行為特征包括:
[0012]在設定時間段內(nèi),用戶對所述對象的添加關注、刪除關注、點擊和搜索行為中的至少一種行為的次數(shù),或者用戶對所述對象的添加關注時長、瀏覽時長。
[0013]根據(jù)本發(fā)明一優(yōu)選實施方式,依據(jù)用戶針對各對象的行為特征,確定用戶對各對象的關注度包括:
[0014]依據(jù)用戶對對象的各類型行為對應的權重,對各行為的次數(shù)或時長進行加權處理后,得到用戶對對象的關注度。
[0015]根據(jù)本發(fā)明一優(yōu)選實施方式,依據(jù)確定出的熱點概念,形成向用戶推薦的熱點推薦集合包括:
[0016]利用所述確定出的熱點概念,形成候選熱點推薦集合;
[0017]對所述候選熱點推薦集合中的熱點概念進行過濾和/或排序,形成向用戶推薦的熱點推薦集合。
[0018]根據(jù)本發(fā)明一優(yōu)選實施方式,利用所述確定出的熱點概念,形成候選熱點推薦集合包括:
[0019]將所述確定出的熱點概念,加入候選熱點推薦集合;或者,
[0020]將所述確定出的熱點概念中,命中近期熱點概念集合的熱點概念,加入候選熱點推薦集合。
[0021 ]根據(jù)本發(fā)明一優(yōu)選實施方式,該方法還包括:
[0022]從用戶歷史行為數(shù)據(jù)中,提取用戶針對各熱點概念的行為特征;
[0023]依據(jù)用戶針對各熱點概念的行為特征,確定用戶對各熱點概念的關注度;
[0024]選擇關注度滿足預設條件的熱點概念加入所述候選熱點推薦集合。
[0025]根據(jù)本發(fā)明一優(yōu)選實施方式,所述用戶針對各熱點概念的行為特征包括以下至少一種:
[0026]用戶對熱點概念所對應新聞資訊的點擊次數(shù)或瀏覽時長;
[0027]用戶對熱點概念的搜索次數(shù)。
[0028]根據(jù)本發(fā)明一優(yōu)選實施方式,所述依據(jù)用戶針對各熱點概念的行為特征,確定用戶對各熱點概念的關注度包括:
[0029]依據(jù)用戶對某熱點概念的各類型行為對應的權重,對各行為的次數(shù)或時長進行加權處理后,得到用戶對所述某熱點概念的關注度。
[0030]根據(jù)本發(fā)明一優(yōu)選實施方式,對所述候選熱點推薦集合中的熱點概念進行過濾包括:
[0031]若熱點概念所關聯(lián)的對象均不屬于所述用戶的自選對象,則將該熱點概念從所述候選熱點推薦集合中過濾掉;或者,
[0032]若熱點概念被所述用戶已添加關注或已刪除關注過,則將該熱點概念從所述候選熱點推薦集合中過濾掉;或者,
[0033]若熱點概念已向所述用戶推薦過預設次數(shù),則將該熱點概念從所述候選熱點推薦集合中過濾掉。
[0034]根據(jù)本發(fā)明一優(yōu)選實施方式,對所述候選熱點推薦集合中的熱點概念進行排序包括:
[0035]依據(jù)熱點概念的熱度值從高到低的順序,對所述候選熱點推薦集合中的熱點概念進行排序,其中熱點概念的熱度值由以下因素中的至少一種確定:
[0036]熱點概念所對應新聞資訊的點擊熱度或引用度;
[0037]熱點概念的搜索熱度或關注熱度;
[0038]熱點概念所關聯(lián)對象的搜索熱度或關注熱度。
[0039]本發(fā)明還提供了一種熱點概念的推薦裝置,該裝置包括:
[0040]第一特征提取單元,用于從用戶歷史行為數(shù)據(jù)中,提取用戶針對各對象的行為特征;
[0041]第一關注度確定單元,用于依據(jù)用戶針對各對象的行為特征,確定用戶對各對象的關注度;
[0042]第一熱點確定單元,用于確定關注度滿足預設條件的對象所關聯(lián)的熱點概念;
[0043]推薦單元,用于依據(jù)所述第一熱點確定單元確定出的熱點概念,形成向用戶推薦的熱點推薦集合。
[0044]根據(jù)本發(fā)明一優(yōu)選實施方式,所述用戶針對各對象的行為特征包括:
[0045]在設定時間段內(nèi),用戶對所述對象的添加關注、刪除關注、點擊和搜索行為中的至少一種行為的次數(shù),或者用戶對所述對象的添加關注時長、瀏覽時長。
[0046]根據(jù)本發(fā)明一優(yōu)選實施方式,所述第一關注度確定單元,用于依據(jù)用戶對對象的各類型行為對應的權重,對各行為的次數(shù)或時長進行加權處理后,得到用戶對對象的關注度。
[0047]根據(jù)本發(fā)明一優(yōu)選實施方式,所述推薦單元具體包括:
[0048]候選集合形成單元,用于利用所述第一熱點確定單元確定出的熱點概念,形成候選熱點推薦集合;
[0049]熱點集合形成單元,用于對所述候選熱點推薦集合中的熱點概念進行過濾和/或排序,形成向用戶推薦的熱點推薦集合。
[0050]根據(jù)本發(fā)明一優(yōu)選實施方式,所述候選集合形成單元,具體用于將所述第一熱點確定單元確定出的熱點概念,加入候選熱點推薦集合;或者,將所述第一熱點確定單元確定出的熱點概念中,命中近期熱點概念集合的熱點概念,加入候選熱點推薦集合。
[0051 ]根據(jù)本發(fā)明一優(yōu)選實施方式,該裝置還包括:
[0052]第二特征提取單元,用于從用戶歷史行為數(shù)據(jù)中,提取用戶針對各熱點概念的行為特征;
[0053]第二關注度確定單元,用于依據(jù)用戶針對各熱點概念的行為特征,確定用戶對各熱點概念的關注度;
[0054]第二熱點確定單元,用于選擇關注度滿足預設條件的熱點概念加入所述候選熱點推薦集合。
[0055]根據(jù)本發(fā)明一優(yōu)選實施方式,所述用戶針對各熱點概念的行為特征包括以下至少一種:
[0056]用戶對熱點概念所對應新聞資訊的點擊次數(shù)或瀏覽時長;
[0057]用戶對熱點概念的搜索次數(shù)。
[0058]根據(jù)本發(fā)明一優(yōu)選實施方式,所述第二關注度確定單元,具體用于:依據(jù)用戶對某熱點概念的各類型行為對應的權重,對各行為的次數(shù)或時長進行加權處理后,得到用戶對所述某熱點概念的關注度。
[0059]根據(jù)本發(fā)明一優(yōu)選實施方式,所述熱點集合形成單元包括:
[0060]過濾子單元,用于若熱點概念所關聯(lián)的對象均不屬于所述用戶的自選對象,則將該熱點概念從所述候選熱點推薦集合中過濾掉;或者,
[0061]若熱點概念被所述用戶已添加關注或已刪除關注過,則將該熱點概念從所述候選熱點推薦集合中過濾掉;或者,
[0062]若熱點概念已向所述用戶推薦過預設次數(shù),則將該熱點概念從所述候選熱點推薦集合中過濾掉。
[0063]根據(jù)本發(fā)明一優(yōu)選實施方式,所述熱點集合形成單元包括:
[0064]排序子單元,用于依據(jù)熱點概念的熱度值從高到低的順序,對所述候選熱點推薦集合中的熱點概念進行排序,其中熱點概念的熱度值由以下因素中的至少一種確定:
[0065]熱點概念所對應新聞資訊的點擊熱度或引用度;
[0066]熱點概念的搜索熱度或關注熱度;
[0067]熱點概念所關聯(lián)對象的搜索熱度或關注熱度。
[0068]由以上技術方案可以看出,本發(fā)明基于用戶針對各對象的行為特征,確定用戶對對象的關注度滿足預設條件的對象所關聯(lián)的熱點概念,從而形成向用戶推薦的熱點推薦集合。也就是說,基于用戶對對象的潛在興趣以及對象與熱點概念之間的關聯(lián)關系,確定出用戶可能感興趣的熱點概念以向用戶推薦,這種推薦方式更加有針對性和個性化。
【【附圖說明】】
[0069]圖1為本發(fā)明實施例提供的主要方法流程圖;
[0070]圖2為本發(fā)明實施例提供的基于用戶針對熱點概念的行為特征確定候選熱點推薦集合的流程圖;
[0071 ]圖3為本發(fā)明實施例提供的以股票為例的詳細方法流程圖;
[0072]圖4a為本發(fā)明實施例提供的股票類APP的選股界面示意圖;
[0073]圖4b為本發(fā)明實施例提供的股票類APP的自選股列表界面示意圖;
[0074]圖5為本發(fā)明實施例提供的向用戶推薦熱點概念的效果示意圖;
[0075]圖6為本發(fā)明實施例提供的裝置結構圖。
【【具體實施方式】】
[0076]為了使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面結合附圖和具體實施例對本發(fā)明進行詳細描述。
[0077]在本發(fā)明實施例中使用的術語是僅僅出于描述特定實施例的目的,而非旨在限制本發(fā)明。在本發(fā)明實施例和所附權利要求書中所使用的單數(shù)形式的“一種”、“所述”和“該”也旨在包括多數(shù)形式,除非上下文清楚地表示其他含義。
[0078]應當理解,本文中使用的術語“和/或”僅僅是一種描述關聯(lián)對象的關聯(lián)關系,表示可以存在三種關系,例如,六和/或B,可以表示:單獨存在A,同時存在A和B,單獨存在B這三種情況。另外,本文中字符,一般表示前后關聯(lián)對象是一種“或”的關系。
[0079]取決于語境,如在此所使用的詞語“如果”可以被解釋成為“在……時”或“當……時”或“響應于確定”或“響應于檢測”。類似地,取決于語境,短語“如果確定”或“如果檢測(陳述的條件或事件)”可以被解釋成為“當確定時”或“響應于確定”或“當檢測(陳述的條件或事件)時”或“響應于檢測(陳述的條件或事件)”。
[0080]圖1為本發(fā)明提供的主要方法流程圖,如圖1中所示,該方法可以包括以下步驟:
[0081]在101中,從歷史行為數(shù)據(jù)中,提取用戶針對各對象的行為特征。
[0082]通常用戶在使用某應用時,在該應用中會對該應用所提供類型的對象進行操作行為,這些行為數(shù)據(jù)通常會以日志的形式進行存儲,例如存儲于應用服務器端。上述對對象的操作行為可以包括但不限于:對對象添加關注、刪除關注、點擊、瀏覽、搜索等。因此,從歷史行為數(shù)據(jù)中,就可以提取出在設定時間段內(nèi),例如在近一周內(nèi)、僅一個月內(nèi)等(時間段的具體時長可以依據(jù)對象類型的不同進行靈活設置,若對象對時間比較敏感,即時性要求較高,則可以選擇較短的時間段時長,反之,則可以選擇較長的時間段時長),用戶對各對象的添加關注、刪除關注、點擊和搜索行為中的至少一種行為的次數(shù),或者用戶對各對象的添加關注時長、瀏覽時長等。
[0083]在102中,依據(jù)用戶針對各對象的行為特征,確定用戶對各對象的關注度。
[0084]由于用戶對各對象的添加關注、刪除關注、點擊、瀏覽、搜索等行為及其對應特征,均體現(xiàn)了用戶對各對象是否關注以及關注的程度(即關注度),因此,在本步驟中,可以依據(jù)上述行為的次數(shù)或時長信息來確定用戶對各對象的關注度。
[0085]在此提供一種優(yōu)選的方式,可以預先設置用戶對對象各類型行為對應的權重,然后對各行為的次數(shù)或時長進行加權處理后,得到用戶對對象的關注度。
[0086]由于對對象進行添加關注、點擊、瀏覽和搜索均體現(xiàn)了用戶對該對象關注,因此,這些行為對應的權重可以設置為正數(shù),而用戶對對象的刪除關注體現(xiàn)了用戶對該對象的關注減少,因此,可以設置刪除關注行為對應的權重為負數(shù)。
[0087]另外,由于次數(shù)和時長采用不同的量綱,因此可以采用不同級別的權重值來進行調(diào)整,當然也可以采用其他調(diào)整方式。
[0088]上述進行加權處理的方式可以采用但不限于加權求和、加權平均等。
[0089]在103中,確定關注度滿足預設條件的對象所關聯(lián)的熱點概念。
[0090]在本步驟中,首先確定關注度滿足預設條件的對象。其中預設條件可以是關注度達到一定閾值,或者關注度排在前Ml個,其中Ml為預設的正整數(shù)。
[0091 ]然后對確定出的對象,進一步確定其所關聯(lián)的熱點概念。通常對象與熱點概念之間存在一定的關聯(lián)關系,該關聯(lián)關系可能是一對一的、也可能是多對一的、還可能是一對多的,或者是多對多的??梢灶A先維護對象與熱點概念之間的關聯(lián)關系表,然后通過查詢該關聯(lián)關系表的方式,確定對象所關聯(lián)的熱點概念。
[0092]其中,對象與熱點概念之間的關聯(lián)關系可以采用多種方式確定,在此僅列舉幾種方式:
[0093]第一種方式:獲取設定時段的新聞文本,基于與熱點概念在新聞文本中的共現(xiàn)關系確定各熱點概念的相關對象。
[0094]當確定了熱點概念及其相關對象的領域后,例如確定在金融領域中確定相關對象,則可以獲取設定時段的新聞文本,該新聞文本可以是與金融領域相關的新聞文本,基于金融領域的詞庫,確定在新聞文本中出現(xiàn)的對象關鍵詞,基于對象關鍵詞與熱點新聞在新聞文本中的共現(xiàn)關系,例如共現(xiàn)次數(shù)、共現(xiàn)頻率,等等,從中確定各熱點概念。在統(tǒng)計共現(xiàn)次數(shù)和共現(xiàn)頻率時,可以預設的窗口長度,將在該窗口長度內(nèi)共同出現(xiàn)認為是共現(xiàn)。該窗口長度可以是20個字符、30個字符,等等。
[0095]第二種方式:從熱點概念所屬領域的知識圖譜中,確定主營業(yè)務與熱點概念相關的對象作為該熱點概念的相關對象。
[0096]這種方式主要應用于業(yè)務類的對象,在熱點概念所屬領域的知識圖譜中,包含有對象的主營業(yè)務信息,其中該主營業(yè)務信息包括但不限于該對象所屬企業(yè)、公司、組織等投資的業(yè)務、經(jīng)營的業(yè)務、銷售的業(yè)務、生產(chǎn)的業(yè)務等等。
[0097]當然除了上述兩種方式之外,還可以采用其他方式,例如人工指定與某概念關聯(lián)的對象,等等。
[0098]在104中,依據(jù)確定出的熱點概念,形成向用戶推薦的熱點推薦集合。
[0099]在本步驟中,可以直接將確定出的熱點概念作為熱點推薦集合向用戶推薦。但這種方式的推薦精準度較差,因此可以對確定出的熱點概念進行進一步處理后,形成向用戶推薦的熱點推薦集合。
[0100]可以首先利用步驟103確定出的熱點概念,形成候選熱點推薦集合;然后對候選熱點推薦集合中的熱點概念進行過濾和/或排序,形成向用戶推薦的熱點推薦集合。
[0101]其中,在形成候選熱點推薦集合時,可以直接將步驟103確定出的熱點概念加入候選熱點推薦集合。但通常,用戶希望看到的是近期的熱點概念,因此可以將步驟103確定出的熱點概念中,屬于近期熱點概念的加入候選熱點推薦集合。在判斷一個熱點概念是否屬于近期熱點概念時,可以通過判斷該熱點概念是否命中近期熱點概念集合來實現(xiàn)。在本發(fā)明實施例中,可以維護一個近期熱點概念集合,例如將最近預設時間段(具體時長可以根據(jù)實際需求靈活設置)內(nèi)的熱點概念構成近期熱線概念集合,并及時進行更新。
[0102]另外,除了基于用戶針對各對象的行為特征來確定熱點概念加入候選熱點推薦集合之外,還可以進一步基于用戶針對熱點概念的行為特征來確定熱點概念。具體地,可以采用如圖2中所示的方式,包括以下步驟:
[0103]在201中,從用戶歷史行為數(shù)據(jù)中,提取用戶針對各熱點概念的行為特征。
[0104]上述對對象的操作行為可以包括但不限于:對熱點概念所對應新聞資訊進行點擊或瀏覽,用戶對熱點概念進行搜索等。因此,從歷史行為數(shù)據(jù)中,就可以提取出在設定時間段內(nèi),例如在近一周內(nèi)、僅一個月內(nèi)等,用戶對各熱點概念所對應新聞資訊的點擊次數(shù)或瀏覽時長,或者用戶對熱點概念的搜索次數(shù)等行為特征。
[0105]在202中,依據(jù)用戶針對各熱點概念的行為特征,確定用戶對各熱點概念的關注度。
[0106]由于用戶對熱點概念所對應新聞資訊進行點擊或瀏覽,用戶對熱點概念進行搜索等行為及其對應特征,均體現(xiàn)了用戶對各熱點概念是否關注以及關注的程度(即關注度),因此,在本步驟中,可以依據(jù)上述行為的次數(shù)或時長信息來確定用戶對各熱點概念的關注度。
[0107]在此提供一種優(yōu)選的方式,可以預先設置用戶對各點概念各類型行為對應的權重,然后對各行為的次數(shù)或時長進行加權處理后,得到用戶對熱點對象的關注度。
[0108]另外,由于次數(shù)和時長采用不同的量綱,因此可以采用不同級別的權重值來進行調(diào)整,當然也可以采用其他調(diào)整方式。
[0109]上述進行加權處理的方式可以采用但不限于加權求和、加權平均等。
[0110]在203中,選擇關注度滿足預設條件的熱點概念加入候選熱點推薦集合。
[0111]其中預設條件可以是關注度達到一定閾值,或者關注度排在前M2個,其中M2為預設的正整數(shù)。
[0112]在形成候選熱點推薦集合后,對候選熱點推薦集合進行的過濾處理可以包括但不限于以下方式中至少之一:
[0113]第一種過濾處理:若熱點概念所關聯(lián)的對象均不屬于該用戶的自選對象,則將該熱點概念從候選熱點推薦集合中過濾掉(即刪除)。
[0114]候選熱點推薦集合中確定出的熱點概念數(shù)量可能較多,但其中用戶感興趣的通常是與所關注對象相關聯(lián)的熱點概念,若一個熱點概念所關聯(lián)的對象均不屬于用戶的自選對象(即用戶關注的對象),則用戶很大程度上對該熱點概念并不感興趣,因此,可以將其從候選熱點推薦集合中過濾掉。
[0115]第二種過濾處理:若熱點概念被該用戶已添加關注或已刪除關注過,則該熱點概念從候選熱點推薦集合中過濾掉。
[0116]若某熱點概念已經(jīng)被該用戶添加過,則無需重復向該用戶推薦,可以將該熱點概念從候選熱點推薦集合中過濾掉。若某熱點概念已經(jīng)被該用戶刪除關注過,則說明該用戶目前已經(jīng)不再對該熱點概念感興趣,因此可以將該熱點概念從候選熱點推薦集合中過濾掉。
[0117]第三種過濾處理:若熱點概念已向該用戶推薦過預設次數(shù),則將該熱點概念從候選熱點推薦集合中過濾掉。
[0118]若一個熱點概念已經(jīng)向用戶推薦過多次,可能用戶已經(jīng)關注了該熱點概念,那么就無需再推薦,也可能盡管推薦了很多次,但用戶一直未關注該熱點概念,那說明用戶對其并不感興趣,因此也無需再推薦。上述的預設次數(shù)可以靈活調(diào)整。
[0119]在形成候選熱點推薦集合后,對候選熱點推薦集合進行的排序處理可以依據(jù)各熱點概念的熱度值從高到低的順序,其中熱點概念的熱度值可以由以下因素中的至少一種確定:
[0120]第一種因素:熱點概念所對應新聞資訊的點擊熱度或引用度。其中點擊熱度可以由熱點概念所對應新聞資訊被大眾點擊的次數(shù)、瀏覽的時長等反映。若新聞資訊被大眾點擊的次數(shù)越多,或者瀏覽的時長越長,則該新聞資訊的點擊熱度越高。在本發(fā)明實施例中,通過統(tǒng)計抓取的各新聞資訊在不同網(wǎng)站出現(xiàn)的次數(shù),來確定新聞資訊的引用度。一個新聞資訊在不同網(wǎng)站出現(xiàn)的次數(shù)越多,則該新聞資訊的引用度越高。
[0121]另外,在確定熱點概念所對應的新聞資訊時,實際上就是確定熱點概念與新聞資訊之間的關聯(lián)關系。若一個熱點概念或者其擴展詞在一個新聞資訊的標題、概括等重要部分中出現(xiàn),則可以認為該熱點概念與該新聞資訊關聯(lián)。例如,以熱點概念“互聯(lián)網(wǎng)汽車”為例,若一個新聞資訊的標題中出現(xiàn)了“互聯(lián)網(wǎng)汽車”或者“物聯(lián)網(wǎng)汽車”、“智能汽車”等擴展詞,則該新聞資訊與熱點概念“互聯(lián)網(wǎng)汽車”之間存在關聯(lián)關系,是熱點概念“互聯(lián)網(wǎng)汽車”所對應的新聞資訊。
[0122]第二種因素:熱點概念的搜索熱度或關注熱度。搜索熱度可以由熱點概念被大眾搜索的次數(shù)反映,被大眾搜索的次數(shù)越多,搜索熱度越高。搜索熱度可以由熱點概念被大眾關注的次數(shù)反映,被大眾關注(例如在股票類APP中添加關注)的次數(shù)越多,則關注熱度越尚O
[0123]第三種因素:熱點概念所關聯(lián)對象的搜索熱度或關注熱度。熱點概念的熱度可以由其所關聯(lián)所有對象的搜索次數(shù)總和來反映,或者由其所關聯(lián)所有對象的被關注次數(shù)總和來反映。
[0124]本發(fā)明提供的上述方法可以應用于多種領域,下面以金融領域為例,以股票作為熱點概念的相關對象,對上述方法進行詳細描述。圖3為本發(fā)明實施例提供的以股票為例的詳細方法流程圖,如圖3所示,該方法可以具體包括以下步驟:
[0125]在301a中,從歷史行為數(shù)據(jù)中,提取用戶針對各股票的行為特征。
[0126]用戶在使用股票類APP時,可以在諸如圖4a中所示的選股界面中,對各股票實施諸如添加關注、點擊、瀏覽、搜索等操作,若用戶對某股票添加關注,則該股票就進入該用戶的自選股列表。自選股列表的界面可以如圖4b所示,在該自選股列表的界面上,用戶可以對各股票實施諸如取消關注、點擊、瀏覽、搜索等操作。用戶還可以在其他界面上,對股票進行諸如點擊、瀏覽、搜索等操作行為。在本步驟中,可以歷史行為數(shù)據(jù)中,提取近一段時間,諸如一周之內(nèi)用戶對各股票的添加關注、取消關注、點擊、瀏覽、搜索等行為的次數(shù),或者用戶對各股票的添加關注、瀏覽等行為的時長。
[0127]在302a中,依據(jù)用戶針對各股票的行為特征,確定用戶對各股票的關注度。
[0128]可以預先對添加關注、取消關注、點擊、瀏覽、搜索股票的行為的次數(shù)和時長設置權重,然后采用加權求和的方式,分別得到用戶對各股票的關注度,可以看做一個打分值。
[0129]在303a中,確定關注度滿足預設條件的股票所關聯(lián)的熱點概念。
[0130]在本步驟中,可以將關注度超過預設閾值的股票確定出來,然后依據(jù)股票與熱點概念之間的關聯(lián)關系,確定已確定的股票所關聯(lián)的熱點概念。其中股票與熱點概念之間的關聯(lián)關系可以預先確定,并保存為一張映射表,通過查找該映射表就能夠確定股票所關聯(lián)的熱點概念。
[0131]在預先確定股票與熱點概念之間的關聯(lián)關系時,可以采用上述實施例步驟103中所述的兩種方式。
[0132]第一種方式:獲取設定時段的新聞文本,基于與熱點概念在新聞文本中的共現(xiàn)關系確定各熱點概念的相關股票。
[0133]以“環(huán)?!备拍顬槔?,可以獲取90日之內(nèi)的新聞文本,統(tǒng)計新聞文本中與“環(huán)保”共現(xiàn)于20個字符的各股票名稱,經(jīng)過統(tǒng)計后,選取共現(xiàn)次數(shù)排在前10個的股票名稱,例如“興源環(huán)境”、“長青集團”、“錢江水利”、“雪迪龍”等等,將這10個股票作為“環(huán)保”概念的相關股西
ο
[0134]第二種方式:從熱點概念在金融領域的知識圖譜中,確定主營業(yè)務與熱點概念相關的股票作為該熱點概念的相關股票。
[0135]以“全息手機”概念為例,通過查找知識圖譜,確定出以下股票作為“全息手機”概念的相關股票:
[0136]“長江通信”、“深天馬”、“萊寶高科”等股票是全息手機的供應商;
[0137]“利達光電”是全息手機的生產(chǎn)商。
[0138]上述步驟301a?303a可以與下述的301b?303b并行執(zhí)行,也可以以任意的順序先后執(zhí)行。
[0139]在301b中,從用戶歷史行為數(shù)據(jù)中,提取用戶針對各熱點概念的行為特征。
[0140]用戶在使用股票類APP時,股票類APP會提供諸如新聞資訊的相關界面,在該新聞資訊的相關界面上,用戶可以對各條新聞資訊進行點擊和瀏覽等操作行為,各新聞資訊通常都是與一個或多個熱點概念相關的,因此用戶對新聞資訊的操作行為也體現(xiàn)了用戶對熱點概念的潛在興趣。另外,在股票類APP上,用戶也可以通過界面上提供的搜索功能,對熱點概念進行搜索,這一搜索操作行為,較為直接的體現(xiàn)了用戶對熱點概念的潛在興趣。在本實施例中,可以從歷史行為數(shù)據(jù)中,提取近一段時間,諸如一周內(nèi),用戶對各熱點概念所對應新聞資訊的點擊次數(shù)或瀏覽時長,或者用戶對熱點概念的搜索次數(shù)等行為特征。
[0141 ]在302b中,依據(jù)用戶針對各熱點概念的行為特征,確定用戶對各熱點概念的關注度。
[0142]例如,可以將用戶對熱點概念“虛擬現(xiàn)實”所對應新聞資訊進行點擊的次數(shù)、瀏覽的次數(shù)、瀏覽的時長,以及對熱點概念“虛擬現(xiàn)實”進行搜索的次數(shù),進行加權求和,其中各行為特征對應的權重值預先設置,就可以得到用戶對“虛擬現(xiàn)實”的關注度。
[0143]在303b中,確定關注度滿足預設條件的熱點概念。
[0144]在304中,利用303a和303b中確定出的熱點概念,形成候選熱點推薦集合。
[0145]將303a和303b中確定出的熱點概念進行合并和去重,形成候選熱點推薦集合。
[0146]在305中,將候選熱點推薦集合中的熱點概念進行過濾和排序,形成向用戶推薦的熱點推薦集合。
[0147]本步驟中在進行過濾時,若某熱點概念所關聯(lián)的股票均不屬于該用戶的自選股(已添加關注的股票),則說明用戶對該熱點概念感興趣的程度比較低,可以將其從候選熱點推薦集合中刪除。
[0148]若某熱點概念被該用戶已添加關注或已刪除關注過,則可以將該熱點概念從候選熱點推薦集合中刪除。
[0149]由于本發(fā)明實現(xiàn)的熱點概念推薦的處理是周期性執(zhí)行的,例如每天執(zhí)行一次,或者由特定事件觸發(fā)的,例如用戶每次啟動該股票類APP時執(zhí)行。因此,同一熱點概念可能向該用戶推薦過多次,加入某熱點概念已經(jīng)向該用戶推薦過預設次數(shù),例如3次,則可以將該熱點概念從候選熱點推薦集合中刪除。
[0150]然后,按照熱點概念的熱度值從高到低的順序,對過濾后候選熱點推薦集合中的熱點概念進行排序,形成最終的熱點推薦集合。
[0151]最終形成的熱點推薦集合在推薦給用戶時,可以采用多種展現(xiàn)形式,諸如以提醒消息的形式、以浮動窗口的形式等。舉個例子,當用戶每天第一次打開股票類APP時,可以以提醒消息的形式向該用戶推薦熱點概念,如圖5所示。需要說明的是,在圖4a、圖4b和圖5中,“X”用以縮略表示文字、數(shù)字等字符,用以縮略表示段落中的字符。這些圖示均為示意圖,并不用以限制界面中的內(nèi)容,也不限制界面中還可以包含其他內(nèi)容。
[0152]另外,上述方法可以在服務器端執(zhí)行,并將熱點推薦列表發(fā)送給終端設備?;蛘撸鲜龇椒ㄒ部梢栽诮K端設備端執(zhí)行。執(zhí)行上述方法的裝置可以是位于服務器端的應用軟件或者還可以為位于服務器端的應用中的插件或軟件開發(fā)工具包(Software DevelopmentKit,SDK)等功能單元,或者,還可以位于終端設備端,本發(fā)明實施例對此不進行特別限定。
[0153]所示實施例除了適用于股票類的對象之外,還可以適用于諸如基金、期貨等其他可投資類對象。
[0154]圖6為本發(fā)明實施例提供的裝置結構圖,如圖6所示,該裝置可以包括:第一特征提取單元01、第一關注度確定單元02、第一熱點確定單元03和推薦單元20,還可以進一步包括第二特征提取單元11、第二關注度確定單元12和第二熱點確定單元13。各組成單元的主要功能如下:
[0155]第一特征提取單元01負責從用戶歷史行為數(shù)據(jù)中,提取用戶針對各對象的行為特征。其中,用戶針對各對象的行為特征可以包括但不限于:在設定時間段內(nèi),用戶對對象的添加關注、刪除關注、點擊和搜索行為中的至少一種行為的次數(shù),或者用戶對對象的添加關注時長、瀏覽時長。
[0156]第一關注度確定單元02負責依據(jù)用戶針對各對象的行為特征,確定用戶對各對象的關注度。具體地,第一關注度確定單元02可以依據(jù)用戶對對象的各類型行為對應的權重,對各行為的次數(shù)或時長進行加權處理后,得到用戶對對象的關注度。
[0157]由于對對象進行添加關注、點擊、瀏覽和搜索均體現(xiàn)了用戶對該對象關注,因此,這些行為對應的權重可以設置為正數(shù),而用戶對對象的刪除關注體現(xiàn)了用戶對該對象的關注減少,因此,可以設置刪除關注行為對應的權重為負數(shù)。另外,由于次數(shù)和時長采用不同的量綱,因此可以采用不同級別的權重值來進行調(diào)整,當然也可以采用其他調(diào)整方式。上述進行加權處理的方式可以采用但不限于加權求和、加權平均等。
[0158]第一熱點確定單元03負責確定關注度滿足預設條件的對象所關聯(lián)的熱點概念。具體地,可以首先確定關注度滿足預設條件的對象。其中預設條件可以是關注度達到一定閾值,或者關注度排在前Ml個,其中Ml為預設的正整數(shù)。然后對確定出的對象,進一步確定其所關聯(lián)的熱點概念。通常對象與熱點概念之間存在一定的關聯(lián)關系,該關聯(lián)關系可能是一對一的、也可能是多對一的、還可能是一對多的,或者是多對多的。可以預先維護對象與熱點概念之間的關聯(lián)關系表,然后通過查詢該關聯(lián)關系表的方式,確定對象所關聯(lián)的熱點概念。
[0159]推薦單元20負責依據(jù)第一熱點確定單元03確定出的熱點概念,形成向用戶推薦的熱點推薦集合。可以直接將確定出的熱點概念作為熱點推薦集合向用戶推薦。但這種方式的推薦精準度較差,因此可以對確定出的熱點概念進行進一步處理后,形成向用戶推薦的熱點推薦集合。
[0160]具體地,推薦單元20可以包括:候選集合形成單元21和熱點集合形成單元22。
[0161]候選集合形成單元21負責利用第一熱點確定單元03確定出的熱點概念,形成候選熱點推薦集合。可以直接將第一熱點確定單元03確定出的熱點概念,加入候選熱點推薦集合;或者,將第一熱點確定單元O 3確定出的熱點概念中,命中近期熱點概念集合的熱點概念,加入候選熱點推薦集合。
[0162]熱點集合形成單元22負責對候選熱點推薦集合中的熱點概念進行過濾和/或排序,形成向用戶推薦的熱點推薦集合。
[0163]除了基于用戶針對各對象的行為特征來確定熱點概念加入候選熱點推薦集合之夕卜,還可以進一步基于用戶針對熱點概念的行為特征來確定熱點概念。第二特征提取單元11負責從用戶歷史行為數(shù)據(jù)中,提取用戶針對各熱點概念的行為特征。其中,用戶針對各熱點概念的行為特征包括但不限于:用戶對熱點概念所對應新聞資訊的點擊次數(shù)或瀏覽時長;用戶對熱點概念的搜索次數(shù)。
[0164]第二關注度確定單元12負責依據(jù)用戶針對各熱點概念的行為特征,確定用戶對各熱點概念的關注度。由于用戶對熱點概念所對應新聞資訊進行點擊或瀏覽,用戶對熱點概念進行搜索等行為及其對應特征,均體現(xiàn)了用戶對各熱點概念是否關注以及關注的程度(即關注度),因此,可以依據(jù)上述行為的次數(shù)或時長信息來確定用戶對各熱點概念的關注度。在此提供一種優(yōu)選的方式,可以預先設置用戶對各點概念各類型行為對應的權重,然后對各行為的次數(shù)或時長進行加權處理后,得到用戶對熱點對象的關注度。
[0165]第二熱點確定單元13負責選擇關注度滿足預設條件的熱點概念加入候選熱點推薦集合。
[0166]熱點集合形成單元22可以具體包括:
[0167]過濾子單元221負責對候選熱點推薦集合的過濾處理,可以包括但不限于以下方式中至少之一:
[0168]第一種方式:若熱點概念所關聯(lián)的對象均不屬于用戶的自選對象,則過濾子單元221將該熱點概念從候選熱點推薦集合中過濾掉。
[0169]第二種方式:若熱點概念被用戶已添加關注或已刪除關注過,則過濾子單元221將該熱點概念從候選熱點推薦集合中過濾掉。
[0170]第三種方式:若熱點概念已向用戶推薦過預設次數(shù),則過濾子單元221將該熱點概念從候選熱點推薦集合中過濾掉。
[0171 ]和/或,熱點集合形成單元22可以包括:
[0172]排序子單元222負責依據(jù)熱點概念的熱度值從高到低的順序,對候選熱點推薦集合中的熱點概念進行排序,其中熱點概念的熱度值由以下因素中的至少一種確定:
[0173]第一種因素:熱點概念所對應新聞資訊的點擊熱度或引用度。其中點擊熱度可以由熱點概念所對應新聞資訊被大眾點擊的次數(shù)、瀏覽的時長等反映。在本發(fā)明實施例中,通過統(tǒng)計抓取的各新聞資訊在不同網(wǎng)站出現(xiàn)的次數(shù),來確定新聞資訊的引用度。
[0174]第二種因素:熱點概念的搜索熱度或關注熱度。搜索熱度可以由熱點概念被大眾搜索的次數(shù)反映。搜索熱度可以由熱點概念被大眾關注的次數(shù)反映。
[0175]第三種因素:熱點概念所關聯(lián)對象的搜索熱度或關注熱度。熱點概念的熱度可以由其所關聯(lián)所有對象的搜索次數(shù)總和來反映,或者由其所關聯(lián)所有對象的被關注次數(shù)總和來反映。
[0176]圖6中以熱點集合形成單元22同時包含過濾子單元221和排序子單元222,且過濾子單元221和排序子單元222以先后的順序?qū)蜻x熱點推薦單元進行處理為例。
[0177]在本發(fā)明所提供的幾個實施例中,應該理解到,所揭露的裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式。
[0178]所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目的。
[0179]另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。
[0180]上述以軟件功能單元的形式實現(xiàn)的集成的單元,可以存儲在一個計算機可讀取存儲介質(zhì)中。上述軟件功能單元存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)或處理器(processor)執(zhí)行本發(fā)明各個實施例所述方法的部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(Read-Only Memory,R0M)、隨機存取存儲器(Random Access Memory,RAM)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
[0181]以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應包含在本發(fā)明保護的范圍之內(nèi)。
【主權項】
1.一種熱點概念的推薦方法,其特征在于,該方法包括: 從用戶歷史行為數(shù)據(jù)中,提取用戶針對各對象的行為特征; 依據(jù)用戶針對各對象的行為特征,確定用戶對各對象的關注度; 確定關注度滿足預設條件的對象所關聯(lián)的熱點概念; 依據(jù)確定出的熱點概念,形成向用戶推薦的熱點推薦集合。2.根據(jù)權利要求1所述的方法,其特征在于,所述用戶針對各對象的行為特征包括: 在設定時間段內(nèi),用戶對所述對象的添加關注、刪除關注、點擊和搜索行為中的至少一種行為的次數(shù),或者用戶對所述對象的添加關注時長、瀏覽時長。3.根據(jù)權利要求2所述的方法,其特征在于,依據(jù)用戶針對各對象的行為特征,確定用戶對各對象的關注度包括: 依據(jù)用戶對對象的各類型行為對應的權重,對各行為的次數(shù)或時長進行加權處理后,得到用戶對對象的關注度。4.根據(jù)權利要求1所述的方法,其特征在于,依據(jù)確定出的熱點概念,形成向用戶推薦的熱點推薦集合包括: 利用所述確定出的熱點概念,形成候選熱點推薦集合; 對所述候選熱點推薦集合中的熱點概念進行過濾和/或排序,形成向用戶推薦的熱點推薦集合。5.根據(jù)權利要求4所述的方法,其特征在于,利用所述確定出的熱點概念,形成候選熱點推薦集合包括: 將所述確定出的熱點概念,加入候選熱點推薦集合;或者, 將所述確定出的熱點概念中,命中近期熱點概念集合的熱點概念,加入候選熱點推薦隹A口 O6.根據(jù)權利要求4所述的方法,其特征在于,該方法還包括: 從用戶歷史行為數(shù)據(jù)中,提取用戶針對各熱點概念的行為特征; 依據(jù)用戶針對各熱點概念的行為特征,確定用戶對各熱點概念的關注度; 選擇關注度滿足預設條件的熱點概念加入所述候選熱點推薦集合。7.根據(jù)權利要求6所述的方法,其特征在于,所述用戶針對各熱點概念的行為特征包括以下至少一種: 用戶對熱點概念所對應新聞資訊的點擊次數(shù)或瀏覽時長; 用戶對熱點概念的搜索次數(shù)。8.根據(jù)權利要求7所述的方法,其特征在于,所述依據(jù)用戶針對各熱點概念的行為特征,確定用戶對各熱點概念的關注度包括: 依據(jù)用戶對某熱點概念的各類型行為對應的權重,對各行為的次數(shù)或時長進行加權處理后,得到用戶對所述某熱點概念的關注度。9.根據(jù)權利要求4至8任一權項所述的方法,其特征在于,對所述候選熱點推薦集合中的熱點概念進行過濾包括: 若熱點概念所關聯(lián)的對象均不屬于所述用戶的自選對象,則將該熱點概念從所述候選熱點推薦集合中過濾掉;或者, 若熱點概念被所述用戶已添加關注或已刪除關注過,則將該熱點概念從所述候選熱點推薦集合中過濾掉;或者, 若熱點概念已向所述用戶推薦過預設次數(shù),則將該熱點概念從所述候選熱點推薦集合中過濾掉。10.根據(jù)權利要求4至8任一權項所述的方法,其特征在于,對所述候選熱點推薦集合中的熱點概念進行排序包括: 依據(jù)熱點概念的熱度值從高到低的順序,對所述候選熱點推薦集合中的熱點概念進行排序,其中熱點概念的熱度值由以下因素中的至少一種確定: 熱點概念所對應新聞資訊的點擊熱度或引用度; 熱點概念的搜索熱度或關注熱度; 熱點概念所關聯(lián)對象的搜索熱度或關注熱度。11.一種熱點概念的推薦裝置,其特征在于,該裝置包括: 第一特征提取單元,用于從用戶歷史行為數(shù)據(jù)中,提取用戶針對各對象的行為特征;第一關注度確定單元,用于依據(jù)用戶針對各對象的行為特征,確定用戶對各對象的關注度; 第一熱點確定單元,用于確定關注度滿足預設條件的對象所關聯(lián)的熱點概念; 推薦單元,用于依據(jù)所述第一熱點確定單元確定出的熱點概念,形成向用戶推薦的熱點推薦集合。12.根據(jù)權利要求11所述的裝置,其特征在于,所述用戶針對各對象的行為特征包括: 在設定時間段內(nèi),用戶對所述對象的添加關注、刪除關注、點擊和搜索行為中的至少一種行為的次數(shù),或者用戶對所述對象的添加關注時長、瀏覽時長。13.根據(jù)權利要求12所述的裝置,其特征在于,所述第一關注度確定單元,用于依據(jù)用戶對對象的各類型行為對應的權重,對各行為的次數(shù)或時長進行加權處理后,得到用戶對對象的關注度。14.根據(jù)權利要求11所述的裝置,其特征在于,所述推薦單元具體包括: 候選集合形成單元,用于利用所述第一熱點確定單元確定出的熱點概念,形成候選熱點推薦集合; 熱點集合形成單元,用于對所述候選熱點推薦集合中的熱點概念進行過濾和/或排序,形成向用戶推薦的熱點推薦集合。15.根據(jù)權利要求14所述的裝置,其特征在于,所述候選集合形成單元,具體用于將所述第一熱點確定單元確定出的熱點概念,加入候選熱點推薦集合;或者,將所述第一熱點確定單元確定出的熱點概念中,命中近期熱點概念集合的熱點概念,加入候選熱點推薦集合。16.根據(jù)權利要求14所述的裝置,其特征在于,該裝置還包括: 第二特征提取單元,用于從用戶歷史行為數(shù)據(jù)中,提取用戶針對各熱點概念的行為特征; 第二關注度確定單元,用于依據(jù)用戶針對各熱點概念的行為特征,確定用戶對各熱點概念的關注度; 第二熱點確定單元,用于選擇關注度滿足預設條件的熱點概念加入所述候選熱點推薦隹A口 O17.根據(jù)權利要求16所述的裝置,其特征在于,所述用戶針對各熱點概念的行為特征包括以下至少一種: 用戶對熱點概念所對應新聞資訊的點擊次數(shù)或瀏覽時長; 用戶對熱點概念的搜索次數(shù)。18.根據(jù)權利要求17所述的裝置,其特征在于,所述第二關注度確定單元,具體用于:依據(jù)用戶對某熱點概念的各類型行為對應的權重,對各行為的次數(shù)或時長進行加權處理后,得到用戶對所述某熱點概念的關注度。19.根據(jù)權利要求14至18任一權項所述的裝置,其特征在于,所述熱點集合形成單元包括: 過濾子單元,用于若熱點概念所關聯(lián)的對象均不屬于所述用戶的自選對象,則將該熱點概念從所述候選熱點推薦集合中過濾掉;或者, 若熱點概念被所述用戶已添加關注或已刪除關注過,則將該熱點概念從所述候選熱點推薦集合中過濾掉;或者, 若熱點概念已向所述用戶推薦過預設次數(shù),則將該熱點概念從所述候選熱點推薦集合中過濾掉。20.根據(jù)權利要求14至18任一權項所述的裝置,其特征在于,所述熱點集合形成單元包括: 排序子單元,用于依據(jù)熱點概念的熱度值從高到低的順序,對所述候選熱點推薦集合中的熱點概念進行排序,其中熱點概念的熱度值由以下因素中的至少一種確定: 熱點概念所對應新聞資訊的點擊熱度或引用度; 熱點概念的搜索熱度或關注熱度; 熱點概念所關聯(lián)對象的搜索熱度或關注熱度。
【文檔編號】G06F17/30GK105868332SQ201610182077
【公開日】2016年8月17日
【申請日】2016年3月28日
【發(fā)明人】朱薔薔
【申請人】百度在線網(wǎng)絡技術(北京)有限公司