国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種信息推薦方法及系統(tǒng)與流程

      文檔序號:11545423閱讀:269來源:國知局
      一種信息推薦方法及系統(tǒng)與流程
      本發(fā)明涉及互聯(lián)網(wǎng)技術領域,特別是涉及一種信息推薦方法及系統(tǒng)。

      背景技術:
      互聯(lián)網(wǎng)用戶通常會在一段時期內(nèi)對一些網(wǎng)站有穩(wěn)定持續(xù)的訪問需求,而記住網(wǎng)址對一些用戶來說是個不小的門檻。盡管一部分站點的網(wǎng)址相對較為簡短,但是一旦數(shù)量太多,要想全部記住也是一件困難的事情。在此前提下,用戶經(jīng)常會使用瀏覽器或網(wǎng)站提供的網(wǎng)址列表的功能,例如,收藏夾、或者類似網(wǎng)址導航功能的“快速通道”中的網(wǎng)址列表,等等。這些網(wǎng)址列表通常是允許用戶自行建立及維護的,使得用戶可以隨時將有長期穩(wěn)定訪問需求的頁面網(wǎng)址加入網(wǎng)址列表中,這樣以后如有訪問需求,不需要在瀏覽器地址欄中輸入網(wǎng)址,而是直接在網(wǎng)址列表中尋找到目標并點擊即可打開目標網(wǎng)址。雖然網(wǎng)址列表能夠使得用戶無需記憶具體的網(wǎng)址便可以訪問到相應的網(wǎng)頁,但是,又會使得用戶的相關訪問范圍受到該網(wǎng)址列表的限制,相應的,也使得網(wǎng)絡中存在的一些尚未包含在網(wǎng)址列表中的網(wǎng)址資源無法得到有效的利用。

      技術實現(xiàn)要素:
      本發(fā)明提供了一種信息推薦方法及系統(tǒng),能夠擴大方便用戶訪問的網(wǎng)址的范圍,使得一些尚未包含的網(wǎng)址列表中的網(wǎng)址資源也能獲得更高的利用率。本發(fā)明提供了如下方案:一種信息推薦方法,包括:采集網(wǎng)址及其對應的標簽,所述標簽為對網(wǎng)頁內(nèi)容、主題和/或形式進行標注的文本;匯總采集到的數(shù)據(jù),以建立數(shù)據(jù)庫,所述數(shù)據(jù)庫中包括網(wǎng)址與標簽之間的對應關系以及同一網(wǎng)址在對應的各個標簽下的標注分布信息;接收到為指定網(wǎng)址進行信息推薦的請求時,在所述數(shù)據(jù)庫中查詢所述指定網(wǎng)址對應的標簽以及所述指定網(wǎng)址在對應的各個標簽下的標注分布信息;根據(jù)所述標注分布信息進行標簽選擇,根據(jù)所選中的標簽在所述數(shù)據(jù)庫中對應的其他網(wǎng)址,向用戶進行網(wǎng)址推薦??蛇x的,所述同一網(wǎng)址在對應的各個標簽下的標注分布信息包括:同一網(wǎng)址在對應的各個標簽下的標注比例,其中,某網(wǎng)址在某標簽下的標注比例為:在所述采集到的數(shù)據(jù)中,該網(wǎng)址被標注為該標簽的次數(shù)與該網(wǎng)址該標注的總次數(shù)之比,通過以下方式進行標簽選擇:根據(jù)所述指定網(wǎng)址在對應的各個標簽下的標注比例,為所述指定網(wǎng)址選擇標簽??蛇x的,所述根據(jù)所述指定網(wǎng)址在對應的各個標簽下的標注比例,為所述指定網(wǎng)址選擇標簽包括:按照所述指定網(wǎng)址在對應的各個標簽下的標注比例的大小,分別對所述指定網(wǎng)址對應的各個標簽進行排序;根據(jù)排序的結果,為所述指定網(wǎng)址選擇標簽。可選的,所述根據(jù)所述指定網(wǎng)址在對應的各個標簽下的標注比例,為所述指定網(wǎng)址選擇標簽包括:計算所述指定網(wǎng)址對應的各個標簽在該用戶的網(wǎng)址列表中的標注權重,其中,對于某標簽,通過以下方式計算其在該用戶的網(wǎng)址列表中的標注權重:獲取該標簽在該用戶的網(wǎng)址列表中對應的全部網(wǎng)址,根據(jù)這些網(wǎng)址分別在該標簽下的標注比例及所述這些網(wǎng)址各自在所述數(shù)據(jù)庫中的標注量,計算該標簽在該用戶的網(wǎng)址列表中的標注權重;根據(jù)所述指定網(wǎng)址對應的各個標簽在該用戶的網(wǎng)址列表中的標注權重,分別對所述指定網(wǎng)址各自對應的各個標簽進行排序;根據(jù)排序的結果,為所述指定網(wǎng)址選擇標簽??蛇x的,當用戶的網(wǎng)址列表中包含多個目錄時,網(wǎng)址列表中具有同一標簽的網(wǎng)址位于同一目錄下;所述方法還包括:獲取用戶的網(wǎng)址列表中的目錄信息;如果用戶的網(wǎng)址列表中存在某標簽對應的目錄,則對該標簽進行加權調整??蛇x的,所述指定網(wǎng)址包括用戶的網(wǎng)址列表中的網(wǎng)址,所述接收到為指定網(wǎng)址進行信息推薦的請求時,在所述數(shù)據(jù)庫中查詢所述指定網(wǎng)址對應的標簽以及所述指定網(wǎng)址在對應的各個標簽下的標注分布信息包括:接收到攜帶有用戶網(wǎng)址列表中的網(wǎng)址的請求時,在所述數(shù)據(jù)庫中分別查詢所述請求中攜帶的各個網(wǎng)址對應的標簽以及所述請求中攜帶的各個網(wǎng)址在對應的各個標簽下的標注分布信息??蛇x的,當用戶的網(wǎng)址列表中包含多個目錄,網(wǎng)址列表中具有同一標簽的網(wǎng)址位于同一目錄下時,所述方法還包括:獲取用戶的網(wǎng)址列表中的目錄信息;在所述目錄信息中查找與所選中的標簽對應的目錄;如果查找到,將所述網(wǎng)址列表中的網(wǎng)址整理到所選中的標簽對應的目錄中;如果未查找到,或者用戶的網(wǎng)址列表中不存在目錄信息,則在所述用戶的網(wǎng)址列表中創(chuàng)建與所選中的標簽對應的目錄,并將所述網(wǎng)址列表中的網(wǎng)址整理到所述創(chuàng)建的目錄中??蛇x的,所述指定網(wǎng)址包括用戶正在向網(wǎng)址列表中添加的網(wǎng)址,所述接收到為指定網(wǎng)址進行信息推薦的請求時,在所述數(shù)據(jù)庫中查詢所述指定網(wǎng)址對應的標簽以及所述指定網(wǎng)址在對應的各個標簽下的標注分布信息包括:接收到攜帶有用戶正在向網(wǎng)址列表中添加的網(wǎng)址的請求時,在所述數(shù)據(jù)庫中查詢所述請求中攜帶的網(wǎng)址對應的標簽以及所述請求中攜帶的網(wǎng)址在對應的各個標簽下的標注分布信息??蛇x的,當用戶的網(wǎng)址列表中包含多個目錄,網(wǎng)址列表中具有同一標簽的網(wǎng)址位于同一目錄下時所述方法還包括:獲取用戶的網(wǎng)址列表中的目錄信息;在所述目錄信息中查找與所選中的標簽對應的目錄;如果查找到,將所述用戶正在向網(wǎng)址列表中添加的網(wǎng)址添加到與所選中的標簽對應的目錄中;如果未查找到,或者用戶的網(wǎng)址列表中不存在目錄信息,則在所述用戶的網(wǎng)址列表中創(chuàng)建與所選中的標簽對應的目錄,并將所述用戶正在向網(wǎng)址列表中添加的網(wǎng)址添加到所述創(chuàng)建的目錄中??蛇x的,還包括:將所述所選中的標簽推薦給用戶。可選的,在采集包含網(wǎng)址及其對應的標簽的數(shù)據(jù)時,還包括:采集標簽之間的父子關系,并將所有的父子關系進行匯總,組成標簽父子鏈;在根據(jù)所選中的標簽在所述數(shù)據(jù)庫中對應的其他網(wǎng)址,向用戶進行網(wǎng)址推薦時,判斷指定網(wǎng)址對應的標簽是否處于標簽父子鏈中,如果是,將指定網(wǎng)址對應的標簽的子標簽加入到推薦網(wǎng)址所依據(jù)的標簽中進行網(wǎng)址的推薦。還提供了一種信息推薦系統(tǒng),包括:數(shù)據(jù)采集單元,用于采集網(wǎng)址及其對應的標簽,所述標簽為對網(wǎng)頁內(nèi)容、主題和/或形式進行標注的文本;數(shù)據(jù)庫建立單元,用于匯總采集到的數(shù)據(jù),以建立數(shù)據(jù)庫,所述數(shù)據(jù)庫中包括網(wǎng)址與標簽之間的對應關系以及同一網(wǎng)址在對應的各個標簽下的標注分布信息;查詢單元,用于在接收到為指定網(wǎng)址進行信息推薦的請求時,在所述數(shù)據(jù)庫中查詢所述指定網(wǎng)址對應的標簽以及所述指定網(wǎng)址在對應的各個標簽下的標注分布信息;推薦單元,用于根據(jù)所述標注分布信息進行標簽選擇,根據(jù)所選中的標簽在所述數(shù)據(jù)庫中對應的其他網(wǎng)址,向用戶進行網(wǎng)址推薦??蛇x的,所述同一網(wǎng)址在對應的各個標簽下的標注分布信息包括:同一網(wǎng)址在對應的各個標簽下的標注比例,其中,某網(wǎng)址在某標簽下的標注比例為:在所述采集到的數(shù)據(jù)中,該網(wǎng)址被標注為該標簽的次數(shù)與該網(wǎng)址該標注的總次數(shù)之比,通過以下單元進行標簽選擇:標簽選擇單元,用于根據(jù)所述指定網(wǎng)址在對應的各個標簽下的標注比例,為所述指定網(wǎng)址選擇標簽??蛇x的,所述標簽選擇單元包括:第一排序子單元,用于按照所述指定網(wǎng)址在對應的各個標簽下的標注比例的大小,分別對所述指定網(wǎng)址對應的各個標簽進行排序;第一選擇子單元,用于根據(jù)排序的結果,為所述指定網(wǎng)址選擇標簽。可選的,所述標簽選擇單元包括:權重計算子單元,用于計算所述指定網(wǎng)址對應的各個標簽在該用戶的網(wǎng)址列表中的標注權重,其中,對于某標簽,通過以下方式計算其在該用戶的網(wǎng)址列表中的標注權重:獲取該標簽在該用戶的網(wǎng)址列表中對應的全部網(wǎng)址,根據(jù)這些網(wǎng)址分別在該標簽下的標注比例及所述這些網(wǎng)址各自在所述數(shù)據(jù)庫中的標注量,計算該標簽在該用戶的網(wǎng)址列表中的標注權重;第二排序子單元,用于根據(jù)所述指定網(wǎng)址對應的各個標簽在該用戶的網(wǎng)址列表中的標注權重,分別對所述指定網(wǎng)址各自對應的各個標簽進行排序;第二選擇子單元,用于根據(jù)排序的結果,為所述指定網(wǎng)址選擇標簽??蛇x的,當用戶的網(wǎng)址列表中包含多個目錄,網(wǎng)址列表中具有同一標簽的網(wǎng)址位于同一目錄下時,所述系統(tǒng)還包括:目錄信息獲取單元,用于獲取用戶的網(wǎng)址列表中的目錄信息;調整單元,用于在用戶的網(wǎng)址列表中存在某標簽對應的目錄時,對該標簽進行加權調整??蛇x的,所述指定網(wǎng)址包括用戶的網(wǎng)址列表中的網(wǎng)址,所述查詢單元包括:第一查詢子單元,用于在接收到攜帶有用戶網(wǎng)址列表中的網(wǎng)址的請求時,在所述數(shù)據(jù)庫中分別查詢所述請求中攜帶的各個網(wǎng)址對應的標簽以及所述請求中攜帶的各個網(wǎng)址在對應的各個標簽下的標注分布信息??蛇x的,當用戶的網(wǎng)址列表中包含多個目錄,網(wǎng)址列表中具有同一標簽的網(wǎng)址位于同一目錄下時,所述系統(tǒng)還包括:第一用戶數(shù)據(jù)獲取單元,用于獲取用戶的網(wǎng)址列表中的目錄信息;第一查找單元,用于在所述目錄信息中查找與所選中的標簽對應的目錄;第一添加單元,用于如果查找到,將所述網(wǎng)址列表中的網(wǎng)址整理到所選中的標簽對應的目錄中;第一創(chuàng)建及添加單元,用于如果未查找到,或者用戶的網(wǎng)址列表中不存在目錄信息,則在所述用戶的網(wǎng)址列表中創(chuàng)建與所選中的標簽對應的目錄,并將所述網(wǎng)址列表中的網(wǎng)址整理到到所述創(chuàng)建的目錄中??蛇x的,其特征在于,所述指定網(wǎng)址包括用戶正在向網(wǎng)址列表中添加的網(wǎng)址,所述查詢單元包括:第二查詢子單元,用于在接收到攜帶有用戶正在向網(wǎng)址列表中添加的網(wǎng)址的請求時,在所述數(shù)據(jù)庫中查詢所述請求中攜帶的網(wǎng)址對應的標簽以及所述請求中攜帶的網(wǎng)址在對應的各個標簽下的標注分布信息??蛇x的,當用戶的網(wǎng)址列表中包含多個目錄,網(wǎng)址列表中具有同一標簽的網(wǎng)址位于同一目錄下時,所述系統(tǒng)還包括:第二用戶數(shù)據(jù)獲取單元,用于獲取用戶的網(wǎng)址列表中的目錄信息;第二查找單元,用于在所述目錄信息中查找與所選中的標簽對應的目錄;第二添加單元,用于如果查找到,將所述用戶正在向網(wǎng)址列表中添加的網(wǎng)址添加到與所選中的標簽對應的目錄中;第二創(chuàng)建及添加單元,用于如果未查找到,或者用戶的網(wǎng)址列表中不存在目錄信息,則在所述用戶的網(wǎng)址列表中創(chuàng)建與所選中的標簽對應的目錄,并將所述用戶正在向網(wǎng)址列表中添加的網(wǎng)址添加到所述創(chuàng)建的目錄中。可選的,還包括:標簽推薦單元,用于將所述所選中的標簽推薦給用戶??蛇x的,所述數(shù)據(jù)采集單元還用于采集標簽之間的父子關系,所述數(shù)據(jù)庫建立單元還用于將所有的父子關系進行匯總,以組成標簽父子鏈;所述系統(tǒng)還包括:標簽增加單元,用于在根據(jù)指定網(wǎng)址對應的標簽為用戶推薦網(wǎng)址時,判斷指定網(wǎng)址對應的標簽是否處于標簽父子鏈中,如果是,將指定網(wǎng)址對應的標簽的子標簽加入到推薦網(wǎng)址所依據(jù)的標簽中進行網(wǎng)址的推薦。根據(jù)本發(fā)明提供的具體實施例,本發(fā)明公開了以下技術效果:通過本發(fā)明,可以預先建立數(shù)據(jù)庫,該數(shù)據(jù)庫中保存了網(wǎng)址與標簽之間的對應關系以及同一網(wǎng)址在對應的各個標簽下的標注分布信息,這樣,就可以使用數(shù)據(jù)庫中的這些信息為指定網(wǎng)址(例如用戶網(wǎng)址列表中的網(wǎng)址,或者即將加入到網(wǎng)址列表中的網(wǎng)址等)選擇標簽,并將數(shù)據(jù)庫中該標簽下的其他網(wǎng)址推薦給用戶。根據(jù)推薦的其他網(wǎng)址,還可以通過網(wǎng)址列表訪問到更多可能感興趣的網(wǎng)址,或者將這些網(wǎng)址同樣加入到網(wǎng)址列表中,便于以后的訪問,從而擴大了方便用戶訪問的網(wǎng)址的范圍,使得一些尚未包含的網(wǎng)址列表中的網(wǎng)址資源也能獲得更高的利用率。附圖說明為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1是本發(fā)明實施例提供的方法的流程圖;圖2是本發(fā)明實施例提供的裝置的示意圖。具體實施方式下面將結合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。參見圖1,本發(fā)明實施例提供的信息推薦方法包括以下步驟:S101:采集網(wǎng)址及其對應的標簽,所述標簽為對網(wǎng)頁內(nèi)容、主題和/或形式進行標注的文本;在本發(fā)明實施例中,為了能夠為用戶提供推薦信息,首先需要建立數(shù)據(jù)庫,該數(shù)據(jù)庫中需要包含一些網(wǎng)址,并且每個網(wǎng)址會有對應的標簽,用于對網(wǎng)頁內(nèi)容、主題和/或形式進行標注,以便基于網(wǎng)址對應的標簽進行信息的推薦。在建立數(shù)據(jù)庫時,首先就需要收集一些數(shù)據(jù),主要是為了收集一些網(wǎng)址及其對應的標簽。具體實現(xiàn)時,可以在包含有網(wǎng)址及其標簽的數(shù)據(jù)源中進行采集。例如,其中一種數(shù)據(jù)源可以是導航網(wǎng)站(導航網(wǎng)站就是集合較多網(wǎng)址鏈接,并按照一定條件對鏈接進行分類的一種網(wǎng)站),也就是說導航網(wǎng)站的頁面中通常包含一些導航鏈接,并且會存在類別信息,以便使用戶能夠快速找到自己需要的網(wǎng)站,而不用去記住各類網(wǎng)站的網(wǎng)址。其中,導航網(wǎng)站中的鏈接以及類別信息通常是由網(wǎng)站制作者整理的,具有較高的質量,因此,可以直接將其作為數(shù)據(jù)源進行采集。在對這種數(shù)據(jù)源進行采集時,就可以直接將鏈接對應的類別信息作為鏈接的標簽。例如,導航網(wǎng)站中包含某鏈接,并且該鏈接在“視頻”這個類別中,此時,就可以采集到該鏈接的網(wǎng)址,并且將“視頻”作為該網(wǎng)址的標簽?;蛘?,一些瀏覽器提供了網(wǎng)絡收藏夾的功能,通過該功能,用戶可以把自己喜歡的網(wǎng)址直接保存到網(wǎng)絡數(shù)據(jù)庫中,利用會員系統(tǒng)管理。在用戶將網(wǎng)址保存到網(wǎng)絡收藏夾中時,通常還在網(wǎng)絡收藏夾中建立目錄,以便對收藏的網(wǎng)址進行分類管理,例如,在某用戶的網(wǎng)絡收藏夾中,可能具有“購物”、“生活”等多個子文件夾,將具體的網(wǎng)址存放在各級目錄中。另一方面,數(shù)據(jù)采集的工作通常可以由服務器來完成,因此,服務器可以直接獲取到用戶網(wǎng)絡收藏夾中的數(shù)據(jù),因此,也可以將網(wǎng)絡收藏夾作為數(shù)據(jù)源。對于網(wǎng)絡收藏夾中的網(wǎng)址鏈接,其所在的目錄即可作為該網(wǎng)址的標簽。例如,在某網(wǎng)絡收藏夾中存在某網(wǎng)址的鏈接,該鏈接在“購物”這一目錄中,此時,就可以采集到該網(wǎng)址,并且其標簽為“購物”。此外,還可以通過其他方式采集到網(wǎng)址及其對應的標簽,例如,如果某網(wǎng)址不存在直接可以作為標簽的信息,還可以通過對網(wǎng)頁內(nèi)容或者網(wǎng)頁標題的分析等方式來獲取到網(wǎng)址的標簽,等等,這里不再詳述。需要說明的是,一些可以作為標簽的信息在其數(shù)據(jù)來源中可能存在包含關系或者層次關系等父子關系,例如導航網(wǎng)站中各個類別之間的層次關系(如“音樂”這個類別中還可能包括“在線音樂”、“DJ音樂”等等,也即存在一級頁面、二級頁面等多級頁面的情況,此時,“音樂”相當于是“在線音樂”、“DJ音樂”的父標簽,相應的,“在線音樂”、“DJ音樂”相當于是“音樂”的子標簽),網(wǎng)絡收藏夾中可能存在多級目錄等等,而標簽之間的這些父子關系也可能影響到具體的推薦。因此,在本發(fā)明實施例中,在采集數(shù)據(jù)時,還可以同時采集這些標簽之間的父子關系。S102:匯總采集到的數(shù)據(jù),以建立數(shù)據(jù)庫,所述數(shù)據(jù)庫中包括網(wǎng)址與標簽之間的對應關系以及同一網(wǎng)址在對應的各個標簽下的標注分布信息;采集到的數(shù)據(jù)可能包含多個網(wǎng)址,每個網(wǎng)址可能從不同的數(shù)據(jù)源中多次被采集到,以至于每個網(wǎng)址可能對應多個不同的標簽;另外,同一數(shù)據(jù)源中的同一標簽下可能包含多個網(wǎng)址,不同的數(shù)據(jù)源中還可能存在相同的標簽,以至于一個標簽下可能對應多個網(wǎng)址,因此,可以對這樣的數(shù)據(jù)進行匯總,最終建立起網(wǎng)址與標簽之間的對應關系。同時,還可以統(tǒng)計出同一個網(wǎng)址在各個標簽下被標注的次數(shù),以及同一個網(wǎng)址被標注的總次數(shù),由此統(tǒng)計出同一網(wǎng)址在對應的各個標簽下的標注分布信息。該標注分布信息可以直接由在各個標簽下被標注的次數(shù)來表示,或者,還可以由網(wǎng)址在各個標簽下的標注比例來表示。其中,某網(wǎng)址在某標簽下的標注比例為:在所述采集到的數(shù)據(jù)中,該網(wǎng)址被標注為該標簽的次數(shù)與該網(wǎng)址被標注的總次數(shù)之比。例如,在采集到的數(shù)據(jù)中,網(wǎng)址A總共被標注了100次,其中,被標記為標簽X的次數(shù)為50次,則該網(wǎng)址A在標簽X下的標注比例為50%。其中,在統(tǒng)計各個網(wǎng)址被標記為各個標簽的次數(shù)時,可以直接將各個數(shù)據(jù)源不加區(qū)別地直接進行統(tǒng)計,例如,發(fā)現(xiàn)某網(wǎng)址A在3個導航網(wǎng)站中被標記為“音樂”,在10個用戶的網(wǎng)絡收藏夾中被標記為“音樂”,則該網(wǎng)址A被標記為“音樂”的次數(shù)可以記為3+10=13次。當然,由于導航網(wǎng)站一般是由專業(yè)人員建立并維護的,數(shù)據(jù)的可信度比較高,而網(wǎng)絡收藏夾中的數(shù)據(jù)一般是由用戶自己手動建立并維護的,數(shù)據(jù)的可信度相對較低,因此,在進行次數(shù)的統(tǒng)計時,可以將不同的數(shù)據(jù)源賦予不同的權重。例如,可以如下進行設定:如果某網(wǎng)址被某導航網(wǎng)站標注為某標簽,則直接將該網(wǎng)址被標注為該標簽的次數(shù)記為100,而如果該網(wǎng)址被某用戶網(wǎng)絡收藏夾標注為該標簽,則仍然將該網(wǎng)址被標注為該標簽的次數(shù)記為1,以此類推。需要說明的是,在對采集到的數(shù)據(jù)進行匯總時,還可以包括對數(shù)據(jù)進行過濾、聚類等處理,其中,過濾是指將文本過長、出現(xiàn)次數(shù)太少的數(shù)據(jù)去除。聚類是指,將重復的數(shù)據(jù)聚為一類,甚至可以將一些文本內(nèi)容并不完全一致但實際上表達相同含義的數(shù)據(jù)聚為一類,其中,所述數(shù)據(jù)可以為標簽。例如,標簽1、標簽2及標簽3表達的含義相同或相近,則可以將這三個標簽聚為一類,可以將其中一個標簽(例如標簽1)作為該標簽類的主標簽,其他標簽(如標簽2和標簽3)則作為該標簽類的替代標簽,這樣,可以將標簽2及標簽3下的網(wǎng)址合并到標簽1下,并且,當統(tǒng)計某網(wǎng)址被標記為標簽1的次數(shù)時,將該網(wǎng)址被標記為標簽2及標簽3的次數(shù)也統(tǒng)計進來,同時,相加之后的總次數(shù)也是該網(wǎng)址被標記為標簽2或標簽3的次數(shù)。另外,在考慮標簽之間的父子關系的情況下,還需要對這種父子關系進行匯總,并保存在數(shù)據(jù)庫中。其中,在匯總父子關系時,由于導航網(wǎng)站一般是由專業(yè)人員建立并維護的,數(shù)據(jù)的可信度比較高,因此,如果發(fā)現(xiàn)在采集到的導航網(wǎng)站數(shù)據(jù)中,標簽1是標簽2的子分類,則直接添加父子標簽二元組“標簽1→標簽2”;而網(wǎng)絡收藏夾一般是由用戶自己手動建立并維護的,數(shù)據(jù)的可信度相對較低,因此,對于用戶網(wǎng)絡收藏夾中采集到的數(shù)據(jù),還可以進行進一步地判斷,再決定是否將其作為可信的數(shù)據(jù)添加到數(shù)據(jù)庫中。在進行判斷時,由于如果標簽1確實是標簽2的子標簽,則按照這種關系進行標記的數(shù)量應該會比較大,另外,用所有用戶數(shù)據(jù)計算之后,這兩個標簽內(nèi)部的網(wǎng)址分布情況應該具有相似性,因此,就可以將以上兩個條件作為判斷依據(jù)。具體實現(xiàn)時,可以通過以下方式進行判斷:如果在采集到的收藏夾數(shù)據(jù)中,標簽1是標簽2的子目錄,則:每出現(xiàn)一次,則給二元組“標簽1→標簽2”標記父子關系得分1;保留累加之后超過一定閾值的二元組“標簽1→標簽2”;查詢標簽數(shù)據(jù)庫,獲取標簽1、標簽2下所有網(wǎng)址和標注分布情況,計算出標簽1、標簽2的相似度:將相似度超過閾值的二元組“標簽1→標簽2”視為合理的父子標簽,添加到數(shù)據(jù)庫中。其中,在計算標簽1與標簽2之間的相似度時,可以采用如下方式實現(xiàn):假設標簽1的收藏總量為t1,標簽2的收藏總量為t2,在它們之下有N個共同的網(wǎng)址,其中網(wǎng)址i的收藏總量為ui,在標簽1下的收藏比例為wi1,在標簽2下的收藏比例為wi2,則標簽1和標簽2的相似度為兩者共同網(wǎng)址收藏比例的調和平均值按照網(wǎng)址收藏總量進行加權求和的結果,如公式(1)所示。最后再匯總所有的二元組,得到每個標簽的標簽父子鏈“標簽1→標簽2→......→標簽N”,該標簽父子鏈表示標簽1是標簽2的子標簽,標簽2又是標簽3的子標簽,直到最頂層的標簽為止。S103:接收到為指定網(wǎng)址進行信息推薦的請求時,在所述數(shù)據(jù)庫中查詢所述指定網(wǎng)址對應的標簽以及所述指定網(wǎng)址在對應的各個標簽下的標注分布信息;在建立了上述數(shù)據(jù)庫之后,就可以為指定的網(wǎng)址進行信息推薦了。具體實現(xiàn)時,可以為用戶網(wǎng)址列表中的網(wǎng)址提供推薦信息,這里的網(wǎng)址列表可以是用戶的本地收藏夾、網(wǎng)絡收藏夾、瀏覽器為用戶統(tǒng)計出的“最近訪問網(wǎng)址列表”、“最常訪問網(wǎng)址列表”或者類似于導航網(wǎng)站功能的“快速通道”中的網(wǎng)址列表等等。具體實現(xiàn)時,可以針對多種情形為用戶進行信息的推薦。例如,用戶網(wǎng)址列表中的數(shù)據(jù)可能是由用戶添加的,但是用戶可能并沒有為其中的網(wǎng)址添加標簽等分類信息,因此網(wǎng)址列表中的數(shù)據(jù)可能比較雜亂無章,不便于查找,針對這種情況,本發(fā)明實施例可以根據(jù)數(shù)據(jù)庫中的數(shù)據(jù),為網(wǎng)址列表中的各個數(shù)據(jù)推薦可以使用的標簽,進而就可以利用推薦的標簽對網(wǎng)址進行分類等管理(例如,根據(jù)為各個網(wǎng)址推薦的標簽,在網(wǎng)址列表中創(chuàng)建相應的目錄,并將網(wǎng)址放入到各自的目錄中,等等。需要說明的是,在本發(fā)明實施例中,“目錄”可以看作是“標簽”的別稱,也就是說,當一個網(wǎng)址列表中包含具有同一標簽的多個網(wǎng)址時,就可以將這些網(wǎng)址整理到同一個目錄下,并且可以將標簽的名稱作為該目錄的名稱,代表該目錄下的各個網(wǎng)址都帶有該同一標簽,換言之,“標簽”和“目錄”都可以看作是對網(wǎng)址所屬類別的一種描述,只不過在數(shù)據(jù)庫中單獨針對某一個網(wǎng)址時稱為標簽,在用戶網(wǎng)址列表中針對某一些網(wǎng)址時稱為目錄)?;蛘?,根據(jù)當前網(wǎng)址列表中已經(jīng)存在的網(wǎng)址,還可以為用戶推薦其他的網(wǎng)址,這樣用戶可以將推薦的網(wǎng)址也一并加入到網(wǎng)址列表中,或者直接訪問等等。另外,在用戶執(zhí)行將某網(wǎng)址加入某網(wǎng)址列表中的操作時,也可以為用戶當前正在添加的這個網(wǎng)址提供合適的標簽,這樣用戶不需要手動為該網(wǎng)址打標簽,如果用戶接受推薦,并且當前的網(wǎng)址列表中存在與推薦的標簽對應的目錄,則可以直接將該網(wǎng)址添加到該目錄中,或者如果當前的網(wǎng)址列表中不存在與該推薦的標簽相對應的目錄,則可以創(chuàng)建一個目錄,并將該網(wǎng)址放入到該創(chuàng)建的目錄中。或者,還可以根據(jù)用戶當前正在添加的網(wǎng)址,為用戶推薦其他的網(wǎng)址,這樣用戶可以直接訪問該網(wǎng)址,或者將該網(wǎng)址也加入到網(wǎng)址列表中,等等。需要說明的是,在上述針對用戶的網(wǎng)址列表中的網(wǎng)址進行標簽的推薦時,相當于是用戶只需要點擊整理網(wǎng)址列表的按鈕,瀏覽器就可以針對用戶當前的網(wǎng)址列表,為其中的各個網(wǎng)址提供最合適的標簽,進而對網(wǎng)址列表中的目錄結構進行組織或者整理,這樣,用戶可以不再執(zhí)行手動的維護網(wǎng)址列表的操作,因此,相當于實現(xiàn)了“一鍵式整理網(wǎng)址列表”的功能,例如,針對收藏夾這種網(wǎng)址列表,就可以稱為“一鍵整理搜藏夾”等等。類似的,在上述針對用戶正在向網(wǎng)址列表中添加的網(wǎng)址進行標簽的推薦時,相當于用戶只需要選擇想要添加的網(wǎng)址,瀏覽器就可以自動為網(wǎng)址選擇標簽,并直接將其添加到用戶網(wǎng)址列表中對應的目錄下,用戶可以不再執(zhí)行其他操作,因此,相當于實現(xiàn)了“一鍵式添加到網(wǎng)址列表”的功能,例如,針對收藏夾這種網(wǎng)址列表,可以稱為“一鍵收藏”。也就是說,在實際應用中,步驟S103中所述的指定網(wǎng)址可以是用戶的網(wǎng)址列表中的網(wǎng)址,也可以是用戶當前正在添加到網(wǎng)址列表中的那個網(wǎng)址。具體將哪個或者哪些網(wǎng)址作為指定網(wǎng)址,可以根據(jù)接收到的請求來確定,例如,如果需要基于網(wǎng)址列表中的網(wǎng)址進行推薦,則可以在請求中攜帶網(wǎng)址列表中的網(wǎng)址(可以是一個網(wǎng)址列表中的全部或者部分網(wǎng)址),如果需要基于用戶當前正在添加到某網(wǎng)址列表中的網(wǎng)址進行推薦,則可以在請求中攜帶該正在添加的網(wǎng)址(還可以同時攜帶該網(wǎng)址列表中已經(jīng)存在的目錄信息,對此后文中會有詳細地介紹)。當然,還可以預先定義請求消息的類型,當需要針對不同的場景進行推薦時,可以分別在請求中攜帶相應的類型信息。需要說明的是,即使是基于為網(wǎng)址列表中的多個網(wǎng)址進行信息的推薦,實際上也可以分解為分別針對各個網(wǎng)址進行推薦,因此,下面重點介紹針對單個網(wǎng)址進行推薦的過程。對于某指定網(wǎng)址,首先可以在數(shù)據(jù)庫中查詢該網(wǎng)址對應的標簽,由于一個網(wǎng)址對應的標簽可能有多個,因此還同時查詢到該網(wǎng)址在各個標簽下的標注分布信息,例如,在各個標簽下的分布比例等等。也就是說,由于預先從一些數(shù)據(jù)源中采集了大量的網(wǎng)址保存在了數(shù)據(jù)庫中,并且在數(shù)據(jù)庫中這些網(wǎng)址都具有自己的標簽,而對于需要提供推薦信息的指定網(wǎng)址而言,一般情況下,通常會包含在數(shù)據(jù)庫中的網(wǎng)址中,因此,通常而言,在接收到對某指定網(wǎng)址進行信息推薦的請求后,就可以直接在數(shù)據(jù)庫中查詢到該網(wǎng)址對應有哪些標簽,以及該網(wǎng)址在這些標簽下各自的分布情況。當然,在實際應用中可能存在針對某指定網(wǎng)址,數(shù)據(jù)庫中并不直接存在該網(wǎng)址的情況,此時,可以根據(jù)該指定網(wǎng)址的網(wǎng)址組成逐級向上查找。例如,某指定網(wǎng)址為www.a.b.c.com/目錄1/目錄2/page.html,如果數(shù)據(jù)庫中不存在該網(wǎng)址,則可以將該網(wǎng)址中的page.html去掉,查詢數(shù)據(jù)庫中是否存在“www.a.b.c.com/目錄1/目錄2/”這個網(wǎng)址,如果存在,則將該網(wǎng)址對應的標簽,作為該指定網(wǎng)址對應的標簽;如果仍然不存在,則去掉“目錄2/”,查詢數(shù)據(jù)庫中是否存在“www.a.b.c.com/目錄1/”這個網(wǎng)址,如果仍然找不到,還可以到域名級別進行查找,例如查找是否存在“www.a.b.c.com/”,如果還沒有,還可以去掉“a.”,甚至“b.”等等,直到能夠在數(shù)據(jù)庫中被找到為止。S104:根據(jù)所述標注分布信息進行標簽選擇,根據(jù)所選中的標簽在所述數(shù)據(jù)庫中對應的其他網(wǎng)址,向用戶進行網(wǎng)址推薦。如前文所述,具體在進行信息推薦時,可以為某指定網(wǎng)址推薦合適的標簽,也可以為用戶推薦網(wǎng)址等等。其中,在為用戶推薦網(wǎng)址時,也可以首先根據(jù)指定網(wǎng)址選擇合適的標簽,然后再根據(jù)該標簽下的所有網(wǎng)址的標注量向用戶進行網(wǎng)址的推薦。因此,關鍵問題在于為指定網(wǎng)址選擇合適的標簽,在本發(fā)明實施例中,可以通過以下方式進行:在查找到指定網(wǎng)址對應的各個標簽之后,可以直接根據(jù)該指定網(wǎng)址在各個標簽下的標注比例,對各個標簽進行排序,然后選擇排序比較靠前的標簽推薦給用戶,或者將排序比較靠前的標簽下標注量比較大的網(wǎng)址推薦給用戶。例如,對于某指定網(wǎng)址A,在數(shù)據(jù)庫中為其查找到的標簽包括標簽1、標簽2和標簽3,其中,該網(wǎng)址A在標簽1下的標注比例為a1,網(wǎng)址A在標簽2下的標注比例為a2,網(wǎng)址A在標簽3下的標注比例為a3,如果a2>a1>a3,則可以將標簽2推薦給網(wǎng)址A,或者,將標簽2對應的所有網(wǎng)址中,訪問量最大的一個或多個網(wǎng)址推薦給用戶。另外,在實際應用中,如果一個用戶自己的網(wǎng)址列表中,某標簽下有多個網(wǎng)址,則該標簽對于該用戶應該具有較高的權重。也就是說,為某用戶甲的網(wǎng)址(可能是該用戶甲網(wǎng)址列表中的某網(wǎng)址,或者該用戶甲正在向網(wǎng)址列表中添加的網(wǎng)址)推薦的標簽,是依據(jù)數(shù)據(jù)庫中的數(shù)據(jù)選擇的,選擇出的標簽一般是多數(shù)用戶都使用的(也就是說,假設為網(wǎng)址A選擇了標簽1,是因為根據(jù)數(shù)據(jù)庫中的數(shù)據(jù)顯示,針對網(wǎng)址A,大多數(shù)用戶都將其標注成了標簽1),如果該選擇的標簽恰好在用戶甲的網(wǎng)址列表中出現(xiàn),并且在用戶甲的網(wǎng)址列表中,該標簽下還有多個網(wǎng)址,則將該標簽推薦給用戶甲之后,被用戶甲選擇使用的概率會大大提高。為此,本發(fā)明實施例中還提出了標簽在用戶的網(wǎng)址列表中的標注權重的概念。也即,在針對某指定網(wǎng)址A進行信息推薦時,如果在數(shù)據(jù)庫中查找到該網(wǎng)址A對應的標簽有標簽1、標簽2和標簽3,則可以首先獲取到用戶網(wǎng)址列表中的網(wǎng)址以及目錄信息,然后針對上述各個標簽,進行以下處理:首先,針對標簽1,看用戶網(wǎng)址列表中是否存在標簽1對應的目錄,如果存在,再看該標簽1對應的目錄下除了網(wǎng)址A之外是否還存在其他網(wǎng)址,如果存在,則基于用戶網(wǎng)址列表中該標簽1對應的目錄下的所有網(wǎng)址,計算該標簽1在該用戶網(wǎng)址列表中的標注權重,否則,如果該標簽1對應的目錄下只有網(wǎng)址A,或者用戶網(wǎng)址列表中不存在標簽1對應的目錄,則直接將該網(wǎng)址A在該標簽1下的標注比例作為該標簽1在用戶網(wǎng)址列表中的標注權重。關于標簽2及標簽3也分別做同樣處理,最終,分別可以計算得到各個標簽在該用戶列表中的標注權重,然后,就可以根據(jù)各個標簽對應的標注權重對各個標簽進行排序。例如同樣對于指定網(wǎng)址A,通過查詢數(shù)據(jù)庫,其在標簽1下的標注比例為a1,在標簽2下的標注比例為a2,在標簽3下的標注比例為a3,且a1>a2>a3;在當前用戶的網(wǎng)址列表中,標簽a1對應的目錄及標簽a3對應的目錄下沒有其他的網(wǎng)址,標簽a2對應的目錄下除了網(wǎng)址A外還有網(wǎng)址B,則此時,標簽2在該用戶網(wǎng)址列表中的標注權重會因為網(wǎng)址B的存在而增高,最終計算出來的標簽2在該用戶網(wǎng)址列表中的標注權重可能會出現(xiàn)超過標簽1在該用戶網(wǎng)址列表中的標注權重的情況(此時,標簽1在該用戶網(wǎng)址列表中的標注權重等于網(wǎng)址A在該標簽1下的標注比例),從而使得標簽2能夠獲得較大的推薦幾率。下面以標簽1為例,介紹當用戶網(wǎng)址列表中該標簽1對應的目錄下的網(wǎng)址有多個時,如何計算該標簽1在用戶網(wǎng)址列表中的標注權重。首先,對于指定網(wǎng)址對應的標簽1,確定出在用戶的網(wǎng)址列表中,該標簽1對應的目錄下的網(wǎng)址有哪些,例如在用戶的網(wǎng)址列表中標簽1對應的目錄下有N個網(wǎng)址,則該標簽1在該網(wǎng)址列表中的標注權重為:這N個網(wǎng)址在該標簽1下的標注比例按照這N個網(wǎng)址從數(shù)據(jù)庫中讀取得到的標注總量進行加權之后的和。例如,假設這N個網(wǎng)址分別為網(wǎng)址A、B......N,其中,網(wǎng)址A在標簽1下的標注比例是w1,標注總量是u1;網(wǎng)址B在標簽1下標注比例是w2,標注總量是u2...網(wǎng)址N在標簽1下標注比例是wN,標注總量是uN,那么標簽1的在該用戶網(wǎng)址列表中的標注權重可以如公式(2)所示。N*(w1*u1+w2*u2+...+wN*uN)/(u1+u2+...+uN)(2)需要說明的是,在上述按照標注權重對標簽進行排序時,需要用到用戶的網(wǎng)址列表中的網(wǎng)址及其目錄信息。在實際應用中,如果是針對網(wǎng)址列表中的網(wǎng)址進行推薦,則即使不使用標注權重進行排序,在發(fā)起推薦請求時,也自然會攜帶上網(wǎng)址列表中包含的網(wǎng)址,因此,為了實現(xiàn)上述按照標注權重進行排序,只要再攜帶上網(wǎng)址列表中的目錄信息即可。而針對用戶當前正在向網(wǎng)址列表中添加的網(wǎng)址進行信息的推薦時,如果不需要利用標注權重進行排序,則僅需在請求中攜帶用戶當前正在添加的網(wǎng)址,因此,如果需要利用標注權重進行排序,還需要再攜帶上網(wǎng)址列表中的網(wǎng)址及目錄信息。另外,無論是根據(jù)標注比例還是標注權重對標簽進行排序,如果用戶在其網(wǎng)址列表中,已經(jīng)將指定網(wǎng)址標記為某標簽,則該標簽對于該用戶應該具有較高的權重。也就是說,如果在用戶網(wǎng)址列表的目錄中,指定網(wǎng)址已經(jīng)被標注為某標簽,則首先將該標簽的標注比例乘以某大于1的系數(shù)(例如1.5等),然后再與其他標簽的標注比例進行排序,或者計算標簽在用戶網(wǎng)址列表中的權重。一般而言,在向用戶進行網(wǎng)址推薦時,如果父子標簽都可以用于推薦,則推薦子標簽下的鏈接更為合適。因此,如果在數(shù)據(jù)庫中還保存了標簽父子鏈,則在根據(jù)某指定網(wǎng)址向用戶進行推薦其他網(wǎng)址時,在為該指定網(wǎng)址選擇了合適的標簽之后,可以首先判斷該標簽是否處于某標簽父子鏈中,如果是,并且該標簽在該標簽父子鏈中存在子標簽,則該子標簽也可以用于推薦,并且,可以將父標簽的標注權重加在子標簽的標注權重上,使得子標簽的標注權重增大。也就是說當父子標簽均可用于推薦的時候,可以將父標簽的標注權重疊加給子標簽,這樣子標簽就具有較高的標注權重,在排序時也比較占優(yōu)勢。例如,某標簽父子鏈為:團購->購物,如果針對某指定網(wǎng)址,“購物”是合適的標簽,則“團購”也可以用于推薦,并且,還可以將“購物”的標注權重加在“團購”的標注權重上,以便使得“團購”的標注權重升高,這樣可能會使得“團購”得到更多的推薦機會。需要說明的是,在使用本發(fā)明實施例提供的方法為某網(wǎng)址進行標簽推薦時,如果數(shù)據(jù)庫中不存在該網(wǎng)址,則可以通過其他方式來確定網(wǎng)址的標簽,例如,可以后臺加載網(wǎng)址,從而抓取該網(wǎng)址的頁面內(nèi)容進行分析,從而提取出能夠代表頁面內(nèi)容的中心詞,將該中心詞作為網(wǎng)址的標簽,并將其推薦給用戶,同時,還可以將該網(wǎng)址與該標簽之間的對應關系保存在數(shù)據(jù)庫中,以供為其他用戶推薦時使用。與本發(fā)明實施例提供的信息推薦方法相對應,本發(fā)明實施例還提供了一種信息推薦系統(tǒng),參見圖2,該系統(tǒng)包括:數(shù)據(jù)采集單元201,用于采集網(wǎng)址及其對應的標簽,所述標簽為對網(wǎng)頁內(nèi)容、主題和/或形式進行標注的文本;數(shù)據(jù)庫建立單元202,用于匯總采集到的數(shù)據(jù),以建立數(shù)據(jù)庫,所述數(shù)據(jù)庫中包括網(wǎng)址與標簽之間的對應關系以及同一網(wǎng)址在對應的各個標簽下的標注分布信息;查詢單元203,用于在接收到為指定網(wǎng)址進行信息推薦的請求時,在所述數(shù)據(jù)庫中查詢所述指定網(wǎng)址對應的標簽以及所述指定網(wǎng)址在對應的各個標簽下的標注分布信息;推薦單元204,用于根據(jù)所述標注分布信息進行標簽選擇,根據(jù)所選中的標簽在所述數(shù)據(jù)庫中對應的其他網(wǎng)址,向用戶進行網(wǎng)址推薦。其中,所述同一網(wǎng)址在對應的各個標簽下的標注分布信息包括:同一網(wǎng)址在對應的各個標簽下的標注比例,其中,某網(wǎng)址在某標簽下的標注比例為:在所述采集到的數(shù)據(jù)中,該網(wǎng)址被標注為該標簽的次數(shù)與該網(wǎng)址該標注的總次數(shù)之比;具體實現(xiàn)時,當需要進行標簽選擇時,通過以下單元完成:標簽選擇單元,用于根據(jù)所述指定網(wǎng)址在對應的各個標簽下的標注比例,為所述指定網(wǎng)址選擇標簽。具體的,所述標簽選擇單元可以包括:第一排序子單元,用于按照所述指定網(wǎng)址在對應的各個標簽下的標注比例的大小,分別對所述指定網(wǎng)址對應的各個標簽進行排序;第一選擇子單元,用于根據(jù)排序的結果,為所述指定網(wǎng)址選擇標簽?;蛘?,所述標簽選擇單元也可以包括:權重計算子單元,用于計算所述指定網(wǎng)址對應的各個標簽在該用戶的網(wǎng)址列表中的標注權重,其中,對于某標簽,通過以下方式計算其在該用戶的網(wǎng)址列表中的標注權重:獲取該標簽在該用戶的網(wǎng)址列表中對應的全部網(wǎng)址,根據(jù)這些網(wǎng)址分別在該標簽下的標注比例及所述這些網(wǎng)址各自在所述數(shù)據(jù)庫中的標注量,計算該標簽在該用戶的網(wǎng)址列表中的標注權重;第二排序子單元,用于根據(jù)所述指定網(wǎng)址對應的各個標簽在該用戶的網(wǎng)址列表中的標注權重,分別對所述指定網(wǎng)址各自對應的各個標簽進行排序;第二選擇子單元,用于根據(jù)排序的結果,為所述指定網(wǎng)址選擇標簽。在實際應用中,當用戶的網(wǎng)址列表中包含多個目錄,網(wǎng)址列表中具有同一標簽的網(wǎng)址位于同一目錄下時,該系統(tǒng)中還可以包括:目錄信息獲取單元,用于獲取用戶的網(wǎng)址列表中的目錄信息;調整單元,用于如果用戶的網(wǎng)址列表中存在某標簽對應的目錄,則對該標簽進行加權調整。其中,所述指定網(wǎng)址可以是指用戶的網(wǎng)址列表中的網(wǎng)址,相應的,查詢單元203可以包括:第一查詢子單元,用于在接收到攜帶有用戶網(wǎng)址列表中的網(wǎng)址的請求時,在所述數(shù)據(jù)庫中分別查詢所述請求中攜帶的各個網(wǎng)址對應的標簽以及所述請求中攜帶的各個網(wǎng)址在對應的各個標簽下的標注分布信息。其中,當網(wǎng)址列表中包含多個目錄,網(wǎng)址列表中具有同一標簽的網(wǎng)址位于同一目錄下時,該系統(tǒng)還可以包括:第一用戶數(shù)據(jù)獲取單元,用于獲取用戶的網(wǎng)址列表中的目錄信息;第一查找單元,用于在所述目錄信息中查找與所選中的標簽對應的目錄;第一添加單元,用于如果查找到,將所述網(wǎng)址列表中的網(wǎng)址整理到所選中的標簽對應的目錄中;第一創(chuàng)建及添加單元,用于如果未查找到,或者用戶的網(wǎng)址列表中不存在目錄信息,則在所述用戶的網(wǎng)址列表中創(chuàng)建與所選中的標簽對應的目錄,并將所述網(wǎng)址列表中的網(wǎng)址整理到到所述創(chuàng)建的目錄中。在實際應用中,所述指定網(wǎng)址也可以包括用戶正在向網(wǎng)址列表中添加的網(wǎng)址,此時,查詢單元203包括:第二查詢子單元,用于在接收到攜帶有用戶正在向網(wǎng)址列表中添加的網(wǎng)址的請求時,在所述數(shù)據(jù)庫中查詢所述請求中攜帶的網(wǎng)址對應的標簽以及所述請求中攜帶的網(wǎng)址在對應的各個標簽下的標注分布信息。類似的,當用戶的網(wǎng)址列表中包含多個目錄,網(wǎng)址列表中具有同一標簽的網(wǎng)址位于同一目錄下時,該系統(tǒng)還可以包括:第二用戶數(shù)據(jù)獲取單元,用于獲取用戶的網(wǎng)址列表中的目錄信息;第二查找單元,用于在所述目錄信息中查找與所選中的標簽對應的目錄;第二添加單元,用于如果查找到,將所述用戶正在向網(wǎng)址列表中添加的網(wǎng)址添加到與所選中的標簽對應的目錄中;第二創(chuàng)建及添加單元,用于如果未查找到,或者用戶的網(wǎng)址列表中不存在目錄信息,則在所述用戶的網(wǎng)址列表中創(chuàng)建與所選中的標簽對應的目錄,并將所述用戶正在向網(wǎng)址列表中添加的網(wǎng)址添加到所述創(chuàng)建的目錄中。另外,在實際應用中,該系統(tǒng)還可以包括:標簽推薦單元,用于將所述所選中的標簽推薦給用戶。所述數(shù)據(jù)采集單元還用于采集標簽之間的父子關系,所述數(shù)據(jù)庫建立單元還用于將所有的父子關系進行匯總,組成標簽父子鏈;所述系統(tǒng)還包括:標簽增加單元,用于在根據(jù)指定網(wǎng)址對應的標簽為用戶推薦網(wǎng)址時,判斷指定網(wǎng)址對應的標簽是否處于標簽父子鏈中,如果是,將指定網(wǎng)址對應的標簽的子標簽加入到推薦網(wǎng)址所依據(jù)的標簽中進行網(wǎng)址的推薦。通過以上的實施方式的描述可知,本領域的技術人員可以清楚地了解到本發(fā)明可借助軟件加必需的通用硬件平臺的方式來實現(xiàn)。基于這樣的理解,本發(fā)明的技術方案本質上或者說對現(xiàn)有技術做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品可以存儲在存儲介質中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網(wǎng)絡設備等)執(zhí)行本發(fā)明各個實施例或者實施例的某些部分所述的方法。本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于裝置或系統(tǒng)實施例而言,由于其基本相似于方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。以上所描述的裝置及系統(tǒng)實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡單元上。可以根據(jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領域普通技術人員在不付出創(chuàng)造性勞動的情況下,即可以理解并實施。以上對本發(fā)明所提供的一種信息推薦方法及系統(tǒng),進行了詳細介紹,本文中應用了具體個例對本發(fā)明的原理及實施方式進行了闡述,以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領域的一般技術人員,依據(jù)本發(fā)明的思想,在具體實施方式及應用范圍上均會有改變之處。綜上所述,本說明書內(nèi)容不應理解為對本發(fā)明的限制。
      當前第1頁1 2 3 
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1