国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      對信息項進行搜索的方法和系統(tǒng)的制作方法

      文檔序號:6470018閱讀:159來源:國知局
      專利名稱:對信息項進行搜索的方法和系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明總體上涉及對信息項的搜索,更具體地,本發(fā)明涉及對 對象評估進行搜索的方法及相關(guān)系統(tǒng)和計算機程序產(chǎn)品。
      背景技術(shù)
      隨著計算機技術(shù)及網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,大量的信息通過計算 機網(wǎng)絡(luò)傳輸?;ヂ?lián)網(wǎng)的普及導(dǎo)致信息共享技術(shù)飛速地增長,互聯(lián)網(wǎng) 也越來越滲透到人們的生活中,人們在互聯(lián)網(wǎng)上共享信息的同時, 也面臨如何從如此龐大的信息量中有效地檢索出自己所需的信息。
      目前所廣泛使用的搜索引擎即旨在于協(xié)助用戶從大量信息中進 行檢索,以使得用戶可以方便、快捷地查找和檢索其所需的各種信 息。由于互聯(lián)網(wǎng)上信息內(nèi)容的數(shù)量和類型眾多,因此搜索引擎所搜 索到的結(jié)果數(shù)目也不少,有益的是通過對搜索結(jié)果進行排序,使得 最相關(guān)、最重要的結(jié)果排在最前面,以便用戶能夠更快速地獲取信 息。因此,對各種搜索引擎技術(shù)的改進和優(yōu)化,都直接反應(yīng)到對搜 索結(jié)果的排序上。
      互聯(lián)網(wǎng)上信息內(nèi)容的類型豐富,其中隨著web使用率的提高以 及電子商務(wù)的快速擴展,越來越多的人在web上查找與各種產(chǎn)品(諸 如服裝、電子產(chǎn)品等)相關(guān)聯(lián)的信息或者與各種服務(wù)(例如餐飲、 住宿、旅游等服務(wù)項目)相關(guān)聯(lián)的信息。這些信息通常包括一些已 經(jīng)使用或者購買這些產(chǎn)品或服務(wù)的用戶對它們的評價和意見,這些 評價和意見對于潛在的客戶、產(chǎn)品制造商和在線商家實際上都是非 常有用的。如何對這些搜索得到或者從相應(yīng)的數(shù)據(jù)存儲中直接獲取 的信息項目按照一定順序排序、以更有效的方式顯示給用戶,是信 息檢索領(lǐng)域的一個難題。目前較為常見的方法是對用戶的評價和意見根據(jù)時間進行排序,也即將時間最近的評價放置在最上面,越往 下則時間越早。但是,這種按照時間排序的方法無法體現(xiàn)各種評價 的重要性,也即無法有效地幫助用戶獲得期望的信息。
      圖1示意性地示出了現(xiàn)有技術(shù)中對用戶評價的搜索結(jié)果進行顯
      示的屏幕截圖。從圖1中可以看出,總共有473條用戶評價,其中 根據(jù)各條評價對特定產(chǎn)品或服務(wù)給出的星級評分(包括1星、2
      星.....5星)用柱狀圖直觀顯示了各個星級評分的用戶評價數(shù)目,
      并且在柱狀圖的右側(cè)通過括號內(nèi)的數(shù)字給出了具體的評價數(shù)目。此 外,還給出了平均的用戶評價。在圖1的下半部分顯示了"最有用的 用戶評價",從圖中可以看出,759人中有716人認為其下所列的評 價很有用。
      上述現(xiàn)有技術(shù)是通過從用戶獲取反饋信息來對各種評價和意見 進行分級評定,從而提供這種"最有用的用戶評價"的顯示。圖2示 意性地示出了現(xiàn)有技術(shù)中采集用戶反饋信息的屏幕截圖。例如在用 戶閱讀完其他用戶給出的評價或意見之后,可以要求用戶對該評價 或意見進行打分或評級,從而為該評價或者意見獲得一個分值。在 圖2中,簡單地通過兩個按鈕"Yes"和"No"由用戶點擊來選擇該評價 是否對其有用。基于對這些用戶反饋信息的統(tǒng)計,可以對評價或者 意見進行打分排序,將分值最高的排在最前面,分值低的排在后面。 但是上述方法至少存在以下缺陷其需要人工參與打分或評級,并 且其準確性基本上取決于用戶反饋的回復(fù)率。而這對于目前閱讀者 多、反饋回復(fù)者少的網(wǎng)絡(luò)現(xiàn)狀來說,是很難進行有效地統(tǒng)計的。
      因此,需要一種對此類信息項進行有效地搜索、對搜索結(jié)果進 行排序但不需要用戶反饋的方法,使得將對用戶最重要、最有價值 的信息項排在最前面,從而幫助用戶更為直接快速有效的獲得產(chǎn)品
      或服務(wù)的信息,也即從少量的信息項就可以獲取盡可能多的有用信 自,
      發(fā)明內(nèi)容因此,為了克服現(xiàn)有技術(shù)中存在的不足,本發(fā)明提供了一種對 信息項進行搜索的方法以及相關(guān)系統(tǒng)和計算機程序產(chǎn)品,其特別地 適合于對產(chǎn)品或服務(wù)的各種評估進行搜索的方法。
      根據(jù)本發(fā)明的一個方面,提供一種對信息項進行搜索的方法,包
      括接收對對象的查詢;基于該查詢,搜索與所述對象相關(guān)的信息 項以獲取對象的信息項集合,其中每個信息項與 一個用戶相關(guān)聯(lián); 提取該信息項集合中每個關(guān)聯(lián)的用戶的歷史信息項記錄;基于所有 用戶的歷史信息項記錄,計算每個用戶針對所述對象的有效性權(quán)重; 基于該有效性權(quán)重,對所述對象的信息項集合中的所有信息項進行 排序;以及將排序的信息項作為搜索結(jié)果進行輸出。
      根據(jù)本發(fā)明的另一方面,提供一種對信息項進行搜索的系統(tǒng),包 括接收組件,接收對對象的查詢;搜索組件,基于該查詢,搜索 與所述對象相關(guān)的信息項以獲取對象的信息項集合,其中每個信息 項與一個用戶相關(guān)聯(lián);提取組件,提取該信息項集合中每個關(guān)聯(lián)的 用戶的歷史信息項記錄;有效性權(quán)重計算組件,基于所有用戶的歷 史信息項記錄,計算每個用戶針對所述對象的有效性權(quán)重;排序組 件,基于該有效性權(quán)重,對所述對象的信息項集合中的所有信息項 進行排序;以及輸出組件,將排序的信息項作為搜索結(jié)果進行輸出。
      根據(jù)本發(fā)明的另 一方面,還提供一種包含用于執(zhí)行根據(jù)本發(fā)明 的方法的計算機程序代碼的計算機程序產(chǎn)品。
      利用本發(fā)明,用戶在對產(chǎn)品或者服務(wù)進行搜索時,對其最有價 值、可靠性最高的信息項通常排在信息項目列表的較靠前的位置。
      進 一 步地,本發(fā)明的搜索排序方法可以針對數(shù)據(jù)庫或數(shù)據(jù)存儲 中的信息項單獨使用,也可以與任何已有的搜索引擎結(jié)合使用,優(yōu) 化對其搜索結(jié)果的顯示。


      參考以下結(jié)合附圖的詳細說明后,本發(fā)明的特征、優(yōu)點以及其 它方面將變得更加明顯,其中在附圖中圖i示出了現(xiàn)有技術(shù)中對用戶評價的搜索結(jié)果進行顯示的屏幕截圖2示出了現(xiàn)有技術(shù)中采集用戶反饋信息的屏幕截圖3示出了根據(jù)本發(fā)明的方法的流程圖4示出了根據(jù)本發(fā)明的系統(tǒng)的架構(gòu)圖;以及
      圖5示出了可以實現(xiàn)本發(fā)明的計算機系統(tǒng)。
      請注意,在全部附圖中,若存在的話,相同的參考標記表示相同的部件。
      具體實施例方式
      在以下的詳細描述中,為了便于全面理解本發(fā)明,通過示例的方式 說明了許多特定的細節(jié)。不過本領(lǐng)域技術(shù)人員可以很清楚,本發(fā)明也可 以不需要這些細節(jié)就能實現(xiàn)。此外,為了更加清楚地解釋本發(fā)明,在某 些示例中,公知的方法、處理、元件和電路僅僅是進行了概括性地描述, 而沒有詳細說明。以下結(jié)合附圖對本發(fā)明進行更詳細的解釋和說明。應(yīng) 當理解,本發(fā)明的附圖及實施例僅用于示例性作用,不是用于限制本發(fā) 明的保護范圍。
      本發(fā)明涉及對各種對象的信息項進行搜索和排序。其中,"對象" 可以包括各種有形的或者無形的產(chǎn)品、產(chǎn)品特征和/或服務(wù),包括但不 限于,例如服裝、數(shù)碼產(chǎn)品、酒店、餐飲、旅游等等??梢葬槍λ羞@ 些對象給出相關(guān)的評價,這些對象的信息項例如可以是使用過或購買過 此類產(chǎn)品或服務(wù)的用戶對它們的評價或意見。
      以下將通過具體實例來描述本發(fā)明的方法和系統(tǒng),其中在該實例 中,我們以對各種產(chǎn)品或服務(wù)的評價或意見作為信息項的示例。但是, 本領(lǐng)域技術(shù)人員可以理解,本發(fā)明不限于此,而是可以應(yīng)用在對通過任 何途徑搜索獲取的各種信息項的排序方法中。
      在現(xiàn)有的各種電子購物網(wǎng)站中,對于一項產(chǎn)品或服務(wù),通常會 提供有使用/購買過該產(chǎn)品或享受過該服務(wù)的用戶對此產(chǎn)品或服務(wù) 的評價信息,這些信息可以幫助用戶判斷是否適合選擇該產(chǎn)品或服 務(wù)。但是,隨著評價信息數(shù)量的增長,尤其在需整合不同來源的評 價信息的情況下,對于一項產(chǎn)品或服務(wù)的評價信息的數(shù)量可以達到 成百上千。這樣數(shù)量的評價信息對于用戶來說是很難一一閱讀的。為 此,用戶希望能快速而有效地獲得最有參考價值和客觀的評價信息。那么,對于用戶來說最有參考價值和最有效的評價應(yīng)該是來自對所述 對象有著較為豐富的使用經(jīng)驗或體驗的用戶所發(fā)表的評價信息,而 不是專業(yè)寫手或缺乏使用經(jīng)驗的用戶發(fā)表的評價信息。而用戶對所 述對象的使用經(jīng)驗和評價客觀性可以通過分析用戶歷史對此類對象 的評價信息獲得。
      由此可知,評價者的歷史評價對于分析該評價者的評估標準是 非常有用的。可以通過對特定用戶的歷史評價進行分析,從而提供 對其給出的針對特定對象的評價的盡可能準確的評估。
      在分析評價者的歷史評價時,我們考慮要克服以下幾個問題, 即如何判斷評價者給出的評價是否客觀,如果一個評價者一直都是 正面的意見或者一直都是負面的意見,則該評價者的意見是否有價 值?以及如何識別該評價者是否是商家所雇傭的寫手?
      針對上述問題,我們?yōu)榻o出各種對象的信息項(或者評價)的 用戶分配一個有效性權(quán)重,在該有效性斥又重中反映該對象的信息項 的有效性。將用戶對對象的評價按照用戶的有效性權(quán)重進行排序, 從而將最有價值的信息項放置在最前面,使得用戶可以快速有效地 獲取有用信 息o
      由于進行評價的對象覆蓋面廣泛,因此需要對所評價的對象進 行分類,以便更有組織地、更合理地分配用戶的有效性權(quán)重。在已 有的購物網(wǎng)站或網(wǎng)上商城中,通常已經(jīng)存在對產(chǎn)品或服務(wù)的分類, 例如,粗略地可以分為服飾、鞋包、數(shù)碼產(chǎn)品、圖書音像、家居用 品、食品、酒店等等類別。各種產(chǎn)品或服務(wù)的信息項就與其相應(yīng)的 類別相關(guān)聯(lián)。上述類別的劃分可以根據(jù)所提供的產(chǎn)品或服務(wù)的數(shù)量、 類型等進行合理地分配、靈活設(shè)置。上述類別可以預(yù)先設(shè)定好,也 可以在之后進行調(diào)整,例如在某類產(chǎn)品的型號、品牌等增多時,可 以對該類再進行細分,或者在產(chǎn)品數(shù)目變少時,合并某些類別。
      為了解決前面提到的現(xiàn)實中可能存在的問題,本發(fā)明提出的評
      價者的有效性權(quán)重中至少包括三個因子該評價者評價過的對象類 別數(shù)目占總的對象類別數(shù)目的比例;該評價者對每個評論過的對象
      9類別的評價與整體評價的情感傾向 一致度;該評價者的評價在所有
      評價中所占的比重。
      評價者的有效性權(quán)重是這三個因子的函數(shù)關(guān)系。在一種實施方
      式中,某一評價者Ri對特定對象類別Oj的有效性權(quán)重A (Ri, Oj)
      由類別比例Reateg。ry、情感傾向一致度C011senti和評價比重Rc。匪ent這
      三個因子的連乘表示,也即
      A ( Rl, Oj ) —Rcategory*ConSenti*Rcomment C l)
      本領(lǐng)域技術(shù)人員可以理解,還可以使用其他的函數(shù)關(guān)系來表示 該有效性權(quán)重,諸如三個因子的線性組合等。
      類別比例Reateg。ry表示特定評價者Ri所評價過的對象類別的數(shù)目 在總的對象類別數(shù)目中所占的比例。從其定義上可以直觀地得到其 計算方法,即
      Rcategwy=Ri所評價過的對象類別的數(shù)目/總的對象類別的數(shù)目(2 ) 類別比例Reate,y因子能夠有效地屏蔽掉商家所雇傭的寫手。這 是因為,通常商家所雇傭的寫手往往只針對一種或者少數(shù)幾種類別 的對象(產(chǎn)品或服務(wù))進行評價,由于其評價過的對象類別的數(shù)目 較少,因此,在所有對象類別中所占據(jù)的比例也較小,從而可以通 過類別比例因子反映在該評價者的有效性權(quán)重中。
      情感傾向一致度Consenu表示特定評價者對每個評論過的對象類
      別的評價與整體評價的情感傾向一致性。在分析評價者對每個評價 對象類別的情感傾向時,應(yīng)用自然語言處理進行分析,并將其表示
      為情感傾向矢量SentiV(Ri)。隨著計算機和互聯(lián)網(wǎng)的廣泛應(yīng)用, 計算機可處理的自然語言文本數(shù)量空前增長,自然語言處理技術(shù)在 針對海量信息的文本挖掘、信息提取、人機交互等應(yīng)用中發(fā)揮著重 要的作用。自然語言處理從語法和語義兩個層面入手,從文本中抽 取相應(yīng)的內(nèi)容進行詞義和句義的分析,挖掘評價者所表達的意見。 可選地,可以將評價者的意見賦予一定的數(shù)值,例如從-5到5的數(shù) 值。很明顯,本領(lǐng)域技術(shù)人員可以理解,也可以取其他范圍的數(shù)值 來表示。其中情感傾向矢量的各個元素即為該評價者Ri對各個對象類別的評價意見數(shù)值。
      針對前面提到的有的評價者可能出于惡意或者不負責任地做出 評價,始終給出正面的或者負面的評價,這種評價基本上沒有價值。 因此,通過將特定評價者的評價與整體評價的情感傾向進行比較, 可以有效地抑制上述現(xiàn)象。整體評價的情感傾向也由情感傾向矢量
      SentiV (all)來表示。SentiV (all)可以是一個統(tǒng)計值,例如,舍棄 極端值之后的平均值,或者只抽取一定數(shù)量的樣本之后的均值。在 一種實施方式中,整體評價的情感傾向矢量SentiV (all)由所有評 價者的情感傾向矢量的均值來表示。
      在一種實施方式中,評價者Ri的情感傾向一致度Con,ti計算為 該評價者Ri的情感傾向矢量與整體評價的情感傾向矢量的內(nèi)積,即
      Consentl= SentiV ( Ri) SentiV ( all) ( 3 ) 很明顯,如果評價者Ri對各個對象類別的意見與大部分評價者的意 見都是一致的,則情感傾向一致度Conse^的值也較高。如果對于各 個對象類別,評價者Ri的意見總是為正(分值很高)或者總是為負 (分值很低),則在與整體評價的情感傾向進行比較,也即計算內(nèi) 積之后,其數(shù)值也不大,從而可以通過情感傾向一致度Consent,因子 反映在該評價者Ri的有效性權(quán)重中。
      評價比重Rc。m ment表示特定評價者的評價在所有評價中所占的比 重。在一種實施方式中,評價比重由兩部分組成,評〗介者Ri對所述 評價對象所屬對象類另'J的評價數(shù)目占該評價者對所有對象類另'J的評 價數(shù)目的比重;以及該評價者對所述評價對象所屬對象類別的評價 數(shù)目占所有評價者對所述評價對象所屬對象類別的評價數(shù)目的比 重。在一種實施方式中,可以通過下面的公式計算評價比重Rc。mment:
      Ri對Oj類別的評價數(shù)目 Ri對Oj類別的評價數(shù)目 (4)
      畫men ^對所有類別的評價數(shù)目+ 2所有評價者對Oj類別的評價數(shù)目
      其中,系數(shù)、和人2是用來平衡這兩部分在評價比重R comment 中所占 的比重,其可以根據(jù)經(jīng)驗來調(diào)整?W和人2的取值。從上述公式可以看出,通過將評價者Ri對Oj類別做出過的評價數(shù)目與其自身對所有 對象類別的評價數(shù)目相比以及與所有評價者對Oj類別的評價數(shù)目相 比,可以判斷該評價者Ri是否側(cè)重于某個對象類別,也即是否是該 對象類別領(lǐng)域的權(quán)威人士。在Ri針對Oj對象類別的評價比重Rc。mment 高時,就意味著Ri對Oj的評價更具有價值,反映在有效性權(quán)重上 其能增加有效性權(quán)重的數(shù)值。
      在上文中描述了在一種應(yīng)用中本發(fā)明的實施方式的與信息項相 關(guān)的有效性權(quán)重,基于該有效性權(quán)重,可以對搜索到的信息項進行 排序,從而有效性權(quán)重高的信息項排在前面,有效性權(quán)重低的信息 項排在后面,使得用戶只需要瀏覽少量的信息,就可以快速獲得所 期望的有用的信息。
      下面參考圖3描述根據(jù)本發(fā)明實施方式的對對象的信息項進行 搜索的方法流程。在該流程中,仍然以對諸如各種產(chǎn)品或服務(wù)的對 象的評價或意見作為信息項的示例進行說明。
      如圖3所示,在步驟S300中,開始該處理流程。 在步驟S302中,接收用戶對評價對象Oj的查詢。 在步驟S304中,基于用戶的查詢,搜索與評價對象Oj相關(guān)的 信息項以獲取該評價對象的信息項集合,其中每個信息項與 一個用 戶相關(guān)聯(lián),也即每個信息項是由與之相關(guān)聯(lián)的用戶生成的,該用戶 也稱為評價者。在一種實施方式中,例如,當與搜索引擎結(jié)合使用 時,根據(jù)步驟S302中用戶輸入的評價對象查詢,從各個數(shù)據(jù)庫中基 于關(guān)鍵詞搜索與該評價對象相關(guān)聯(lián)的信息項,也即對該評價對象的 評價或意見,從而得到對象Oj的信息項集合。從這些評價或意見中 可以獲得生成該評價或意見的用戶(即評價者)的ID,從而形成該 評價對象的評價者集合。在另一種實施方式中,當各種對象已經(jīng)按 照前面描述的方式進行了分類時,在數(shù)據(jù)存儲中各個對象的評價可 以與其所屬的類別相關(guān)聯(lián),也即通過類別對對象評價進行索引,從
      而可以快速搜索出所查詢對象的信息項集合和評價者集合。
      在步驟S306中,提取信息項集合中每個關(guān)聯(lián)的用戶的歷史信息項記錄,也即提取評價者集合中每個評價者的歷史評價記錄。例如, 根據(jù)評價者的ID,檢索該評價者所有曾經(jīng)給出過的評價記錄。
      在以下的步驟中,將計算每個評價者Ri針對所查詢的評價對象 Oj的有效性權(quán)重。
      在步驟S308中,識別評價者Ri所評價過的所有對象的類別, 統(tǒng)計對象類別的數(shù)目。該結(jié)果可以應(yīng)用在隨后的計算有效性權(quán)重中 的類別比例因子中。
      在步驟S310中,計算評價者Ri針對所查詢的評價對象Oj的有 效性權(quán)重。從上文描述中可知,本發(fā)明實施方式的有效性權(quán)重至少 包括三個因子類別比例Reateg。ry,評價者Ri評價過的對象類別數(shù)目 占總的對象類別數(shù)目的比例;情感傾向一致度Consenti,評價者Ri對 每個評論過的對象類別的評價與整體評價的情感傾向一致度;評價 比重R—,評價者Ri的評價在所有評價中所占的比重。在該步驟 中,根據(jù)前面給出的公式,分別計算這三個因子,然后例如將三個 因子連乘以得到有效性權(quán)重的值。
      其中,類別比例Rcateg。ry的計算為使用在步驟S308中獲得的 Ri所評價過的對象類別的數(shù)目除以總的類別數(shù)目,該總的類別數(shù)目 可以是在前文所描述的對所有對象進行分類的時候確定的。
      情感傾向一致度Consenti的計算涉及首先應(yīng)用自然語言處理技 術(shù)分析評價者對各個對象類別的評價中的情感傾向,例如賦予一定 數(shù)值表示其情感傾向的程度。在一個實施方式中,正面的評價例如 以1到5的數(shù)值表示,負面的評價例如以-5到-1的數(shù)值表示,0表 示中立。然后,對于每個評價者Ri,建立該評價者Ri的情感傾向矢 量SentiV(Ri)。 一般說來,評價者Ri的情感傾向矢量的維數(shù)是Ri 所評價過的對象類別的數(shù)目,每個元素即為該評價者Ri對相應(yīng)的對 象類別的評價意見數(shù)值。由于各個評價者不一定會對所有的對象類 另'J都進行評價,因此這樣使得各自的情感傾向矢量的維數(shù)不對應(yīng)。 為了在形式上統(tǒng)一這些矢量以及之后的計算方便,將所有的情感傾 向矢量的維數(shù)都統(tǒng)一為總的對象類別的數(shù)目,對于評價者Ri未做出任何評價的對象類別,其相應(yīng)的元素值為O。接著,在得到了所有評 價者的情感傾向矢量之后,在一種實施方式中,可以對所有這些矢
      量求平均,以得到整體評價的情感傾向矢量SentiV (all)。很明顯, 本領(lǐng)域技術(shù)人員可以理解還可以采用其他的計算方式才艮據(jù)所有評價 者的情感傾向矢量求解整體評價的情感傾向矢量。最后,將評價者 Ri的情感傾向矢量SentiV ( Ri)與整體評價的情感傾向矢量SentiV
      (all)進行內(nèi)積,以得到評價者Ri的情感傾向一致度CO!lsenti。
      評價比重的計算Rc。mment包括計算評價者Ri對評價對象Oj的 類別的評價數(shù)目占該評價者Ri對所有對象類別的評價數(shù)目的比重; 以及計算評價者Ri對評價對象Oj的類別的評價數(shù)目占所有評價者 對評價對象Oj的類別的評價數(shù)目的比重。其中,評價者Ri對所有 對象類別的評價數(shù)目,基本上就是該評價者Ri所給出過的所有評價 的數(shù)目。所有評價者對評價對象Oj的類別的評價數(shù)目是上面提到的 在步驟S304中獲取的評價者集合中的所有評價者對評價對象Oj的 類別的評價數(shù)目,其基本上是對象Oj的類別的所有評價數(shù)目。然后, 根據(jù)前述公式(4)計算評價比重Rc。mment,經(jīng)驗系數(shù)、和人2可以平
      衡這兩部分結(jié)果在評價比重Rc。mment中所占的比重。
      在計算得到上述三個因子之后,就可以獲得評價者Ri對對象Oj 的有效性權(quán)重。
      接著,在步驟S312中,判斷是否所有的評價者的有效性權(quán)重都 已經(jīng)計算完畢。
      如果判斷結(jié)果為"否",則處理返回到步驟S308,繼續(xù)對下一個 評價者進行計算,并繼續(xù)執(zhí)行以后的步驟。
      如果判斷結(jié)果為"是",則處理前進到步驟S314。
      在步驟S314中,將所選評價對象Oj的所有評價基于各個評價 者的有效性權(quán)重進行排序,其中有效性權(quán)重高的評價具有較靠前的 位置。通過考慮評價者針對特定評價對象的有效性權(quán)重,能夠獲得 更好的排序效果。
      最后,在步驟S316中,將經(jīng)過排序的信息項作為搜索結(jié)果進行輸出。在一種實施方式中,例如可以在顯示屏上將搜索結(jié)果呈現(xiàn)給 用戶,其中例如可以只顯示排序后的前10-50條信息項,以便于用戶 瀏覽。本領(lǐng)域技術(shù)人員可以理解,也可以采用各種各樣的圖形信息 來呈現(xiàn)給用戶。
      可選地,本發(fā)明的對搜索結(jié)果的排序除了考慮評價者的有效性 權(quán)重,還可以進一步考慮其他因素,例如給出評價的時間。對于某 些類別的對象(產(chǎn)品或服務(wù)),較早給出的評價可能對于當前評估 對象價值不大,因此其在排序時的位置較靠后。
      圖4示意性地示出了實現(xiàn)根據(jù)本發(fā)明一個實施方式的搜索方法 的系統(tǒng)示意框圖。其中,參考標號400表示根據(jù)本發(fā)明實施方式的 搜索系統(tǒng),在該搜索系統(tǒng)400中包括接收組件401、搜索組件402、 提取組件404、有效性權(quán)重計算組件406、排序組件408以及輸出組 件409。其中,在圖4中還示出了數(shù)據(jù)存儲庫410,該數(shù)據(jù)存儲庫410 可以包含在排序系統(tǒng)400之中,也可以作為其外部的獨立部件,甚 至該數(shù)據(jù)存儲庫410還可以以分布式分布在計算機網(wǎng)絡(luò)中。
      如圖4所示,接收組件401例如從用戶接收對對象的查詢。搜 索組件402基于接收的查詢,例如從數(shù)據(jù)存儲庫410中搜索與所查 詢的對象相關(guān)的信息項,以獲取所查詢對象的信息項集合,其中每 個信息項與一個用戶相關(guān)聯(lián)。搜索組件402還從獲取的信息項集合 中搜索所有的相關(guān)聯(lián)用戶,形成用戶集合。提取組件404繼而為該 用戶集合中的每個用戶提取各自的歷史信息項記錄,例如也從數(shù)據(jù) 存儲庫410中獲取這些歷史信息項記錄。接著,有效性權(quán)重計算組 件406計算各個用戶對特定對象的有效性權(quán)重。然后,基于所計算 的有效性權(quán)重,由排序組件408對該特定對象的信息項集合中的所 有信息項進行排序,其中,有效性權(quán)重高的信息項排列在較靠前的 位置,從而獲得改善的排序效果。最后,將經(jīng)過排序的信息項作為 搜索結(jié)果由輸出組件409輸出,例如通過顯示屏呈現(xiàn)給用戶。
      在本發(fā)明的一種應(yīng)用中,例如,對象的信息項是用戶對該對象 的評價或意見。在這種應(yīng)用中,有效性片又重計算組件406可以至少
      15包括以下子組件類別比例計算組件412、情感傾向一致度計算組件 414、評價比重計算組件416、函數(shù)組件418以及識別組件420。
      其中,類別比例計算組件412、情感傾向一致度計算組件414以 及評價比重計算組件416分別按照前面所描述的方法計算相應(yīng)的因 子。在情感傾向一致度計算組件414中還包括自然語言處理組件(未 示出),此自然語言處理組件可以根據(jù)語法和語義分析各個信息項 中表達的情感傾向性,并將其表示為情感傾向矢量。
      識別組件420識別對象所屬的類別,也即識別由提取組件404 提取的歷史信息項記錄中各個對象的類別,從而統(tǒng)計出相關(guān)的對象 類別的數(shù)目或相關(guān)類別的評價數(shù)目,以用于后續(xù)的使用或計算。例 如,在類別比例計算組件412中用于計算評價者Ri評價過的對象類 別數(shù)目占總的對象類別數(shù)目的比例;在情感傾向一致度計算組件414 中,可以使用識別組件420來識別各個信息項中的對象類別以協(xié)助 建立情感傾向矢量;以及在評價比重計算組件416中用于計算評價 者Ri對評價者對象Oj的類別的評價數(shù)目等等。
      函數(shù)組件418接收類別比例計算組件412、情感傾向一致度計算 組件414和評價比重計算組件416的計算結(jié)果,根據(jù)函數(shù)關(guān)系計算 有效性權(quán)重。在一種實施方式中,函數(shù)組件例如可以是乘法器,其 將接收到的三個結(jié)果(即類別比例、情感傾向度和評價比重)相乘, 以得到有效性權(quán)重。在可選的實施方式中,函數(shù)組件還可以是加法 器或者加法器與乘法器的結(jié)合或者任意合適的函數(shù)關(guān)系計算組件。
      在可選的實施方式中,排序組件408還可以有其他輸入,例如 各個信息項生成的時間,從而排序組件408可以進一步根據(jù)生成時 間對信息項進行排序。
      圖4僅示出了能夠?qū)崿F(xiàn)本發(fā)明的一種排序系統(tǒng)的示例。本領(lǐng)域 技術(shù)人員可以理解,在各組件/模塊的具體實現(xiàn)上,尤其是通過軟件 實現(xiàn)各個模塊功能時,可以存在多種可選方案。例如,可以將所示 的搜索組件402和提取組件404合并到同一模塊中。
      下面,將參考圖5來描述可以實現(xiàn)本發(fā)明的計算機系統(tǒng)。圖5示意性示出了可以實現(xiàn)根據(jù)本發(fā)明的實施方式的計算機系統(tǒng)的結(jié)構(gòu)
      方框圖。
      圖5中所示的計算機系統(tǒng)包括CPU (中央處理單元)501、 RAM (隨機存取存儲器)502、 ROM (只讀存儲器)503、系統(tǒng)總線504、 硬盤控制器505、鍵盤控制器506、串行接口控制器507、并行接口 控制器508、顯示器控制器509、硬盤510、鍵盤511、串行外部設(shè) 備512、并行外部設(shè)備513和顯示器514。在這些部件中,與系統(tǒng)總 線504相連的有CPU501、 RAM 502、 ROM 503、硬盤控制器505、 鍵盤控制器506、串行接口控制器507、并行接口控制器508和顯示 器控制器509。硬盤510與硬盤控制器505相連,鍵盤511與鍵盤控 制器506相連,串行外部設(shè)備512與串行接口控制器507相連,并 行外部設(shè)備513與并行接口控制器508相連,以及顯示器514與顯 示器控制器509相連。
      圖5中每個部件的功能在本技術(shù)領(lǐng)域內(nèi)都是眾所周知的,濱且 圖5所示的結(jié)構(gòu)也是常規(guī)的。圖5所述的結(jié)構(gòu)方框圖僅僅為了示例 的目的而示出的,并非是對本發(fā)明的限制。在一些情況下,可以根 據(jù)需要添加或者減少其中的一些部件。
      本發(fā)明的搜索以及對搜索結(jié)果進行排序方法可以針對數(shù)據(jù)庫或 數(shù)據(jù)存儲中的信息項單獨使用,也可以與任何已有的搜索引擎結(jié)合 使用,優(yōu)化對其搜索結(jié)果的顯示。從上文的描述可知,對信息項進 行搜索的過程可以以任何已知的算法、過程、方式來實現(xiàn),而該實 現(xiàn)本身不屬于本發(fā)明的范圍。
      此外,本領(lǐng)域技術(shù)人員可以理解,盡管本發(fā)明的各個方面可以 作為框圖、流程圖或使用其它圖示表示加以說明和描述,但可以理 解,在此描述的這些模塊、組件、設(shè)備、系統(tǒng)、技術(shù)或方法可以以 作為非限制性實例的硬件、軟件、固件、專用電路或邏輯、通用硬 件或控制器或其它計算設(shè)備或其組合來實現(xiàn)。
      領(lǐng)域技術(shù)人員顯而易見的是,在不脫離本發(fā)明精神的情況下,可以對本發(fā)明各實施方式進行修改和變更。本說明書中的描述僅僅是用于說明 性的,而不應(yīng)被認為是限制性的。本發(fā)明的范圍僅受所附權(quán)利要求書的限制。
      權(quán)利要求
      1.一種對信息項進行搜索的方法,包括接收對對象的查詢;基于該查詢,搜索與所述對象相關(guān)的信息項以獲取對象的信息項集合,其中每個信息項與一個用戶相關(guān)聯(lián);提取該信息項集合中每個關(guān)聯(lián)的用戶的歷史信息項記錄;基于所有用戶的歷史信息項記錄,計算每個用戶針對所述對象的有效性權(quán)重;以及基于該有效性權(quán)重,對所述對象的信息項集合中的所有信息項進行排序;將排序的信息項作為搜索結(jié)果進行輸出。
      2. 根據(jù)權(quán)利要求l所述的方法,其中所述信息項是用戶對所述 對象的評價。
      3. 根據(jù)權(quán)利要求1或2所述的方法,還包括 識別所述對象所屬的對象類別。
      4. 根據(jù)權(quán)利要求2所述的方法,其中計算每個用戶針對所述對 象的有效性權(quán)重包括計算該用戶評價過的對象類別數(shù)目占總的對象類別數(shù)目的比例; 計算該用戶對每個評價過的對象類別的評價與整體評價的情感 傾向一致度;計算該用戶的評價在所有評價中所占的比重;以及將類別比例、情感傾向 一 致度和評價比重相乘以得到所述有效性權(quán)重。
      5. 根據(jù)權(quán)利要求4所述的方法,其中應(yīng)用自然語言處理從用戶 評價中分析用戶對每個對象類別的情感傾向,并將其表示為情感傾向矢量。
      6. 根據(jù)權(quán)利要求5所述的方法,其中計算該用戶對每個評價過 的對象類別的評價與整體評價的情感傾向 一 致度包括將該用戶的情感傾向矢量與整體評價的情感傾向矢量進行內(nèi)積。
      7. 根據(jù)權(quán)利要求6所述的方法,其中所述整體評價的情感傾向矢量由所有用戶的情感傾向矢量的均值來表示。
      8. 根據(jù)權(quán)利要求4-7任一所述的方法,其中根據(jù)以下因素計算 所述評價比重該用戶對所述對象所屬對象類別的評價數(shù)目占該用 戶對所有對象類別的評價數(shù)目的比重;以及該用戶對所述對象所屬對象類別的評價數(shù)目占所有用戶對所述對象所屬對象類別的評價數(shù)目的比重。
      9. 根據(jù)權(quán)利要求1-8任一所述的方法,其中將有效性權(quán)重高的 信息項排在前面。
      10. 根據(jù)權(quán)利要求l-9任一所述的方法,其中搜索步驟包括從至 少 一 個數(shù)據(jù)存儲庫中搜索與所述對象相關(guān)的信息項。
      11. 一種對信息項進行排序的系統(tǒng),包括 接收組件,接收對對象的查詢;搜索組件,基于該查詢,搜索與所述對象相關(guān)的信息項以獲取對 象的信息項集合,其中每個信息項與一個用戶相關(guān)聯(lián);提取組件,提取該信息項集合中每個關(guān)聯(lián)的用戶的歷史信息項記錄;有效性權(quán)重計算組件,基于所有用戶的歷史信息項記錄,計算每 個用戶針對所述對象的有效性權(quán)重;排序組件,基于該有效性權(quán)重,對所述對象的信息項集合中的所 有信息項進行排序;以及輸出組件,將排序的信息項作為搜索結(jié)果進行輸出。
      12. 根據(jù)權(quán)利要求11所述的系統(tǒng),其中所述信息項是用戶對所 述對象的評價。
      13. 根據(jù)權(quán)利要求11或12所述的系統(tǒng),還包括 識別組件,用于識別所述對象所屬的對象類別。
      14. 根據(jù)權(quán)利要求13所述的系統(tǒng),其中有效性權(quán)重計算組件進 一步包括類別比例計算組件,計算該用戶評價過的對象類別數(shù)目占總的對象類別數(shù)目的比例;情感傾向一致度計算組件,計算該用戶對每個評價過的對象類別的評價與整體評價的情感傾向 一 致度;評價比重計算組件,計算該用戶的評價在所有評價中所占的比重;以及乘法器,將所述類別比例、情感傾向一致度和評價比重相乘以得到所述有效性權(quán)重。
      15. 根據(jù)權(quán)利要求14所述的系統(tǒng),其中在情感傾向一致度計算 組件中,包括自然語言處理組件,用于從用戶評價中分析用戶對每 個評價對象類別的情感傾向,并將其表示為情感傾向矢量。
      16. 根據(jù)權(quán)利要求15所述的系統(tǒng),其中情感傾向一致度計算組 件包括將該用戶的情感傾向矢量與整體評價的情感傾向矢量進行內(nèi) 積的組件。
      17. 根據(jù)權(quán)利要求16所述的系統(tǒng),其中所述整體評價的情感傾 向矢量由所有用戶的情感傾向矢量的均值來表示。
      18. 根據(jù)權(quán)利要求14-17任一所述的系統(tǒng),其中評價比重計算組 件根據(jù)以下因素計算所述評價比重該用戶對所述對象所屬對象類 別的評價數(shù)目占該用戶對所有對象類別的評價數(shù)目的比重;以及該 用戶對所述對象所屬對象類別的評價數(shù)目占所有用戶對所述對象所 屬對象類別的評價數(shù)目的比重。
      19. 根據(jù)權(quán)利要求11-18任一所述的系統(tǒng),其中排序組件將有效 性權(quán)重高的信息項排在前面。
      20. 根據(jù)權(quán)利要求11-19任一所述的系統(tǒng),其中搜索組件從至少 一個數(shù)據(jù)存儲庫中搜索與所述對象相關(guān)的信息項。
      全文摘要
      本發(fā)明提供了一種對信息項進行搜索的方法和系統(tǒng)。方法包括以下步驟接收對對象的查詢;基于該查詢,搜索與所述對象相關(guān)的信息項以獲取對象的信息項集合,其中每個信息項與一個用戶相關(guān)聯(lián);提取該信息項集合中每個關(guān)聯(lián)的用戶的歷史信息項記錄;基于所有用戶的歷史信息項記錄,計算每個用戶針對所述對象的有效性權(quán)重;基于該有效性權(quán)重,對所述對象的信息項集合中的所有信息項進行排序;以及將排序的信息項作為搜索結(jié)果進行輸出。
      文檔編號G06F17/30GK101661487SQ20081021333
      公開日2010年3月3日 申請日期2008年8月27日 優(yōu)先權(quán)日2008年8月27日
      發(fā)明者?;奂? 中 蘇, 蔡柯柯, 郭宏蕾 申請人:國際商業(yè)機器公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1