對問答論壇中討論話題的排名的制作方法
【專利摘要】提供了用于對具有以問答形式的帖子的討論話題進行評分的系統(tǒng)。系統(tǒng)接收查詢,并且接著對可以包括一個或多個術(shù)語特征和一個或多個非術(shù)語特征的討論話題的特征進行標(biāo)識。術(shù)語特征可以是將多個帖子的術(shù)語進行組合以將其視為單個文檔的組合的帖子特征。術(shù)語特征可以是包含討論話題的問題的問題特征。術(shù)語特征還可以是包含與帖子的問題有關(guān)的帖子的術(shù)語的問題帖子特征。系統(tǒng)接著針對每個特征而生成特征分?jǐn)?shù),并且將特征分?jǐn)?shù)組合成指示討論話題與查詢之間的相關(guān)性的相關(guān)性分?jǐn)?shù)。系統(tǒng)還可以在對討論話題進行排名時使用該相關(guān)性分?jǐn)?shù)。
【專利說明】對問答論壇中討論話題的排名
【背景技術(shù)】
[0001] 許多搜索引擎服務(wù)(例如,Google和Bing)都提供對能夠經(jīng)由互聯(lián)網(wǎng)獲取的信息的 搜索。這些搜索引擎服務(wù)允許用戶針對他們可能感興趣的顯示頁面(例如,網(wǎng)頁)進行搜索。 在用戶提交包括搜索術(shù)語的搜索請求(也被稱為"查詢")之后,搜索引擎服務(wù)對可以與那些 搜索術(shù)語有關(guān)的網(wǎng)頁進行標(biāo)識。為了快速識別有關(guān)網(wǎng)頁,搜索引擎服務(wù)可保存關(guān)鍵詞到網(wǎng) 頁的映射。該映射可以通過對網(wǎng)絡(luò)(即萬維網(wǎng))進行"爬取(crawl)"以對每個網(wǎng)頁的關(guān)鍵詞 進行標(biāo)識而生成。為了對網(wǎng)絡(luò)進行爬取,搜索引擎服務(wù)可使用基礎(chǔ)網(wǎng)頁的列表來對可以通 過那些基礎(chǔ)網(wǎng)頁而訪問的所有網(wǎng)頁進行標(biāo)識??梢允褂酶鞣N公知的技術(shù)來對任何特定的網(wǎng) 頁的關(guān)鍵詞進行標(biāo)識,例如對標(biāo)題中的詞語進行標(biāo)識、對在網(wǎng)頁的元數(shù)據(jù)中所提供的詞語 進行標(biāo)識、對突出顯示的詞語進行標(biāo)識等。搜索引擎服務(wù)可以生成相關(guān)性分?jǐn)?shù)來指示網(wǎng)頁 的信息可以與搜索請求有多相關(guān)。搜索引擎服務(wù)接著以基于網(wǎng)頁的相關(guān)性的順序來向用戶 顯示到那些網(wǎng)頁的鏈接。
[0002] 討論話題是人們利用互聯(lián)網(wǎng)進行溝通的一種流行的方式。一種特定的流行的類型 的討論話題服務(wù)是網(wǎng)絡(luò)論壇。網(wǎng)絡(luò)論壇是允許網(wǎng)站的用戶發(fā)布可用于由網(wǎng)站的其他用戶查 看的信息的網(wǎng)站。討論話題(例如,新聞討論組)允許人們參與關(guān)于具體的主題的討論。討論 話題通常在某人創(chuàng)建了針對主題的初始消息,并且將該消息作為新的討論話題而發(fā)布時被 發(fā)起。其他人可以閱讀該初始消息并且發(fā)布對該討論話題的回復(fù)消息。例如,初始消息可以 提出諸如"有人遇到過Acme軟件產(chǎn)品以錯誤代碼456異常結(jié)束的情況嗎? "之類的問題。想要 參與討論的人可以發(fā)布回復(fù)消息,例如"這種事總是發(fā)生在我身上"或者"我通過重新安裝 軟件解決了該問題"。
[0003] 問答(Q&A)論壇被定制為這樣的討論話題,其以問題開始并且可以包括表示Q&A形 式的討論話題的一個或多個回答。例如,銷售某軟件產(chǎn)品的公司內(nèi)的客戶支持小組可以為 其客戶提供Q&A,以創(chuàng)建并且參與有關(guān)該軟件產(chǎn)品的討論話題。客戶可通過發(fā)布提出問題 (例如,在上文中所提及的那個問題)的初始消息而發(fā)起討論話題??梢酝ㄟ^由另一個客戶 或客戶服務(wù)代表發(fā)布回復(fù)消息來回答那個問題。當(dāng)發(fā)布對問題的回答時,每個發(fā)布者可以 將該發(fā)帖指定為具有所建議的回答。由于發(fā)布者的知識會有顯著差異,因此所建議的回答 可能是錯誤的。論壇管理員可以檢查所建議的回答,并且將一個或多個帖子標(biāo)記為具有經(jīng) 驗證的回答一一即,經(jīng)驗證為正確的回答。同樣,Q&A論壇可以具有針對本質(zhì)上相同的初始 問題的不同的討論話題。為了幫助客戶挑選提供與初始問題有關(guān)的最佳討論的討論話題, 論壇管理員可以將那些討論話題中的一些指定為重要的。
[0004] 公司的討論話題的語料庫(corpus)可以提供與客戶會遇到的問題和擔(dān)憂有關(guān)的 大量的知識以及合適的回復(fù),例如對所提出的問題的回答。公司可以允許客戶使用通用搜 索引擎來搜索討論話題的語料庫??蛻敉ǔ]斎雴栴}來尋找其回答。然而,這樣的通用搜索 引擎可能不會以特別有幫助的順序?qū)λ阉鹘Y(jié)果進行排名。例如,這樣的通用搜索引擎可能 將包含與其初始問題相同的問題的帖子的網(wǎng)頁排名得相對高,而將僅包含回答卻不包含問 題的帖子的網(wǎng)頁排名得相對低。
【發(fā)明內(nèi)容】
[0005] 提供了用于對具有以問答形式的帖子的討論話題進行評分的方法和系統(tǒng)。系統(tǒng)接 收到查詢并且接著對可以包括一個或多個術(shù)語特征和一個或多個非術(shù)語特征的討論話題 的特征進行標(biāo)識。術(shù)語特征可以是組合的帖子特征,該組合的帖子特征將討論話題的多個 帖子中的術(shù)語進行組合以將其看作單個文檔。術(shù)語特征可以是包含討論話題的問題(例如, 討論話題的第一個帖子的主題)的問題特征。術(shù)語特征還可以是包含與帖子的問題相關(guān)的 帖子的術(shù)語(例如,討論話題的第一個帖子的文本)的問題帖子特征。非術(shù)語特征可以是回 答特征、熱門度特征、權(quán)威特征、重要性特征、或者點擊鏈接特征。系統(tǒng)接著針對每個特征生 成特征分?jǐn)?shù),并且將特征分?jǐn)?shù)組合成指示討論話題與查詢之間的相關(guān)性的相關(guān)性分?jǐn)?shù)。當(dāng) 對討論話題進行排名時,系統(tǒng)也可以使用該相關(guān)性分?jǐn)?shù)。
【附圖說明】
[0006] 圖1是示出了一些實施例中的Q&A排名系統(tǒng)的組件的框圖。
[0007] 圖2是示出了一些實施例中的Q&A排名系統(tǒng)的訓(xùn)練排名器組件的處理的流程圖。 [0008]圖3是示出了一些實施例中的Q&A排名系統(tǒng)的排名話題組件的處理的流程圖。
[0009] 圖4是示出了一些實施例中的Q&A排名系統(tǒng)的計算特征分?jǐn)?shù)組件的處理的流程圖。
[0010] 圖5是示出了一些實施例中的Q&A排名系統(tǒng)的計算術(shù)語特征分?jǐn)?shù)組件的處理的流 程圖。
[0011] 圖6是示出了一些實施例中的Q&A排名系統(tǒng)的檢索特征組件的處理的流程圖。
【具體實施方式】
[0012] 提供了用于對具有以問答形式的帖子的討論話題進行評分的方法和系統(tǒng)。在一些 實施例中,Q&A排名系統(tǒng)接收到查詢,并且針對討論話題而生成指示討論話題與查詢之間的 相關(guān)性的相關(guān)性分?jǐn)?shù)。為了針對討論話題生成相關(guān)性分?jǐn)?shù),Q&A排名系統(tǒng)從每個討論話題中 提取特征,并且針對每個特征而生成特征分?jǐn)?shù)。例如,特征可以包括術(shù)語特征,例如問題特 征(例如,討論話題的第一個帖子的主題)、問題帖子特征(例如,討論話題的第一個帖子的 文本)、以及組合的帖子特征。特征還可以包括一個或多個非術(shù)語特征,例如在下文中所描 述的回答特征、熱門度特征、權(quán)威特征、重要性特征、以及點擊鏈接(c 1 i ckthrough)特征。接 著,Q&A排名系統(tǒng)對討論話題的特征分?jǐn)?shù)進行組合以生成相關(guān)性分?jǐn)?shù)。Q&A排名系統(tǒng)可以使 用特征權(quán)重來對特征分?jǐn)?shù)進行加權(quán),所述特征權(quán)重是使用從Q&A論壇中得出的訓(xùn)練數(shù)據(jù)、經(jīng) 由機器學(xué)習(xí)算法(例如,神經(jīng)網(wǎng)絡(luò)或自適應(yīng)增強)而學(xué)習(xí)到的。在下文中,將術(shù)語特征與非術(shù) 語特征描述為影響討論話題與查詢之間的相關(guān)性??商娲?,不含非術(shù)語特征的術(shù)語特征 可以被認(rèn)為確定術(shù)語特征的內(nèi)容與查詢之間的相關(guān)性,而非術(shù)語特征可以被認(rèn)為指示討論 話題的整體相關(guān)性而無論帖子的內(nèi)容。例如,具有經(jīng)驗證的回答的討論話題更有可能是相 關(guān)的而無論其內(nèi)容。
[0013] 在一些實施例中,從討論話題的術(shù)語中得出術(shù)語特征,以用于與查詢的術(shù)語進行 比較。問題特征表示討論話題的主要問題。主要問題可以是當(dāng)討論話題開始時最初提出的 問題。例如,討論話題的初始帖子的主題可以包含該問題??商娲?,Q&A論壇可以保存問題 分區(qū)(field)以用于存儲討論話題的主要問題。問題特征可以包含問題的全部詞語、僅問題 的關(guān)鍵詞、僅問題的非噪聲詞語等。問題帖子特征表示與問題的發(fā)帖(例如,討論話題的初 始帖子)有關(guān)的討論話題的帖子的術(shù)語。討論話題的初始帖子可以包含作為其主體的問題, 或者可以與在初始帖子之外的問題分區(qū)所提出的問題相關(guān)。問題帖子特征還可以包含帖子 中的所有術(shù)語或者可以僅包含帖子的正文中的術(shù)語(例如,不包括存儲在帖子的主題中的 問題)。問題帖子特征還可以表示初始帖子的發(fā)布者的其他帖子,這是因為發(fā)布者可以已經(jīng) 在后續(xù)的帖子中闡明了問題。問題特征和問題帖子特征可以被認(rèn)為是基于問題的特征,這 是因為它們與帖子的問題相關(guān)。組合的帖子特征表示將討論話題的帖子的術(shù)語組合成單個 文檔。組合的帖子特征可以包括來自以下帖子的術(shù)語:討論話題的所有帖子、除了問題帖子 之外的所有帖子、或者討論話題的經(jīng)挑選的帖子。例如,可以基于帖子的新近度、帖子是否 有回答等來選擇帖子。
[0014] 針對問題、問題帖子、以及組合的帖子使用分離的術(shù)語特征有幾個優(yōu)點。例如,將 問題與問題帖子分離,允許分離于與對問題的討論的查詢的相關(guān)性而評估與對問題的查詢 的相關(guān)性。同樣,將多個帖子組合成組合的帖子特征允許對整體的討論話題與查詢之間的 相關(guān)性進行評估,而不是僅僅對討論話題的單個帖子之間的相關(guān)性進行評估。將問題帖子 與組合的帖子分離允許分離于后續(xù)的帖子而評估與對發(fā)布者的初始評論的查詢的相關(guān)性。 盡管術(shù)語特征被看作是分離的特征,但是Q&A排名系統(tǒng)可以針對全部三個術(shù)語特征而生成 組合的特征分?jǐn)?shù),該組合的特征分?jǐn)?shù)基于組合的帖子特征分?jǐn)?shù)、問題帖子特征分?jǐn)?shù)、以及問 題特征分?jǐn)?shù)的加權(quán)求和。
[0015] 在一些實施例中,非術(shù)語特征允許將討論話題與查詢之間的相關(guān)性作為因素而計 入標(biāo)準(zhǔn)中,而非僅將查詢和討論話題的術(shù)語作為因素而計入標(biāo)準(zhǔn)中。從討論話題的帖子的 元數(shù)據(jù)中得出指示該帖子是否有回答的回答特征。帖子可以具有由發(fā)布者指示的建議的回 答和/或由管理員指示的經(jīng)驗證的回答。具有經(jīng)驗證的回答的討論話題可以被認(rèn)為比僅具 有建議的回答的討論話題更相關(guān),而僅具有建議的回答的討論話題可以被認(rèn)為比沒有回答 的討論話題更相關(guān)。熱門度特征表示討論話題的熱門度,并且可以從討論話題已經(jīng)被查看 的次數(shù)中得出。熱門的討論話題可以被認(rèn)為比不熱門的討論話題更相關(guān)。權(quán)威特征表示回 答的發(fā)布者的權(quán)威。權(quán)威指示由發(fā)布者在其他討論話題中所給出的回答的質(zhì)量,并且可以 基于由該發(fā)布者給出的已經(jīng)經(jīng)驗證的回答的數(shù)量來確定。具有由經(jīng)常給出經(jīng)驗證的回答的 發(fā)布者所給出的回答的討論話題可以被認(rèn)為比具有來自沒有經(jīng)驗證的回答的發(fā)布者的回 答的討論話題更相關(guān)。重要性特征表示討論話題相對于論壇中的其他討論話題的重要性, 并且可以由管理員來指示。一些Q&A論壇允許管理員指定討論話題的重要性。具有高重要性 的討論話題可以被認(rèn)為比具有低重要性的討論話題更相關(guān)。點擊鏈接特征是從指示用戶何 時已經(jīng)選擇或點擊了來自搜索結(jié)果中的討論話題的點擊鏈接數(shù)據(jù)中得出的。點擊鏈接數(shù)據(jù) 可以是討論話題被點擊的次數(shù)的計數(shù)。點擊鏈接數(shù)據(jù)可以由Q&A論壇本身提供(例如,內(nèi)部 點擊鏈接特征)和/或可以由外部搜索引擎提供(例如,外部點擊鏈接特征)。具有高點擊鏈 接計數(shù)的討論話題被認(rèn)為比具有低點擊鏈接計數(shù)的討論話題更相關(guān)。
[0016] Q&A排名系統(tǒng)可以根據(jù)以下等式而生成指示討論話題與查詢之間的相關(guān)性的相關(guān) 性分?jǐn)?shù):
[0017] RS= E iWiFSi (1)
[0018]其中,RS表示相關(guān)性分?jǐn)?shù),?51表示特征i的特征分?jǐn)?shù),并且^表示特征i的權(quán)重。權(quán) 重可以使用機器學(xué)習(xí)算法而學(xué)習(xí)到,并且可以表示特征分?jǐn)?shù)的非線性組合(例如,神經(jīng)網(wǎng)絡(luò) 或者加權(quán)樹的集合hQ&A排名系統(tǒng)可以根據(jù)以下等式針對術(shù)語特征而生成組合的特征分 數(shù):
(2)
[0020]其中,t表示查詢的術(shù)語,TF't表示針對術(shù)語t的子分?jǐn)?shù),N表示討論話題的數(shù)量,而 n表示包含術(shù)語t的討論話題的數(shù)量。等式2是被稱為BM25F的術(shù)語頻率乘以逆向文檔頻率 (tf*idf)度量的變型。術(shù)語的子分?jǐn)?shù)是根據(jù)以下等式而生成的:
[0022]其中,cp、q以及qp分別表示組合的帖子特征、問題特征以及問題帖子特征;TFt,^ 示術(shù)語t在特征x中出現(xiàn)的次數(shù);口"表示特征x中的術(shù)語的數(shù)量;AVDLX表示包含術(shù)語t的所有 討論話題的特征x中的術(shù)語的平均數(shù)量;而^表示特征x的可調(diào)的權(quán)重。
[0023] 回答特征可以具有由以下等式所表示的特征分?jǐn)?shù)FSa:
[0024] ^ %如果討論話題沒有回答 &如果討論話題有所建議的回答,但沒有經(jīng)驗證的回答 .、 = 乂 (4) ip2如果討論話題有經(jīng)驗證的回答,但沒有所建議的回答 〇?3如果討論話題有經(jīng)驗證的回答以及所建議的回答
[0025]其中,vy表示條件y的可調(diào)的參數(shù)。
[0026] 熱門度特征可以具有由以下等式所表示的特征分?jǐn)?shù)FSP: \〇^(Nv + bS\i ^ ^ ^maxv
[0027] RSp 二、p pJ 1 ,P (5) ,l〇§(^max,'p + ^V),如果.~>
[0028] 其中具表示討論話題已經(jīng)被查看的次數(shù),而Nmax,P、bP表示可調(diào)的參數(shù)。
[0029]權(quán)威特征可以具有由以下等式所表示的特征分?jǐn)?shù)FSau:
(6)
[0031] 其中,Na表示該討論話題中經(jīng)驗證的回答(或者,如果沒有經(jīng)驗證的回答則是所建 議的回答)的發(fā)布者跨所有討論話題的經(jīng)驗證的回答的數(shù)量,而k a表示可調(diào)的參數(shù)。
[0032]重要性特征可以具有這樣的特征分?jǐn)?shù)FS1:如果討論話題已經(jīng)被標(biāo)記為重要,則其 被設(shè)置為1,否則其被設(shè)置為LQ&A論壇可以允許管理員將重要性設(shè)置為例如在0到1之間的 某個數(shù)值。在這樣的情況下,特征分?jǐn)?shù)FSi可以取該值。
[0033]點擊鏈接特征可以具有由以下等式所表示的特征分?jǐn)?shù)FS。:
[0034] FS = (l〇g^Vc + bc),0 - Nc ^ Nmax,c (7) C ^max>c + bc), mNc> Nmax:c
[0035]其中,N。表示討論話題(或者其帖子中的一個)被點擊的次數(shù),而Nmax,。、b。是可調(diào)的 參數(shù)。
[0036]圖1是示出了一些實施例中的Q&A排名系統(tǒng)的組件的框圖。Q&A排名系統(tǒng)100可以包 括討論話題存儲110和討論話題元數(shù)據(jù)存儲120。討論話題存儲包含Q&A論壇的討論話題的 每一個的帖子。討論話題元數(shù)據(jù)存儲包含針對討論話題而保存的諸如重要性、點擊鏈接數(shù) 據(jù)等之類的元數(shù)據(jù)。Q&A排名系統(tǒng)包括訓(xùn)練排名器組件130,其輸入來自訓(xùn)練數(shù)據(jù)存儲140的 訓(xùn)練數(shù)據(jù)、學(xué)習(xí)從該訓(xùn)練數(shù)據(jù)中所提取的特征的權(quán)重、并且將所述權(quán)重存儲在權(quán)重存儲150 中。Q&A排名系統(tǒng)還包括排名話題組件160、計算特征分?jǐn)?shù)組件170、計算術(shù)語特征分?jǐn)?shù)組件 180、以及檢索特征組件190。排名話題組件輸入查詢、針對每個討論話題而生成相關(guān)性分 數(shù)、并且接著基于相關(guān)性分?jǐn)?shù)來對討論話題進行排名。計算特征分?jǐn)?shù)組件針對查詢的討論 話題而生成特征分?jǐn)?shù)。計算術(shù)語特征分?jǐn)?shù)組件針對查詢的討論話題而生成術(shù)語特征分?jǐn)?shù)。 檢索特征組件提取術(shù)語特征和非術(shù)語特征。
[0037]其上可以實現(xiàn)Q&A排名系統(tǒng)的計算設(shè)備和系統(tǒng)可以包括中央處理單元、輸入設(shè)備、 輸出設(shè)備(例如,顯示設(shè)備和揚聲器)、存儲設(shè)備(例如,存儲器和磁盤驅(qū)動器)、網(wǎng)絡(luò)接口、圖 形處理單元、加速度計、蜂窩式無線電鏈接接口、全球定位系統(tǒng)設(shè)備等。輸入設(shè)備可以包括 鍵盤、定點設(shè)備、觸摸屏、手勢識別設(shè)備(例如,針對空中手勢的)、頭部和眼部追蹤設(shè)備、用 于語音識別的麥克風(fēng)等。計算設(shè)備可以包括臺式計算機、膝上型計算機、平板計算機、電子 閱讀器、個人數(shù)字助理、智能電話、游戲設(shè)備、服務(wù)器、以及計算機系統(tǒng)(例如,大規(guī)模并行系 統(tǒng))。計算設(shè)備可以訪問包括計算機可讀存儲介質(zhì)和數(shù)據(jù)傳輸介質(zhì)的計算機可讀介質(zhì)。計算 機可讀存儲介質(zhì)是有形的存儲單元,其不包括瞬時性的、傳播的信號。計算機可讀存儲介質(zhì) 的示例包括諸如主存儲器、高速緩沖存儲器、二級存儲器(例如,DVD)等之類的存儲器,并且 包括其他存儲單元。計算機可讀存儲介質(zhì)可以具有記錄在其上的或者可以編碼有實現(xiàn)Q&A 排名系統(tǒng)的計算機可執(zhí)行指令或邏輯。數(shù)據(jù)傳輸介質(zhì)用于通過經(jīng)由有線或無線連接的易失 性的、傳播的信號或載波(例如,電磁波)來傳輸數(shù)據(jù)。
[0038]可以在由一個或多個計算機、處理器、或其它設(shè)備所執(zhí)行的計算機可執(zhí)行指令(例 如,程序模塊和組件)的一般性的上下文中描述Q&A排名系統(tǒng)。通常而言,程序模塊或組件包 括執(zhí)行特定的任務(wù)或?qū)崿F(xiàn)特定的數(shù)據(jù)類型的例程、程序、對象、數(shù)據(jù)結(jié)構(gòu)等。通常而言,程序 模塊的功能可以如在各種實施例中所期望的那樣組合或分布??梢允褂美鐚S眉呻娐?("ASIC")的硬件來實現(xiàn)Q&A排名系統(tǒng)的方面。
[0039]圖2是示出了一些實施例中的Q&A排名系統(tǒng)的訓(xùn)練排名器組件的處理的流程圖。訓(xùn) 練排名器組件200輸入訓(xùn)練數(shù)據(jù),該訓(xùn)練數(shù)據(jù)可以包括討論話題(和相關(guān)聯(lián)的元數(shù)據(jù))、查 詢、以及針對每個查詢的指示該查詢的每個討論話題的期望的排名的標(biāo)簽。組件使用多種 機器學(xué)習(xí)技術(shù)中的任何一種而學(xué)習(xí)特征的權(quán)重,并且將所述權(quán)重存儲在權(quán)重存儲中。在方 框201中,組件收集訓(xùn)練數(shù)據(jù)??梢酝ㄟ^要求用戶對每個查詢的討論話題手動地進行排名來 收集訓(xùn)練數(shù)據(jù)。在方框202-206中,組件針對每個查詢而循環(huán)計算每個討論話題的特征分 數(shù)。在方框202中,組件在訓(xùn)練數(shù)據(jù)中選擇下一個查詢。在決策框203中,如果所有的查詢都 已經(jīng)被選擇,則組件在方框207處繼續(xù),否則,組件在方框204處繼續(xù)。在方框204中,組件選 擇下一個討論話題。在決策框205中,如果所有的討論話題都已經(jīng)被選擇,則組件循環(huán)至方 框202來選擇下一個查詢,否則,組件在方框206處繼續(xù)。在方框206中,組件調(diào)用計算特征分 數(shù)組件來計算特征分?jǐn)?shù),并且接著循環(huán)至方框204來選擇下一個討論話題。在方框207中,組 件基于所計算的特征分?jǐn)?shù)而學(xué)習(xí)特征的權(quán)重,并且接著完成。組件可以使用通過利用例如 梯度上升方法來調(diào)整權(quán)重的迭代過程而學(xué)習(xí)權(quán)重,從而改善優(yōu)化度量(例如,誤差函數(shù))。
[0040] 圖3是示出了一些實施例中的Q&A排名系統(tǒng)的排名話題組件的處理的流程圖。向排 名話題組件300傳遞查詢,并且排名話題組件300基于討論話題存儲的討論話題與查詢之間 的相關(guān)性來對討論話題進行排名。在方框301中,組件選擇下一個討論話題。在決策框302 中,如果所有的討論話題都已經(jīng)被選擇,則組件在方框305處繼續(xù),否則,組件在方框303處 繼續(xù)。在方框303中,組件調(diào)用計算特征分?jǐn)?shù)組件來計算所選擇的討論話題的特征分?jǐn)?shù)。在 方框304中,組件通過根據(jù)等式1的使用權(quán)重存儲中的權(quán)重來將特征分?jǐn)?shù)進行組合從而計算 所選擇的討論話題的相關(guān)性,并且接著循環(huán)至方框301以選擇下一討論話題。在方框305中, 組件根據(jù)討論話題的相關(guān)性分?jǐn)?shù)來對討論話題進行排名。
[0041] 圖4是示出了一些實施例中的Q&A排名系統(tǒng)的計算特征分?jǐn)?shù)組件的處理的流程圖。 向計算特征分?jǐn)?shù)組件400傳遞查詢和討論話題,并且計算特征分?jǐn)?shù)組件400針對討論話題的 特征中的每個特征而生成特征分?jǐn)?shù)。在方框401中,組件調(diào)用檢索特征組件來提取針對該討 論話題的特征。在方框402中,組件調(diào)用計算術(shù)語特征分?jǐn)?shù)組件來計算術(shù)語特征分?jǐn)?shù)。在方 框403中,組件使用等式4來計算回答特征分?jǐn)?shù)。在方框404中,組件使用等式5來計算熱門度 特征分?jǐn)?shù)。在方框405中,組件使用等式6來計算權(quán)威特征分?jǐn)?shù)。在方框406中,組件計算重要 性特征分?jǐn)?shù)。在方框407中,組件使用等式7來計算點擊鏈接特征分?jǐn)?shù),并且接著返回該特征 分?jǐn)?shù)。
[0042]圖5是示出了一些實施例中的Q&A排名系統(tǒng)的計算術(shù)語特征分?jǐn)?shù)組件的處理的流 程圖。向組件500傳遞查詢和討論話題,并且組件500針對該查詢而返回該討論話題的術(shù)語 特征分?jǐn)?shù)。在方框501中,組件對術(shù)語特征分?jǐn)?shù)進行初始化。在方框502-508中,組件針對查 詢的每個術(shù)語而循環(huán)計算術(shù)語特征子分?jǐn)?shù)。在方框502中,組件選擇查詢的下一個術(shù)語。在 決策框503中,如果所有的術(shù)語都已經(jīng)被選擇,則組件返回術(shù)語特征分?jǐn)?shù),否則組件在方框 504處繼續(xù)。在方框504中,組件根據(jù)等式3來計算組合的帖子特征分?jǐn)?shù)。在方框505中,組件 根據(jù)等式3來計算所選擇的術(shù)語的問題特征分?jǐn)?shù)。在方框506中,組件根據(jù)等式3來計算所選 擇的術(shù)語的問題帖子特征分?jǐn)?shù)。在507中,組件根據(jù)等式3將組合的帖子特征分?jǐn)?shù)、問題特征 分?jǐn)?shù)、以及問題帖子特征分?jǐn)?shù)組合成所選擇的術(shù)語的組合的特征分?jǐn)?shù)。在方框508中,組件 根據(jù)等式2將組合的特征分?jǐn)?shù)與術(shù)語特征分?jǐn)?shù)相加,并且接著循環(huán)至方框502來選擇查詢的 下一個術(shù)語。
[0043]圖6是示出了一些實施例中的Q&A排名系統(tǒng)的檢索特征組件的處理的流程圖。向檢 索特征組件600傳遞討論話題,并且檢索特征組件600提取并返回特征。在方框601中,組件 通過收集討論話題的多個帖子(例如,所有帖子)并且將它們組合成單個集合或文件,來提 取組合的帖子特征。在方框602中,組件從討論話題的初始帖子的正文中提取問題帖子特 征。在方框603中,組件從初始帖子的主題中提取問題特征。在方框604中,組件從討論話題 的元數(shù)據(jù)中提取回答特征。在方框605中,組件從討論話題的元數(shù)據(jù)中提取熱門度特征。在 方框606中,組件從討論話題的元數(shù)據(jù)中提取權(quán)威特征。在方框607中,組件從討論話題的元 數(shù)據(jù)中提取重要性特征。在方框608中,組件從討論話題的元數(shù)據(jù)中提取點擊鏈接特征,并 且接著返回特征。
[0044]盡管已經(jīng)用特定于結(jié)構(gòu)特征和/或行為的語言描述的主題,但應(yīng)當(dāng)理解的是,在所 附權(quán)利要求中所限定的主題非必須限于在上文中所描述的具體的特征或行為。相反,在上 文中所描述的具體的特征或行為是作為實現(xiàn)權(quán)利要求的示例形式而公開的。從而,除了所 附權(quán)利要求之外,本發(fā)明不受限制。
【主權(quán)項】
1. 一種存儲計算機可執(zhí)行指令的計算機可讀存儲介質(zhì),所述計算機可執(zhí)行指令用于控 制計算系統(tǒng)以對以問答形式的討論話題進行評分,每個討論話題都有具有術(shù)語的主題,所 述計算機可執(zhí)行指令包括: 提供查詢的組件; 標(biāo)識討論話題的特征的組件,所述特征包括表示討論話題的多個帖子的術(shù)語的集合的 組合的帖子特征; 針對所述特征而生成特征分?jǐn)?shù)的組件,所述組合的帖子特征的所述特征分?jǐn)?shù)指示所述 集合的術(shù)語與所述查詢之間的相關(guān)性,以及 基于將討論話題的特征分?jǐn)?shù)進行組合而生成所述討論話題的相關(guān)性分?jǐn)?shù)的組件。2. 根據(jù)權(quán)利要求1所述的計算機存儲介質(zhì),其中,所述討論話題的特征是作為所述討論 話題的主題的問題。3. 根據(jù)權(quán)利要求2所述的計算機可讀存儲介質(zhì),其中,所述問題是從所述討論話題的初 始帖子的主題分區(qū)中得出的。4. 根據(jù)權(quán)利要求1所述的計算機可讀存儲介質(zhì),其中,所述討論話題的特征是所述討論 話題的初始帖子。5. 根據(jù)權(quán)利要求1所述的計算機可讀存儲介質(zhì),其中,所述討論話題的特征基于所述討 論話題的點擊鏈接。6. 根據(jù)權(quán)利要求1所述的計算機可讀存儲介質(zhì),其中,所述討論話題的特征基于所述討 論話題的新近性。7. -種用于基于與查詢之間的相關(guān)性來對討論話題進行評分的計算系統(tǒng),所述討論話 題是以問答形式的,所述計算系統(tǒng)包括: 存儲計算機可執(zhí)行指令的計算機可讀存儲介質(zhì),所述計算機可執(zhí)行指令包括: 標(biāo)識討論話題的特征的指令,所述特征包括基于問題的特征,所述基于問題的特征包 括與所述討論話題的所述問題的發(fā)帖有關(guān)的術(shù)語; 針對所述特征而生成特征分?jǐn)?shù)的指令,其中,所述基于問題的特征的所述特征分?jǐn)?shù)指 示與所述討論話題的所述問題的發(fā)帖有關(guān)的所述術(shù)語的相關(guān)性;以及 基于將討論話題的特征分?jǐn)?shù)進行組合而生成所述討論話題的相關(guān)性分?jǐn)?shù)的指令;以及 執(zhí)行由所述計算機可讀存儲介質(zhì)所存儲的所述計算機可執(zhí)行指令的處理器。8. 根據(jù)權(quán)利要求7所述的計算系統(tǒng),其中,所述討論話題的特征包括組合的帖子特征。9. 根據(jù)權(quán)利要求7所述的計算系統(tǒng),其中,所述討論話題的所述基于問題的特征是問題 特征。10. 根據(jù)權(quán)利要求9所述的計算系統(tǒng),其中,所述問題特征是從所述討論話題的初始帖 子的主題分區(qū)中得出的。11. 根據(jù)權(quán)利要求7所述的計算系統(tǒng),其中,所述基于問題的特征是問題帖子特征。12. 根據(jù)權(quán)利要求11所述的計算系統(tǒng),其中,所述問題帖子特征包含包括所述問題的帖 子的正文的術(shù)語。13. 根據(jù)權(quán)利要求7所述的計算系統(tǒng),其中,所述討論話題的特征是回答特征。14. 根據(jù)權(quán)利要求7所述的計算系統(tǒng),其中,所述討論話題的特征是點擊鏈接特征。15. -種用于對問答論壇的討論話題進行排名的方法,所述方法包括: 接收包括術(shù)語的查詢; 針對多個討論話題中的每個, 標(biāo)識所述討論話題的特征,所述特征包括表示來自討論話題的多個帖子的術(shù)語的集合 的組合的帖子特征、表示所述討論話題的問題的問題特征、表示所述討論話題的問題帖子 的術(shù)語的問題帖子特征、以及從由回答特征、熱門度特征、權(quán)威特征、重要性特征、內(nèi)部點擊 鏈接特征、以及外部點擊鏈接特征組成的分組中所選擇的一個或多個特征; 針對所標(biāo)識的特征中的每個而生成特征分?jǐn)?shù);并且 基于所述討論話題的所述特征分?jǐn)?shù)的加權(quán)的組合而生成所述討論話題的相關(guān)性分?jǐn)?shù); 以及 基于所述討論話題的整體的分?jǐn)?shù)而對所述討論話題進行排名。
【文檔編號】G06F17/30GK105917364SQ201480071854
【公開日】2016年8月31日
【申請日】2014年12月12日
【發(fā)明人】N·沃倫可夫, D·梅耶澤
【申請人】微軟技術(shù)許可有限責(zé)任公司