說(shuō)明該新聞的被關(guān)注度較高,在向讀者推薦新聞的過(guò)程中應(yīng)考慮加大該新聞的推薦權(quán)重。
[0033]具體而言,可以選取一個(gè)新聞作為預(yù)推薦的第一新聞,并確定該第一新聞的相關(guān)新聞。
[0034]例如,可以通過(guò)以下方式獲取第一新聞的相關(guān)新聞:計(jì)算其他新聞與該第一新聞之間的距離,當(dāng)其他新聞與第一新聞之間的距離不大于設(shè)定的閾值時(shí),則確定該其他新聞為第一新聞的相關(guān)新聞。
[0035]這里所述的其他新聞與所述第一新聞之間的距離一般可以通過(guò)以下方式計(jì)算獲得:
[0036]方式I
[0037]???他新聞的特征向量與第一新聞的特征向量的交集,確定該其他新聞與該第一新聞之間的距離。
[0038]方式2
[0039]根據(jù)其他新聞的特征向量與第一新聞的特征向量的內(nèi)積或夾角的余弦,確定該其他新聞與該第一新聞之間的距離。
[0040]方式3
[0041]???他新聞的特征向量的最小哈希值與第一新聞的特征向量的最小哈希值,確定該其他新聞與該第一新聞之間的距離。
[0042]以上,特征向量可以由以下中的一個(gè)或多個(gè)提取:新聞標(biāo)題,新聞?wù)?,或新聞全文?br>[0043]應(yīng)該理解,只要其他新聞與該第一新聞之間的距離不大于設(shè)定的閾值就被認(rèn)為是該第一新聞的“相關(guān)新聞”。如果該設(shè)定的閾值一定的情況下,如果該第一新聞的被關(guān)注度越尚,那么其相關(guān)新聞就越多。
[0044]此外,還應(yīng)該理解,雖然本公開中討論的新聞的發(fā)布載體包括網(wǎng)站、微信公眾號(hào)和微博公眾平臺(tái),但是隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,會(huì)有越來(lái)越多的新的新聞發(fā)布載體的出現(xiàn)。因此,這里所說(shuō)的第一新聞的相關(guān)新聞,不僅僅是在上述發(fā)布載體中出現(xiàn)的滿足有個(gè)條件的相關(guān)新聞,還包括來(lái)源于其他發(fā)布載體的相關(guān)新聞。
[0045]102、獲取第一新聞及其相關(guān)新聞的評(píng)論。
[0046]在確定了第一新聞、第一新聞的相關(guān)新聞、以及第一新聞和相關(guān)新聞的不同來(lái)源(發(fā)布載體)之后,本公開的方法還需要獲取該第一新聞及其相關(guān)新聞的評(píng)論。
[0047]一般地,評(píng)論的內(nèi)容可以通過(guò)搜索引擎的爬蟲(spider)抓取網(wǎng)頁(yè)后,經(jīng)對(duì)該網(wǎng)頁(yè)的頁(yè)面分析獲得。通常,這樣同主題的網(wǎng)頁(yè)聚集在一起,疊加評(píng)論的數(shù)量或用特定算法,便可確定評(píng)論的情況。
[0048]在本公開的實(shí)施方式中,需要獲取該第一新聞及其相關(guān)新聞在各個(gè)發(fā)布載體上的評(píng)論情況,包括,例如評(píng)論的數(shù)量、評(píng)論的發(fā)布載體、評(píng)論的發(fā)布時(shí)間等。
[0049]可以理解,從任何以下任何一種電子設(shè)備訪問(wèn)搜索引擎。該電子設(shè)備具體可以包括移動(dòng)設(shè)備,例如手機(jī)、PDA(Personal Digital Assistant,個(gè)人數(shù)字助理)、膝上型計(jì)算機(jī)、掌上電腦等等,也可以包括固定設(shè)備,例如個(gè)人計(jì)算機(jī)、智能電視等等。
[0050]這些電子設(shè)備可以支持包括Android(安卓)、1S、WindowsPhone或者windows等的操作系統(tǒng),通常可以運(yùn)行通過(guò)互聯(lián)網(wǎng)訪問(wèn)網(wǎng)頁(yè)的瀏覽器或內(nèi)置微型瀏覽器的應(yīng)用程序。[0051 ] 103、根據(jù)評(píng)論,確定第一新聞的推薦權(quán)重。
[0052]具體地,首先確定該第一新聞及其相關(guān)新聞的評(píng)論的權(quán)重因子,然后根據(jù)權(quán)重因子確定該第一新聞的推薦權(quán)重。
[0053]這里,評(píng)論的權(quán)重因子包括以下中的一個(gè)或多個(gè):評(píng)論的數(shù)量、評(píng)論的發(fā)布載體、評(píng)論的發(fā)布時(shí)間。
[0054]在一個(gè)實(shí)施例中,可以根據(jù)評(píng)論的數(shù)量來(lái)確定該第一新聞的推薦權(quán)重。例如,根據(jù)第一新聞和相關(guān)新聞在各個(gè)發(fā)布載體中的評(píng)論的數(shù)量總和,來(lái)確定該第一新聞的推薦權(quán)重。
[0055]例如,一段時(shí)間內(nèi),人們都在“北極蚊子多”為主題的新聞很關(guān)注,因此多個(gè)新聞發(fā)布載體均發(fā)布該新聞或相關(guān)新聞,且讀者也可以在對(duì)應(yīng)的發(fā)布平臺(tái)上對(duì)該新聞或相關(guān)新聞進(jìn)行評(píng)論。那么,通過(guò)統(tǒng)計(jì)該新聞及其相關(guān)新聞在各個(gè)發(fā)布載體上評(píng)論的數(shù)量,可以反映出讀者對(duì)這一新聞的關(guān)注度。如果將讀者關(guān)注度納入新聞推薦時(shí)的考慮權(quán)重,無(wú)疑能有利于提升讀者的閱讀感受。
[0056]在另一個(gè)實(shí)施例中,還可以進(jìn)一步地區(qū)分新聞及評(píng)論的不同來(lái)源,以便更精準(zhǔn)地反映讀者的關(guān)注度??蛇x地,根據(jù)評(píng)論的數(shù)量和評(píng)論的發(fā)布載體的影響力因子來(lái)確定第一新聞的推薦權(quán)重。比如,一個(gè)新聞發(fā)布載體在讀者中的影響力較大,那么該發(fā)布載體上的評(píng)論的重要性就需要相應(yīng)提升?;蛘?,如果一個(gè)新聞發(fā)布載體上的評(píng)論質(zhì)量較高,也應(yīng)相應(yīng)地提升該發(fā)布載體上的評(píng)論的重要性。也就是說(shuō),可以根據(jù)第一新聞和相關(guān)新聞在各個(gè)發(fā)布載體中的評(píng)論的數(shù)量與對(duì)應(yīng)的發(fā)布載體的影響力因子的乘積的加和,確定第一新聞的推薦權(quán)重,其中發(fā)布載體的影響力因子根據(jù)該發(fā)布載體的影響力而確定。
[0057]容易理解,一個(gè)內(nèi)容提供商在新聞讀者中的影響力越高,那么其影響力因子的數(shù)值就越大。該影響力因子與其發(fā)布載體上評(píng)論總數(shù)的乘積,就反映出該內(nèi)容提供商的讀者群體對(duì)第一新聞的關(guān)注度。
[0058]有時(shí),當(dāng)一個(gè)新聞主題反復(fù)出現(xiàn),比如“霧霾”,讀者在對(duì)該新聞進(jìn)行評(píng)論時(shí),可能會(huì)在不同時(shí)期發(fā)布的該主題的新聞進(jìn)行評(píng)述。因此,對(duì)一個(gè)新聞的關(guān)注度還反映在時(shí)效性方面。
[0059]在另一個(gè)實(shí)施例中,可以根據(jù)第一新聞和相關(guān)新聞在各個(gè)發(fā)布載體中的評(píng)論的數(shù)量與對(duì)應(yīng)的發(fā)布時(shí)間的時(shí)效性因子的乘積的加和,確定所述第一新聞的推薦權(quán)重,其中所述發(fā)布時(shí)間的時(shí)效性因子隨評(píng)論的發(fā)布時(shí)間距離當(dāng)前時(shí)刻的時(shí)間間隔越短而越大。
[0060]也就是說(shuō),如果一個(gè)新聞的評(píng)論越新,越說(shuō)明該新聞近期被讀者關(guān)注的情況。因此,將離當(dāng)前時(shí)點(diǎn)越接近的評(píng)論的時(shí)效性因子賦以更大的值。
[0061]或者,在再一個(gè)實(shí)施例中,可以將上述權(quán)重因子一并進(jìn)行考慮。也就是,根據(jù)第一新聞和相關(guān)新聞在各個(gè)發(fā)布載體中的評(píng)論的數(shù)量與對(duì)應(yīng)的影響力因子、時(shí)效性因子的乘積的加和,確定所述第一新聞的推薦權(quán)重。
[0062]應(yīng)該理解,這里僅僅示例性地提供了評(píng)論的權(quán)重因子,例如評(píng)論的數(shù)量、評(píng)論的發(fā)布載體、評(píng)論的發(fā)布時(shí)間,但是根據(jù)不同體現(xiàn)關(guān)注度的需要及考慮,可以選取評(píng)論的其他特性作為權(quán)重因子,例如評(píng)論的轉(zhuǎn)載次數(shù)、重復(fù)率、內(nèi)容質(zhì)量、字?jǐn)?shù)等。
[0063]由此可見,根據(jù)本發(fā)明的基于評(píng)論確定新聞推薦權(quán)重的方法,能夠?qū)⑿侣劙l(fā)布載體以及讀者的關(guān)注情況作為新聞推薦時(shí)的考慮因素,依據(jù)讀者對(duì)預(yù)推薦新聞的評(píng)論作為推薦的權(quán)重因子,從而提高讀者的閱讀體驗(yàn)。
[0064]下面將結(jié)合圖2,說(shuō)明根據(jù)本發(fā)明的基于評(píng)論確定新聞推薦權(quán)重的裝置。如圖2所示,該裝置20包括:相關(guān)新聞確定模塊21、評(píng)論獲取模塊22和推薦權(quán)重確定模塊23。
[0065]其中,相關(guān)新聞確定模塊21用于確定第一新聞的相關(guān)新聞。評(píng)論獲取模塊22用于獲取第一新聞及相關(guān)新聞的評(píng)論。推薦權(quán)重確定模塊23根據(jù)評(píng)論確定第一新聞的推薦權(quán)重。
[0066]可選地,相關(guān)新聞確定模塊21通過(guò)計(jì)算其他新聞與第一新聞之間的距離,當(dāng)其他新聞與第一新聞之間的距離不大于設(shè)定的閾值時(shí),則確定其他新聞為第一新聞的相關(guān)新聞。
[0067]計(jì)算其他新聞與所述第一新聞之間的距離通過(guò)以下方式進(jìn)行:
[0068]根據(jù)所述其他新聞的特征向量與所述第一新聞的特征向量的交集,確定所述計(jì)算其他新聞與所述第一新聞之間的距離;或者
[0069]根據(jù)所述其他新聞的特征向量與所述第一新聞的特征向量的內(nèi)積或夾角的余弦,確定所述計(jì)算其他新聞與所述第一新聞之間的距離;或者
[0070]根據(jù)所述其