推薦Web內(nèi)容給用戶的系統(tǒng),方法和計(jì)算機(jī)程序的制作方法
【專利摘要】本發(fā)明是關(guān)于一個(gè)用于推薦用戶網(wǎng)站內(nèi)容的系統(tǒng)、方法和程序。實(shí)施例中,用戶直接訪問網(wǎng)址的網(wǎng)頁,該網(wǎng)頁包含了多個(gè)子頁的連接。然后,用戶通過該登陸頁訪問子頁的軌跡都會被記錄下來。接著,子頁中最高訪問量的網(wǎng)頁作為新的登陸頁。最后用戶就會被重新引導(dǎo)到新的登陸頁。
【專利說明】推薦Web內(nèi)容給用戶的系統(tǒng),方法和計(jì)算機(jī)程序
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)站內(nèi)容相關(guān)領(lǐng)域,特別是在網(wǎng)站內(nèi)容的推薦方面。
【背景技術(shù)】
[0002]描述用戶在網(wǎng)頁上的行為的一個(gè)關(guān)鍵點(diǎn)是要得知哪個(gè)內(nèi)容應(yīng)該推薦給用戶。使用域名推薦,用戶直接通過網(wǎng)址訪問主頁,這樣有嚴(yán)重的局限性,因?yàn)橐粋€(gè)網(wǎng)址包含很多不同的內(nèi)容和要提供給不同的群體。這種包含大量不同信息,類似新聞的網(wǎng)站相當(dāng)普遍和典型。
[0003]另外一個(gè)傳統(tǒng)的做法是通過搜索引擎。雖然這種方法有效但需要用戶有一個(gè)明確的搜索目標(biāo)。另一種辦法是去提供最受歡迎的子部分作為網(wǎng)頁上的推薦或會話。雖然同樣有效,但是這種方法不好確定什么是最受歡迎和需要用戶去瀏覽這些推薦。另外一種方法是使用簡易信息聚合的方法。這種方法也需要用戶手動識別和訂購不同的服務(wù)。因此需要一個(gè)更有效的方法去解決。
【發(fā)明內(nèi)容】
[0004]本發(fā)明是關(guān)于一個(gè)用于推薦用戶網(wǎng)站內(nèi)容的系統(tǒng)、方法和程序。在實(shí)施例中,用戶直接訪問網(wǎng)址的網(wǎng)頁,該網(wǎng)頁包羅了多個(gè)子頁的連接。然后,用戶通過該登陸頁訪問子頁的軌跡都會被記錄下來。接著,子頁中最高訪問量的網(wǎng)頁作為新的登陸頁。最后用戶就會被重新引導(dǎo)到新的登陸頁。
[0005]在另一個(gè)實(shí)施例中,用戶在網(wǎng)頁上的訪問軌跡都被記錄下來。此外,至少一個(gè)網(wǎng)頁用做基于用戶訪問軌跡的用戶喜愛網(wǎng)頁。進(jìn)一步,還必須至少有一個(gè)網(wǎng)頁作為網(wǎng)址登陸頁。在另一個(gè)實(shí)施例中,社區(qū)中用戶在網(wǎng)頁上訪問的軌跡被記錄下來。然后根據(jù)用戶的活動軌跡選擇一個(gè)網(wǎng)頁。該網(wǎng)頁則推薦給用戶社區(qū)。
【專利附圖】
【附圖說明】
[0006]為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其它的附圖。
[0007]圖1描述一個(gè)網(wǎng)絡(luò)架構(gòu),和其中的實(shí)施例相對應(yīng)。
[0008]圖2描述了一個(gè)典型的系統(tǒng),和其中的實(shí)施例相對應(yīng)。
[0009]圖3展會了一個(gè)系統(tǒng),用于跟蹤大量用戶的訪問軌跡,和其中的實(shí)施例相對應(yīng)。
[0010]圖4展示了一個(gè)系統(tǒng),用于自動重導(dǎo)向一個(gè)新的登陸頁,和其中的實(shí)施例相對應(yīng)。
【具體實(shí)施方式】
[0011]下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其它實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0012]圖1描述了一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)100,和一個(gè)實(shí)施例相對應(yīng)。如圖。至少有一個(gè)網(wǎng)絡(luò)102。在網(wǎng)絡(luò)架構(gòu)100的環(huán)境中,網(wǎng)絡(luò)102可以是包含以下但不限于以下的形式,例如電信網(wǎng)絡(luò)、局域網(wǎng)、無線網(wǎng)、對等網(wǎng)絡(luò)、電纜網(wǎng)絡(luò)等等。連接到網(wǎng)絡(luò)102的是大量的設(shè)備,如服務(wù)器104、用戶終端電腦106、PDA108、移動電話110、電視機(jī)112等等。
[0013]圖2描述了一個(gè)典型的系統(tǒng)200。系統(tǒng)200可以在圖1的網(wǎng)絡(luò)架構(gòu)100中實(shí)現(xiàn)。當(dāng)然也可以在任何特定的環(huán)境中實(shí)現(xiàn)。
[0014]如圖,系統(tǒng)200至少有一個(gè)中央處理器202和主存儲器204(例如RAM),還包含一個(gè)圖形處理器206和顯示器208。系統(tǒng)也包含第二存儲設(shè)備210.存儲設(shè)備210可以是硬盤、磁帶、軟盤等。通過可移動驅(qū)動器讀取數(shù)據(jù)。計(jì)算機(jī)程序或計(jì)算機(jī)控制邏輯算法存儲在主存儲器204或第二存儲設(shè)備210.[0015]在一個(gè)實(shí)施例中用戶直接通過網(wǎng)站訪問網(wǎng)頁,該網(wǎng)頁包含多個(gè)子頁。每一頁包含多種界面(如用戶圖形界面(GUI))。網(wǎng)站還包含一個(gè)登陸頁,該登陸頁是用戶訪問的起點(diǎn)(如通過網(wǎng)址訪問網(wǎng)站)。因此,在實(shí)施例中,用戶訪問被自動地指向一個(gè)網(wǎng)頁。此外,用戶的訪問軌跡會被記錄下來。訪問量最多的子頁會被指定為新的登陸頁。然后用戶之后的訪問會自動的重新導(dǎo)向。
[0016]在一個(gè)實(shí)施例中,用戶在網(wǎng)頁上的訪問軌跡都被記錄下來。此外,至少一個(gè)網(wǎng)頁用做基于用戶訪問軌跡的用戶喜愛網(wǎng)頁。進(jìn)一步,還必須至少有一個(gè)網(wǎng)頁作為網(wǎng)址主頁。在另一個(gè)實(shí)施例中,社區(qū)中用戶在網(wǎng)頁上訪問的軌跡被記錄下來。然后根據(jù)用戶的活動軌跡選擇一個(gè)網(wǎng)頁。該網(wǎng)頁則推薦給用戶社區(qū)。
[0017]如上所述,決定用戶更喜歡哪部分的網(wǎng)站的方法是通過學(xué)習(xí)用戶在網(wǎng)站內(nèi)的瀏覽模式得到。這個(gè)方法自動識別用戶更感興趣的網(wǎng)站部分,通過排除重復(fù)的導(dǎo)航軌跡,該導(dǎo)航軌跡是用戶習(xí)慣性的為了到達(dá)感興趣的內(nèi)容的軌跡。這個(gè)靈感是來源于門戶網(wǎng)站的智能導(dǎo)航。
[0018]網(wǎng)站內(nèi)容推薦系統(tǒng)能夠識別門戶外的網(wǎng)頁URLs。例如大量的用戶訪問BBC網(wǎng)站,但他們可能只是從相同的主頁門戶進(jìn)去然后瀏覽旅游、廚藝等子網(wǎng)頁。因此主頁并不代表用戶的興趣所在。
[0019]除了識別好的推薦內(nèi)容,URLs能夠作為用戶資料的基礎(chǔ)。通常,只基于網(wǎng)頁瀏覽的資料文件會包含許多不相關(guān)的網(wǎng)址網(wǎng)頁,影響區(qū)分用戶的興趣所在。例如BBC、CNET等門戶網(wǎng)站并不能告訴我們用戶的興趣所在。而相對的,當(dāng)前的方法能夠確定用戶感興趣的部分,比如BBC網(wǎng)站中的旅游部分。這些網(wǎng)頁的內(nèi)容不需要去分析或理解,是為了去形成一個(gè)資料的基礎(chǔ)——協(xié)作過濾系統(tǒng)利用用戶和他們的歷史記錄的共性去識別好的推薦內(nèi)容和伙伴。
[0020]進(jìn)一步地,網(wǎng)站內(nèi)容推薦系統(tǒng)能夠自動地分類識別的URLs。通過記錄用戶在門戶上的喜好,該系統(tǒng)生成一張藍(lán)圖表明用戶的類型。門戶上的用戶資料文件根據(jù)用戶瀏覽不同的內(nèi)容而建立起來。這些內(nèi)容可以用用戶社區(qū)偏好(UCPs)標(biāo)記起來,如運(yùn)動、音樂等。這些UCPs代表了用戶喜歡的內(nèi)容類型。內(nèi)容標(biāo)記則幫助對URLs進(jìn)行分類。
[0021]此外,該系統(tǒng)能夠區(qū)分個(gè)人喜好和組用戶喜好。通過這種方式,它能夠向個(gè)人推薦此人經(jīng)常訪問的個(gè)人或內(nèi)部網(wǎng)站,即使發(fā)現(xiàn)該網(wǎng)站被眾多用戶所喜好。
[0022]為了識別門戶外的URLs用于向用戶推薦,該系統(tǒng)關(guān)注用戶的網(wǎng)站進(jìn)入點(diǎn)或其他內(nèi)容收集并自動和隱性學(xué)習(xí)用戶感興趣的網(wǎng)頁,根據(jù)用戶的歷史記錄和類似用戶的瀏覽記錄。系統(tǒng)可能隨機(jī)地監(jiān)控一組用戶去決定哪個(gè)URLs對該組用戶比較重要。系統(tǒng)會進(jìn)一步自動識別URLs和有用的東西。例如URLs要求達(dá)到一個(gè)可見的重復(fù)等級才能被推薦到組用戶中。
[0023]作為一個(gè)可選項(xiàng),網(wǎng)站內(nèi)容推薦系統(tǒng)只適用于受歡迎且有確切數(shù)目網(wǎng)頁的網(wǎng)站。這個(gè)過濾器識別受歡迎的網(wǎng)址,在一定范圍的網(wǎng)頁內(nèi),該算法能達(dá)到最優(yōu)效果。例如假設(shè)一個(gè)域X被選擇,然后這個(gè)域中,所有的登陸頁都被標(biāo)記并且所有離開該網(wǎng)頁的鏈接都會被標(biāo)記(見圖3)。
[0024]如果一個(gè)子頁最受用戶或用戶組歡迎(如比其他子頁的瀏覽數(shù)超過一定數(shù)量),那么該子頁變成最好的進(jìn)入點(diǎn)。該過程會一直遞歸地循環(huán),直到一個(gè)父類被找到有多個(gè)受歡迎的子類。
[0025]舉個(gè)例子,如果一個(gè)用戶經(jīng)常訪問News, com,該網(wǎng)站有許多子網(wǎng)頁的鏈接。用戶主要瀏覽運(yùn)動部分然后是足球部分。接著用戶選擇世界杯的網(wǎng)頁。該網(wǎng)頁有一系列的子網(wǎng)頁的鏈接,但是用戶都沒有興趣而是瀏覽其他內(nèi)容的網(wǎng)頁。網(wǎng)站內(nèi)容推薦系統(tǒng)首先以主頁作為最受歡迎的進(jìn)入點(diǎn)開始。然后進(jìn)一步發(fā)現(xiàn)用戶經(jīng)常瀏覽運(yùn)動網(wǎng)頁。接著這網(wǎng)頁變成最優(yōu)進(jìn)入點(diǎn)推薦給用戶。該系統(tǒng)進(jìn)一步分析得知用戶經(jīng)常從該網(wǎng)頁瀏覽足球網(wǎng)頁。然后該網(wǎng)頁又變成最優(yōu)進(jìn)入點(diǎn)推薦給用戶。該過程一直持續(xù)知道系統(tǒng)到達(dá)世界杯的網(wǎng)頁,這時(shí)系統(tǒng)無法進(jìn)一步更新因?yàn)橛脩粢呀?jīng)沒有喜好的子網(wǎng)頁了。該遞歸過程會趨于穩(wěn)定在一定的回合之后,如圖4所示。一旦最受歡迎的登陸頁的子類被推薦,他們會變成登陸頁并且他們的子類也可以被推薦。當(dāng)然,子類需要超過一定受到歡迎度才能被推薦。
【權(quán)利要求】
1.一個(gè)非易失性計(jì)算機(jī)可讀介質(zhì)包含計(jì)算機(jī)程序,包含:計(jì)算機(jī)代碼用于引導(dǎo)用戶進(jìn)入登陸頁,通過URL,該登陸頁包含大量的子頁鏈接,每一個(gè)鏈接的URLs都不同于登陸頁,即每一個(gè)子頁都是獨(dú)立的網(wǎng)站并且不同于其他的子網(wǎng)頁;計(jì)算機(jī)代碼用于跟蹤用戶從登陸頁訪問每一個(gè)子頁的訪問數(shù)量;計(jì)算機(jī)代碼用于指定其中一個(gè)有最高訪問量的子頁作為用戶新的登陸頁,即新的登陸頁是用戶訪問網(wǎng)站的進(jìn)入點(diǎn),當(dāng)其中的子頁的訪問量超過其他子頁的一定數(shù)量之后,則該子頁被重新指定為新的登陸頁,其中是通過排除用戶為了到達(dá)目的網(wǎng)頁而產(chǎn)生的重復(fù)的瀏覽軌跡來實(shí)現(xiàn)的;計(jì)算機(jī)代碼自動地重新導(dǎo)向用戶到新的登陸頁 URL0
2.權(quán)利要求項(xiàng)I中的非易失性計(jì)算機(jī)可讀介質(zhì)還包括計(jì)算機(jī)代碼用于利用新的登陸頁的子頁URL作為用戶資料配置文件的基礎(chǔ)。
3.權(quán)利要求項(xiàng)2中的非易失性計(jì)算機(jī)可讀介質(zhì),新登陸頁的子網(wǎng)頁的URL會自動分類,通過識別用戶的一個(gè)或多個(gè)類型。
4.權(quán)利要求項(xiàng)3中的非易失性計(jì)算機(jī)可讀介質(zhì),新登陸頁的子網(wǎng)頁的URL會自動地分類,利用新登陸頁的目錄標(biāo)簽。
5.權(quán)利要求項(xiàng)I中的非易失性計(jì)算機(jī)可讀介質(zhì)還包括計(jì)算機(jī)代碼用于根據(jù)用戶的歷史記錄自動地識別URLs和有用的東西,這些對于用戶是隱藏的。即URLs要求達(dá)到一個(gè)可見的重復(fù)等級才能被推薦到組用戶中。
6.權(quán)利要求項(xiàng)I中的非易失性計(jì)算機(jī)可讀介質(zhì)中,其中指定的子網(wǎng)頁是根據(jù)用戶的瀏覽歷史記錄以及其他用戶的瀏覽歷史記錄計(jì)算得出。
7.權(quán)利要求項(xiàng)I中的非易失性計(jì)算機(jī)可讀介質(zhì)中,進(jìn)一步包含計(jì)算機(jī)代碼用于監(jiān)控一組用戶用于決定該組用戶的重要的URLs。
8.權(quán)利要求項(xiàng)I中的非易失性計(jì)算機(jī)可讀介質(zhì)中,進(jìn)一步包含能夠確定網(wǎng)站的網(wǎng)頁數(shù)量。
9.權(quán)利要求項(xiàng)8中的非易失性計(jì)算機(jī)可讀介質(zhì)中,進(jìn)一步包含比較網(wǎng)站的網(wǎng)頁數(shù)量和閥值數(shù)量。
10.權(quán)利要求項(xiàng)9中的非易失性計(jì)算機(jī)可讀介質(zhì)中,跟蹤、指定和重導(dǎo)向的過程僅當(dāng)網(wǎng)站的網(wǎng)頁數(shù)量超過一定的閥值才執(zhí)行。
11.權(quán)利要求項(xiàng)9中的非易失性計(jì)算機(jī)可讀介質(zhì)中,跟蹤、指定和重導(dǎo)向的過程對網(wǎng)站每一個(gè)登陸頁都執(zhí)行。
12.權(quán)利要求項(xiàng)I中的非易失性計(jì)算機(jī)可讀介質(zhì)中,進(jìn)一步包含:計(jì)算機(jī)代碼用于跟蹤社區(qū)中每一個(gè)用戶在網(wǎng)站上的活動,每個(gè)社區(qū)用戶分享至少一個(gè)相同的興趣;計(jì)算機(jī)代碼用于根據(jù)用戶活動選擇其中一個(gè)子網(wǎng)頁,該選擇的網(wǎng)頁存在活動歷史文件中且要達(dá)到一定的感興趣的用戶數(shù)量;計(jì)算機(jī)代碼推薦選擇的網(wǎng)頁給社區(qū)用戶。
13.權(quán)利要求項(xiàng)I中的非易失性計(jì)算機(jī)可讀介質(zhì)中,進(jìn)一步包含計(jì)算機(jī)代碼用于分類至少一個(gè)子網(wǎng)頁URL通過以下的方法:記錄喜好,利用多個(gè)社區(qū)用戶的喜好和他們訪問的網(wǎng)站網(wǎng)頁;監(jiān)控多個(gè)用戶在網(wǎng)頁內(nèi)容上的消耗時(shí)間;用多個(gè)社區(qū)用戶的喜好標(biāo)記該內(nèi)容;分類至少一個(gè)子網(wǎng)頁URLs利用內(nèi)容標(biāo)簽。
14.權(quán)利要求項(xiàng)13中的非易失性計(jì)算機(jī)可讀介質(zhì)中,社區(qū)喜好代表了社區(qū)用戶感興趣的內(nèi)容類型。
15.權(quán)利要求項(xiàng)I中的非易失性計(jì)算機(jī)可讀介質(zhì)中,登陸頁包含主頁。
16.權(quán)利要求項(xiàng)15中的非易失性計(jì)算機(jī)可讀介質(zhì)中,每個(gè)子網(wǎng)頁包括網(wǎng)站的一部分而不是主頁。
17.一種方法,包括:直接引導(dǎo)用戶到登陸頁,通過URL的方式。該登陸頁包含多個(gè)子網(wǎng)頁的鏈接,這些子網(wǎng)頁的URL不同于登陸頁UR1,每一個(gè)子網(wǎng)頁都是獨(dú)立于登陸頁且不同于其他子網(wǎng)頁;跟蹤用戶通過登陸頁訪問其他子網(wǎng)頁的訪問數(shù)量;指定其中一個(gè)最高訪問量的子網(wǎng)頁作為新的登陸頁。該新的登陸頁是用戶剛登陸的第一個(gè)網(wǎng)頁,該指定過程僅當(dāng)其中的一個(gè)子網(wǎng)頁的訪問數(shù)量超過其他網(wǎng)頁一定數(shù)量才執(zhí)行,其中排除了用戶為了到達(dá)目的地的導(dǎo)航軌跡中不必要的網(wǎng)頁;自動重定向用戶的新的登陸頁為子網(wǎng)頁的URL,在用戶一系列的訪問之后。
18.—個(gè)系統(tǒng),包括:一個(gè)硬件處理器用于直接引導(dǎo)用戶到登陸頁,通過URL的方式。該登陸頁包含多個(gè)子網(wǎng)頁的鏈接,這些子網(wǎng)頁的URL不同于登陸頁UR1,每一個(gè)子網(wǎng)頁都是獨(dú)立于登陸頁且不同于其他子網(wǎng)頁;跟蹤用戶通過登陸頁訪問其他子網(wǎng)頁的訪問數(shù)量;指定其中一個(gè)最高訪問量的子網(wǎng)頁作為新的登陸頁。該新的登陸頁是用戶剛登陸的第一個(gè)網(wǎng)頁,該指定過程僅當(dāng)其中的一個(gè)子網(wǎng)頁的訪問數(shù)量超過其他網(wǎng)頁一定數(shù)量才執(zhí)行,其中排除了用戶為了到達(dá)目的地的導(dǎo)航軌跡中不必要的網(wǎng)頁;自動重定向用戶的新的登陸頁為子網(wǎng)頁的URL,在用戶一系列的訪問之后。
19.權(quán)利要求項(xiàng) 8中的系統(tǒng),處理器通過總線連接到存儲器。
【文檔編號】G06F17/30GK103885967SQ201210560266
【公開日】2014年6月25日 申請日期:2012年12月20日 優(yōu)先權(quán)日:2012年12月20日
【發(fā)明者】湯武驚, 李圳龍, 羅笑南, 楊艾琳, 劉海亮, 吳超如, 郭江波 申請人:中山大學(xué)深圳研究院