本申請(qǐng)涉及互聯(lián)網(wǎng)領(lǐng)域,具體而言,涉及一種點(diǎn)擊路徑的統(tǒng)計(jì)方法和裝置。
背景技術(shù):
隨著技術(shù)的發(fā)展,如今一個(gè)網(wǎng)頁已不再僅僅是某些單一元素(文章,圖片,視頻)的展現(xiàn),在頁面上存在有多個(gè)交互元素的情況已成為常見的表現(xiàn)形式。然而,目前還沒有關(guān)于對(duì)用戶在網(wǎng)頁頁面上的點(diǎn)擊行為進(jìn)行分析的方案,無法確定出在網(wǎng)頁頁面上用戶點(diǎn)擊網(wǎng)頁元素的熱門路徑。
針對(duì)上述的問題,目前尚未提出有效的解決方案。
技術(shù)實(shí)現(xiàn)要素:
本申請(qǐng)實(shí)施例提供了一種點(diǎn)擊路徑的統(tǒng)計(jì)方法和裝置,以至少解決無法確定出在網(wǎng)頁頁面上用戶點(diǎn)擊網(wǎng)頁元素的熱門路徑的技術(shù)問題。
根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面,提供了一種點(diǎn)擊路徑的統(tǒng)計(jì)方法,包括:獲取用戶在目標(biāo)網(wǎng)頁上的點(diǎn)擊行為數(shù)據(jù),其中,所述點(diǎn)擊行為數(shù)據(jù)記錄有用戶在所述目標(biāo)網(wǎng)頁上點(diǎn)擊網(wǎng)頁元素的行為路徑;由所述點(diǎn)擊行為數(shù)據(jù)中每一條行為路徑生成一個(gè)路徑集合,其中,所述路徑集合包含有對(duì)應(yīng)的行為路徑中至少點(diǎn)擊兩個(gè)網(wǎng)頁元素的子路徑;統(tǒng)計(jì)生成的路徑集合中子路徑出現(xiàn)的次數(shù);以及將出現(xiàn)次數(shù)最多的子路徑作為所述目標(biāo)網(wǎng)頁上的熱門路徑。
進(jìn)一步地,將出現(xiàn)次數(shù)最多的子路徑作為所述目標(biāo)網(wǎng)頁上的熱門路徑包括:將出現(xiàn)次數(shù)相同且相互之間具有包含關(guān)系的兩條子路徑合并,將合并的兩條子路徑中路徑長(zhǎng)的子路徑作為合并后的子路徑;將合并后出現(xiàn)次數(shù)最多的子路徑作為所述目標(biāo)網(wǎng)頁上的熱門路徑。
進(jìn)一步地,獲取用戶在目標(biāo)網(wǎng)頁上的點(diǎn)擊行為數(shù)據(jù)包括:對(duì)所述目標(biāo)網(wǎng)頁上的所有網(wǎng)頁元素進(jìn)行標(biāo)示,將唯一表示網(wǎng)頁元素的唯一識(shí)別碼代替相應(yīng)的網(wǎng)頁元素;用所述唯一識(shí)別碼記錄用戶點(diǎn)擊網(wǎng)頁元素的行為路徑,得到所述點(diǎn)擊行為數(shù)據(jù)。
進(jìn)一步地,由所述點(diǎn)擊行為數(shù)據(jù)中每一條行為路徑生成一個(gè)路徑集合包括:將由 所述唯一識(shí)別碼記錄的行為路徑拆解成個(gè)子路徑,得到所述路徑集合,其中,表示從包含有n個(gè)唯一識(shí)別碼的行為路徑中拆解出包含有i個(gè)唯一識(shí)別碼的子路徑的數(shù)量。
進(jìn)一步地,在將出現(xiàn)次數(shù)最多的子路徑作為所述目標(biāo)網(wǎng)頁上的熱門路徑之后,所述方法還包括:將出現(xiàn)次數(shù)最多的子路徑中各唯一識(shí)別碼轉(zhuǎn)化為相應(yīng)的網(wǎng)頁元素的名稱;將轉(zhuǎn)化后的網(wǎng)頁元素的名稱按照現(xiàn)次數(shù)最多的子路徑中唯一識(shí)別碼的順序排序后進(jìn)行展示。
根據(jù)本申請(qǐng)實(shí)施例的另一方面,還提供了一種點(diǎn)擊路徑的統(tǒng)計(jì)裝置,包括:獲取單元,用于獲取用戶在目標(biāo)網(wǎng)頁上的點(diǎn)擊行為數(shù)據(jù),其中,所述點(diǎn)擊行為數(shù)據(jù)記錄有用戶在所述目標(biāo)網(wǎng)頁上點(diǎn)擊網(wǎng)頁元素的行為路徑;生成單元,用于由所述點(diǎn)擊行為數(shù)據(jù)中每一條行為路徑生成一個(gè)路徑集合,其中,所述路徑集合包含有對(duì)應(yīng)的行為路徑中至少點(diǎn)擊兩個(gè)網(wǎng)頁元素的子路徑;統(tǒng)計(jì)單元,用于統(tǒng)計(jì)生成的路徑集合中子路徑出現(xiàn)的次數(shù);以及確定單元,用于將出現(xiàn)次數(shù)最多的子路徑作為所述目標(biāo)網(wǎng)頁上的熱門路徑。
進(jìn)一步地,所述確定單元包括:合并模塊,用于將出現(xiàn)次數(shù)相同且相互之間具有包含關(guān)系的兩條子路徑合并,將合并的兩條子路徑中路徑長(zhǎng)的子路徑作為合并后的子路徑;確定模塊,用于將合并后出現(xiàn)次數(shù)最多的子路徑作為所述目標(biāo)網(wǎng)頁上的熱門路徑。
進(jìn)一步地,所述獲取單元包括:標(biāo)示模塊,用于對(duì)所述目標(biāo)網(wǎng)頁上的所有網(wǎng)頁元素進(jìn)行標(biāo)示,將唯一表示網(wǎng)頁元素的唯一識(shí)別碼代替相應(yīng)的網(wǎng)頁元素;記錄模塊,用于用所述唯一識(shí)別碼記錄用戶點(diǎn)擊網(wǎng)頁元素的行為路徑,得到所述點(diǎn)擊行為數(shù)據(jù)。
進(jìn)一步地,所述生成單元包括:生成模塊,用于將由所述唯一識(shí)別碼記錄的行為路徑拆解成個(gè)子路徑,得到所述路徑集合,其中,表示從包含有n個(gè)唯一識(shí)別碼的行為路徑中拆解出包含有i個(gè)唯一識(shí)別碼的子路徑的數(shù)量。
進(jìn)一步地,所述裝置還包括:轉(zhuǎn)化單元,用于在將出現(xiàn)次數(shù)最多的子路徑作為所述目標(biāo)網(wǎng)頁上的熱門路徑之后,將出現(xiàn)次數(shù)最多的子路徑中各唯一識(shí)別碼轉(zhuǎn)化為相應(yīng)的網(wǎng)頁元素的名稱;顯示單元,用于將轉(zhuǎn)化后的網(wǎng)頁元素的名稱按照現(xiàn)次數(shù)最多的子路徑中唯一識(shí)別碼的順序排序后進(jìn)行展示。
根據(jù)本申請(qǐng)實(shí)施例,通過獲取用戶在目標(biāo)網(wǎng)頁上的記錄有用戶在目標(biāo)網(wǎng)頁上點(diǎn)擊網(wǎng)頁元素的行為路徑的點(diǎn)擊行為數(shù)據(jù),由點(diǎn)擊行為數(shù)據(jù)中每一條行為路徑生成一個(gè)路徑集合,統(tǒng)計(jì)所有生成的路徑集合中子路徑出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)最多的子路徑作為目標(biāo)網(wǎng)頁上的熱門路徑,從而確定出目標(biāo)網(wǎng)頁上的網(wǎng)頁元素的熱門路徑,解決了無法確定出在網(wǎng)頁頁面上用戶點(diǎn)擊網(wǎng)頁元素的熱門路徑的技術(shù)問題。在此基礎(chǔ)上,可以根據(jù)熱門路徑進(jìn)一步分析多個(gè)元素之間的安排是否對(duì)于用戶的點(diǎn)擊和轉(zhuǎn)化帶來影響。
附圖說明
此處所說明的附圖用來提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申請(qǐng)的示意性實(shí)施例及其說明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:
圖1是根據(jù)本申請(qǐng)實(shí)施例的點(diǎn)擊路徑的統(tǒng)計(jì)方法的流程圖;
圖2是根據(jù)本申請(qǐng)實(shí)施例的點(diǎn)擊路徑的統(tǒng)計(jì)裝置的示意圖。
具體實(shí)施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本申請(qǐng)方案,下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分的實(shí)施例,而不是全部的實(shí)施例。基于本申請(qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本申請(qǐng)保護(hù)的范圍。
需要說明的是,本申請(qǐng)的說明書和權(quán)利要求書及上述附圖中的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本申請(qǐng)的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。
根據(jù)本申請(qǐng)實(shí)施例,提供了一種點(diǎn)擊路徑的統(tǒng)計(jì)方法的方法實(shí)施例,需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。
圖1是根據(jù)本申請(qǐng)實(shí)施例的點(diǎn)擊路徑的統(tǒng)計(jì)方法的流程圖,如圖1所示,該方法包括如下步驟:
步驟S102,獲取用戶在目標(biāo)網(wǎng)頁上的點(diǎn)擊行為數(shù)據(jù)。其中,點(diǎn)擊行為數(shù)據(jù)記錄有用戶在目標(biāo)網(wǎng)頁上點(diǎn)擊網(wǎng)頁元素的行為路徑。
步驟S104,由點(diǎn)擊行為數(shù)據(jù)中每一條行為路徑生成一個(gè)路徑集合,其中,路徑集合包含有對(duì)應(yīng)的行為路徑中至少點(diǎn)擊兩個(gè)網(wǎng)頁元素的子路徑。
步驟S106,統(tǒng)計(jì)生成的路徑集合中子路徑出現(xiàn)的次數(shù)。
步驟S108,將出現(xiàn)次數(shù)最多的子路徑作為目標(biāo)網(wǎng)頁上的熱門路徑。
對(duì)于用戶在目標(biāo)網(wǎng)頁上的點(diǎn)擊行為數(shù)據(jù),可以通過在目標(biāo)網(wǎng)頁上設(shè)置爬蟲程序,記錄用戶在目標(biāo)網(wǎng)頁上的點(diǎn)擊行為,得到點(diǎn)擊行為數(shù)據(jù),也可以從目標(biāo)網(wǎng)頁的訪問日志上獲取點(diǎn)擊行為數(shù)據(jù)。點(diǎn)擊網(wǎng)頁元素的行為路徑是指由同一在一次訪問中,按順序點(diǎn)擊的網(wǎng)頁元素形成的路徑,例如,用戶在訪問目標(biāo)網(wǎng)頁過程中,依次點(diǎn)擊了目標(biāo)網(wǎng)頁上的文章a、圖片b、圖片c和視頻e,因此,由文章a、圖片b、圖片c和視頻e形成用戶的一條點(diǎn)擊行為路徑:文章a-圖片b-圖片c-視頻e。
獲取到點(diǎn)擊行為數(shù)據(jù)之后,將由每一條行為路徑生成一個(gè)路徑集合,該路徑集合中可以包括至少點(diǎn)擊了兩個(gè)網(wǎng)頁元素的子路徑,以上述路徑為例,生成的路徑集合可以是{文章a-圖片b,圖片b-圖片c,圖片c-視頻e,圖片b-視頻e,文章a-圖片c,文章a-視頻e,文章a-圖片b-圖片c,文章a-圖片b-視頻e,文章a-圖片c-視頻e圖片b-圖片c-視頻e,文章a-圖片b-圖片c-視頻e}。由每條行為路徑生成一條路徑集合,多條行為路徑生成多個(gè)路徑集合。然后,統(tǒng)計(jì)所有路徑集合中每條子路徑出現(xiàn)的次數(shù),并將出現(xiàn)次數(shù)最多的子路徑作為該目標(biāo)網(wǎng)頁上的熱門路徑。
根據(jù)本申請(qǐng)實(shí)施例,通過獲取用戶在目標(biāo)網(wǎng)頁上的記錄有用戶在目標(biāo)網(wǎng)頁上點(diǎn)擊網(wǎng)頁元素的行為路徑的點(diǎn)擊行為數(shù)據(jù),由點(diǎn)擊行為數(shù)據(jù)中每一條行為路徑生成一個(gè)路徑集合,統(tǒng)計(jì)所有生成的路徑集合中子路徑出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)最多的子路徑作為目標(biāo)網(wǎng)頁上的熱門路徑,從而確定出目標(biāo)網(wǎng)頁上的網(wǎng)頁元素的熱門路徑,解決了無法確定出在網(wǎng)頁頁面上用戶點(diǎn)擊網(wǎng)頁元素的熱門路徑的技術(shù)問題。在此基礎(chǔ)上,可以根據(jù)熱門路徑進(jìn)一步分析多個(gè)元素之間的安排是否對(duì)于用戶的點(diǎn)擊和轉(zhuǎn)化帶來影響。
優(yōu)選地,將出現(xiàn)次數(shù)最多的子路徑作為目標(biāo)網(wǎng)頁上的熱門路徑包括:將出現(xiàn)次數(shù)相同且相互之間具有包含關(guān)系的兩條子路徑合并,將合并的兩條子路徑中路徑長(zhǎng)的子路徑作為合并后的子路徑;將合并后出現(xiàn)次數(shù)最多的子路徑作為目標(biāo)網(wǎng)頁上的熱門路徑。
本申請(qǐng)實(shí)施例中,由于同一路徑集合或者不同路徑集合之間,子路徑均有長(zhǎng)有短,且長(zhǎng)的子路徑包含有短的子路徑中所有元素,以上述舉例中的行為路徑為例,子路徑:文章a-圖片b-圖片c-視頻e包括所有其他的子路徑,子路徑:文章a-圖片b-圖片c包含有子路徑:文章a-圖片b,圖片b-圖片c和文章a-圖片c。當(dāng)統(tǒng)計(jì)結(jié)果中,長(zhǎng)的子路徑與短的子路徑出現(xiàn)的次數(shù)相同時(shí),則短的子路徑合并到長(zhǎng)的子路徑中,以對(duì)統(tǒng)計(jì)后的子路徑進(jìn)行整合,將最終的出現(xiàn)次數(shù)最多的子路徑作為熱門路徑。
本申請(qǐng)實(shí)施例中,通過將長(zhǎng)短子路徑進(jìn)行整合,保證出現(xiàn)的統(tǒng)計(jì)出的熱門路徑盡可能為長(zhǎng)的路徑,且減少子路徑的總數(shù)量。
優(yōu)選地,獲取用戶在目標(biāo)網(wǎng)頁上的點(diǎn)擊行為數(shù)據(jù)包括:對(duì)目標(biāo)網(wǎng)頁上的所有網(wǎng)頁元素進(jìn)行標(biāo)示,將唯一表示網(wǎng)頁元素的唯一識(shí)別碼代替相應(yīng)的網(wǎng)頁元素;用唯一識(shí)別碼記錄用戶點(diǎn)擊網(wǎng)頁元素的行為路徑,得到點(diǎn)擊行為數(shù)據(jù)。
本申請(qǐng)實(shí)施例中,將目標(biāo)網(wǎng)頁上的所有元素用其相應(yīng)的唯一識(shí)別碼進(jìn)行標(biāo)示,然后以唯一識(shí)別碼記錄用戶點(diǎn)擊網(wǎng)頁元素的行為路徑。
例:目標(biāo)網(wǎng)頁上包含有網(wǎng)頁元素:視頻A(1),視頻B(2),圖片A(3),圖片B(4),文章鏈接A(5)。其中,括號(hào)內(nèi)為相應(yīng)的網(wǎng)頁元素對(duì)應(yīng)的識(shí)別碼,有三個(gè)用戶:
甲:視頻A-圖片B-文章鏈接A-圖片A;
乙:視頻B-圖片B-文章鏈接A-圖片A;
丙:視頻B-視頻A-圖片B-文章鏈接A-圖片A;
記錄的點(diǎn)擊行為數(shù)據(jù)為:
甲:1-4-5-3;
乙:2-4-5-3;
丙:2-1-4-5-3。
根據(jù)本申請(qǐng)實(shí)施例,通過用唯一識(shí)別碼代替相應(yīng)的網(wǎng)頁元素,記錄用戶在目標(biāo)網(wǎng)頁上的點(diǎn)擊行為數(shù)據(jù),大大降低了記錄的數(shù)據(jù)量。
優(yōu)選地,由點(diǎn)擊行為數(shù)據(jù)中每一條行為路徑生成一個(gè)路徑集合包括:將由唯一識(shí)別碼記錄的行為路徑拆解成個(gè)子路徑,得到路徑集合,其中,表示從包含有n個(gè)唯一識(shí)別碼的行為路徑中拆解出包含有i個(gè)唯一識(shí)別碼的子路徑的數(shù)量。
表示n個(gè)元素中i個(gè)元素?zé)o序組合的總數(shù)量,即從包含有n個(gè)唯一識(shí)別碼的行為路徑中拆解出包含有i個(gè)唯一識(shí)別碼的子路徑的數(shù)量。本申請(qǐng)實(shí)施例中,將每一條由唯一識(shí)別碼記錄的行為路徑拆解成個(gè)子路徑,如上述舉例中,用戶甲的行為路徑對(duì)應(yīng)的路徑集合為:{1-4-5-3,1-5-3,1-4-5,1-4-3,4-5-3,1-4,1-5,1-3,4-5,4-3,5-3},則可以判斷出熱門路徑為4-5-3(出現(xiàn)3次),具體的計(jì)算邏輯為,現(xiàn)將所有的路徑拆分為,則甲可以分成:1-4-5-3,1-5-3,1-4-5,1-4-3,4-5-3,1-4,1-5,1-3,4-5,4-3,5-3,共十一種,相應(yīng)的將所有的用戶行為數(shù)據(jù)進(jìn)行打散,然后統(tǒng)計(jì)。雖然5-3和4-5-3都出現(xiàn)了3次,但是因?yàn)?-5-3的路徑包含了5-3,所以將4-5-3作為熱門路徑。
優(yōu)選地,在將出現(xiàn)次數(shù)最多的子路徑作為目標(biāo)網(wǎng)頁上的熱門路徑之后,方法還包括:將出現(xiàn)次數(shù)最多的子路徑中各唯一識(shí)別碼轉(zhuǎn)化為相應(yīng)的網(wǎng)頁元素的名稱;將轉(zhuǎn)化后的網(wǎng)頁元素的名稱按照現(xiàn)次數(shù)最多的子路徑中唯一識(shí)別碼的順序排序后進(jìn)行展示。
在確定出熱門路徑之后,將熱門路徑即出現(xiàn)次數(shù)最多的子路徑中各唯一識(shí)別碼轉(zhuǎn)化為相應(yīng)的網(wǎng)頁元素的名稱,然后按照原有的順序進(jìn)行展示,例如上述距離中,4-5-3為熱門路徑,所以最后在前端進(jìn)行展現(xiàn)時(shí),將其轉(zhuǎn)化成圖片B-文章鏈接A-圖片A進(jìn)行展示。
本申請(qǐng)實(shí)施例中,在利用唯一識(shí)別碼確定出熱門路徑之后,將唯一識(shí)別碼表示的熱門路徑轉(zhuǎn)化為網(wǎng)頁元素的名稱表示的熱門路徑,并進(jìn)行展示,直觀地反映出熱門路徑的網(wǎng)頁元素。
下面對(duì)本申請(qǐng)實(shí)施例中的一種可選的實(shí)施方式進(jìn)行描述,具體包括:
1.對(duì)頁面的元素進(jìn)行唯一識(shí)別碼的標(biāo)示;
2.統(tǒng)計(jì)用戶的網(wǎng)頁元素點(diǎn)擊行為,得出所有用戶的點(diǎn)擊行為數(shù)據(jù);
3.將用戶的點(diǎn)擊行為數(shù)據(jù)通過唯一識(shí)別碼在前端進(jìn)行編譯(翻譯),并傳送編譯后數(shù)據(jù)到服務(wù)器端;
4.將每一個(gè)用戶的行為路徑進(jìn)行打散,則每個(gè)用戶可得到子路徑數(shù)為:
5.得到所有用戶的打散數(shù)據(jù)后進(jìn)行數(shù)量累計(jì)統(tǒng)計(jì);
6.得到數(shù)量統(tǒng)計(jì)后按序排列,當(dāng)統(tǒng)計(jì)數(shù)相同時(shí),將短路徑并入長(zhǎng)路徑之中,如得 到A-B-C為5次,A-B也為5次,B-C也為5次,A-C同樣為5次,則因?yàn)锳-B-C的路徑最長(zhǎng)且包含了A-B,B-C,A-C,所以這四條路徑合并為一條:A-B-C 5次進(jìn)行排列。
7.得出排序的識(shí)別碼標(biāo)號(hào)組合,其中,統(tǒng)計(jì)數(shù)(出現(xiàn)次數(shù))最多的即為熱門路徑。
8.在前端進(jìn)行展現(xiàn)時(shí),將唯一識(shí)別碼轉(zhuǎn)化為相應(yīng)的元素名稱按序排列。
本申請(qǐng)實(shí)施例還提供了一種點(diǎn)擊路徑的統(tǒng)計(jì)裝置,該裝置可以用于執(zhí)行本申請(qǐng)實(shí)施例的點(diǎn)擊路徑的統(tǒng)計(jì)方法,如圖2所示,該裝置包括:獲取單元10、生成單元20、統(tǒng)計(jì)單元30和確定單元40。
獲取單元10用于獲取用戶在目標(biāo)網(wǎng)頁上的點(diǎn)擊行為數(shù)據(jù),其中,點(diǎn)擊行為數(shù)據(jù)記錄有用戶在目標(biāo)網(wǎng)頁上點(diǎn)擊網(wǎng)頁元素的行為路徑。
生成單元20用于由點(diǎn)擊行為數(shù)據(jù)中每一條行為路徑生成一個(gè)路徑集合,其中,路徑集合包含有對(duì)應(yīng)的行為路徑中至少點(diǎn)擊兩個(gè)網(wǎng)頁元素的子路徑。
統(tǒng)計(jì)單元30用于統(tǒng)計(jì)生成的路徑集合中子路徑出現(xiàn)的次數(shù)。
確定單元40用于將出現(xiàn)次數(shù)最多的子路徑作為目標(biāo)網(wǎng)頁上的熱門路徑。
對(duì)于用戶在目標(biāo)網(wǎng)頁上的點(diǎn)擊行為數(shù)據(jù),可以通過在目標(biāo)網(wǎng)頁上設(shè)置爬蟲程序,記錄用戶在目標(biāo)網(wǎng)頁上的點(diǎn)擊行為,得到點(diǎn)擊行為數(shù)據(jù),也可以從目標(biāo)網(wǎng)頁的訪問日志上獲取點(diǎn)擊行為數(shù)據(jù)。點(diǎn)擊網(wǎng)頁元素的行為路徑是指由同一在一次訪問中,按順序點(diǎn)擊的網(wǎng)頁元素形成的路徑,例如,用戶在訪問目標(biāo)網(wǎng)頁過程中,依次點(diǎn)擊了目標(biāo)網(wǎng)頁上的文章a、圖片b、圖片c和視頻e,因此,由文章a、圖片b、圖片c和視頻e形成用戶的一條點(diǎn)擊行為路徑:文章a-圖片b-圖片c-視頻e。
獲取到點(diǎn)擊行為數(shù)據(jù)之后,將由每一條行為路徑生成一個(gè)路徑集合,該路徑集合中可以包括至少點(diǎn)擊了兩個(gè)網(wǎng)頁元素的子路徑,以上述路徑為例,生成的路徑集合可以是{文章a-圖片b,圖片b-圖片c,圖片c-視頻e,圖片b-視頻e,文章a-圖片c,文章a-視頻e,文章a-圖片b-圖片c,文章a-圖片b-視頻e,文章a-圖片c-視頻e圖片b-圖片c-視頻e,文章a-圖片b-圖片c-視頻e}。由每條行為路徑生成一條路徑集合,多條行為路徑生成多個(gè)路徑集合。然后,統(tǒng)計(jì)所有路徑集合中每條子路徑出現(xiàn)的次數(shù),并將出現(xiàn)次數(shù)最多的子路徑作為該目標(biāo)網(wǎng)頁上的熱門路徑。
根據(jù)本申請(qǐng)實(shí)施例,通過獲取用戶在目標(biāo)網(wǎng)頁上的記錄有用戶在目標(biāo)網(wǎng)頁上點(diǎn)擊網(wǎng)頁元素的行為路徑的點(diǎn)擊行為數(shù)據(jù),由點(diǎn)擊行為數(shù)據(jù)中每一條行為路徑生成一個(gè)路徑集合,統(tǒng)計(jì)所有生成的路徑集合中子路徑出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)最多的子路徑作為目標(biāo)網(wǎng)頁上的熱門路徑,從而確定出目標(biāo)網(wǎng)頁上的網(wǎng)頁元素的熱門路徑,解決了無 法確定出在網(wǎng)頁頁面上用戶點(diǎn)擊網(wǎng)頁元素的熱門路徑的技術(shù)問題。在此基礎(chǔ)上,可以根據(jù)熱門路徑進(jìn)一步分析多個(gè)元素之間的安排是否對(duì)用戶的點(diǎn)擊和轉(zhuǎn)化帶來影響。
優(yōu)選地,確定單元包括:合并模塊,用于將出現(xiàn)次數(shù)相同且相互之間具有包含關(guān)系的兩條子路徑合并,將合并的兩條子路徑中路徑長(zhǎng)的子路徑作為合并后的子路徑;確定模塊,用于將合并后出現(xiàn)次數(shù)最多的子路徑作為目標(biāo)網(wǎng)頁上的熱門路徑。
本申請(qǐng)實(shí)施例中,由于同一路徑集合或者不同路徑集合之間,子路徑均有長(zhǎng)有短,且長(zhǎng)的子路徑包含有短的子路徑中所有元素,以上述舉例中的行為路徑為例,子路徑:文章a-圖片b-圖片c-視頻e包括所有其他的子路徑,子路徑:文章a-圖片b-圖片c包含有子路徑:文章a-圖片b,圖片b-圖片c和文章a-圖片c。當(dāng)統(tǒng)計(jì)結(jié)果中,長(zhǎng)的子路徑與短的子路徑出現(xiàn)的次數(shù)相同時(shí),則短的子路徑合并到長(zhǎng)的子路徑中,以對(duì)統(tǒng)計(jì)后的子路徑進(jìn)行整合,將最終的出現(xiàn)次數(shù)最多的子路徑作為熱門路徑。
本申請(qǐng)實(shí)施例中,通過將長(zhǎng)短子路徑進(jìn)行整合,保證出現(xiàn)的統(tǒng)計(jì)出的熱門路徑盡可能為長(zhǎng)的路徑,且減少子路徑的總數(shù)量。
優(yōu)選地,獲取單元包括:標(biāo)示模塊,用于對(duì)目標(biāo)網(wǎng)頁上的所有網(wǎng)頁元素進(jìn)行標(biāo)示,將唯一表示網(wǎng)頁元素的唯一識(shí)別碼代替相應(yīng)的網(wǎng)頁元素;記錄模塊,用于用唯一識(shí)別碼記錄用戶點(diǎn)擊網(wǎng)頁元素的行為路徑,得到點(diǎn)擊行為數(shù)據(jù)。
本申請(qǐng)實(shí)施例中,將目標(biāo)網(wǎng)頁上的所有元素用其相應(yīng)的唯一識(shí)別碼進(jìn)行標(biāo)示,然后以唯一識(shí)別碼記錄用戶點(diǎn)擊網(wǎng)頁元素的行為路徑。
例:目標(biāo)網(wǎng)頁上包含有網(wǎng)頁元素:視頻A(1),視頻B(2),圖片A(3),圖片B(4),文章鏈接A(5)。其中,括號(hào)內(nèi)為相應(yīng)的網(wǎng)頁元素對(duì)應(yīng)的識(shí)別碼,有三個(gè)用戶:
甲:視頻A-圖片B-文章鏈接A-圖片A;
乙:視頻B-圖片B-文章鏈接A-圖片A;
丙:視頻B-視頻A-圖片B-文章鏈接A-圖片A;
記錄的點(diǎn)擊行為數(shù)據(jù)為:
甲:1-4-5-3;
乙:2-4-5-3;
丙:2-1-4-5-3。
根據(jù)本申請(qǐng)實(shí)施例,通過用唯一識(shí)別碼代替相應(yīng)的網(wǎng)頁元素,記錄用戶在目標(biāo)網(wǎng) 頁上的點(diǎn)擊行為數(shù)據(jù),大大降低了記錄的數(shù)據(jù)量。
優(yōu)選地,生成單元包括:生成模塊,用于將由唯一識(shí)別碼記錄的行為路徑拆解成個(gè)子路徑,得到路徑集合,其中,表示從包含有n個(gè)唯一識(shí)別碼的行為路徑中拆解出包含有i個(gè)唯一識(shí)別碼的子路徑的數(shù)量。
表示n個(gè)元素中i個(gè)元素?zé)o序組合的總數(shù)量,即從包含有n個(gè)唯一識(shí)別碼的行為路徑中拆解出包含有i個(gè)唯一識(shí)別碼的子路徑的數(shù)量。本申請(qǐng)實(shí)施例中,將每一條由唯一識(shí)別碼記錄的行為路徑拆解成個(gè)子路徑,如上述舉例中,用戶甲的行為路徑對(duì)應(yīng)的路徑集合為:{1-4-5-3,1-5-3,1-4-5,1-4-3,4-5-3,1-4,1-5,1-3,4-5,4-3,5-3},則可以判斷出熱門路徑為4-5-3(出現(xiàn)3次),具體的計(jì)算邏輯為,現(xiàn)將所有的路徑拆分為,則甲可以分成:1-4-5-3,1-5-3,1-4-5,1-4-3,4-5-3,1-4,1-5,1-3,4-5,4-3,5-3十一種,相應(yīng)的將所有的用戶行為數(shù)據(jù)進(jìn)行打散,然后統(tǒng)計(jì)。雖然5-3和4-5-3都出現(xiàn)了3次,但是因?yàn)?-5-3的路徑包含了5-3,所以將4-5-3作為熱門路徑。
優(yōu)選地,裝置還包括:轉(zhuǎn)化單元,用于在將出現(xiàn)次數(shù)最多的子路徑作為目標(biāo)網(wǎng)頁上的熱門路徑之后,將出現(xiàn)次數(shù)最多的子路徑中各唯一識(shí)別碼轉(zhuǎn)化為相應(yīng)的網(wǎng)頁元素的名稱;顯示單元,用于將轉(zhuǎn)化后的網(wǎng)頁元素的名稱按照現(xiàn)次數(shù)最多的子路徑中唯一識(shí)別碼的順序排序后進(jìn)行展示。
在確定出熱門路徑之后,將熱門路徑即出現(xiàn)次數(shù)最多的子路徑中各唯一識(shí)別碼轉(zhuǎn)化為相應(yīng)的網(wǎng)頁元素的名稱,然后按照原有的順序進(jìn)行展示,例如上述距離中,4-5-3為熱門路徑,所以最后在前端進(jìn)行展現(xiàn)時(shí),將其轉(zhuǎn)化成圖片B-文章鏈接A-圖片A進(jìn)行展示。
本申請(qǐng)實(shí)施例中,在利用唯一識(shí)別碼確定出熱門路徑之后,將唯一識(shí)別碼表示的熱門路徑轉(zhuǎn)化為網(wǎng)頁元素的名稱表示的熱門路徑,并進(jìn)行展示,直觀地反映出熱門路徑的網(wǎng)頁元素。
所述點(diǎn)擊路徑的統(tǒng)計(jì)裝置包括處理器和存儲(chǔ)器,上述獲取單元10、生成單元20、統(tǒng)計(jì)單元30和確定單元40等均作為程序單元存儲(chǔ)在存儲(chǔ)器中,由處理器執(zhí)行存儲(chǔ)在存儲(chǔ)器中的上述程序單元。上述路徑集合可以存儲(chǔ)在存儲(chǔ)器中。
處理器中包含內(nèi)核,由內(nèi)核去存儲(chǔ)器中調(diào)取相應(yīng)的程序單元。內(nèi)核可以設(shè)置一個(gè) 或以上,通過調(diào)整內(nèi)核參數(shù)來確定熱門路徑。
存儲(chǔ)器可能包括計(jì)算機(jī)可讀介質(zhì)中的非永久性存儲(chǔ)器,隨機(jī)存取存儲(chǔ)器(RAM)和/或非易失性內(nèi)存等形式,如只讀存儲(chǔ)器(ROM)或閃存(flash RAM),存儲(chǔ)器包括至少一個(gè)存儲(chǔ)芯片。
本申請(qǐng)還提供了一種計(jì)算機(jī)程序產(chǎn)品的實(shí)施例,當(dāng)在數(shù)據(jù)處理設(shè)備上執(zhí)行時(shí),適于執(zhí)行初始化有如下方法步驟的程序代碼:獲取用戶在目標(biāo)網(wǎng)頁上的記錄有用戶在目標(biāo)網(wǎng)頁上點(diǎn)擊網(wǎng)頁元素的行為路徑的點(diǎn)擊行為數(shù)據(jù),由點(diǎn)擊行為數(shù)據(jù)中每一條行為路徑生成一個(gè)路徑集合,統(tǒng)計(jì)所有生成的路徑集合中子路徑出現(xiàn)的次數(shù),將出現(xiàn)次數(shù)最多的子路徑作為目標(biāo)網(wǎng)頁上的熱門路徑。
上述本申請(qǐng)實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
在本申請(qǐng)的上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。
在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的技術(shù)內(nèi)容,可通過其它的方式實(shí)現(xiàn)。其中,以上所描述的裝置實(shí)施例僅僅是示意性的,例如所述單元的劃分,可以為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本申請(qǐng)各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。
所述集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本申請(qǐng)的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī)、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、移動(dòng)硬盤、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
以上所述僅是本申請(qǐng)的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本申請(qǐng)?jiān)淼那疤嵯?,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本申請(qǐng)的保護(hù)范圍。