本技術(shù)涉及終端領(lǐng)域,尤其涉及一種頁面信息的收集方法及電子設(shè)備。
背景技術(shù):
1、目前,越來越多的業(yè)務(wù)依賴于收集大量且高質(zhì)量的數(shù)據(jù)。以頁面信息這一數(shù)據(jù)為例,收集大量的頁面信息,為不同類別的頁面信息標(biāo)注對應(yīng)類別的標(biāo)簽,后續(xù)可以為不同標(biāo)簽的頁面提供更多業(yè)務(wù),例如優(yōu)化不同頁面對應(yīng)的運行參數(shù)、定向?qū)δ繕?biāo)頁面投放廣告等等。然而,目前的頁面信息通常依賴于人工操作,如何收集大量且高質(zhì)量的布局信息,則是亟待結(jié)局的問題。
技術(shù)實現(xiàn)思路
1、本技術(shù)提供了一種頁面信息的收集方法及電子設(shè)備,該方法應(yīng)用于第一設(shè)備。該方法包括:第一設(shè)備可以采用自動化命令控制第二設(shè)備依次顯示一個頁面,在每控制第二設(shè)備顯示一個頁面后,獲取當(dāng)前頁面的頁面信息。此外,若用戶開啟自動標(biāo)簽?zāi)J?,則第一設(shè)備還采用模型基于該頁面信息獲取當(dāng)前頁面對應(yīng)的標(biāo)簽;若用戶開啟手動標(biāo)簽?zāi)J?,則第一設(shè)備還接收用戶輸入的當(dāng)前頁面對應(yīng)的標(biāo)簽。最后,第一設(shè)備將當(dāng)前頁面的頁面信息、標(biāo)簽關(guān)聯(lián)存儲,進一步的,還可以獲取當(dāng)前頁面所屬應(yīng)用的標(biāo)識、活動的標(biāo)識等,并將其中一項或多項與頁面信息、標(biāo)簽關(guān)聯(lián)存儲。從而降低人工成本,提高數(shù)據(jù)收集和標(biāo)注標(biāo)簽的效率和準(zhǔn)確率。
2、第一方面,本技術(shù)提供了一種頁面信息的收集方法,該方法應(yīng)用于第一設(shè)備,該方法包括:該第一設(shè)備執(zhí)行第一程序,基于該第一程序執(zhí)行以下操作:該第一設(shè)備控制該第二設(shè)備依次顯示第一組頁面中的每個頁面;其中,在控制該第二設(shè)備顯示第一頁面的過程中,該第一設(shè)備還執(zhí)行以下操作:獲取該第一頁面的布局信息,該第一頁面為該第一組頁面中的任一個頁面;基于該第一頁面的布局信息確定對應(yīng)的第一標(biāo)簽,該第一標(biāo)簽指示該第一頁面的場景。
3、實施第一方面提供的方法后,采用自動化命令能夠快速、批量地進行頁面信息的采集,快速的對頁面標(biāo)注標(biāo)簽,顯著提高工作效率。
4、結(jié)合第一方面描述的方法,在控制該第二設(shè)備依次顯示第一組頁面中的每個頁面之后,該方法還包括:獲取該第一頁面的截圖;將該第一頁面的布局信息的存儲路徑和該第一頁面的截圖的存儲路徑,與該第一標(biāo)簽進行關(guān)聯(lián)存儲。
5、這樣,關(guān)聯(lián)存儲標(biāo)簽與頁面的布局信息和截圖的存儲路徑,可以幫助用戶進一步查詢、關(guān)聯(lián)分類收集到的數(shù)據(jù)。
6、結(jié)合第一方面描述的方法,在獲取該第一頁面的截圖之后,該方法還包括:將該第一頁面的布局信息的存儲路徑和該第一頁面的截圖的存儲路徑,與以下一項或多項進行關(guān)聯(lián)存儲:該第一頁面所屬應(yīng)用的標(biāo)識、該第一頁面的標(biāo)識。
7、這樣,可以采用多種維度來分類存儲收集到的頁面信息,便于后續(xù)查詢目標(biāo)頁面的信息。
8、結(jié)合第一方面描述的方法,在控制該第二設(shè)備依次顯示第一組頁面中的每個頁面之前,該方法還包括:接收到第一操作;基于該第一頁面的布局信息確定對應(yīng)的第一標(biāo)簽,具體包括:響應(yīng)該第一操作,基于該第一頁面的布局信息確定對應(yīng)的第一標(biāo)簽。
9、這樣,第一設(shè)備可以基于用戶操作來啟動自動標(biāo)簽的工作模式。
10、結(jié)合第一方面描述的方法,該方法還包括:該第一設(shè)備控制該第二設(shè)備依次顯示第二組頁面中的每個頁面;其中,在控制該第二設(shè)備顯示第二頁面的過程中,該第一設(shè)備還執(zhí)行以下操作:獲取該第二頁面的布局信息,該第二頁面為該第二組頁面中的任一個頁面;接收到輸入第二標(biāo)簽的第二操作,將該第二標(biāo)簽確定為該第二頁面對應(yīng)的標(biāo)簽,該第二標(biāo)簽指示該第二頁面的場景。
11、這樣,在提供自動采集頁面信息的基礎(chǔ)上,本技術(shù)除了提供自動標(biāo)簽的方法外,還提供有手動標(biāo)簽的方法,這樣不僅提高分類收集頁面信息的準(zhǔn)確率和效率,還可以在面對全新的頁面場景時,避免模型不能準(zhǔn)確輸出未訓(xùn)練的標(biāo)簽,可以采用手動標(biāo)注標(biāo)簽的方式來分類收集頁面信息,并且還可以將手動處理的頁面信息以及對應(yīng)標(biāo)簽作為后續(xù)階段模型的訓(xùn)練數(shù)據(jù),進一步更新模型,保證模型實時學(xué)習(xí)到新場景下的數(shù)據(jù)。
12、結(jié)合第一方面描述的方法,在控制該第二設(shè)備依次顯示第二組頁面中的每個頁面之前,該方法還包括:接收到第三操作;接收到輸入第二標(biāo)簽的第二操作,將該第二標(biāo)簽確定為該第二頁面對應(yīng)的標(biāo)簽,具體包括:響應(yīng)該第三操作,顯示提示用戶輸入標(biāo)簽的信息,接收到輸入第二標(biāo)簽的第二操作,將該第二標(biāo)簽確定為該第二頁面對應(yīng)的標(biāo)簽。
13、這樣,第一設(shè)備可以基于用戶操作來啟動手動標(biāo)簽的工作模式。
14、結(jié)合第一方面描述的方法,該第一設(shè)備控制該第二設(shè)備依次顯示第一組頁面中的每個頁面,具體包括:該第一設(shè)備控制該第二設(shè)備基于模擬操作的命令依次顯示第一組頁面中的每個頁面。
15、這樣,為了實現(xiàn)快速收集頁面信息,除了高效的自動標(biāo)簽標(biāo)注外,還需要自動切換頁面場景,采用模擬操作為快速切換頁面,以實現(xiàn)快速收集頁面信息提供了可行的途徑。
16、結(jié)合第一方面描述的方法,該第一設(shè)備控制該第二設(shè)備依次顯示第一組頁面中的每個頁面,具體包括:該第一設(shè)備向該第二設(shè)備依次發(fā)送多個模擬操作的命令,用于該第二設(shè)備依次響應(yīng)每個模擬操作的命令,依次顯示第一組頁面中的每個頁面;或者,該第一設(shè)備向該第二設(shè)備發(fā)送啟動自動化類應(yīng)用的命令,用于該第二設(shè)備啟動該自動化類應(yīng)用,并通過該自動化類應(yīng)用依次生成多個模擬操作的命令,依次響應(yīng)每個模擬操作的命令,依次顯示第一組應(yīng)用中每個應(yīng)用的多個頁面。
17、這樣,第一設(shè)備可以每隔一定時間自動向第二設(shè)備發(fā)送模擬操作的命令,或者第一設(shè)備只需控制第二設(shè)備開啟相關(guān)自動化類的應(yīng)用,由第二設(shè)備中的自動化類的應(yīng)用每隔一段時間自動生成模擬操作的命令等,提供多種可以實現(xiàn)的方法。
18、結(jié)合第一方面描述的方法,在獲取該第一頁面的布局信息之前,該方法還包括:該第一設(shè)備從轉(zhuǎn)存(dump)文件中獲取該第一頁面所屬應(yīng)用的標(biāo)識;該第一設(shè)備從該dump文件中獲取該第一頁面的活動標(biāo)識。
19、這樣,可以從dump文件中獲取到第二設(shè)備中正在顯示的焦點頁面的相關(guān)信息。
20、結(jié)合第一方面描述的方法,該第一設(shè)備從dump文件中獲取該第一頁面所屬應(yīng)用的標(biāo)識,具體包括:該第一設(shè)備從dump文件中獲取與第一正則表達(dá)式匹配的第一頁面所屬應(yīng)用的標(biāo)識;該第一設(shè)備從該dump文件中獲取該第一頁面的活動標(biāo)識,具體包括:該第一設(shè)備從該dump文件中獲取與第二正則表達(dá)式匹配的第一頁面的活動標(biāo)識。
21、這樣,在dump文件存儲繁雜信息的情況下,通過正則表達(dá)式可以準(zhǔn)確獲取到目標(biāo)信息,提升信息質(zhì)量。
22、結(jié)合第一方面描述的方法,基于該第一頁面的布局信息確定對應(yīng)的第一標(biāo)簽,具體包括:將該第一頁面的布局信息的特征輸入到標(biāo)簽預(yù)測模型,得到該第一頁面對應(yīng)的第一標(biāo)簽,其中,該標(biāo)簽預(yù)測模型通過多組數(shù)據(jù)訓(xùn)練得到,一組該數(shù)據(jù)包括:頁面的布局信息的特征,和該頁面對應(yīng)的標(biāo)簽。
23、這樣,采用標(biāo)簽預(yù)測模型來自動標(biāo)注頁面的標(biāo)簽,減少對人力資源的依賴,降低人工標(biāo)注成本,能夠輕松應(yīng)對數(shù)據(jù)量的增長,滿足大規(guī)模數(shù)據(jù)處理的需求。
24、結(jié)合第一方面描述的方法,在基于該第一頁面的布局信息確定對應(yīng)的第一標(biāo)簽之前,該方法還包括:獲取該第一頁面的截圖;將該第一頁面的布局信息的特征輸入到標(biāo)簽預(yù)測模型,通過該第一頁面的截圖監(jiān)督該標(biāo)簽預(yù)測模型,得到該第一頁面對應(yīng)的第一標(biāo)簽。
25、這樣,采用監(jiān)督的方式,可以提升模型預(yù)測結(jié)果。
26、第二方面,本技術(shù)提供了一種電子設(shè)備,包括:處理器、存儲器及存儲在該存儲器上的計算機程序,該處理器執(zhí)行該計算機程序以實現(xiàn)如第一方面中任一項描述的方法。
27、第三方面,本技術(shù)提供了一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)如第一方面中任一項描述方法。
28、第四方面,本技術(shù)提供了一種計算機程序產(chǎn)品,該計算機程序產(chǎn)品包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)如第一方面中任一項描述的方法。