本申請實施例涉及通信領(lǐng)域,并且更具體地,涉及通信領(lǐng)域中用于確定應(yīng)用程序app活躍場景的方法和裝置。
背景技術(shù):
:隨著網(wǎng)絡(luò)環(huán)境的日益完善、移動互聯(lián)網(wǎng)技術(shù)的發(fā)展,各類移動互聯(lián)網(wǎng)應(yīng)用的需求逐漸被激發(fā),手機app(application)應(yīng)用市場前景巨大。用戶使用app的這一行為與所處的場景密切相關(guān),對于某一手機app的使用場景,主要可以分為移動場景和穩(wěn)定場景兩大類,典型的移動場景包括公共場所、露天環(huán)境、公共交通環(huán)境等,典型的穩(wěn)定場景包括家庭場景和辦公場景。對于一個app來說,了解其使用場景是非常有必要的,從需求的角度來看,某一類型的用戶在某一場景下產(chǎn)生了一些需求,為了使這些需求得到滿足,這些用戶就需要使用手機app來完成一些任務(wù)。在眾多使用場景中,確定出相對活躍的場景有利于分析不同app在不同使用場景下的側(cè)重?,F(xiàn)有技術(shù)多研究某一特定app的活躍場景,或是對少量目標(biāo)app通過內(nèi)置軟件的方式來收集該少量目標(biāo)app的使用記錄,并判斷各個app在各個使用場景下的使用狀態(tài)。但是,現(xiàn)有技術(shù)往往是直接利用收集到的時間或者次數(shù)得到各個使用場景下app的相對或絕對使用情況,并沒有考慮到由于app本身的不同特性,導(dǎo)致收集到的數(shù)據(jù)不夠準(zhǔn)確,例如,視頻類app一般會被持續(xù)使用一段時間,在這段時間內(nèi)會產(chǎn)生大量統(tǒng)一資源定址器(uniformresourcelocator,url),或者單個用戶在短時間內(nèi)頻繁使用某個app,app在持續(xù)被使用的過程中會產(chǎn)生大量記錄,這些記錄不但會降低確定app活躍場景的效率,而且會對影響結(jié)果的準(zhǔn)確性。技術(shù)實現(xiàn)要素:本申請實施例提供的用于確定應(yīng)用程序app活躍場景的方法和裝置,能夠提高確定app活躍場景的效率,同時提高結(jié)果的準(zhǔn)確性。第一方面,提供了一種用于確定應(yīng)用程序app活躍場景的方法,包括:獲取多條app使用記錄,所述多條app使用記錄中的每條app使用記錄包括用戶標(biāo)識、使用時間、使用地理位置以及統(tǒng)一資源定址器url,所述每條app使用記錄用于表示所述用戶標(biāo)識對應(yīng)的用戶在所述使用時間以及所述使用地理位置訪問了所述url;對所述多條app使用記錄進(jìn)行整合,獲得多條整合記錄,所述多條整合記錄中的每條整合記錄包括所述用戶標(biāo)識、所述使用時間、app標(biāo)識以及使用場景,所述每條整合記錄用于表示與所述用戶標(biāo)識對應(yīng)的用戶所述使用時間在所述使用場景下使用了與所述app標(biāo)識對應(yīng)的app,其中,在所述多條整合記錄中,同一用戶同一時間在同一使用場景下對同一app的整合記錄為一條;根據(jù)所述多條整合記錄,確定所述多條整合記錄中的至少一個app中的每個app在至少一個場景中的每個場景下被使用的次數(shù)。本申請實施例的用于確定app活躍場景的方法,通過將獲取到的多條app使用記錄進(jìn)行整合,保證同一用戶同一時間在同一使用場景下對同一app的使用記錄只有一條,不會出現(xiàn)由于app本身的不同特性,進(jìn)行計算的記錄不夠準(zhǔn)確的情況,能夠提高確定app的活躍場景的效率,同時提高結(jié)果的準(zhǔn)確性。應(yīng)理解,本申請實施例可以運用到其他與用戶服務(wù)與產(chǎn)品使用相關(guān)的領(lǐng)域,例如,可以分析不同的通訊服務(wù)產(chǎn)品(短信、漫游或手機上網(wǎng)等)在不同場景下使用的側(cè)重??蛇x地,可以對用戶進(jìn)行分類(年齡、職業(yè)等),以便于了解不同特征的用戶群體對同一app的使用活躍場景方面的差異。在第一方面的第一種可能的實現(xiàn)方式中,所述對所述多條app使用記錄進(jìn)行整合,獲得多條整合記錄,包括:根據(jù)第一映射關(guān)系,確定與所述每條app使用記錄中的所述url對應(yīng)的app標(biāo)識,所述第一映射關(guān)系用于表示多個所述url與多個app標(biāo)識之間的對應(yīng)關(guān)系;根據(jù)所述每條app使用記錄中的所述使用時間以及所述使用地理位置,確定所述每條app使用記錄對應(yīng)的所述使用場景;建立所述每條app使用記錄中的所述用戶標(biāo)識和所述使用時間與所述app標(biāo)識和所述使用場景之間的對應(yīng)關(guān)系,形成多條新的app使用記錄;根據(jù)所述使用時間,將所述多條新的app使用記錄中同一用戶同一時間在同一使用場景下對同一app的app使用記錄進(jìn)行合并,獲得所述多條整合記錄。可選地,上述使用場景包括:居家場景、辦公場景、途中場景和其他場景。應(yīng)理解,本申請實施例中所描述的使用場景還可以指其他任意場景,本申請實施例對此不作限定。還應(yīng)理解,上述第一映射關(guān)系可以為提前確定的,也可以在進(jìn)行整合的時候確定,本申請實施例對此不作限定??蛇x地,第一設(shè)備可以通過對app進(jìn)行手動的完全的測試得到每個app所對應(yīng)的url,具體操作如下:先將app安裝到真實設(shè)備中,對該app進(jìn)行一段時間的使用,且盡量使用到該app的所有功能,再用tcpdump捕獲該app在使用期間發(fā)出的網(wǎng)絡(luò)數(shù)據(jù)包,并輸出成后綴為pcap的文件,最后使用winpcap對該文件進(jìn)行解析,得到app訪問的url列表,構(gòu)成該app與其url的對應(yīng)表。結(jié)合第一方面的上述可能的實現(xiàn)方式,在第一方面的第二種可能的實現(xiàn)方式中,所述多條整合記錄為m個用戶n天生成的,m和n均為大于1的整數(shù),所述根據(jù)所述多條整合記錄,確定所述多條整合記錄中的至少一個app中的每個app在至少一個使用場景中的每個使用場景下被使用的次數(shù),包括:根據(jù)所述多條整合記錄,確定所述至少一個app中的第一app在所述至少一個使用場景中的第一使用場景下被所述m個用戶中的每個用戶在所述n天中的每天使用的次數(shù);將所述第一app在所述第一使用場景下被所述每個用戶在所述n天中的每天使用的次數(shù)相加,獲得所述第一app在所述第一使用場景下被使用的次數(shù)。具體地,第一設(shè)備可以分別確定每個app在每個使用場景下被使用的次數(shù),以確定第一app在第一使用場景下被使用的次數(shù)為例,先確定該第一app在該第一使用場景下被m個用戶中的每個用戶在n天中的每天使用的次數(shù),再將其進(jìn)行相加,獲得第一app在第一使用場景下被使用的次數(shù)。應(yīng)理解,第一app為上述至少一個app中的任意一個app,第一使用場景為上述至少一個使用場景中的任意一個使用場景,本申請對此不作限定。結(jié)合第一方面的上述可能的實現(xiàn)方式,在第一方面的第三種可能的實現(xiàn)方式中,所述確定所述至少一個app中的第一app在所述至少一個使用場景中的第一使用場景下被所述m個用戶中的每個用戶在所述n天中的每天使用的次數(shù),包括:根據(jù)所述多條整合記錄,確定所述第一app在所述第一使用場景下被所述m個用戶中的第一用戶在所述n天中的第一天的每個小時使用的次數(shù);將所述第一app在所述第一使用場景下被所述第一用戶在所述每個小時使用的次數(shù)相加,獲得所述第一app在所述第一使用場景下被所述第一用戶在所述第一天使用的次數(shù)。具體地,第一設(shè)備可以該第一app在該第一使用場景下被m個用戶中的每個用戶在n天中的每天使用的次數(shù)時,可以分別確定第一app在第一使用場景下被每個用戶在每天使用次數(shù)。以確定第一app在第一使用場景下被第一用戶在第一天使用的次數(shù)為例,先確定該第一app在該第一使用場景下被第一用戶在第一天中的每個小時使用的次數(shù),再將其進(jìn)行相加,獲得第一app在第一使用場景下被第一用戶在第一天使用的次數(shù)。應(yīng)理解,第一用戶為上述m個用戶中的任意一個用戶,第一天為上述n天中的任意一天,本申請對此不作限定。結(jié)合第一方面的上述可能的實現(xiàn)方式,在第一方面的第四種可能的實現(xiàn)方式中,所述確定所述第一app在所述第一使用場景下被所述m個用戶中的第一用戶在所述n天中的第一天的每個小時使用的次數(shù),包括:若所述第一用戶第一小時內(nèi)在所述第一使用場景下使用了所述第一app,將所述第一app在所述第一使用場景下被所述第一用戶在所述第一小時使用的次數(shù)確定為1次。具體地,由于某些app的特性會在一段時間內(nèi)被頻繁使用或持續(xù)使用,例如視頻類app,第一設(shè)備可以將一個小時內(nèi)用戶在同一場景下對同一app的使用記錄確定為該用戶的1次使用記錄。這樣,第一app在第一使用場景下被第一用戶在第一天使用的次數(shù)取值即為0至24,數(shù)據(jù)簡單,在便于統(tǒng)計。結(jié)合第一方面的上述可能的實現(xiàn)方式,在第一方面的第五種可能的實現(xiàn)方式中,在所述確定所述多條整合記錄中的至少一個app中的每個app在至少一個場景中的每個場景下被使用的次數(shù)之后,所述方法還包括:將同一app在所述每個使用場景下被使用的次數(shù)相加,分別獲得所述每個app被使用的總次數(shù);將所述每個app在所述每個使用場景下被使用的次數(shù)除以所述總次數(shù),獲得所述每個app在所述每個使用場景下被使用的相對次數(shù);根據(jù)所述相對次數(shù),從所述至少一個使用場景中確定所述每個app的活躍場景。具體地,上述第一設(shè)備還可以根據(jù)每個app在每個使用場景下被使用的次數(shù),確定每個app的活躍場景。對于第一app而言,該第一設(shè)備可以將該第一app在每個使用場景下被使用的次數(shù)占該第一app在所有使用場景下被使用的次數(shù)的比例較大的使用場景,確定為該第一app的活躍場景。結(jié)合第一方面的上述可能的實現(xiàn)方式,在第一方面的第六種可能的實現(xiàn)方式中,所述獲取多條app使用記錄,包括:從運營商的管道數(shù)據(jù)中獲取所述多條app使用記錄。在本申請實施例中,多條app使用記錄來自運營商的管道數(shù)據(jù),這樣,不需要借助內(nèi)置的軟件或者在特定的平臺上收集用戶數(shù)據(jù),在提高效率的同時,能夠很好地保護用戶的隱私。第二方面,提供了一種用于確定應(yīng)用程序app活躍場景的裝置,用于執(zhí)行第一方面或第一方面任意可能的實現(xiàn)方式中的方法。具體地,該裝置包括用于執(zhí)行上述第一方面或第一方面的任意可能的實現(xiàn)方式中的方法的單元。第三方面,提供了一種用于確定應(yīng)用程序app活躍場景的裝置,該裝置包括:收發(fā)器、存儲器和處理器。其中,該收發(fā)器、該存儲器和該處理器通過內(nèi)部連接通路互相通信,該存儲器用于存儲指令,該處理器用于執(zhí)行該存儲器存儲的指令,以控制接收器接收信號,并控制發(fā)送器發(fā)送信號,并且當(dāng)該處理器執(zhí)行該存儲器存儲的指令時,該執(zhí)行使得該處理器執(zhí)行第一方面或第一方面的任一種可能的實現(xiàn)方式中的方法。第四方面,提供了一種計算機可讀介質(zhì),用于存儲計算機程序,該計算機程序包括用于執(zhí)行第一方面或第一方面的任意可能的實現(xiàn)方式中的方法的指令。附圖說明圖1示出了本申請實施例的用于確定應(yīng)用程序app活躍場景的方法的示意性流程圖。圖2示出了根據(jù)本申請實施例的用于確定應(yīng)用程序app活躍場景的裝置的示意性框圖。圖3示出了根據(jù)本申請實施例的另一用于確定應(yīng)用程序app活躍場景的裝置的示意性框圖。具體實施方式下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進(jìn)行描述。圖1是根據(jù)本申請實施例的用于確定應(yīng)用程序app活躍場景的方法的示意性流程圖。應(yīng)理解,圖1所示的方法可以由任何具有數(shù)據(jù)分析功能的設(shè)備執(zhí)行,本文稱為第一設(shè)備,可選地,該第一設(shè)備可以為計算機,但本申請實施例對此不作限定。s110,獲取多條app使用記錄,所述多條app使用記錄中的每條app使用記錄包括用戶標(biāo)識、使用時間、使用地理位置以及統(tǒng)一資源定址器url,所述每條app使用記錄用于表示所述用戶標(biāo)識對應(yīng)的用戶在所述使用時間以及所述使用地理位置訪問了所述url;s120,對所述多條app使用記錄進(jìn)行整合,獲得多條整合記錄,所述多條整合記錄中的每條整合記錄包括所述用戶標(biāo)識、所述使用時間、app標(biāo)識以及使用場景,所述每條整合記錄用于表示與所述用戶標(biāo)識對應(yīng)的用戶所述使用時間在所述使用場景下使用了與所述app標(biāo)識對應(yīng)的app,其中,在所述多條整合記錄中,同一用戶同一時間在同一使用場景下對同一app的整合記錄為一條;s130,根據(jù)所述多條整合記錄,確定所述多條整合記錄中的至少一個app中的每個app在至少一個使用場景中的每個使用場景下被使用的次數(shù)。具體地,第一設(shè)備可以獲取用戶對手機中app的多條app使用記錄,并對該多條app使用記錄進(jìn)行整合,獲得多條整合記錄,整合的目的是為了去掉重復(fù)記錄,因此,在多條整合記錄中,同一用戶同一時間在同一使用場景下對同一app的整合記錄為一條,該第一設(shè)備再根據(jù)該多條整合記錄,計算該多條整合記錄中所涉及的每個app分別在每個使用場景下被使用的次數(shù),進(jìn)而可以確定每個app的活躍場景。本申請實施例的用于確定app活躍場景的方法,通過將獲取到的多條app使用記錄進(jìn)行整合,保證同一用戶同一時間在同一使用場景下對同一app的使用記錄只有一條,不會出現(xiàn)由于app本身的不同特性,進(jìn)行計算的記錄不夠準(zhǔn)確的情況,能夠提高確定app活躍場景的效率,同時提高結(jié)果的準(zhǔn)確性。應(yīng)理解,本申請實施例可以運用到其他與用戶服務(wù)與產(chǎn)品使用相關(guān)的領(lǐng)域,例如,可以分析不同的通訊服務(wù)產(chǎn)品(短信、漫游或手機上網(wǎng)等)在不同場景下使用的側(cè)重??蛇x地,可以對用戶進(jìn)行分類(年齡、職業(yè)等),以便于了解不同特征的用戶群體對同一app的使用活躍場景方面的差異。作為一個可選的實施例,所述對所述多條app使用記錄進(jìn)行整合,獲得多條整合記錄,包括:根據(jù)第一映射關(guān)系,確定與所述每條app使用記錄中的所述url對應(yīng)的app標(biāo)識,所述第一映射關(guān)系用于表示多個所述url與多個app標(biāo)識之間的對應(yīng)關(guān)系;根據(jù)所述每條app使用記錄中的所述使用時間以及所述使用地理位置,確定所述每條app使用記錄對應(yīng)的所述使用場景;建立所述每條app使用記錄中的所述用戶標(biāo)識和所述使用時間與所述app標(biāo)識和所述使用場景之間的對應(yīng)關(guān)系,形成多條新的app使用記錄;根據(jù)所述使用時間,將所述多條新的app使用記錄中同一用戶同一時間在同一使用場景下對同一app的app使用記錄進(jìn)行合并,獲得所述多條整合記錄。具體地,上述第一設(shè)備可以根據(jù)用于表示多個url和多個app標(biāo)識之間的對應(yīng)關(guān)系的第一映射關(guān)系,將上述多條app使用記錄中的url關(guān)聯(lián)到app標(biāo)識上,再根據(jù)上述多條app使用記錄中的使用時間和使用地理位置,確定每條app使用記錄所對應(yīng)的使用場景,將上述多條app使用記錄中的使用時間和使用地理位置關(guān)聯(lián)到使用場景上,建立每條app記錄中用戶標(biāo)識和使用時間與app標(biāo)識和使用場景之間的對應(yīng)關(guān)系,最后,再將同一用戶同一時間在同一使用場景下對同一app的app使用記錄進(jìn)行合并,獲得整合后的多條整合記錄。可選地,上述使用場景包括:居家場景、辦公場景、途中場景和其他場景。在一種具體實現(xiàn)方式中,該第一設(shè)備可以根據(jù)用戶在基站的注冊天數(shù)、使用app的個數(shù)、主叫電話數(shù)、未接電話數(shù)等等較能區(qū)分居家和辦公場景的記錄進(jìn)行kmeans聚類,最終將類別中的記錄產(chǎn)生的時間處于12:00-20:00的比例排名第一的為辦公場景,記錄產(chǎn)生的時間處于20:00-24:00和0:00-8:00的比例排名第一的為居家場景,但本申請實施例對此不作限定。應(yīng)理解,上述第一映射關(guān)系可以為提前確定的,也可以在進(jìn)行整合的時候確定,本申請實施例對此不作限定??蛇x地,第一設(shè)備可以通過對app進(jìn)行手動的完全的測試得到每個app所對應(yīng)的url,具體操作如下:先將app安裝到真實設(shè)備中,對該app進(jìn)行一段時間的使用,且盡量使用到該app的所有功能,再用tcpdump捕獲該app在使用期間發(fā)出的網(wǎng)絡(luò)數(shù)據(jù)包,并輸出成后綴為pcap的文件,最后使用winpcap對該文件進(jìn)行解析,得到app訪問的url列表,構(gòu)成該app與其url的對應(yīng)表。作為一個可選的實施例,所述多條整合記錄為m個用戶n天生成的,m和n均為大于1的整數(shù),所述根據(jù)所述多條整合記錄,確定所述多條整合記錄中的至少一個app中的每個app在至少一個使用場景中的每個使用場景下被使用的次數(shù),包括:根據(jù)所述多條整合記錄,確定所述至少一個app中的第一app在所述至少一個使用場景中的第一使用場景下被所述m個用戶中的每個用戶在所述n天中的每天使用的次數(shù);將所述第一app在所述第一使用場景下被所述每個用戶在所述n天中的每天使用的次數(shù)相加,獲得所述第一app在所述第一使用場景下被使用的次數(shù)。具體地,第一設(shè)備可以分別確定每個app在每個使用場景下被使用的次數(shù),以確定第一app在第一使用場景下被使用的次數(shù)為例,先確定該第一app在該第一使用場景下被m個用戶中的每個用戶在n天中的每天使用的次數(shù),再將其進(jìn)行相加,獲得第一app在第一使用場景下被使用的次數(shù)。應(yīng)理解,第一app為上述至少一個app中的任意一個app,第一使用場景為上述至少一個使用場景中的任意一個使用場景,本申請對此不作限定。作為一個可選的實施例,所述確定所述至少一個app中的第一app在所述至少一個使用場景中的第一使用場景下被所述m個用戶中的每個用戶在所述n天中的每天使用的次數(shù),包括:根據(jù)所述多條整合記錄,確定所述第一app在所述第一使用場景下被所述m個用戶中的第一用戶在所述n天中的第一天的每個小時使用的次數(shù);將所述第一app在所述第一使用場景下被所述第一用戶在所述每個小時使用的次數(shù)相加,獲得所述第一app在所述第一使用場景下被所述第一用戶在所述第一天使用的次數(shù)。具體地,第一設(shè)備可以該第一app在該第一使用場景下被m個用戶中的每個用戶在n天中的每天使用的次數(shù)時,可以分別確定第一app在第一使用場景下被每個用戶在每天使用次數(shù)。以確定第一app在第一使用場景下被第一用戶在第一天使用的次數(shù)為例,先確定該第一app在該第一使用場景下被第一用戶在第一天中的每個小時使用的次數(shù),再將其進(jìn)行相加,獲得第一app在第一使用場景下被第一用戶在第一天使用的次數(shù)。應(yīng)理解,第一用戶為上述m個用戶中的任意一個用戶,第一天為上述n天中的任意一天,本申請對此不作限定。作為一個可選的實施例,所述確定所述第一app在所述第一使用場景下被所述m個用戶中的第一用戶在所述n天中的第一天的每個小時使用的次數(shù),包括:若所述第一用戶第一小時內(nèi)在所述第一使用場景下使用了所述第一app,將所述第一app在所述第一使用場景下被所述第一用戶在所述第一小時使用的次數(shù)確定為1次。具體地,由于某些app的特性會在一段時間內(nèi)被頻繁使用或持續(xù)使用,例如視頻類app,第一設(shè)備可以將一個小時內(nèi)用戶在同一場景下對同一app的使用記錄確定為該用戶的1次使用記錄,即若上述第一用戶第一小時內(nèi)在該第一使用場景下使用了該第一app,將該第一app在該第一使用場景下被該第一用戶在第一天的第一小時使用的次數(shù)確定為1次。這樣,第一app在第一使用場景下被第一用戶在第一天使用的次數(shù)取值即為0至24,數(shù)據(jù)簡單,在便于統(tǒng)計。作為一個可選的實施例,在所述確定所述多條整合記錄中的至少一個app中的每個app在至少一個使用場景中的每個使用場景下被使用的次數(shù)之后,所述方法還包括:將同一app在所述每個使用場景下被使用的次數(shù)相加,分別獲得所述每個app被使用的總次數(shù);將所述每個app在所述每個使用場景下被使用的次數(shù)除以所述總次數(shù),獲得所述每個app在所述每個使用場景下被使用的相對次數(shù);根據(jù)所述相對次數(shù),從所述至少一個使用場景中確定所述每個app的活躍場景。具體地,上述第一設(shè)備還可以根據(jù)每個app在每個使用場景下被使用的次數(shù),確定每個app的活躍場景。對于第一app而言,該第一設(shè)備可以將該第一app在每個使用場景下被使用的次數(shù)占該第一app在所有使用場景下被使用的次數(shù)的比例較大的使用場景,確定為該第一app的活躍場景。作為一個可選的實施例,所述獲取多條app使用記錄,包括:從運營商的管道數(shù)據(jù)中獲取所述多條app使用記錄。在本申請實施例中,多條app使用記錄來自運營商的管道數(shù)據(jù),相比于借助內(nèi)置的軟件或者在特定的平臺上的收集方式更能保護用戶的隱私,本申請實施例能夠基于用戶大量真實使用記錄,更加快速和客觀的描述app在不同使用場景下的使用側(cè)重,反映出用戶背后不同的心理需求,可以以此作為后期營銷推送的指導(dǎo)和依據(jù)。下面結(jié)合一個具體的實施例,對本申請的用于確定應(yīng)用程序app活躍場景的方法進(jìn)行詳細(xì)說明。(1)數(shù)據(jù)提取從數(shù)據(jù)記錄表中獲取記錄了用戶手機數(shù)據(jù)業(yè)務(wù)所訪問的服務(wù)器域名host,基站所記錄的用戶的手機使用app時產(chǎn)生的數(shù)據(jù),包括用戶位置數(shù)據(jù)、用戶發(fā)起的互聯(lián)網(wǎng)上網(wǎng)記錄和用戶使用app時產(chǎn)生的記錄等,獲取到的數(shù)據(jù)如下表所示:表1字段名字段說明數(shù)據(jù)樣例user_no用戶編號12366time用戶發(fā)起業(yè)務(wù)的時間1423988103.0lac用戶發(fā)起業(yè)務(wù)時的位置區(qū)號a038sac用戶發(fā)起業(yè)務(wù)時的服務(wù)區(qū)號02abci用戶發(fā)起業(yè)務(wù)時的小區(qū)號00aahost用戶訪問的urlweixin.qq.com(2)數(shù)據(jù)整合對app的url數(shù)據(jù)和用戶場景的數(shù)據(jù)進(jìn)行整合。首先進(jìn)行app與url的匹配,通過對app進(jìn)行手動的完全的測試可以得到每個app所對應(yīng)的host,具體操作如下:(a)將app安裝到真實設(shè)備中,對app進(jìn)行一段時間的使用,盡量使用到app的所有功能。(b)用tcpdump捕獲app在使用期間發(fā)出的網(wǎng)絡(luò)數(shù)據(jù)包,并輸出成后綴為pcap的文件。(c)使用winpcap對該文件進(jìn)行解析,得到app訪問的url列表,構(gòu)成app與其url的對應(yīng)關(guān)系。然后進(jìn)行用戶應(yīng)用的使用場景識別,即根據(jù)獲取的用戶地理位置信息輸出該時刻用戶所處的使用場景,使用場景的輸出標(biāo)簽有居家、途中、辦公和其他四種,具體操作如下:(a)獲取單個用戶在辦公場景和居家場景中具有顯著性差異的智能手機使用行為特征(這些特征是通過對大量的用戶半結(jié)構(gòu)訪談的方式得到的),包括了主叫/被叫通話次數(shù),未接電話次數(shù),使用app的種類,使用app的個數(shù),主叫/被叫通話時長,基站注冊總天數(shù),主叫/被叫短信總數(shù)。(b)選取了基于在基站的注冊天數(shù),使用app的個數(shù),主叫電話數(shù),未接電話數(shù)這幾個較能區(qū)分居家和辦公場景的特征進(jìn)行kmeans聚類。(c)將類別中產(chǎn)生時間處于12:00-20:00的比例排名第一的記錄確定為辦公場景,將產(chǎn)生時間處于20:00-24:00和0:00-8:00的比例排名第一的記錄確定為居家場景。途中場景的判斷也是采用類似的方法,總結(jié)出用戶在途中使用智能手機的特征和移動特征,將是否具有使用導(dǎo)航類app、基站切換次數(shù)、停留時間、在基站的移動速度是否大于1m/s等等特征進(jìn)行聚類。最終,對居家場景、辦公場景以及途中場景對應(yīng)的數(shù)據(jù)進(jìn)行標(biāo)記,再將除了被標(biāo)記為居家場景、辦公場景以及途中場景之外的其他數(shù)據(jù)標(biāo)記為其他場景。通過對app進(jìn)行手動的完全的測試得到每個url與app的對應(yīng)關(guān)系,并進(jìn)行應(yīng)用的使用場景識別得到每條用戶記錄所對應(yīng)的使用場景。最后,將得到的數(shù)據(jù)進(jìn)行整合。整合后的每條記錄包括用戶編號、記錄的產(chǎn)生時間、該記錄所使用的app名稱和該條記錄對應(yīng)的使用場景,下表為整合后的記錄的示例。表2(3)app的待分析記錄提取由于一個人在某一個小時某一使用場景中頻繁使用某個app,以及某個app在某次持續(xù)被使用過程中會產(chǎn)生大量記錄,這樣大量的數(shù)據(jù)會降低應(yīng)用的使用場景識別的效率,且可能對總體數(shù)據(jù)結(jié)果的準(zhǔn)確性造成的影響。因此,在本申請實施例中,將一個人在一小時、一個使用場景內(nèi)出現(xiàn)的多個同一app的多個使用記錄均合并為一條使用記錄,表明在這一小時這一使用場景下該app處于被使用狀態(tài)。按照上述方法,對所有使用記錄進(jìn)行處理,即可提取出各個app在不同使用場景下的待分析記錄,如下表所示:表3由于上述兩條記錄是同一用戶在同一使用場景同一時間對同一app的使用記錄,因此,對上述兩條記錄進(jìn)行合并,獲得一條記錄。應(yīng)理解,表2中的記錄時間(time)可以由python直接轉(zhuǎn)換得到記錄小時(hour)。(4)app的使用場景計算采用四級計算指標(biāo),對待分析記錄進(jìn)行計算,得出每一個app在居家場景、辦公場景、途中場景和/或其他場景下的相對活躍次數(shù)。下面以qq為例,具體操作如下:(a)根據(jù)上述待分析記錄,判斷一個用戶在某一小時、某個使用場景中是否有出現(xiàn)qq的使用記錄。假設(shè)a表示居家場景,b表示辦公場景,c表示途中場景,d表示其他場景,應(yīng)理解,a、b、c和d均為邏輯型指標(biāo),取值范圍是0或者1。以下步驟以居家場景a為例,a1表示第一個小時qq在居家場景是否出現(xiàn)了使用記錄,a2表示第二個小時qq在居家場景是否出現(xiàn)了使用記錄,以此類推,a24表示第二十四個小時qq在居家場景是否出現(xiàn)了使用記錄,將a1,a2,…,a24統(tǒng)稱為一級指標(biāo)。(b)將同一用戶一天內(nèi)所有小時的一級指標(biāo)進(jìn)行累加,得到二級指標(biāo),該二級指標(biāo)為該用戶m在某一天n的居家場景a中,qq的使用記錄出現(xiàn)的總次數(shù)。該指標(biāo)命名為smn,應(yīng)理解,smn為整數(shù)型指標(biāo),取值范圍為0至24。sm1表示第一天用戶m在居家場景a中出現(xiàn)qq的使用記錄的次數(shù),sm2表示第二天用戶m在居家場景a中出現(xiàn)qq的使用記錄的次數(shù),以此類推,smn表示第n天用戶m在居家場景a中出現(xiàn)qq的使用記錄的次數(shù)。(c)將所有用戶(假設(shè)上述待分析記錄中包括的用戶個數(shù)為17892)、所有天數(shù)(假設(shè)上述待分析記錄中qq的總使用天數(shù)為38天,本文稱為一個周期)的二級指標(biāo)進(jìn)行累加,得到三級指標(biāo),該三級指標(biāo)為所有用戶在一個周期內(nèi)在居家場景中,出現(xiàn)qq的使用記錄的總次數(shù)。該三級指標(biāo)用sa來表示,其他三個使用場景的使用總次數(shù)也可以這樣計算,分別記為sb,sc和sd。(d)最后計算四級指標(biāo),該四級指標(biāo)為qq在一個周期內(nèi)在某使用場景中的相對使用次數(shù),它等于qq在某使用場景中的總使用次數(shù)除以qq在所有使用場景中的總使用次數(shù),其中,qq在某使用場景中的總使用次數(shù)即為三級指標(biāo),qq在所有使用場景中的總使用次數(shù)為將qq的所有使用場景下的三級指標(biāo)之和,記為st=sum(sa,sb,sc,sd)。因此,將qq在居家場景a中的相對使用次數(shù)記為sta=sa/st。應(yīng)理解,上述四個使用場景中每個使用場景的相對使用次數(shù)取值在0到1之間,所有使用場景的相對使用次數(shù)之和等于1。根據(jù)上述計算方法,可以獲得多個app在各個使用場景下的相對使用次數(shù),即對于某一特定的app,分別獲得該app在居家場景、辦公場景、途中場景以及其他場景中的相對使用次數(shù)。相對活躍次數(shù)越大,表明該app在該使用場景中被使用的越多。(5)app的使用場景輸出可以對于數(shù)據(jù)中所有能夠匹配到url的app的結(jié)果進(jìn)行批量輸出,也可以對某一特定app的相對使用次數(shù)進(jìn)行輸出。下表為根據(jù)本申請的應(yīng)用的使用場景識別方法對3個app的在不同使用場景下的相對使用次數(shù)進(jìn)行輸出的示例表。表4本申請實施例的用于確定app活躍場景的方法,通過將獲取到的多條app使用記錄進(jìn)行整合,保證同一用戶同一時間在同一使用場景下對同一app的使用記錄只有一條,不會出現(xiàn)由于app本身的不同特性,進(jìn)行計算的記錄不夠準(zhǔn)確的情況,能夠提高確定app活躍場景的效率,同時提高結(jié)果的準(zhǔn)確性。應(yīng)理解,上述各過程的序號的大小并不意味著執(zhí)行順序的先后,各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定,而不應(yīng)對本申請實施例的實施過程構(gòu)成任何限定。上文結(jié)合圖1,詳細(xì)描述了根據(jù)本申請實施例的用于確定應(yīng)用程序app活躍場景的方法,下面將結(jié)合圖2至圖3,詳細(xì)描述根據(jù)本申請實施例的用于確定應(yīng)用程序app活躍場景的裝置。圖2示出了本申請實施例提供的用于確定應(yīng)用程序app活躍場景的裝置200,該裝置200包括:獲取單元210,用于獲取多條app使用記錄,所述多條app使用記錄中的每條app使用記錄包括用戶標(biāo)識、使用時間、使用地理位置以及統(tǒng)一資源定址器url,所述每條app使用記錄用于表示所述用戶標(biāo)識對應(yīng)的用戶在所述使用時間以及所述使用地理位置訪問了所述url;整合單元220,用于對所述多條app使用記錄進(jìn)行整合,獲得多條整合記錄,所述多條整合記錄中的每條整合記錄包括所述用戶標(biāo)識、所述使用時間、app標(biāo)識以及使用場景,所述每條整合記錄用于表示與所述用戶標(biāo)識對應(yīng)的用戶所述使用時間在所述使用場景下使用了與所述app標(biāo)識對應(yīng)的app,其中,在所述多條整合記錄中,同一用戶同一時間在同一使用場景下對同一app的整合記錄為一條;確定單元230,用于根據(jù)所述多條整合記錄,確定所述多條整合記錄中的至少一個app中的每個app在至少一個使用場景中的每個使用場景下被使用的次數(shù)。本申請實施例的用于確定app活躍場景的裝置,通過將獲取到的多條app使用記錄進(jìn)行整合,保證同一用戶同一時間在同一使用場景下對同一app的使用記錄只有一條,不會出現(xiàn)由于app本身的不同特性,進(jìn)行計算的記錄不夠準(zhǔn)確的情況,能夠提高確定app活躍場景的效率,同時提高結(jié)果的準(zhǔn)確性??蛇x地,所述確定單元230還用于:根據(jù)第一映射關(guān)系,確定與所述每條app使用記錄中的所述url對應(yīng)的app標(biāo)識,所述第一映射關(guān)系用于表示多個所述url與多個app標(biāo)識之間的對應(yīng)關(guān)系;根據(jù)所述每條app使用記錄中的所述使用時間以及所述使用地理位置,確定所述每條app使用記錄對應(yīng)的所述使用場景;所述整合單元220具體用于:建立所述每條app使用記錄中的所述用戶標(biāo)識和所述使用時間與所述app標(biāo)識和所述使用場景之間的對應(yīng)關(guān)系,形成多條新的app使用記錄;根據(jù)所述使用時間,將所述多條新的app使用記錄中同一用戶同一時間在同一使用場景下對同一app的app使用記錄進(jìn)行合并,獲得所述多條整合記錄。可選地,所述多條整合記錄為m個用戶n天生成的,m和n均為大于1的整數(shù),所述確定單元230具體用于:根據(jù)所述多條整合記錄,確定所述至少一個app中的第一app在所述至少一個使用場景中的第一使用場景下被所述m個用戶中的每個用戶在所述n天中的每天使用的次數(shù);將所述第一app在所述第一使用場景下被所述每個用戶在所述n天中的每天使用的次數(shù)相加,獲得所述第一app在所述第一使用場景下被使用的次數(shù)??蛇x地,所述確定單元230具體用于:根據(jù)所述多條整合記錄,確定所述第一app在所述第一使用場景下被所述m個用戶中的第一用戶在所述n天中的第一天的每個小時使用的次數(shù);將所述第一app在所述第一使用場景下被所述第一用戶在所述每個小時使用的次數(shù)相加,獲得所述第一app在所述第一使用場景下被所述第一用戶在所述第一天使用的次數(shù)。可選地,所述確定單元230具體用于:若所述第一用戶第一小時內(nèi)在所述第一使用場景下使用了所述第一app,將所述第一app在所述第一使用場景下被所述第一用戶在所述第一小時使用的次數(shù)確定為1次??蛇x地,所述確定單元230還用于:在所述確定所述多條整合記錄中的至少一個app中的每個app在至少一個使用場景中的每個使用場景下被使用的次數(shù)之后,將同一app在所述每個使用場景下被使用的次數(shù)相加,分別獲得所述每個app被使用的總次數(shù);將所述每個app在所述每個使用場景下被使用的次數(shù)除以所述總次數(shù),獲得所述每個app在所述每個使用場景下被使用的相對次數(shù);根據(jù)所述相對次數(shù),從所述至少一個使用場景中確定所述每個app的活躍場景。可選地,所述獲取單元210具體用于:從運營商的管道數(shù)據(jù)中獲取所述多條app使用記錄。應(yīng)理解,這里的裝置200以功能單元的形式體現(xiàn)。這里的術(shù)語“單元”可以指應(yīng)用特有集成電路(applicationspecificintegratedcircuit,asic)、電子電路、用于執(zhí)行一個或多個軟件或固件程序的處理器(例如共享處理器、專有處理器或組處理器等)和存儲器、合并邏輯電路和/或其它支持所描述的功能的合適組件。在一個可選例子中,本領(lǐng)域技術(shù)人員可以理解,裝置200可以具體為上述實施例100中的第一設(shè)備,裝置200可以用于與執(zhí)行上述方法實施例100的第一設(shè)備對應(yīng)的各個流程和/或步驟,為避免重復(fù),在此不再贅述。圖3示出了本申請實施例提供的另一用于確定應(yīng)用程序app活躍場景的裝置300的示意性框圖。該裝置300包括處理器310、收發(fā)器320和存儲器330。其中,處理器310、收發(fā)器320和存儲器330通過內(nèi)部連接通路互相通信,該存儲器330用于存儲指令,該處理器310用于執(zhí)行該存儲器330存儲的指令,以控制該收發(fā)器320發(fā)送信號和/或接收信號。其中,該收發(fā)器320用于獲取多條app使用記錄,所述多條app使用記錄中的每條app使用記錄包括用戶標(biāo)識、使用時間、使用地理位置以及統(tǒng)一資源定址器url,所述每條app使用記錄用于表示所述用戶標(biāo)識對應(yīng)的用戶在所述使用時間以及所述使用地理位置訪問了所述url;該處理器310用于對所述多條app使用記錄進(jìn)行整合,獲得多條整合記錄,所述多條整合記錄中的每條整合記錄包括所述用戶標(biāo)識、所述使用時間、app標(biāo)識以及使用場景,所述每條整合記錄用于表示與所述用戶標(biāo)識對應(yīng)的用戶所述使用時間在所述使用場景下使用了與所述app標(biāo)識對應(yīng)的app,其中,在所述多條整合記錄中,同一用戶同一時間在同一使用場景下對同一app的整合記錄為一條;根據(jù)所述多條整合記錄,確定所述多條整合記錄中的至少一個app中的每個app在至少一個使用場景中的每個使用場景下被使用的次數(shù)。應(yīng)理解,裝置300可以具體為上述實施例100中的第一設(shè)備,并且可以用于執(zhí)行上述方法實施例100對應(yīng)的各個步驟和/或流程??蛇x地,該存儲器330可以包括只讀存儲器和隨機存取存儲器,并向處理器提供指令和數(shù)據(jù)。存儲器的一部分還可以包括非易失性隨機存取存儲器。例如,存儲器還可以存儲設(shè)備類型的信息。該處理器310可以用于執(zhí)行存儲器中存儲的指令,并且當(dāng)該處理器310執(zhí)行存儲器中存儲的指令時,該處理器310用于執(zhí)行與上述實施例100對應(yīng)的各個步驟和/或流程。應(yīng)理解,在本申請實施例中,上述裝置的處理器可以是中央處理單元(centralprocessingunit,cpu),該處理器還可以是其他通用處理器、數(shù)字信號處理器(digitalsignalprocessing,dsp)、專用集成電路(applicationspecificintegratedcircuit,asic)、現(xiàn)場可編程門陣列(field-programmablegatearray,fpga)或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件等。通用處理器可以是微處理器或者該處理器也可以是任何常規(guī)的處理器等。在實現(xiàn)過程中,上述方法的各步驟可以通過處理器中的硬件的集成邏輯電路或者軟件形式的指令完成。結(jié)合本申請實施例所公開的方法的步驟可以直接體現(xiàn)為硬件處理器執(zhí)行完成,或者用處理器中的硬件及軟件單元組合執(zhí)行完成。軟件單元可以位于隨機存儲器,閃存、只讀存儲器,可編程只讀存儲器或者電可擦寫可編程存儲器、寄存器等本領(lǐng)域成熟的存儲介質(zhì)中。該存儲介質(zhì)位于存儲器,處理器執(zhí)行存儲器中的指令,結(jié)合其硬件完成上述方法的步驟。為避免重復(fù),這里不再詳細(xì)描述。應(yīng)理解,說明書通篇中提到的“一個實施例”或“一實施例”意味著與實施例有關(guān)的特定特征、結(jié)構(gòu)或特性包括在本申請的至少一個實施例中。因此,在整個說明書各處出現(xiàn)的“在一個實施例中”或“在一實施例中”未必一定指相同的實施例。此外,這些特定的特征、結(jié)構(gòu)或特性可以任意適合的方式結(jié)合在一個或多個實施例中。應(yīng)理解,在本申請的各種實施例中,上述各過程的序號的大小并不意味著執(zhí)行順序的先后,各過程的執(zhí)行順序應(yīng)以其功能和內(nèi)在邏輯確定,而不應(yīng)對本申請實施例的實施過程構(gòu)成任何限定。另外,本文中術(shù)語“系統(tǒng)”和“網(wǎng)絡(luò)”在本文中常被可互換使用。本文中術(shù)語“和/或”,僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可以存在三種關(guān)系,例如,a和/或b,可以表示:單獨存在a,同時存在a和b,單獨存在b這三種情況。另外,本文中字符“/”,一般表示前后關(guān)聯(lián)對象是一種“或”的關(guān)系。應(yīng)理解,在本申請實施例中,“與a相應(yīng)的b”表示b與a相關(guān)聯(lián),根據(jù)a可以確定b。但還應(yīng)理解,根據(jù)a確定b并不意味著僅僅根據(jù)a確定b,還可以根據(jù)a和/或其它信息確定b。本領(lǐng)域普通技術(shù)人員可以意識到,結(jié)合本文中所公開的實施例描述的各示例的單元及算法步驟,能夠以電子硬件、計算機軟件或者二者的結(jié)合來實現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計約束條件。專業(yè)技術(shù)人員可以對每個特定的應(yīng)用來使用不同方法來實現(xiàn)所描述的功能,但是這種實現(xiàn)不應(yīng)認(rèn)為超出本申請的范圍。所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為了描述的方便和簡潔,上述描述的系統(tǒng)、裝置和單元的具體工作過程,可以參考前述方法實施例中的對應(yīng)過程,在此不再贅述。在本申請所提供的幾個實施例中,應(yīng)該理解到,所揭露的系統(tǒng)、裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口、裝置或單元的間接耦合或通信連接,也可以是電的,機械的或其它的形式連接。所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本申請實施例方案的目的。另外,在本申請各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以是兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本申請的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出貢獻(xiàn)的部分,或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:u盤、移動硬盤、只讀存儲器(read-onlymemory,rom)、隨機存取存儲器(randomaccessmemory,ram)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。以上所述,僅為本申請的具體實施方式,但本申請的保護范圍并不局限于此,任何熟悉本
技術(shù)領(lǐng)域:
的技術(shù)人員在本申請揭露的技術(shù)范圍內(nèi),可輕易向到各種等效的修改或替換,這些修改或替換都應(yīng)涵蓋在本申請的保護范圍之內(nèi)。因此,本申請的保護范圍應(yīng)以權(quán)利要求的保護范圍為準(zhǔn)。當(dāng)前第1頁12