專利名稱:自動獲取手機終端信息的系統(tǒng)和方法
技術領域:
本發(fā)明涉及移動互聯(lián)網(wǎng)、計算機軟件等領域,具體涉及一種自動獲取手機終端信息的系統(tǒng)和方法。
背景技術:
目前,隨著3G網(wǎng)絡的商用,移動數(shù)據(jù)業(yè)務發(fā)展迅猛,運營商提供業(yè)務的種類不斷增加。運營商對移動數(shù)據(jù)業(yè)務的關注正從“網(wǎng)絡”向“用戶”層面不斷深化,如何管理好、發(fā)展好各類業(yè)務已經(jīng)成為一個亟待解決的問題。手機終端作為用戶體驗移動數(shù)據(jù)業(yè)務的物理設備,是用戶對運營商服務的感知和 體驗效果的傳導媒介,是用戶選擇業(yè)務類型的重要影響因素。在目前移動終端差異化、多樣化、個性化的情況下,手機終端能力對業(yè)務體驗、消費行為的影響也愈發(fā)凸顯。在移動數(shù)據(jù)業(yè)務發(fā)展過程中,存在難以準確定位目標用戶,確定適合用戶的業(yè)務、內(nèi)容和媒體格式等問題。目前,通過分析手機終端注冊短信、WAP上網(wǎng)行為等獲取少量終端信息即機型參數(shù)和業(yè)務支持能力信息(機型參數(shù)例如屏幕大小、分辨率,業(yè)務支持能力信息例如是否支持Java),不能很好的滿足精確營銷需要;如果采用人工整理終端信息,則存在事務繁瑣且工作量巨大的問題。機型參數(shù)和業(yè)務支持能力信息。
發(fā)明內(nèi)容
名詞解釋
終端信息包括終端參數(shù)信息和業(yè)務支持能力信息等。終端參數(shù)信息,例如屏幕大小、分辨率、操作系統(tǒng)類型等。業(yè)務支持能力信息,例如是否支持KJAVA、是否支持流媒體、是否支持QQ等。手機終端注冊短信終端以普通短信方式向服務器發(fā)送“終端注冊信息”,內(nèi)容包括本機型號,本機ESN或MEID,插入本機UM卡的MSI,以及本機軟件版本。注冊過程完全在后臺進行,即無論是發(fā)送注冊短消息,還是接收注冊成功確認短消息,都不給用戶以提示,也不在短消息收件箱和發(fā)件箱中顯示短消息,避免干擾用戶正常使用。手機資訊門戶提供手機終端的行情資訊門戶網(wǎng)站,可提供包括各類手機終端的參數(shù)和業(yè)務支持能力信息搜索和查詢等服務,例如手機信息網(wǎng)(http://shouji. tenaa.com. cn/),中關村在線(http://www. zol. com. cn/),太平洋電腦網(wǎng)(http://peonline,com. cn)。爬蟲種子門戶是選定用來通過爬蟲程序獲取機型參數(shù)和業(yè)務支持能力信息的手機資訊門戶。爬蟲搜索或搜索爬蟲主要是通過爬蟲程序抓取網(wǎng)頁,對網(wǎng)頁文本內(nèi)容進行提取、分析的過程。分布式并發(fā)技術在此處指分布式處理技術,是分布式計算技術的一種。一種自動獲取手機終端信息的系統(tǒng),所述的系統(tǒng)通過與短信業(yè)務網(wǎng)關連接,采集手機終端注冊短信,所述的系統(tǒng)對手機資訊門戶進行搜索,其特征是該系統(tǒng)在云端運行,它包括注冊短信采集單元、注冊短信解析單元、終端信息采集單元以及管理單元;
所述的注冊短信采集單元用于從短信業(yè)務網(wǎng)關采集手機終端注冊短信;
所述的注冊短信解析單元用于解析手機終端注冊短信獲取用戶信息;
所述的終端信息采集單元用于根據(jù)用戶信息中的新機型名稱在手機資訊門戶進行搜索,獲取終端信息即該新機型參數(shù)和業(yè)務支持能力信息;
所述的管理單元用于配置搜索相關信息和過濾搜索結果的相關信息。 本發(fā)明的管理單元包括爬蟲種子和權重配置模塊、終端信息名稱配置模塊和號段信息維護模塊。一種自動獲取手機終端信息的方法,應用自動獲取手機終端信息的系統(tǒng),它包括以下步驟
步驟A、從短信業(yè)務網(wǎng)關采集手機終端注冊短信的步驟;
步驟B、解析手機終端注冊短信獲取用戶信息的步驟;
步驟C、根據(jù)用戶信息判斷是否為新機型的步驟;如果不是新機型,則返回步驟A,如果是新機型,則轉(zhuǎn)步驟D ;
步驟D、根據(jù)新機型名稱在手機資訊門戶進行搜索獲取該新機型相關網(wǎng)頁的步驟;
步驟E、對步驟D獲取的網(wǎng)頁進行去重處理,對剩余的網(wǎng)頁進行匹配過濾處理;
步驟F、對步驟E獲取的數(shù)據(jù)進行聚合處理,獲得機型參數(shù)和業(yè)務支持能力信息,并寫入終端信息數(shù)據(jù)庫的步驟。本發(fā)明的步驟A具體為注冊短信采集單元從短信業(yè)務網(wǎng)關采集手機終端注冊短信,送往云端進行解析。本發(fā)明的步驟B具體為云端的注冊短信解析單元采用分布式并發(fā)計算技術對多個手機注冊短信進行并發(fā)解析處理,獲取各用戶信息并存入注冊短信解析單元中的用戶信息數(shù)據(jù)庫;所述的用戶信息包括手機號碼、手機機型等。本發(fā)明的步驟D具體為采用爬蟲搜索,在手機資訊門戶中選擇若干作為爬蟲種子門戶,以新機型名稱作為爬蟲關鍵詞,利用分布式并發(fā)計算技術,同時對多個爬蟲種子門戶進行搜索,獲取該新機型參數(shù)和業(yè)務支持能力信息。本發(fā)明的步驟E具體為對多個爬蟲種子門戶獲取的網(wǎng)頁進行去重處理,對剩余的網(wǎng)頁進行匹配過濾處理;所述的匹配過濾處理是對終端信息名稱的匹配處理即根據(jù)機型參數(shù)和業(yè)務支持能力信息的名稱進行過濾,獲取終端信息即機型參數(shù)和業(yè)務支持能力信
肩、O本發(fā)明的有益效果
本發(fā)明實現(xiàn)了用戶手機終端信息的自動獲??;并發(fā)對手機終端注冊短信進行解析,提高了解析效率;同時對多個手機資訊門戶進行爬蟲搜索,提高了手機終端信息抓取的廣度(更多終端信息)和深度(準確度)。手機終端信息可用于終端媒體格式實時適配,提升用戶業(yè)務使用體驗,用于移動業(yè)務精準營銷和用戶消費行為分析,支撐移動互聯(lián)網(wǎng)流量經(jīng)營。
圖I是本發(fā)明的流程示意圖。圖2是本發(fā)明的應用場景示意圖。圖3是本發(fā)明手機終端注冊短信采集流程圖。圖4是本發(fā)明手機終端信息采集流程圖。圖5是本發(fā)明一實施例的結構示意圖。
具體實施例方式下面結合附圖和實施例對本發(fā)明作進一步的說明。本發(fā)明提出了一種自動獲取手機終端信息的系統(tǒng)和方法。具體說明如下
如圖I所示,為本發(fā)明自動獲取手機終端信息的系統(tǒng)和方法的流程示意圖。包括以下步驟
步驟A、從短信業(yè)務網(wǎng)關采集手機終端注冊短信,送往云端進行解析;
步驟B、云端采用分布式計算技術對手機注冊短信進行并發(fā)解析處理,獲取用戶信息(如手機號碼、手機機型等),寫入用戶信息數(shù)據(jù)庫;
步驟C、判斷手機是否為新機型,如果不是,轉(zhuǎn)步驟A,否則,轉(zhuǎn)步驟D ;
步驟D、以機型名稱作為爬蟲關鍵詞,利用云平臺分布式并發(fā)技術,同時對多個爬蟲種子門戶進行搜索;
步驟E、對各爬蟲程序抓取的網(wǎng)頁進行去重處理,對剩余的網(wǎng)頁進行語義分析、匹配過濾處理;
步驟F、進行聚合分析處理,獲得機型參數(shù)和業(yè)務支持能力信息,并寫入終端信息數(shù)據(jù)
庫;
本發(fā)明的應用場景如圖2所示,由手機終端、短信業(yè)務網(wǎng)關、自動獲取手機終端信息的系統(tǒng)和手機資訊門戶等四部分構成。具體說明如下
I、手機終夂而
用戶開機時,判斷終端的ESN (或pseudo-ESN或MEID)和UM卡的MSI參數(shù)對是否與上次關機時的參數(shù)對匹配。如果匹配,終端不做任何處理,繼續(xù)執(zhí)行后續(xù)的開機過程;如果不匹配,終端應將新的ESN/IMSI參數(shù)對以及終端的軟件版本和終端型號以短消息的方式上報短信業(yè)務網(wǎng)關。2、短信業(yè)務網(wǎng)關
接收手機終端發(fā)送的注冊短信,直接向手機終端信息自動采集系統(tǒng)轉(zhuǎn)發(fā)或提供交換機鏡像端口供采集。3、自動獲取手機終端信息的系統(tǒng)
從短信業(yè)務網(wǎng)關采集手機終端注冊短信,解析獲取用戶號碼、終端機型等信息,寫入用戶信息數(shù)據(jù)庫。當發(fā)現(xiàn)手機終端為新機型時,利用爬蟲技術,通過互聯(lián)網(wǎng)從手機資訊門戶進行爬蟲搜索,然后對爬蟲結果進行聚合分析處理,獲得更多終端信息。
系統(tǒng)采用云計算理念設計,對采集的注冊短信進行并發(fā)解析處理,提高注冊短信解析效率;采用分布式計算技術,同時對多個手機資訊門戶網(wǎng)站進行爬蟲搜索,對搜索結果進行分析、聚合處理,提高終端信息采集廣度(更多終端信息)和深度(準確度);系統(tǒng)采用分布式數(shù)據(jù)庫技術,對數(shù)據(jù)進行眾向分割處理,用戶號碼、機型信息存儲在用戶信息數(shù)據(jù)庫,機型參數(shù)和業(yè)務支持能力信息存儲在終端信息數(shù)據(jù)庫,提高數(shù)據(jù)庫的訪問速度。4、手機資訊門戶
提供手機終端的行情資訊門 戶網(wǎng)站,可提供包括各類手機終端的參數(shù)和業(yè)務支持能力信息搜索和查詢等服務。手機終端注冊短信采集和解析 I、手機終端注冊短信采集
手機終端注冊短信采集流程如圖3所示,包括以下步驟
步驟A、接收從短信業(yè)務網(wǎng)關轉(zhuǎn)發(fā)或鏡像的短消息;
步驟B、對接收短消息的目標端口、消息類型和目的接入號等進行判斷;
步驟C、判斷是否符合指定要求,如果符合,轉(zhuǎn)步驟E,否則,轉(zhuǎn)步驟D ;
步驟D、丟棄該消息,繼續(xù)接收下一條消息,轉(zhuǎn)步驟A ;
步驟E、將接收短消息發(fā)送到云端進行解析處理。2、手機終端注冊短信解析
手機終端信息存在于注冊短信Content (內(nèi)容)字段中,可根據(jù)相關技術規(guī)范進行解析。例如,Content字段解碼后為
<al><bl>SAF-D9900</bl><b2>AlB2FD8E</b2Xb3>4600361200 24361</b3Xb4>5. 2. 20271. 920C〈/b4X/al>DCFF32EB各字段含義
SAF-D9900 :機型 A1B2FD8E ESN 或 MEID 信息 460036120024361 =IMSI 信息 5. 2. 20271. 920C :手機的軟件版本 DCFF32EB CRC 校驗 終端信息采集
終端信息采集流程如圖4所示,包括以下步驟
步驟A、根據(jù)設置的爬蟲種子(手機資訊門戶URL),以機型名稱作為關鍵詞,并發(fā)進行爬蟲搜索,抓取關聯(lián)網(wǎng)頁;
步驟B、對各爬蟲程序抓取的網(wǎng)頁進行去重復處理,對剩余的網(wǎng)頁進行內(nèi)容解析,根據(jù)設定的終端信息名稱,分別進行語義分析和匹配過濾處理;
步驟C、對各爬蟲程序分別搜索到的機型信息進行聚合分析處理,獲得機型參數(shù)和業(yè)務支持能力信息;
爬蟲結果分析處理
將各爬蟲種子及其對應的權重使用S(W) = (Cs1jW1), (sCi w=), ,(sp,wp)]表示。分別對各爬蟲程序抓取的網(wǎng)頁進行去重復處理,例如對搜索結果按照地址是否相同進行過濾,只保留網(wǎng)址不同的搜索結果。對剩余的網(wǎng)頁進行內(nèi)容解析,根據(jù)設定的各終端信息名稱,分別進行語義分析和
匹配過濾處理,獲得各終端信息名稱對應的搜索結果集R = Cr1.r;, srN},同時,計算搜索結果集中^)在各爬蟲結果中出現(xiàn)的次數(shù)ksl =…搜索結果
可信度使用C(R) = (CrlfC1)., (r:,c:),, (rs, cx)}表示,計算^ = % X’ m 為L -N ’
可信度Crn的最大值為&,(^對應的1^即為該終端信息名稱對應的最終搜索結果。以同時從“手機信息網(wǎng)”、“太平洋電腦網(wǎng)”和“中關村在線”搜索新機型摩托羅拉ME811終端信息“JAVA功能”為例進行說明,設置三個手機資訊門戶網(wǎng)站的對搜索結果的影響權重分別為O. 5,0. 3和O. 2。經(jīng)過去重復、語義分析和匹配過濾處理后,各手機資訊門戶搜索結果見下表
權利要求
1.一種自動獲取手機終端信息的系統(tǒng),所述的系統(tǒng)通過與短信業(yè)務網(wǎng)關連接,采集手機終端注冊短信,所述的系統(tǒng)對手機資訊門戶進行搜索,其特征是該系統(tǒng)在云端運行,它包括注冊短信采集單元、注冊短信解析單元、終端信息采集單元以及管理單元; 所述的注冊短信采集單元用于從短信業(yè)務網(wǎng)關采集手機終端注冊短信; 所述的注冊短信解析單元用于解析手機終端注冊短信獲取用戶信息; 所述的終端信息采集單元用于根據(jù)用戶信息中的新機型名稱在手機資訊門戶進行搜索,獲取終端信息即該新機型參數(shù)和業(yè)務支持能力信息; 所述的管理單元用于配置搜索相關信息和過濾搜索結果的相關信息。
2.根據(jù)權利要求I所述的自動獲取手機終端信息的系統(tǒng),其特征是所述的管理單元包括爬蟲種子和權重配置模塊、終端信息名稱配置模塊和號段信息維護模塊。
3.一種自動獲取手機終端信息的方法,應用權利要求I所述的自動獲取手機終端信息的系統(tǒng),其特征是它包括以下步驟 步驟A、從短信業(yè)務網(wǎng)關采集手機終端注冊短信的步驟; 步驟B、解析手機終端注冊短信獲取用戶信息的步驟; 步驟C、根據(jù)用戶信息判斷是否為新機型的步驟;如果不是新機型,則返回步驟A,如果是新機型,則轉(zhuǎn)步驟D ; 步驟D、根據(jù)新機型名稱在手機資訊門戶進行搜索獲取該新機型相關網(wǎng)頁的步驟; 步驟E、對步驟D獲取的網(wǎng)頁進行去重處理,對剩余的網(wǎng)頁進行匹配過濾處理; 步驟F、對步驟E獲取的數(shù)據(jù)進行聚合處理,獲得機型參數(shù)和業(yè)務支持能力信息,并寫入終端信息數(shù)據(jù)庫的步驟。
4.根據(jù)權利要求3所述的自動獲取手機終端信息的方法,其特征是所述的步驟A具體為注冊短信采集單元從短信業(yè)務網(wǎng)關采集手機終端注冊短信,送往云端進行解析。
5.根據(jù)權利要求3所述的自動獲取手機終端信息的方法,其特征是所述的步驟B具體為云端的注冊短信解析單元采用分布式并發(fā)計算技術對多個手機注冊短信進行并發(fā)解析處理,獲取各用戶信息并存入注冊短信解析單元中的用戶信息數(shù)據(jù)庫;所述的用戶信息包括手機號碼、手機機型等。
6.根據(jù)權利要求3所述的自動獲取手機終端信息的方法,其特征是所述的步驟D具體為采用爬蟲搜索,在手機資訊門戶中選擇若干作為爬蟲種子門戶,以新機型名稱作為爬蟲關鍵詞,利用分布式并發(fā)計算技術,同時對多個爬蟲種子門戶進行搜索,獲取該新機型參數(shù)和業(yè)務支持能力信息。
7.根據(jù)權利要求6所述的自動獲取手機終端信息的方法,其特征是所述的步驟E具體為對多個爬蟲種子門戶獲取的網(wǎng)頁進行去重處理,對剩余的網(wǎng)頁進行匹配過濾處理;所述的匹配過濾處理是對終端信息名稱的匹配處理即根據(jù)機型參數(shù)和業(yè)務支持能力信息的名稱進行過濾,獲取終端信息即機型參數(shù)和業(yè)務支持能力信息。
全文摘要
一種自動獲取手機終端信息的系統(tǒng)和方法,所述的系統(tǒng)與短信業(yè)務網(wǎng)關連接,采集手機終端注冊短信,所述的系統(tǒng)對手機資訊門戶進行搜索,該系統(tǒng)在云端運行,它包括注冊短信采集單元、注冊短信解析單元、終端信息采集單元以及管理單元。本發(fā)明實現(xiàn)了用戶手機終端信息的自動獲??;并發(fā)對手機終端注冊短信進行解析,提高了解析效率;同時對多個手機資訊門戶進行爬蟲搜索,提高了手機終端信息抓取的廣度(更多終端信息)和深度(準確度)。
文檔編號G06F17/30GK102932481SQ201210461869
公開日2013年2月13日 申請日期2012年11月16日 優(yōu)先權日2012年11月16日
發(fā)明者嵇正鵬, 袁黎軼, 汪敏娟, 袁海, 胡仲剛, 張聰 申請人:江蘇省公用信息有限公司