国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      基于向量空間模型的重入網(wǎng)分析方法

      文檔序號:7943348閱讀:208來源:國知局
      專利名稱:基于向量空間模型的重入網(wǎng)分析方法
      技術(shù)領(lǐng)域
      本發(fā)明屬于信息通信技術(shù)領(lǐng)域,尤其涉及一種基于向量空間模型的重入網(wǎng)分析方法。
      背景技術(shù)
      目前,電信運營商面臨一個重要問題就是重入網(wǎng)現(xiàn)象,即移動用戶在已經(jīng)擁有一個移動號碼的情況下,再次購買所歸屬的同一移動運營商的新號碼入網(wǎng),新號碼全部或者部分替代原有舊號碼。1.造成大量的重入網(wǎng)用戶的原因很多,主要有如下幾點(1)存在大量對資費敏感客戶。客戶對資費比較敏感,當(dāng)新的資費套餐出現(xiàn)或者某種套餐出現(xiàn)優(yōu)惠,這些資費敏感客戶便在網(wǎng)內(nèi)跳轉(zhuǎn)。通常這部分客戶,是 ARPU (ARPU-Average Revenue Per User,每用戶平均收入)較低的低價值客戶,對號碼依附關(guān)系不大。(2)部分市場營銷政策之間相互影響。新增市場政策和存量市場政策沖突,新推出的市場營銷策略,影響到原有的資費套餐,使得原有資費套餐用戶,轉(zhuǎn)向新套餐。(3)存在大量定位不準(zhǔn)客戶。對于新客戶,沒有合適的分析手段來分析和準(zhǔn)確識別,以至于這部分客戶,在入網(wǎng)后很短時間內(nèi)重入網(wǎng),選擇更適合自己的品牌或套餐?;谏鲜鲈?,有效地識別重入網(wǎng)用戶,并分析用戶重入網(wǎng)的原因,可以有效地減少重入網(wǎng)用戶量,進而能夠減少運營商日常的成本支出,節(jié)省系統(tǒng)的存儲空間,減少前臺營業(yè)成本和客服成本。所以,對于電信運營商來說,識別重入網(wǎng)用戶是所有上述工作的基礎(chǔ), 具有很大的現(xiàn)實意義。目前常用的識別重入網(wǎng)用戶的方法及其問題(1)基于用戶資料的識別技術(shù),通過諸如身份證號碼、用戶姓名、登記地址、聯(lián)系人信息等用戶資料信。缺點目前很多用戶在移動通信商的客戶管理系統(tǒng)中沒有用戶資料。(2)基于 IMEI (International Mobile Equipment Identity)的識別技術(shù)。缺點 很多手機上沒有IMEI,所以用此辦法根本無法有效識別。(3)呼叫指紋所謂“呼叫指紋”就是指用戶在使用移動運營商的產(chǎn)品及服務(wù)過程中所產(chǎn)生的交往圈、呼叫特征、短信特征、位置特征、客服特征、終端特征等信息。這些特征對每一用戶是相對穩(wěn)定的,且存在個體差異,因此可以作為識別重入網(wǎng)用戶的特征。缺點 基于交往圈信息的呼叫指紋算法由于識別準(zhǔn)確率低、識別時間過長、因此,在控制重入網(wǎng)用戶方面不是十分有效。文獻《概念推理網(wǎng)及其在文本分類中的應(yīng)用》(計算機研究與發(fā)展,李曉黎、劉繼敏、史忠植,2000,37 (9) :1032 1038)和文獻《文檔中詞語權(quán)重計算方法的改進》(中文信息學(xué)報,魯松、李曉黎、白碩,2000,14(6) 8-13)介紹了一種基于向量空間模型的信息檢索技術(shù),該技術(shù)是較為成熟且應(yīng)用廣泛的信息檢索技術(shù),它將文檔和查詢信息均用向量空間表示,查詢匹配問題轉(zhuǎn)化為向量空間的矢量匹配問題,文檔與查詢的相似度可用向量之間的夾角來度量。在移動通信領(lǐng)域中,用戶的通話詳單就相當(dāng)于一個一個的文檔,只要能夠提取每個用戶的通話詳單中的特征項,就可以通過計算特征向量和向量之間的夾角余弦來得到用戶與用戶之間的相似度,從而找到重入網(wǎng)的用戶。

      發(fā)明內(nèi)容
      本發(fā)明的目的在于,提供一種基于向量空間模型的重入網(wǎng)分析方法,用于解決常用的重入網(wǎng)計算方法存在的問題。為了實現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案是,一種基于向量空間模型的重入網(wǎng)分析方法,其特征是所述分析方法包括步驟1 確定待匹配用戶號碼集合和新增用戶號碼集合;步驟2 提取待匹配用戶號碼集合中的每個待匹配用戶號碼和與該用戶號碼通話次數(shù)最多的設(shè)定個號碼,將其作為該待匹配用戶號碼的特征項;提取新增用戶號碼集合中的每個新增用戶號碼和與該新增用戶號碼通話次數(shù)最多的設(shè)定個號碼,將其作為該新增用戶號碼的特征項;步驟3 將每個待匹配用戶號碼和該待匹配用戶號碼的特征項作為待匹配用戶號碼話單,從而建立待匹配用戶號碼和待匹配用戶號碼話單的對應(yīng)關(guān)系;將新增用戶號碼和該新增用戶號碼的特征項作為新增用戶號碼話單,從而建立新增用戶號碼和新增用戶號碼話單的對應(yīng)關(guān)系;步驟4 將所有待匹配用戶號碼話單組成待匹配用戶號碼話單集合;將所有新增用戶號碼話單組成新增用戶號碼話單集合;步驟5 分別確定待匹配用戶號碼話單集合和新增用戶號碼話單集合中的不同的特征項;步驟6 計算每個待匹配用戶號碼話單和每個新增用戶號碼話單中的特征項權(quán)值;步驟7 從待匹配用戶號碼話單集合中任取一個待匹配用戶號碼話單,從新增用戶號碼話單集合中任取一個新增用戶號碼話單,通過計算兩個用戶號碼話單之間的相似度,確定上述兩個用戶號碼話單對應(yīng)的用戶號碼是否為重入網(wǎng)的用戶號碼。所述計算每個待匹配/新增用戶號碼話單的特征項權(quán)值具體利用公式COik = tfikx (log2(N/nk)+l)計算;其中,COik為特征項權(quán)值,tfik為特征項tk在待匹配/新增用戶號碼話單Cli中出現(xiàn)的頻率,i = 1,2,. . .,N,N為待匹配/新增用戶號碼話單集合中的元素個數(shù),nk為待匹配/新增用戶號碼話單集合中特征項tk出現(xiàn)的個數(shù),k = 1,2,. . . m,m為待匹配/新增用戶號碼話單集合中的不同的特征項的個數(shù)。所述計算兩個用戶號碼話單之間的相似度具體利用公式
      m
      Σ ω ,kχ ω Jk
      c0s^ = I —-1m唭中,ω Jk ^p COik分別為待匹配用戶號碼話單
      λ/(Σ
      V ^=Ik=ι
      Cli和新增用戶號碼話單Cli的特征項權(quán)值,m為號碼話單集合中的不同的特征項的個數(shù)。所述確定上述兩個用戶號碼話單對應(yīng)的用戶號碼是否為重入網(wǎng)的用戶號碼具體是,當(dāng)兩個用戶號碼話單之間的相似度小于設(shè)定閾值時,則上述兩個用戶號碼話單對應(yīng)的用戶號碼為重入網(wǎng)的用戶號碼。本發(fā)明將用戶號碼對應(yīng)的通話詳單作為文檔,通過提取通話詳單中的特征項,計算特征向量和向量之間的夾角余弦,獲取用戶與用戶之間的相似度,從而找到重入網(wǎng)的用戶;與常用的重入網(wǎng)識別方法相比,本發(fā)明提供的方法計算速度更快,識別準(zhǔn)確率更高。


      圖1基于向量空間模型的重入網(wǎng)分析方法流程圖。
      具體實施例方式下面結(jié)合附圖,對優(yōu)選實施例作詳細說明。應(yīng)該強調(diào)的是,下述說明僅僅是示例性的,而不是為了限制本發(fā)明的范圍及其應(yīng)用。實施例以聯(lián)通的老CDMA用戶和新入網(wǎng)的CDMA用戶分別作為待匹配的用戶號碼集合和新增用戶號碼集合,并計算集合中每個用戶對其每個聯(lián)系人的通話總次數(shù),從中提取前20個通話頻率最長的號碼,這20個號碼就是用戶的特征項,并通過計算特征項權(quán)值ω ik,獲取重入網(wǎng)用戶號碼。圖1基于向量空間模型的重入網(wǎng)分析方法流程圖。圖1中,本發(fā)明提供的方法包括步驟1 確定待匹配用戶號碼集合和新增用戶號碼集合。根據(jù)聯(lián)通規(guī)范,待匹配用戶號碼是指目前在網(wǎng)用戶(包括零次通話用戶)及半年內(nèi)離網(wǎng)的用戶。新增用戶號碼是指已經(jīng)入網(wǎng)而且有一個完整月的通話行為數(shù)據(jù)的用戶。根據(jù)上述規(guī)范,可以確定確定待匹配用戶號碼集合和新增用戶號碼集合。步驟2 提取待匹配用戶號碼集合中的每個待匹配用戶號碼和與該用戶號碼通話次數(shù)最多的設(shè)定個號碼,將其作為該待匹配用戶號碼的特征項;提取新增用戶號碼集合中的每個新增用戶號碼和與該新增用戶號碼通話次數(shù)最多的設(shè)定個號碼,將其作為該新增用戶號碼的特征項。在本實施例中,設(shè)定數(shù)量為20個。分別提取待匹配用戶號碼集合和新增用戶號碼集合中的每個用戶號碼和與該用戶號碼通話次數(shù)最多的20個號碼。與每個用戶通話次數(shù)最多的20個號碼即為該用戶號碼的特征項。步驟3 將每個待匹配用戶號碼和該待匹配用戶號碼的特征項作為待匹配用戶號碼話單,從而建立待匹配用戶號碼和待匹配用戶號碼話單的對應(yīng)關(guān)系;將新增用戶號碼和該新增用戶號碼的特征項作為新增用戶號碼話單,從而建立新增用戶號碼和新增用戶號碼話單的對應(yīng)關(guān)系。建立用戶號碼話單,將每個用戶號碼和該用戶號碼的特征項作為用戶號碼詳單, 這樣就建立用戶號碼和該用戶號碼詳單的對應(yīng)關(guān)系。步驟4 將所有待匹配用戶號碼話單組成待匹配用戶號碼話單集合;將所有新增用戶號碼話單組成新增用戶號碼話單集合。步驟5 分別確定待匹配用戶號碼話單集合和新增用戶號碼話單集合中的不同的特征項。由于每個用戶號碼話單都有各自的特征項,因此用戶號碼話單集合中很可能會有重復(fù)的特征項,去掉重復(fù)的特征項,剩下的特征項即為用戶號碼話單集合中的不同的特征項。步驟6 計算每個待匹配用戶號碼話單和每個新增用戶號碼話單中的特征項權(quán)值。特征項權(quán)值利用公式ω ik = tfikX (Iog2 (N/nk) +1)進行計算。其中,《ik為特征項權(quán)值,特征項tk在待匹配/新增用戶號碼話單中出現(xiàn)的頻率,i = 1,2,...,N,N為待匹配/新增用戶號碼話單集合中的元素個數(shù),nk為待匹配/新增用戶號碼話單集合中特征項tk出現(xiàn)的個數(shù),k = 1,2,. . . m,m為待匹配/新增用戶號碼話單集合中的不同的特征項的個數(shù)。步驟7 從待匹配用戶號碼話單集合中任取一個待匹配用戶號碼話單,從新增用戶號碼話單集合中任取一個新增用戶號碼話單,通過計算兩個用戶號碼話單之間的相似度,確定上述兩個用戶號碼話單對應(yīng)的用戶號碼是否為重入網(wǎng)的用戶號碼。計算兩個用戶號碼話單之間的相似度具體利用公式
      權(quán)利要求
      1.一種基于向量空間模型的重入網(wǎng)分析方法,其特征是所述分析方法包括步驟1 確定待匹配用戶號碼集合和新增用戶號碼集合;步驟2 提取待匹配用戶號碼集合中的每個待匹配用戶號碼和與該用戶號碼通話次數(shù)最多的設(shè)定個號碼,將其作為該待匹配用戶號碼的特征項;提取新增用戶號碼集合中的每個新增用戶號碼和與該新增用戶號碼通話次數(shù)最多的設(shè)定個號碼,將其作為該新增用戶號碼的特征項;步驟3 將每個待匹配用戶號碼和該待匹配用戶號碼的特征項作為待匹配用戶號碼話單,從而建立待匹配用戶號碼和待匹配用戶號碼話單的對應(yīng)關(guān)系;將新增用戶號碼和該新增用戶號碼的特征項作為新增用戶號碼話單,從而建立新增用戶號碼和新增用戶號碼話單的對應(yīng)關(guān)系;步驟4 將所有待匹配用戶號碼話單組成待匹配用戶號碼話單集合;將所有新增用戶號碼話單組成新增用戶號碼話單集合;步驟5 分別確定待匹配用戶號碼話單集合和新增用戶號碼話單集合中的不同的特征項;步驟6 計算每個待匹配用戶號碼話單和每個新增用戶號碼話單中的特征項權(quán)值;步驟7 從待匹配用戶號碼話單集合中任取一個待匹配用戶號碼話單,從新增用戶號碼話單集合中任取一個新增用戶號碼話單,通過計算兩個用戶號碼話單之間的相似度,確定上述兩個用戶號碼話單對應(yīng)的用戶號碼是否為重入網(wǎng)的用戶號碼。
      2.根據(jù)權(quán)利要求1所述的基于向量空間模型的重入網(wǎng)分析方法,其特征是所述計算每個待匹配/新增用戶號碼話單的特征項權(quán)值具體利用公式《ik = tfikX (log2(N/nk)+l)計算;其中,《ik為特征項權(quán)值,tfik為特征項tk在待匹配/新增用戶號碼話單Cli中出現(xiàn)的頻率,i = 1,2,...,N,N為待匹配/新增用戶號碼話單集合中的元素個數(shù),nk為待匹配/新增用戶號碼話單集合中特征項tk出現(xiàn)的個數(shù),k = 1,2,. . . m,m為待匹配/新增用戶號碼話單集合中的不同的特征項的個數(shù)。
      3.根據(jù)權(quán)利要求2所述的基于向量空間模型的重入網(wǎng)分析方法,其特征是所述計算兩其中,《^和coik分別為待匹配用戶號碼話單Cli和新增用戶號碼話單…的特征項權(quán)值,m為號碼話單集合中的不同的特征項的個數(shù)。
      4.根據(jù)權(quán)利要求3所述的基于向量空間模型的重入網(wǎng)分析方法,其特征是所述確定上述兩個用戶號碼話單對應(yīng)的用戶號碼是否為重入網(wǎng)的用戶號碼具體是,當(dāng)兩個用戶號碼話單之間的相似度小于設(shè)定閾值時,則上述兩個用戶號碼話單對應(yīng)的用戶號碼為重入網(wǎng)的用戶號碼。Σ ω個用戶號碼話單之間的相似度具體利用公式eQ s θ
      全文摘要
      本發(fā)明屬于信息通信技術(shù)領(lǐng)域,尤其涉及一種基于向量空間模型的重入網(wǎng)分析方法。包括確定待匹配用戶號碼集合和新增用戶號碼集合;提取待匹配用戶號碼的特征項;提取新增用戶號碼的特征項;待匹配用戶號碼話單和新增用戶號碼話單;組成待匹配用戶號碼話單集合和新增用戶號碼話單集合;分別確定待匹配用戶號碼話單集合和新增用戶號碼話單集合中的不同的特征項;計算每個待匹配用戶號碼話單和每個新增用戶號碼話單中的特征項權(quán)值;通過計算兩個用戶號碼話單之間的相似度,確定用戶號碼是否為重入網(wǎng)的用戶號碼。本發(fā)明提供的方法計算速度更快,識別準(zhǔn)確率更高。
      文檔編號H04W16/22GK102387512SQ20111031847
      公開日2012年3月21日 申請日期2011年10月19日 優(yōu)先權(quán)日2011年10月19日
      發(fā)明者劉云, 張振江, 程輝, 韓少春 申請人:北京交通大學(xué)
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會獲得點贊!
      1