明的又一實(shí)施例中,接收至少一個客戶端上報的至少一種類別的短信之前,可以獲取各個客戶端所在通信終端當(dāng)前所在地信息,對各個客戶端所在通信終端中的短信接收事件進(jìn)行監(jiān)測,判斷當(dāng)前接收到的短信對應(yīng)的電話號碼的歸屬地是否與通信終端當(dāng)前所在地相同,如果不相同,則將當(dāng)前接收到的短信標(biāo)注為多種類別中的指定類別。
[0118]在本發(fā)明的又一實(shí)施例中,接收至少一個客戶端上報的至少一種類別的短信之前,可以獲取各個客戶端所在通信終端中保存的通訊錄信息,對各個客戶端所在通信終端中的短信接收事件進(jìn)行監(jiān)測,判斷通訊錄中是否存在與當(dāng)前接收到的短信對應(yīng)的電話號碼具有相同歸屬地和/或地區(qū)編碼號段的電話號碼,如果不存在,則將當(dāng)前接收到的短信標(biāo)注為多種類別中的指定類別。
[0119]在步驟S104獲取多種類別的短信之后,步驟S106中將多種類別的短信作為訓(xùn)練語料對短信分類器進(jìn)行訓(xùn)練,本發(fā)明實(shí)施例提供了一種可選的方案,在該方案中,從多種類別的短信中提取屬性特征,隨后將提取的屬性特征和對應(yīng)的短信類別輸入短信分類器進(jìn)行訓(xùn)練。這里的屬性特征可以是短信文本內(nèi)容的關(guān)鍵詞,短信發(fā)送方的電話號碼、名稱、姓名或電話號碼類別等,本發(fā)明不作限制。
[0120]在本發(fā)明的另一實(shí)施例中,步驟S108中服務(wù)器端接收到一新短信時,利用訓(xùn)練后的短信分類器將新短信標(biāo)注為多種類別中的一種。之后,服務(wù)器端還將標(biāo)注的新短信的類別下發(fā)給新短信的目的地址對應(yīng)的客戶端。
[0121]此外,本發(fā)明實(shí)施例中,當(dāng)服務(wù)器將標(biāo)注的新短信的類別下發(fā)給新短信的目的地址對應(yīng)的客戶端之后,可以接收客戶端提交的關(guān)于標(biāo)注的新短信的類別的反饋信息,進(jìn)而根據(jù)反饋信息確定是否更新訓(xùn)練語料。例如,若反饋信息為新短信的類別為不同于標(biāo)注類別的其他類別,則需要確定根據(jù)新短信的其他類別更新訓(xùn)練語料,利用更新的訓(xùn)練語料對短信分類器進(jìn)行訓(xùn)練,以便進(jìn)一步優(yōu)化短信分類器,提高短信分類器自動分類的準(zhǔn)確率。
[0122]下面通過一具體實(shí)施例詳細(xì)介紹本發(fā)明的標(biāo)注短信類別的方法的實(shí)現(xiàn)過程。圖2示出了根據(jù)本發(fā)明另一實(shí)施例的標(biāo)注短信類別的方法的流程圖。參見圖2,該方法至少可以包括步驟S202至步驟S212。
[0123]步驟S202,采用Liblinear構(gòu)造多分類的短信分類器,其中,該短信分類器中的各個參數(shù)依據(jù)短信內(nèi)容的屬性特征進(jìn)行設(shè)置。
[0124]該步驟中,可以調(diào)用Liblinear中的動態(tài)分類庫,利用調(diào)用的動態(tài)分類庫構(gòu)造多分類的短信分類器,從而實(shí)現(xiàn)從二類分類模型到多類分類模型的構(gòu)造。此外,多分類可以是詐騙類、房產(chǎn)中介類、廣告推銷類、響一聲類、公司電話類、教育培訓(xùn)類、商家促銷類或保險類等,本發(fā)明不限于此。
[0125]步驟S204,獲取人工標(biāo)注的多種類別的短信,其中,每種類別的短信包含多條。此夕卜,還可以接收至少一個客戶端上報的至少一種類別的短信。
[0126]步驟S206,從多種類別的短信中提取屬性特征。
[0127]該步驟中,屬性特征可以是短信文本內(nèi)容的關(guān)鍵詞,短信發(fā)送方的電話號碼、名稱、姓名或電話號碼類別等,本發(fā)明不作限制。
[0128]此外,還可以從屬性特征為短信發(fā)送方的電話號碼中提取通信行為的特征,對行為特征數(shù)據(jù)不進(jìn)行限制,包括但不限于通話時間、通話時長、被掛斷占比、呼入占比、通訊錄聯(lián)系人占比、非長途通話占比、請求通話時向?qū)Ψ降钠骄埱蟠螖?shù)。例如,可以收集200個號碼的通話行為(通信行為)的呼入占比(行為特征數(shù)據(jù)),以及每個號碼對應(yīng)的標(biāo)簽(屬性),然后輸入短信分類器,訓(xùn)練該短信分類器的各個參數(shù)。
[0129]在提取屬性特征時,還可以對短信文本內(nèi)容進(jìn)行處理,例如,號碼D發(fā)送的短信文本內(nèi)容中包含有以下內(nèi)容……六五八七三二四……”,預(yù)設(shè)的過濾規(guī)則中,規(guī)定需要將漢字?jǐn)?shù)字轉(zhuǎn)換為阿拉伯?dāng)?shù)字,則轉(zhuǎn)換后的短信為“……6587324……”,對轉(zhuǎn)換后的短信進(jìn)行分詞提取,可以順利提取到“6587324” (詞語),根據(jù)預(yù)設(shè)的詐騙號碼庫,可以發(fā)現(xiàn)該號碼為詐騙號碼,所以可將號碼D分類到“詐騙號碼”之下。
[0130]步驟S208,將提取的屬性特征和對應(yīng)的短信類別輸入短信分類器進(jìn)行訓(xùn)練,計算短信分類器中的各個參數(shù),得到訓(xùn)練后的短信分類器。
[0131]步驟S210,當(dāng)接收到一新短信時,利用訓(xùn)練后的短信分類器將新短信標(biāo)注為多種類別中的一種。
[0132]步驟S212,將標(biāo)注的新短信的類別下發(fā)給新短信的目的地址對應(yīng)的客戶端。
[0133]在步驟S212之后,本發(fā)明實(shí)施例可以接收客戶端提交的關(guān)于標(biāo)注的新短信的類別的反饋信息,進(jìn)而根據(jù)反饋信息確定是否更新訓(xùn)練語料。例如,若反饋信息為新短信的類別為不同于標(biāo)注類別的其他類別,則需要確定根據(jù)新短信的其他類別更新訓(xùn)練語料,利用更新的訓(xùn)練語料對短信分類器進(jìn)行訓(xùn)練,以便進(jìn)一步優(yōu)化短信分類器,提高短信分類器自動分類的準(zhǔn)確率。
[0134]另外,本發(fā)明實(shí)施例提供的上述方案在對短信進(jìn)行標(biāo)注后,可以關(guān)聯(lián)該短信的電話號碼,從而標(biāo)注出電話號碼的類別。這樣,可以應(yīng)用在來電秀以及各種騷擾電話提醒等手機(jī)安全產(chǎn)品中,以盡量避免用戶受到騷擾電話的侵?jǐn)_。例如,對于響一聲電話或詐騙電話,一旦用戶回?fù)軇t可能蒙受經(jīng)濟(jì)損失,對于一些房產(chǎn)中介、保險中介等的電話,用戶可能根本不想收到類似人群的電話。利用本發(fā)明方案,可直接在來電顯示中展示企業(yè)名稱、Logo (標(biāo)識)等信息,還可展示最近的促銷活動等信息,這些信息都可以一并顯示給接收到或者正在撥打該電話的用戶,使得用戶能夠獲得更豐富的信息,以給用戶提供全面的信息提示和操作指導(dǎo)。
[0135]基于同一發(fā)明構(gòu)思,本發(fā)明實(shí)施例還提供一種標(biāo)注短信類別的裝置。圖3示出了根據(jù)本發(fā)明一實(shí)施例的標(biāo)注短信類別的裝置的結(jié)構(gòu)示意圖。參見圖3,該裝置至少可以包括:構(gòu)造模塊310、獲取模塊320、訓(xùn)練模塊330以及標(biāo)注模塊340。
[0136]現(xiàn)介紹本發(fā)明實(shí)施例的標(biāo)注短信類別的裝置的各組成或器件的功能以及各部分間的連接關(guān)系:
[0137]構(gòu)造模塊310,適于采用預(yù)置的短信分類規(guī)則,構(gòu)造多分類的短信分類器,其中,短信分類器中的各個參數(shù)依據(jù)短信的屬性特征進(jìn)行設(shè)置;
[0138]獲取模塊320,與構(gòu)造模塊310相耦合,適于獲取多種類別的短信,其中,每種類別的短信包含多條;
[0139]訓(xùn)練模塊330,與獲取模塊320相耦合,適于將多種類別的短信作為訓(xùn)練語料對短信分類器進(jìn)行訓(xùn)練,計算短信分類器中的各個參數(shù),得到訓(xùn)練后的短信分類器;
[0140]標(biāo)注模塊340,與訓(xùn)練模塊330相耦合,適于當(dāng)接收到一新短信時,利用訓(xùn)練后的短信分類器將新短信標(biāo)注為多種類別中的一種。
[0141]在本發(fā)明一實(shí)施例中,構(gòu)造模塊310構(gòu)造的多分類的短信分類器,其多分類可以是詐騙類、房產(chǎn)中介類、廣告推銷類、響一聲類、公司電話類、教育培訓(xùn)類、商家促銷類或保險類等,本發(fā)明不限于此。
[0142]在本發(fā)明一實(shí)施例中,上述構(gòu)造模塊310還適于:
[0143]采用Liblinear構(gòu)造多分類的短信分類器;或者,
[0144]采用Libsvm構(gòu)造多分類的短信分類器。
[0145]在本發(fā)明一實(shí)施例中,上述構(gòu)造模塊310還適于:
[0146]調(diào)用Liblinear中的動態(tài)分類庫;
[0147]利用調(diào)用的動態(tài)分類庫構(gòu)造多分類的短信分類器。
[0148]在本發(fā)明一實(shí)施例中,上述獲取模塊320還適于:
[0149]獲取人工標(biāo)注的多種類別的短信;或者,
[0150]接收至少一個客戶端上報的至少一種類別的短信。
[0151]在本發(fā)明一實(shí)施例中,上述獲取模塊320包括:
[0152]監(jiān)測單元,適于在接收至少一個客戶端上報的至少一種類別的短信之前,對各個客戶端所在通信終端中的短信接收事件進(jìn)行監(jiān)測;
[0153]生成單元,適于當(dāng)監(jiān)測到陌生電話號碼發(fā)來的短信時,生成提示用戶對陌生電話號碼進(jìn)行標(biāo)注的提示信息;
[0154]接收單元,適于接收用戶對短信的標(biāo)注類別。
[0155]在本發(fā)明一實(shí)施例中,上述監(jiān)測單元還適于:
[0156]獲取當(dāng)前接收的短信對應(yīng)的電話號碼;
[0157]確定當(dāng)前接收到的短信對應(yīng)的電話號碼不屬于預(yù)設(shè)的黑名單或者白名單中的電話號碼時,確定電話號碼為陌生電話號碼。
[0158]在本發(fā)明一實(shí)施例中,上述獲取模塊320包括:
[0159]第一獲取單元,適于在接收至少一個客戶端上報的至少一種類別的短信之前,獲取各個客戶端所在通信終端的電話號碼的歸屬地和/或地區(qū)編碼號段;
[0160]監(jiān)測單元,適于對各個客戶端所在通信終端中的短信接收事件進(jìn)行監(jiān)測;
[0161]第一判斷單元,適于判斷當(dāng)前接收到的短信對應(yīng)的電話號碼的歸屬地和/或地區(qū)編碼號段是否與通信終端的電話號碼的歸屬地和/或地區(qū)編碼號段相同,如果不相同,則將當(dāng)前接收到的短信標(biāo)注為多種類別中的指定類別。
[0162]在本發(fā)明一實(shí)施例中,上述獲取模塊320包括:
[0163]第二獲取單元,適于在接收至少一個客戶端上報的至少一種類別的短信之前,獲取各個客戶端所在通信終端當(dāng)前所在地信息;
[0164]監(jiān)測單元,適于對各個客戶端所在通信終端中的短信接收事件進(jìn)行監(jiān)測;
[0165]第二判斷單元,適于判斷當(dāng)前接收到的短信對應(yīng)的電話號碼的歸屬地是否與通信終端當(dāng)前所在地相同,如果不相同,則將當(dāng)前接收到的短信標(biāo)注為多種類別中的指定類別。
[0166]在本發(fā)明一實(shí)施例中,上述獲取模塊320包括:
[0167]第三獲取單元,適于在接收至少一個客戶端上報的至少一種類別的短信之前,獲取各個客戶端所在通信終端中保存的通訊錄信息;
[0168]監(jiān)測單元,適于對各個客戶端所在通信終端中的短信接收事件進(jìn)行監(jiān)測;
[0169]第三判斷單元,適于判斷通訊錄中是否存在與當(dāng)前接收到的短信對應(yīng)的電話號碼具有相同歸屬地和/或地區(qū)編碼號段的電話號碼