本發(fā)明涉及計(jì)算機(jī)信息處理技術(shù)領(lǐng)域,具體涉及一種欺詐業(yè)務(wù)識(shí)別方法及裝置。
背景技術(shù):
欺詐是指以使人發(fā)生錯(cuò)誤認(rèn)識(shí)為目的的故意行為。受害者由于他人故意的錯(cuò)誤陳述,發(fā)生認(rèn)識(shí)上的錯(cuò)誤造成一定的經(jīng)濟(jì)損失或精神傷害。一般地,發(fā)生經(jīng)濟(jì)損失的情況多一些。交易欺詐,顧名思義是在商品交易過(guò)程中,受害者受到欺詐方誘惑或煽動(dòng)作出錯(cuò)誤判斷完成交易的行為,受害者因此承受巨大的財(cái)產(chǎn)損失。隨著電子商務(wù)的興起,網(wǎng)上銀行的便利,在線交易欺詐呈現(xiàn)越來(lái)越嚴(yán)重的趨勢(shì)。
電子商務(wù)作為一個(gè)巨大的經(jīng)濟(jì)產(chǎn)業(yè),吸引了大量犯罪力量的涌入。傳統(tǒng)商務(wù)模式中雙方是在現(xiàn)實(shí)世界面對(duì)面交易的,而在電子商務(wù)中則變成虛擬的網(wǎng)絡(luò)交易,增加了不確定性,從而為欺詐者提供可乘之機(jī)。在不安全的網(wǎng)絡(luò)環(huán)境下,用戶的真實(shí)性認(rèn)證相對(duì)薄弱,欺詐者很容易實(shí)施欺詐騙取大量財(cái)產(chǎn)。特別是網(wǎng)絡(luò)黑客,為電子商務(wù)欺詐實(shí)施提供了技術(shù)支持。
根據(jù)艾瑞咨詢集團(tuán)在“第三季度核心數(shù)據(jù)發(fā)布會(huì)”上公布的數(shù)據(jù)顯示,電子商務(wù)市場(chǎng)交易規(guī)模,同去年相比相對(duì)來(lái)說(shuō)增長(zhǎng)比較穩(wěn)定,達(dá)到1.3萬(wàn)億人民幣。根據(jù)統(tǒng)計(jì)數(shù)據(jù)顯示,2012年網(wǎng)絡(luò)購(gòu)物的用戶達(dá)到2.09億人次,居于電子商務(wù)中交易人數(shù)的首位,而中國(guó)網(wǎng)民就占據(jù)網(wǎng)購(gòu)份額的28.1%。2013年1月到6月半年時(shí)間,使用網(wǎng)上購(gòu)物、在線支付、網(wǎng)上銀行的用戶比例分別是33.8%、30.5%和29.1%,用戶規(guī)模增長(zhǎng)幅度分別是31.4%、36.2%和29.9%,在各類應(yīng)用中占據(jù)前三的排名。通過(guò)網(wǎng)絡(luò)進(jìn)行購(gòu)物的用戶數(shù)已經(jīng)達(dá)到1.42億,網(wǎng)購(gòu)使用率增長(zhǎng)了5.7個(gè)百分點(diǎn)達(dá)到33.8%,半年時(shí)間里用戶規(guī)模增長(zhǎng)了31.4%。
根據(jù)全球支付解決方案商CyberSource的調(diào)研報(bào)告顯示,2012年,英國(guó)有57%的商家認(rèn)為在線詐騙是他們面臨的最大問(wèn)題,平均有1.8%的電子商務(wù)收入被詐騙者騙走,有1.6%的訂購(gòu)者具有欺詐性。2011年全球預(yù)計(jì)電子商務(wù)詐騙所涉及的金額高達(dá)28億美元,比2010年增長(zhǎng)了8%。因此,為保證電子商務(wù)交易的安全,迫切需要一個(gè)行之有效的檢測(cè)和預(yù)測(cè)欺詐的風(fēng)險(xiǎn)控制系統(tǒng)。
在銀行業(yè)方面,當(dāng)前國(guó)內(nèi)銀行業(yè)務(wù)發(fā)展太快。目前使用信用卡進(jìn)行交易的總數(shù)已經(jīng)達(dá)到了2.1億人次,交易總金額達(dá)到5.1萬(wàn)億元,在這5.1萬(wàn)億元中有2.7萬(wàn)億是消費(fèi)所用。盡管銀行業(yè)務(wù)突飛猛進(jìn),利潤(rùn)顯著提升,但是其對(duì)欺詐交易的風(fēng)險(xiǎn)防范意識(shí)還很淡薄,這也導(dǎo)致銀行卡交易的欺詐事件經(jīng)常發(fā)生,犯罪分子幾乎每次都能得逞。僅在2011年,國(guó)內(nèi)信用卡欺詐交易金額達(dá)到1.74億元,比2010年增長(zhǎng)了5.1個(gè)百分點(diǎn),而在2012年這個(gè)數(shù)字翻了一倍,銀行卡欺詐交易的威脅越來(lái)越嚴(yán)重。由于使用信用卡消費(fèi)便捷的特點(diǎn)以及消費(fèi)環(huán)境的改善,越來(lái)越多的地方支持信用卡支付,信用卡在一定程度上得到普及,隨之而來(lái)的是信用卡欺詐事件不斷發(fā)生。經(jīng)分析發(fā)現(xiàn),導(dǎo)致欺詐事件不斷發(fā)生的原因有兩個(gè)。一方面是因?yàn)殡S著信用卡的普及,對(duì)其實(shí)施欺詐非常有利可圖;另一方面是因?yàn)殂y行監(jiān)管不夠,仍存在一些薄弱環(huán)節(jié),致使欺詐總向這些薄弱環(huán)節(jié)發(fā)起攻擊,在最短的時(shí)間內(nèi)轉(zhuǎn)移卡內(nèi)資金。
欺詐風(fēng)險(xiǎn)屬操作風(fēng)險(xiǎn)范疇。通過(guò)對(duì)已經(jīng)發(fā)生的欺詐事件的行為進(jìn)行分析,很容易發(fā)現(xiàn)它們手段并不是很高明,一般通過(guò)偽造或盜取手段獲取受害者的卡,進(jìn)而實(shí)施欺詐。同時(shí)對(duì)受害者進(jìn)行分析發(fā)現(xiàn),他們的受教育水平相差很大,既有普通工薪團(tuán)體,也有高學(xué)歷高智商人群。一方面是受害人不了解欺詐的手段和方式,仍需加大對(duì)人民群眾宣傳識(shí)別和防范欺詐的力度,另一方面也暴漏出銀行反欺詐管理在意識(shí)、技術(shù)和機(jī)制上的漏洞和不足,尚有待改善。然而,中小型銀行現(xiàn)在的欺詐交易風(fēng)險(xiǎn)管理體系還很薄弱,只有最基本的解決方案,即在案件發(fā)生后,經(jīng)客戶舉報(bào)、投訴方才進(jìn)行案件跟蹤以及客戶關(guān)系處理。但是,欺詐交易風(fēng)險(xiǎn)管理最重要的環(huán)節(jié)是事前的監(jiān)測(cè)和識(shí)別,因?yàn)榘讣l(fā)生時(shí),損失已經(jīng)造成,并且對(duì)資金的追索、案件的偵破不僅成本巨大,而且難以完成。在風(fēng)險(xiǎn)管理方面,銀行可以有更多作為。比如通過(guò)建立模型來(lái)分析和發(fā)現(xiàn)欺詐行為,在不增加存款持有量的情況下改善客戶關(guān)系,而并不只是對(duì)客戶進(jìn)行風(fēng)險(xiǎn)教育和提示那么簡(jiǎn)單。簡(jiǎn)而言之,通過(guò)對(duì)持卡人信息、欺詐事件、歷史交易數(shù)據(jù)進(jìn)行技術(shù)分析,構(gòu)建出一種預(yù)測(cè)欺詐的模型,可以有效的為賬戶的交易行為把關(guān),及時(shí)發(fā)現(xiàn)可能的欺詐交易,從而根本上改善銀行和客戶的關(guān)系。
從保障交易安全的角度出發(fā),有必要建立一套欺詐識(shí)別系統(tǒng),提高欺詐識(shí)別的工作質(zhì)量,保障國(guó)內(nèi)電子商務(wù)和銀行業(yè)交易安全,及時(shí)對(duì)疑似欺詐的交易進(jìn)行限制和制止。
技術(shù)實(shí)現(xiàn)要素:
鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的欺詐業(yè)務(wù)識(shí)別方法及裝置。
依據(jù)本發(fā)明的一個(gè)方面,提供了一種欺詐業(yè)務(wù)識(shí)別方法,包括:
接收業(yè)務(wù)數(shù)據(jù),將業(yè)務(wù)數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)融合處理得到融合業(yè)務(wù)數(shù)據(jù);
調(diào)用規(guī)則引擎和/或分類器模型對(duì)所述融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果;
根據(jù)判定結(jié)果為所述業(yè)務(wù)數(shù)據(jù)設(shè)定識(shí)別標(biāo)簽,將已設(shè)定識(shí)別標(biāo)簽的業(yè)務(wù)數(shù)據(jù)返回給調(diào)用方。
依據(jù)本發(fā)明的另一方面,提供了一種欺詐業(yè)務(wù)識(shí)別裝置,包括:
數(shù)據(jù)融合模塊,用于接收業(yè)務(wù)數(shù)據(jù),將業(yè)務(wù)數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)融合處理得到融合業(yè)務(wù)數(shù)據(jù);
規(guī)則識(shí)別模塊,用于調(diào)用規(guī)則引擎對(duì)所述融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果;
模型識(shí)別模塊,用于調(diào)用分類器模型對(duì)所述融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果;
標(biāo)簽設(shè)定模塊,用于根據(jù)判定結(jié)果為所述業(yè)務(wù)數(shù)據(jù)設(shè)定識(shí)別標(biāo)簽,將已設(shè)定識(shí)別標(biāo)簽的業(yè)務(wù)數(shù)據(jù)返回給調(diào)用方。
根據(jù)本發(fā)明提供的欺詐業(yè)務(wù)識(shí)別方法及裝置,利用規(guī)則引擎可判斷已知的欺詐行為,利用分類器模型可預(yù)測(cè)未知的欺詐行為。其中在規(guī)則引擎中根據(jù)客戶所屬的行業(yè)靈活的定義規(guī)則,方便系統(tǒng)做出決策;分類器模型可運(yùn)用分類算法,每天運(yùn)行大數(shù)據(jù)集的樣本訓(xùn)練模型保存到數(shù)據(jù)庫(kù)中,提高了模型識(shí)別的準(zhǔn)確性。
上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說(shuō)明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式。
附圖說(shuō)明
通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:
圖1示出了本發(fā)明提供的欺詐業(yè)務(wù)識(shí)別方法實(shí)施例一的流程圖;
圖2示出了本發(fā)明提供的欺詐業(yè)務(wù)識(shí)別方法實(shí)施例二的流程圖;
圖3示出了本發(fā)明提供的欺詐業(yè)務(wù)識(shí)別裝置實(shí)施例的功能結(jié)構(gòu)框圖。
具體實(shí)施方式
下面將參照附圖更詳細(xì)地描述本公開(kāi)的示例性實(shí)施例。雖然附圖中顯示了本公開(kāi)的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開(kāi)而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開(kāi),并且能夠?qū)⒈竟_(kāi)的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。
圖1示出了本發(fā)明提供的欺詐業(yè)務(wù)識(shí)別方法實(shí)施例一的流程圖。如圖1所示,該方法包括如下步驟:
步驟101,接收業(yè)務(wù)數(shù)據(jù),將業(yè)務(wù)數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)融合處理得到融合業(yè)務(wù)數(shù)據(jù)。
接收客戶(銀行/支付公司等)傳遞過(guò)來(lái)的有關(guān)交易的業(yè)務(wù)數(shù)據(jù)。在對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行處理之前,首先對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行過(guò)濾處理,以過(guò)濾掉無(wú)用字段。然后,將業(yè)務(wù)數(shù)據(jù)和第三方統(tǒng)計(jì)得到的基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)融合處理得到融合業(yè)務(wù)數(shù)據(jù)。其中基礎(chǔ)數(shù)據(jù)是指用于補(bǔ)充說(shuō)明業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù),例如業(yè)務(wù)產(chǎn)生位置的相關(guān)信息,可通過(guò)IP(Internet Protocol,因特網(wǎng)協(xié)議)地址映射成經(jīng)緯度信息或省市縣信息;再例如業(yè)務(wù)產(chǎn)生設(shè)備相關(guān)信息,可通過(guò)MAC(Media Access Control,介質(zhì)訪問(wèn)控制)地址映射成具體設(shè)備;又例如業(yè)務(wù)產(chǎn)生用戶相關(guān)信息,可通過(guò)手機(jī)號(hào)映射成具體用戶(例如銀行/支付公司的用戶)。通過(guò)將客戶傳遞過(guò)來(lái)的業(yè)務(wù)數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)相融合,解決了客戶只有業(yè)務(wù)數(shù)據(jù)造成的數(shù)據(jù)單一、信息量少的問(wèn)題,對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行多個(gè)維度的補(bǔ)充使其變得更詳細(xì)更立體,使得數(shù)據(jù)分析更準(zhǔn)確,便于后續(xù)識(shí)別決策。
步驟102,調(diào)用規(guī)則引擎和/或分類器模型對(duì)融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果。
本方法提供了兩種識(shí)別工具,分別為規(guī)則引擎和分類器模型。其中規(guī)則引擎中定義了針對(duì)具體業(yè)務(wù)的規(guī)則,每個(gè)業(yè)務(wù)定義有很多規(guī)則。這些規(guī)則可以為黑名單規(guī)則、白名單規(guī)則或維度規(guī)則。維度指的是具體業(yè)務(wù)字段中某個(gè)字段或某幾個(gè)字段的組合,或者某個(gè)字段的延伸,例如郵箱、IP地址和MAC地址等,再或者賬戶的訪問(wèn)頻率。將融合業(yè)務(wù)數(shù)據(jù)輸入至規(guī)則引擎中后,對(duì)融合業(yè)務(wù)數(shù)據(jù)的各個(gè)維度數(shù)據(jù)進(jìn)行打分,綜合各個(gè)維度數(shù)據(jù)的分?jǐn)?shù)得到融合業(yè)務(wù)數(shù)據(jù)的欺詐分?jǐn)?shù),以及根據(jù)所述融合業(yè)務(wù)數(shù)據(jù)的欺詐分?jǐn)?shù),得到判定結(jié)果,即確定該業(yè)務(wù)數(shù)據(jù)是否為欺詐行為的數(shù)據(jù)。分類器模型基于分類算法,利用已知的業(yè)務(wù)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)訓(xùn)練出分類器存入分類器模型數(shù)據(jù)庫(kù)中,當(dāng)系統(tǒng)調(diào)用分類器模型時(shí),將融合業(yè)務(wù)數(shù)據(jù)輸入至選擇的分類器中,得到分類結(jié)果,用于確定該業(yè)務(wù)數(shù)據(jù)是否為欺詐行為的數(shù)據(jù)。
如果系統(tǒng)兼具規(guī)則引擎和分類器模型,具體識(shí)別時(shí)可根據(jù)客戶的設(shè)置選擇其中一個(gè)識(shí)別工具進(jìn)行識(shí)別。如果客戶選擇規(guī)則引擎,則本步驟直接調(diào)用規(guī)則引擎進(jìn)行識(shí)別;如果客戶選擇分類器模型,則本步驟直接調(diào)用分類器模型進(jìn)行識(shí)別。如果客戶同時(shí)選擇規(guī)則引擎和分類器模型,則客戶需設(shè)置兩種識(shí)別工具的預(yù)設(shè)權(quán)重,具體識(shí)別時(shí)可按照各自的預(yù)設(shè)權(quán)重對(duì)識(shí)別結(jié)果進(jìn)行處理生成最終的判定結(jié)果。
步驟103,根據(jù)判定結(jié)果為業(yè)務(wù)數(shù)據(jù)設(shè)定識(shí)別標(biāo)簽,將已設(shè)定識(shí)別標(biāo)簽的業(yè)務(wù)數(shù)據(jù)返回給調(diào)用方。
根據(jù)判定結(jié)果為業(yè)務(wù)數(shù)據(jù)設(shè)定識(shí)別標(biāo)簽,識(shí)別標(biāo)簽可以為P、R和D,P表示通過(guò),即業(yè)務(wù)數(shù)據(jù)為正常數(shù)據(jù);D表示不通過(guò),即業(yè)務(wù)數(shù)據(jù)為欺詐數(shù)據(jù);R表示待定,即需要進(jìn)一步人工審核確認(rèn)。將已設(shè)定識(shí)別標(biāo)簽的業(yè)務(wù)數(shù)據(jù)返回給調(diào)用方。
根據(jù)本實(shí)施例提供的欺詐業(yè)務(wù)識(shí)別方法,利用規(guī)則引擎可判斷已知的欺詐行為,利用分類器模型可預(yù)測(cè)未知的欺詐行為。其中在規(guī)則引擎中根據(jù)客戶所屬的行業(yè)靈活的定義規(guī)則,方便系統(tǒng)做出決策;分類器模型可運(yùn)用分類算法,每天運(yùn)行大數(shù)據(jù)集的樣本訓(xùn)練模型保存到數(shù)據(jù)庫(kù)中,提高了模型識(shí)別的準(zhǔn)確性。
圖2示出了本發(fā)明提供的欺詐業(yè)務(wù)識(shí)別方法實(shí)施例二的流程圖。如圖2所示,該方法包括如下步驟:
步驟201,接收業(yè)務(wù)數(shù)據(jù),將業(yè)務(wù)數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)融合處理得到融合業(yè)務(wù)數(shù)據(jù)。
接收客戶(銀行/支付公司等)傳遞過(guò)來(lái)的有關(guān)交易的業(yè)務(wù)數(shù)據(jù)。在對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行處理之前,首先對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行過(guò)濾處理,以過(guò)濾掉無(wú)用字段。然后,將業(yè)務(wù)數(shù)據(jù)和第三方統(tǒng)計(jì)得到的基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)融合處理得到融合業(yè)務(wù)數(shù)據(jù)。其中基礎(chǔ)數(shù)據(jù)是指用于補(bǔ)充說(shuō)明業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù),例如業(yè)務(wù)產(chǎn)生位置的相關(guān)信息,可通過(guò)IP地址映射成經(jīng)緯度信息或省市縣信息;再例如業(yè)務(wù)產(chǎn)生設(shè)備相關(guān)信息,可通過(guò)MAC地址映射成具體設(shè)備;又例如業(yè)務(wù)產(chǎn)生用戶相關(guān)信息,可通過(guò)手機(jī)號(hào)映射成具體用戶(例如銀行/支付公司的用戶)。通過(guò)將客戶傳遞過(guò)來(lái)的業(yè)務(wù)數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)相融合,使得業(yè)務(wù)數(shù)據(jù)表達(dá)的信息更詳細(xì),便于后續(xù)識(shí)別決策。
步驟202,調(diào)用規(guī)則引擎對(duì)融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果。
在系統(tǒng)最初使用的時(shí)候,系統(tǒng)還沒(méi)有分類器模型,因此在開(kāi)始的這一階段,先調(diào)用規(guī)則引擎對(duì)融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別。規(guī)則引擎中預(yù)先定義了針對(duì)具體業(yè)務(wù)的規(guī)則,每個(gè)業(yè)務(wù)定義有很多規(guī)則。這些規(guī)則可以為黑名單規(guī)則、白名單規(guī)則或維度規(guī)則。維度指的是具體業(yè)務(wù)字段中某個(gè)字段或某幾個(gè)字段的組合,或者某個(gè)字段的延伸,例如郵箱、IP地址和MAC地址等,再或者賬戶的訪問(wèn)頻率。將融合業(yè)務(wù)數(shù)據(jù)輸入至規(guī)則引擎中后,對(duì)融合業(yè)務(wù)數(shù)據(jù)的各個(gè)維度數(shù)據(jù)進(jìn)行打分,綜合各個(gè)維度數(shù)據(jù)的分?jǐn)?shù)得到融合業(yè)務(wù)數(shù)據(jù)的欺詐分?jǐn)?shù),以及根據(jù)所述融合業(yè)務(wù)數(shù)據(jù)的欺詐分?jǐn)?shù),得到判定結(jié)果,即確定該業(yè)務(wù)數(shù)據(jù)是否為欺詐行為的數(shù)據(jù)。
步驟203,根據(jù)判定結(jié)果為業(yè)務(wù)數(shù)據(jù)設(shè)定識(shí)別標(biāo)簽,將已設(shè)定識(shí)別標(biāo)簽的業(yè)務(wù)數(shù)據(jù)返回給調(diào)用方。
根據(jù)判定結(jié)果為業(yè)務(wù)數(shù)據(jù)設(shè)定識(shí)別標(biāo)簽,識(shí)別標(biāo)簽可以為P、R和D,P表示通過(guò),即業(yè)務(wù)數(shù)據(jù)為正常數(shù)據(jù);D表示不通過(guò),即業(yè)務(wù)數(shù)據(jù)為欺詐數(shù)據(jù);R表示待定,即需要進(jìn)一步人工審核確認(rèn)。將已設(shè)定識(shí)別標(biāo)簽的業(yè)務(wù)數(shù)據(jù)返回給調(diào)用方。
利用上述步驟S201至步驟S203執(zhí)行一段時(shí)間后,可獲得大量已設(shè)定識(shí)別標(biāo)簽的業(yè)務(wù)數(shù)據(jù),其中設(shè)定為P和D的業(yè)務(wù)數(shù)據(jù)可作為訓(xùn)練數(shù)據(jù)訓(xùn)練分類器模型。
步驟204,將利用規(guī)則引擎識(shí)別出的業(yè)務(wù)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),對(duì)分類器模型進(jìn)行訓(xùn)練。
利用上述步驟201至步驟203識(shí)別出的業(yè)務(wù)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),對(duì)分類器模型進(jìn)行訓(xùn)練。首先,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,過(guò)濾掉訓(xùn)練數(shù)據(jù)中的無(wú)用字段和/或不被識(shí)別的內(nèi)容;然后,構(gòu)建訓(xùn)練數(shù)據(jù)集作為參數(shù)傳遞給分類算法,訓(xùn)練得到分類器;對(duì)訓(xùn)練出的分類器進(jìn)行評(píng)價(jià),將通過(guò)評(píng)價(jià)體系驗(yàn)證的分類器存入分類器模型數(shù)據(jù)庫(kù)中以供調(diào)用。
評(píng)價(jià)體系包含以下評(píng)價(jià)標(biāo)準(zhǔn)的一項(xiàng)或多項(xiàng):正確率、誤判率、訓(xùn)練時(shí)間的長(zhǎng)短以及ROC曲線(Receiver Operating Characteristic curve,受試者工作特征曲線)。分類器的訓(xùn)練和評(píng)價(jià)是在線下觸發(fā)的,避免讓實(shí)時(shí)的業(yè)務(wù)數(shù)據(jù)等待分類器創(chuàng)建,更符合實(shí)時(shí)性要求。
本實(shí)施例分類器模型所采用的算法可以為決策樹(shù)算法、樸素貝葉斯算法、神經(jīng)網(wǎng)絡(luò)算法、或邏輯回歸算法。本發(fā)明對(duì)此不做限制。
步驟205,接收新的業(yè)務(wù)數(shù)據(jù),將新的業(yè)務(wù)數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)融合處理得到融合業(yè)務(wù)數(shù)據(jù)。具體融合過(guò)程可參見(jiàn)步驟S201中的具體描述。
步驟206,調(diào)用分類器模型對(duì)融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果。
利用步驟204訓(xùn)練得到的分類器模型對(duì)新的融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別。具體的,可根據(jù)客戶的選擇,調(diào)用已被評(píng)價(jià)的一個(gè)分類器對(duì)該融合業(yè)務(wù)數(shù)據(jù)進(jìn)行分類。優(yōu)選地,選擇正確率最高的分類器對(duì)融合業(yè)務(wù)數(shù)據(jù)進(jìn)行分類。
步驟207,根據(jù)判定結(jié)果為新的業(yè)務(wù)數(shù)據(jù)設(shè)定識(shí)別標(biāo)簽,將已設(shè)定識(shí)別標(biāo)簽的新的業(yè)務(wù)數(shù)據(jù)返回給調(diào)用方。
步驟208,根據(jù)利用分類器模型識(shí)別出的欺詐業(yè)務(wù)數(shù)據(jù)生成新的規(guī)則,將新的規(guī)則添加到規(guī)則引擎中。
經(jīng)過(guò)以上步驟205至步驟207的處理,分類器模型可預(yù)測(cè)出新的欺詐行為,本步驟利用分類器模型識(shí)別出的欺詐業(yè)務(wù)數(shù)據(jù)生成新的規(guī)則,將新的規(guī)則添加到規(guī)則引擎中,以此反作用于規(guī)則引擎,使得分類器模型和規(guī)則引擎都能得以更新。
本實(shí)施例中,由于分類器模型要使用已設(shè)定識(shí)別標(biāo)簽的業(yè)務(wù)數(shù)據(jù)進(jìn)行訓(xùn)練得到,所以在最初使用系統(tǒng)的時(shí)候,系統(tǒng)中是沒(méi)有分類器模型的,因此必須首先使用規(guī)則引擎對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行處理,業(yè)務(wù)數(shù)據(jù)經(jīng)規(guī)則引擎處理后最終帶上標(biāo)簽。當(dāng)使用規(guī)則引擎一段時(shí)間后,積累的已設(shè)定識(shí)別標(biāo)簽的業(yè)務(wù)數(shù)據(jù)即可用來(lái)訓(xùn)練分類器模型。當(dāng)規(guī)則引擎和分類器模型都出現(xiàn)時(shí),具體是使用規(guī)則引擎還是分類器模型,可根據(jù)客戶需要設(shè)置的。如果客戶選擇規(guī)則引擎,則直接調(diào)用規(guī)則引擎進(jìn)行識(shí)別;如果客戶選擇分類器模型,則直接調(diào)用分類器模型進(jìn)行識(shí)別。如果客戶同時(shí)選擇規(guī)則引擎和分類器模型,則客戶需設(shè)置兩種識(shí)別工具的預(yù)設(shè)權(quán)重,具體識(shí)別時(shí)可按照各自的預(yù)設(shè)權(quán)重對(duì)識(shí)別結(jié)果進(jìn)行處理生成最終的判定結(jié)果。
進(jìn)一步的,本實(shí)施例還將已設(shè)定識(shí)別標(biāo)簽的業(yè)務(wù)數(shù)據(jù)寫入數(shù)據(jù)庫(kù)中,當(dāng)審計(jì)人員對(duì)識(shí)別標(biāo)簽有異議時(shí),可隨時(shí)在數(shù)據(jù)庫(kù)中調(diào)取數(shù)據(jù)進(jìn)行修正,保證模型訓(xùn)練數(shù)據(jù)的正確性,提高業(yè)務(wù)數(shù)據(jù)識(shí)別的準(zhǔn)確性。
另外,本方法還可在直觀的圖形用戶頁(yè)面中顯示識(shí)別結(jié)果和相應(yīng)的規(guī)則,客戶可方便地在頁(yè)面上編輯(包含創(chuàng)建、修改、刪除、搜索、測(cè)試和使用)各種規(guī)則,而不需要專業(yè)的規(guī)則編輯人員進(jìn)行編輯。還可明確每條規(guī)則的用途和優(yōu)先級(jí),當(dāng)觸發(fā)規(guī)則時(shí)有理有據(jù)的將觸發(fā)原因顯示在頁(yè)面上。客戶還可以在線進(jìn)行規(guī)則的測(cè)試,測(cè)試時(shí)按照正常流程對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,但不將識(shí)別結(jié)果寫入數(shù)據(jù)庫(kù)中。如果測(cè)試結(jié)果令客戶滿意,可以隨時(shí)將規(guī)則應(yīng)用到線上,及時(shí)阻止?jié)撛陲L(fēng)險(xiǎn)。
根據(jù)本實(shí)施例提供的欺詐業(yè)務(wù)識(shí)別方法,利用規(guī)則引擎可判斷已知的欺詐行為,利用分類器模型可預(yù)測(cè)未知的欺詐行為。其中在規(guī)則引擎中根據(jù)客戶所屬的行業(yè)靈活的定義規(guī)則,方便系統(tǒng)做出決策;分類器模型可運(yùn)用分類算法,每天運(yùn)行大數(shù)據(jù)集的樣本訓(xùn)練模型保存到數(shù)據(jù)庫(kù)中,提高了模型識(shí)別的準(zhǔn)確性。本方法結(jié)合了兩種識(shí)別工具的優(yōu)點(diǎn),第一階段借助初始的規(guī)則引擎對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,為分類器模型的訓(xùn)練做數(shù)據(jù)積累;第二階段使用訓(xùn)練好的分類器模型對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,當(dāng)識(shí)別出新的欺詐行為時(shí),可生成新的規(guī)則添加到規(guī)則引擎中,以此反作用于規(guī)則引擎,使得分類器模型和規(guī)則引擎都能得以更新,從而解決了規(guī)則引擎不能實(shí)時(shí)更新的問(wèn)題,反過(guò)來(lái)其對(duì)分類器模型提供的訓(xùn)練數(shù)據(jù)更加準(zhǔn)確,使得分類器模型更能精準(zhǔn)地區(qū)分欺詐與非欺詐行為。
圖3示出了本發(fā)明提供的欺詐業(yè)務(wù)識(shí)別裝置實(shí)施例的功能結(jié)構(gòu)框圖。如圖3所示,該裝置包括:數(shù)據(jù)融合模塊31,規(guī)則識(shí)別模塊32,模型識(shí)別模塊33,標(biāo)簽設(shè)定模塊34。
數(shù)據(jù)融合模塊31,用于接收業(yè)務(wù)數(shù)據(jù),將業(yè)務(wù)數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)融合處理得到融合業(yè)務(wù)數(shù)據(jù)。
數(shù)據(jù)融合模塊31接收客戶(銀行/支付公司等)傳遞過(guò)來(lái)的有關(guān)交易的業(yè)務(wù)數(shù)據(jù)。在對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行處理之前,首先對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行過(guò)濾處理,以過(guò)濾掉無(wú)用字段。然后,將業(yè)務(wù)數(shù)據(jù)和第三方統(tǒng)計(jì)得到的基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)融合處理得到融合業(yè)務(wù)數(shù)據(jù)。其中基礎(chǔ)數(shù)據(jù)是指用于補(bǔ)充說(shuō)明業(yè)務(wù)數(shù)據(jù)的數(shù)據(jù),例如業(yè)務(wù)產(chǎn)生位置的相關(guān)信息,可通過(guò)IP地址映射成經(jīng)緯度信息或省市縣信息;再例如業(yè)務(wù)產(chǎn)生設(shè)備相關(guān)信息,可通過(guò)MAC地址映射成具體設(shè)備;又例如業(yè)務(wù)產(chǎn)生用戶相關(guān)信息,可通過(guò)手機(jī)號(hào)映射成具體用戶(例如銀行/支付公司的用戶)。通過(guò)將客戶傳遞過(guò)來(lái)的業(yè)務(wù)數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)相融合,解決了客戶只有業(yè)務(wù)數(shù)據(jù)造成的數(shù)據(jù)單一、信息量少的問(wèn)題,對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行多個(gè)維度的補(bǔ)充使其變得更詳細(xì)更立體,使得數(shù)據(jù)分析更準(zhǔn)確,便于后續(xù)識(shí)別決策。
規(guī)則識(shí)別模塊32,用于調(diào)用規(guī)則引擎對(duì)融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果。
其中規(guī)則引擎中定義了針對(duì)具體業(yè)務(wù)的規(guī)則,每個(gè)業(yè)務(wù)定義有很多規(guī)則。這些規(guī)則可以為黑名單規(guī)則、白名單規(guī)則或維度規(guī)則。維度指的是具體業(yè)務(wù)字段中某個(gè)字段或某幾個(gè)字段的組合,或者某個(gè)字段的延伸,例如郵箱、IP地址和MAC地址等,再或者賬戶的訪問(wèn)頻率。規(guī)則識(shí)別模塊32進(jìn)一步用于:調(diào)用規(guī)則引擎對(duì)融合業(yè)務(wù)數(shù)據(jù)的各個(gè)維度數(shù)據(jù)進(jìn)行打分;綜合各個(gè)維度數(shù)據(jù)的分?jǐn)?shù)得到融合業(yè)務(wù)數(shù)據(jù)的欺詐分?jǐn)?shù),以及根據(jù)所述融合業(yè)務(wù)數(shù)據(jù)的欺詐分?jǐn)?shù),得到判定結(jié)果,即確定該業(yè)務(wù)數(shù)據(jù)是否為欺詐行為的數(shù)據(jù)。
模型識(shí)別模塊33,用于調(diào)用分類器模型對(duì)融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果。
標(biāo)簽設(shè)定模塊34,用于根據(jù)判定結(jié)果為業(yè)務(wù)數(shù)據(jù)設(shè)定識(shí)別標(biāo)簽,將已設(shè)定識(shí)別標(biāo)簽的業(yè)務(wù)數(shù)據(jù)返回給調(diào)用方。
進(jìn)一步的,該裝置還包括:模型訓(xùn)練模塊35,用于將利用規(guī)則引擎識(shí)別出的業(yè)務(wù)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),對(duì)分類器模型進(jìn)行訓(xùn)練。
模型訓(xùn)練模塊35進(jìn)一步用于:對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,過(guò)濾掉訓(xùn)練數(shù)據(jù)中的無(wú)用字段和/或不被識(shí)別的內(nèi)容;構(gòu)建訓(xùn)練數(shù)據(jù)集作為參數(shù)傳遞給分類算法,訓(xùn)練得到分類器;對(duì)訓(xùn)練出的分類器進(jìn)行評(píng)價(jià),將通過(guò)評(píng)價(jià)體系驗(yàn)證的分類器存入分類器模型數(shù)據(jù)庫(kù)中以供調(diào)用。評(píng)價(jià)體系包含以下評(píng)價(jià)標(biāo)準(zhǔn)的一項(xiàng)或多項(xiàng):正確率、誤判率、訓(xùn)練時(shí)間的長(zhǎng)短以及ROC曲線。分類器的訓(xùn)練和評(píng)價(jià)是在線下觸發(fā)的,避免讓實(shí)時(shí)的業(yè)務(wù)數(shù)據(jù)等待分類器創(chuàng)建,更符合實(shí)時(shí)性要求。
本實(shí)施例分類器模型所采用的算法可以為決策樹(shù)算法、樸素貝葉斯算法、神經(jīng)網(wǎng)絡(luò)算法、或邏輯回歸算法。本發(fā)明對(duì)此不做限制。
進(jìn)一步的,該裝置還包括:規(guī)則生成模塊36,用于根據(jù)利用分類器模型識(shí)別出的欺詐業(yè)務(wù)數(shù)據(jù)生成新的規(guī)則,將新的規(guī)則添加到規(guī)則引擎中,以此反作用于規(guī)則引擎,使得分類器模型和規(guī)則引擎都能得以更新。
進(jìn)一步的,該裝置還包括:綜合識(shí)別模塊37,用于獲取規(guī)則引擎和分類器模型的預(yù)設(shè)權(quán)重;當(dāng)調(diào)用規(guī)則引擎和分類器模型對(duì)所述融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別時(shí),按照各自的預(yù)設(shè)權(quán)重對(duì)識(shí)別結(jié)果進(jìn)行處理得到所述判定結(jié)果。
進(jìn)一步的,該裝置還將已設(shè)定識(shí)別標(biāo)簽的業(yè)務(wù)數(shù)據(jù)寫入數(shù)據(jù)庫(kù)中,當(dāng)審計(jì)人員對(duì)識(shí)別標(biāo)簽有異議時(shí),可隨時(shí)在數(shù)據(jù)庫(kù)中調(diào)取數(shù)據(jù)進(jìn)行修正,保證模型訓(xùn)練數(shù)據(jù)的正確性,提高業(yè)務(wù)數(shù)據(jù)識(shí)別的準(zhǔn)確性。
另外,本裝置還可在直觀的圖形用戶頁(yè)面中顯示識(shí)別結(jié)果和相應(yīng)的規(guī)則,客戶可方便地在頁(yè)面上編輯(包含創(chuàng)建、修改、刪除、搜索、測(cè)試和使用)各種規(guī)則,而不需要專業(yè)的規(guī)則編輯人員進(jìn)行編輯。還可明確每條規(guī)則的用途和優(yōu)先級(jí),當(dāng)觸發(fā)規(guī)則時(shí)有理有據(jù)的將觸發(fā)原因顯示在頁(yè)面上。客戶還可以在線進(jìn)行規(guī)則的測(cè)試,測(cè)試時(shí)按照正常流程對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,但不將識(shí)別結(jié)果寫入數(shù)據(jù)庫(kù)中。如果測(cè)試結(jié)果令客戶滿意,可以隨時(shí)將規(guī)則應(yīng)用到線上,及時(shí)阻止?jié)撛陲L(fēng)險(xiǎn)。
根據(jù)本實(shí)施例提供的欺詐業(yè)務(wù)識(shí)別裝置,利用規(guī)則引擎可判斷已知的欺詐行為,利用分類器模型可預(yù)測(cè)未知的欺詐行為。其中在規(guī)則引擎中根據(jù)客戶所屬的行業(yè)靈活的定義規(guī)則,方便系統(tǒng)做出決策;分類器模型可運(yùn)用分類算法,每天運(yùn)行大數(shù)據(jù)集的樣本訓(xùn)練模型保存到數(shù)據(jù)庫(kù)中,提高了模型識(shí)別的準(zhǔn)確性。本裝置結(jié)合了兩種識(shí)別工具的優(yōu)點(diǎn),第一階段借助初始的規(guī)則引擎對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,為分類器模型的訓(xùn)練做數(shù)據(jù)積累;第二階段使用訓(xùn)練好的分類器模型對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,當(dāng)識(shí)別出新的欺詐行為時(shí),可生成新的規(guī)則添加到規(guī)則引擎中,以此反作用于規(guī)則引擎,使得分類器模型和規(guī)則引擎都能得以更新,從而解決了規(guī)則引擎不能實(shí)時(shí)更新的問(wèn)題,反過(guò)來(lái)其對(duì)分類器模型提供的訓(xùn)練數(shù)據(jù)更加準(zhǔn)確,使得分類器模型更能精準(zhǔn)地區(qū)分欺詐與非欺詐行為。
在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見(jiàn)的。此外,本發(fā)明也不針對(duì)任何特定編程語(yǔ)言。應(yīng)當(dāng)明白,可以利用各種編程語(yǔ)言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語(yǔ)言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。
在此處所提供的說(shuō)明書中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書的理解。
類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開(kāi)并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開(kāi)的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開(kāi)的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式的權(quán)利要求書由此明確地并入該具體實(shí)施方式,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。
本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的所有特征以及如此公開(kāi)的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。
此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。
本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的裝置中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。
應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序。可將這些單詞解釋為名稱。
本發(fā)明公開(kāi)了:A1、一種欺詐業(yè)務(wù)識(shí)別方法,其中,包括:
接收業(yè)務(wù)數(shù)據(jù),將業(yè)務(wù)數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)融合處理得到融合業(yè)務(wù)數(shù)據(jù);
調(diào)用規(guī)則引擎和/或分類器模型對(duì)所述融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果;
根據(jù)判定結(jié)果為所述業(yè)務(wù)數(shù)據(jù)設(shè)定識(shí)別標(biāo)簽,將已設(shè)定識(shí)別標(biāo)簽的業(yè)務(wù)數(shù)據(jù)返回給調(diào)用方。
A2、根據(jù)A1所述的方法,其中,在所述調(diào)用規(guī)則引擎對(duì)所述融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果,根據(jù)判定結(jié)果為所述業(yè)務(wù)數(shù)據(jù)設(shè)定識(shí)別標(biāo)簽之后,所述方法還包括:將利用規(guī)則引擎識(shí)別出的業(yè)務(wù)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),對(duì)所述分類器模型進(jìn)行訓(xùn)練。
A3、根據(jù)A2所述的方法,其中,所述對(duì)模型進(jìn)行訓(xùn)練進(jìn)一步包括:
對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,過(guò)濾掉訓(xùn)練數(shù)據(jù)中的無(wú)用字段和/或不被識(shí)別的內(nèi)容;
構(gòu)建訓(xùn)練數(shù)據(jù)集作為參數(shù)傳遞給分類算法,訓(xùn)練得到分類器;
對(duì)訓(xùn)練出的分類器進(jìn)行評(píng)價(jià),將通過(guò)評(píng)價(jià)體系驗(yàn)證的分類器存入分類器模型數(shù)據(jù)庫(kù)中以供調(diào)用。
A4、根據(jù)A3所述的方法,其中,所述評(píng)價(jià)體系包含以下評(píng)價(jià)標(biāo)準(zhǔn)的一項(xiàng)或多項(xiàng):正確率、誤判率、訓(xùn)練時(shí)間的長(zhǎng)短以及ROC曲線。
A5、根據(jù)A1所述的方法,其中,在所述調(diào)用分類器模型對(duì)所述融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果,根據(jù)判定結(jié)果為所述業(yè)務(wù)數(shù)據(jù)設(shè)定識(shí)別標(biāo)簽之后,所述方法還包括:根據(jù)利用分類器模型識(shí)別出的欺詐業(yè)務(wù)數(shù)據(jù)生成新的規(guī)則,將所述新的規(guī)則添加到所述規(guī)則引擎中。
A6、根據(jù)A1或A5所述的方法,其中,所述規(guī)則引擎所使用的規(guī)則包含以下一項(xiàng)或多項(xiàng):黑名單規(guī)則、白名單規(guī)則和維度規(guī)則。
A7、根據(jù)A1所述的方法,其中,所述調(diào)用規(guī)則引擎對(duì)所述融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果進(jìn)一步包括:
所述調(diào)用規(guī)則引擎對(duì)所述融合業(yè)務(wù)數(shù)據(jù)的各個(gè)維度數(shù)據(jù)進(jìn)行打分;
綜合各個(gè)維度數(shù)據(jù)的分?jǐn)?shù)得到所述融合業(yè)務(wù)數(shù)據(jù)的欺詐分?jǐn)?shù);以及
根據(jù)所述融合業(yè)務(wù)數(shù)據(jù)的欺詐分?jǐn)?shù),得到判定結(jié)果。
A8、根據(jù)A7所述的方法,其中,所述維度數(shù)據(jù)具體為所述融合業(yè)務(wù)數(shù)據(jù)的預(yù)設(shè)字段或預(yù)設(shè)字段的組合。
A9、根據(jù)A1所述的方法,其中,所述調(diào)用規(guī)則引擎和/或分類器模型對(duì)所述融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果進(jìn)一步包括:
獲取規(guī)則引擎和分類器模型的預(yù)設(shè)權(quán)重;
當(dāng)調(diào)用規(guī)則引擎和分類器模型對(duì)所述融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別時(shí),按照各自的預(yù)設(shè)權(quán)重對(duì)識(shí)別結(jié)果進(jìn)行處理得到所述判定結(jié)果。
A10、根據(jù)A1所述的方法,其中,所述基礎(chǔ)數(shù)據(jù)包含業(yè)務(wù)產(chǎn)生位置相關(guān)信息和/或業(yè)務(wù)產(chǎn)生設(shè)備相關(guān)信息和/或業(yè)務(wù)產(chǎn)生用戶相關(guān)信息。
本發(fā)明還公開(kāi)了:B11、一種欺詐業(yè)務(wù)識(shí)別裝置,其中,包括:
數(shù)據(jù)融合模塊,用于接收業(yè)務(wù)數(shù)據(jù),將業(yè)務(wù)數(shù)據(jù)與基礎(chǔ)數(shù)據(jù)進(jìn)行數(shù)據(jù)融合處理得到融合業(yè)務(wù)數(shù)據(jù);
規(guī)則識(shí)別模塊,用于調(diào)用規(guī)則引擎對(duì)所述融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果;
模型識(shí)別模塊,用于調(diào)用分類器模型對(duì)所述融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別,得到判定結(jié)果;
標(biāo)簽設(shè)定模塊,用于根據(jù)判定結(jié)果為所述業(yè)務(wù)數(shù)據(jù)設(shè)定識(shí)別標(biāo)簽,將已設(shè)定識(shí)別標(biāo)簽的業(yè)務(wù)數(shù)據(jù)返回給調(diào)用方。
B12、根據(jù)B11所述的裝置,其中,所述裝置還包括:模型訓(xùn)練模塊,用于將利用規(guī)則引擎識(shí)別出的業(yè)務(wù)數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),對(duì)所述分類器模型進(jìn)行訓(xùn)練。
B13、根據(jù)B12所述的裝置,其中,所述模型訓(xùn)練模塊進(jìn)一步用于:
對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理,過(guò)濾掉訓(xùn)練數(shù)據(jù)中的無(wú)用字段和/或不被識(shí)別的內(nèi)容;
構(gòu)建訓(xùn)練數(shù)據(jù)集作為參數(shù)傳遞給分類算法,訓(xùn)練得到分類器;
對(duì)訓(xùn)練出的分類器進(jìn)行評(píng)價(jià),將通過(guò)評(píng)價(jià)體系驗(yàn)證的分類器存入分類器模型數(shù)據(jù)庫(kù)中以供調(diào)用。
B14、根據(jù)B13所述的裝置,其中,所述評(píng)價(jià)體系包含以下評(píng)價(jià)標(biāo)準(zhǔn)的一項(xiàng)或多項(xiàng):正確率、誤判率、訓(xùn)練時(shí)間的長(zhǎng)短以及ROC曲線。
B15、根據(jù)B11所述的裝置,其中,所述裝置還包括:規(guī)則生成模塊,用于根據(jù)利用分類器模型識(shí)別出的欺詐業(yè)務(wù)數(shù)據(jù)生成新的規(guī)則,將所述新的規(guī)則添加到所述規(guī)則引擎中。
B16、根據(jù)B11或B15所述的裝置,其中,所述規(guī)則引擎所使用的規(guī)則包含以下一項(xiàng)或多項(xiàng):黑名單規(guī)則、白名單規(guī)則和維度規(guī)則。
B17、根據(jù)B11所述的裝置,其中,所述規(guī)則識(shí)別模塊進(jìn)一步用于:調(diào)用規(guī)則引擎對(duì)所述融合業(yè)務(wù)數(shù)據(jù)的各個(gè)維度數(shù)據(jù)進(jìn)行打分;綜合各個(gè)維度數(shù)據(jù)的分?jǐn)?shù)得到所述融合業(yè)務(wù)數(shù)據(jù)的欺詐分?jǐn)?shù);以及根據(jù)所述融合業(yè)務(wù)數(shù)據(jù)的欺詐分?jǐn)?shù),得到判定結(jié)果。
B18、根據(jù)B17所述的裝置,其中,所述維度數(shù)據(jù)具體為所述融合業(yè)務(wù)數(shù)據(jù)的預(yù)設(shè)字段或預(yù)設(shè)字段的組合。
B19、根據(jù)B11所述的裝置,其中,所述裝置還包括:綜合識(shí)別模塊,用于獲取規(guī)則引擎和分類器模型的預(yù)設(shè)權(quán)重;當(dāng)調(diào)用規(guī)則引擎和分類器模型對(duì)所述融合業(yè)務(wù)數(shù)據(jù)進(jìn)行識(shí)別時(shí),按照各自的預(yù)設(shè)權(quán)重對(duì)識(shí)別結(jié)果進(jìn)行處理得到所述判定結(jié)果。
B20、根據(jù)B11所述的裝置,其中,所述基礎(chǔ)數(shù)據(jù)包含業(yè)務(wù)產(chǎn)生位置相關(guān)信息和/或業(yè)務(wù)產(chǎn)生設(shè)備相關(guān)信息和/或業(yè)務(wù)產(chǎn)生用戶相關(guān)信息。