對crm系統(tǒng)中的客戶信息進(jìn)行查重的方法及系統(tǒng)的制作方法
【專利摘要】提供了對客戶信息進(jìn)行查重的方法和系統(tǒng)。該方法包括:針對不同類型的客戶信息,確定出用于在客戶關(guān)系管理CRM系統(tǒng)中查找是否為相同的客戶信息的多個客戶信息的子規(guī)則;將子規(guī)則按預(yù)設(shè)的優(yōu)先級組合成查重規(guī)則;以及根據(jù)所組合的查重規(guī)則對客戶信息進(jìn)行查重。根據(jù)本申請的方法和系統(tǒng),用戶可根據(jù)需要確定不同的查重規(guī)則,因此能夠更靈活且更有效地查找出重復(fù)的客戶信息。
【專利說明】對0剛系統(tǒng)中的客戶信息進(jìn)行查重的方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本申請涉及對客戶信息進(jìn)行查重的方法和系統(tǒng),具體地,涉及在0?系統(tǒng)中對客戶信息進(jìn)行查重的方法及系統(tǒng)。
【背景技術(shù)】
[0002]0應(yīng)系統(tǒng)即客戶關(guān)系管理系統(tǒng)^61^1:101181111) 1冊叫61116111:),企業(yè)通過系統(tǒng)來管理其與客戶之間的關(guān)系。系統(tǒng)是嶄新的以客戶為中心的企業(yè)管理和商業(yè)運(yùn)作模式,也是以信息技術(shù)為手段、有效提高企業(yè)收益、客戶滿意度、雇員生產(chǎn)力的具體軟件和實現(xiàn)方法。系統(tǒng)將客戶當(dāng)作企業(yè)運(yùn)作的核心,客戶在系統(tǒng)中是非常重要的信息,企業(yè)不僅希望收集盡可能多的客戶數(shù)據(jù),也希望系統(tǒng)中的客戶都是有效信息,盡量減少數(shù)據(jù)的冗余。
[0003]但是在從外部加載數(shù)據(jù)的過程中,由于數(shù)據(jù)來源多,錄入規(guī)則各異,相同的客戶在不同數(shù)據(jù)源中可能錄入的名稱并不相同。例如,北京北大方正電子有限公司可能有“北京北大方正電子有限公司”、“方正電子”、“方正電子公司”等多個名稱,但實際上都是同一機(jī)構(gòu)。因此,希望實現(xiàn)數(shù)據(jù)歸并,避免數(shù)據(jù)重復(fù),從而保證系統(tǒng)數(shù)據(jù)的有效性。
【發(fā)明內(nèi)容】
[0004]本發(fā)明提供了一種至少能夠部分改善上述現(xiàn)有技術(shù)中的缺陷對0?系統(tǒng)中的客戶信息進(jìn)行查重的方法和系統(tǒng)。
[0005]根據(jù)本申請的一個方面,提供了一種對客戶信息進(jìn)行查重的方法,其包括:針對不同類型的客戶信息,確定出用于在客戶關(guān)系管理系統(tǒng)中查找是否為相同的客戶信息的多個客戶信息的子規(guī)則;將子規(guī)則按預(yù)設(shè)的優(yōu)先級組合成查重規(guī)則;以及根據(jù)所組合的查重規(guī)則對客戶信息進(jìn)行查重。
[0006]根據(jù)本申請的另一方面,提供了一種對客戶信息進(jìn)行查重的系統(tǒng),其包括確定子規(guī)則模塊、組合模塊和查重模塊,其中,確定子規(guī)則模塊用于針對不同類型的客戶信息,確定出用于在客戶關(guān)系管理系統(tǒng)中查找是否為相同的客戶信息的多個客戶信息的子規(guī)則;組合模塊用于將所述子規(guī)則按預(yù)設(shè)的優(yōu)先級組合成查重規(guī)則;以及查重模塊,用于根據(jù)所組合的查重規(guī)則對客戶信息進(jìn)行查重。
[0007]如上所述,通過本申請?zhí)峁┑膶蛻粜畔⑦M(jìn)行查重的方法和系統(tǒng),能夠通過用戶根據(jù)需要確定不同的查重規(guī)則,因此能夠更靈活且更有效地查找出重復(fù)的客戶信息,從而保證了系統(tǒng)數(shù)據(jù)的唯一性。
【專利附圖】
【附圖說明】
[0008]圖1為根據(jù)本申請的示例性實施方式的對客戶信息進(jìn)行查重的方法流程圖;
[0009]圖2為根據(jù)本申請的示例性實施方式的對客戶信息進(jìn)行查重的方法的詳細(xì)流程圖;以及
[0010]圖3為根據(jù)本申請的示例性實施方式的對客戶信息進(jìn)行查重的系統(tǒng)的示意性框圖。
【具體實施方式】
[0011]為了更好地理解本申請,將參考附圖對本申請的各個方面做出更詳細(xì)的說明??梢岳斫?,所述附圖和詳細(xì)說明只是對本申請優(yōu)選實施方案的描述,而非以任何方式限制本申請的范圍。
[0012]圖1概述地示出了根據(jù)本申請示例性實施方式的對0?系統(tǒng)中的客戶信息進(jìn)行查重的方法。在本申請中,“查重”是指查找多個為相同的客戶信息的信息,即,查找出重復(fù)的客戶信息。
[0013]參見圖1,在步驟3110中,針對不同類型的客戶信息,可確定出用于在客戶關(guān)系管理0應(yīng)系統(tǒng)中查找是否為相同的客戶信息的多個客戶信息的子規(guī)則。換言之,在該步驟中,用戶可針對多種類型的客戶信息,自行確定查重子規(guī)則。接下來,在步驟3120中,可將子規(guī)則按預(yù)設(shè)的優(yōu)先級組合成查重規(guī)則。用戶可充分考慮哪些子規(guī)則組合可查詢出最多的重復(fù)數(shù)據(jù),按需要選擇子規(guī)則進(jìn)行組合。在步驟3130中,用戶可根據(jù)所組合的查重規(guī)則對客戶信息進(jìn)行查重。在一個實施方式中,可首先將客戶信息導(dǎo)入,然后將導(dǎo)入的信息與系統(tǒng)原有的信息進(jìn)行比對,從而查找出重復(fù)的客戶信息。
[0014]根據(jù)本申請的方法,用戶可根據(jù)需要確定不同的查重規(guī)則,因此與現(xiàn)有技術(shù)中的選擇已有的查重規(guī)則的方法相比,能夠更加靈活且更加有效地查找出重復(fù)的客戶信息。
[0015]下面參照圖2詳細(xì)地描述根據(jù)本申請的對客戶信息進(jìn)行查重的方法,在圖2中示出了針對包括文本類型和數(shù)值類型的客戶信息進(jìn)行查重的方法。雖然圖2僅示出了對這兩種類型的客戶信息進(jìn)行查重的情況,但是本申請不限于這兩種類型。例如,本申請還可包括日期類型的客戶信息,該類型的客戶信息可以按與數(shù)值類型的客戶信息的相同的方法進(jìn)行處理,因而本申請省略對其的描述。
[0016]以個體客戶信息為例,文本類型的客戶信息可包括但不限于:姓名、性別、出生地、國籍、民族、身份證號、電話、手機(jī)、電子郵件、興趣愛好等;數(shù)值類型的客戶信息可包括但不限于:年齡、身高、體重、年收入等。以團(tuán)體客戶信息為例,文本類型的客戶信息包括但不限于:機(jī)構(gòu)名稱、簡稱、法人代表、組織機(jī)構(gòu)編碼、地址、郵編、網(wǎng)址、聯(lián)系人、聯(lián)系電話等;數(shù)值類型的客戶信息可包括但不限于:注冊資本、總資產(chǎn)、凈資產(chǎn)、年營業(yè)收入等。一般來說,文本類型不可轉(zhuǎn)換為數(shù)值類型。
[0017]具體地,參見圖2,對于文本類型的客戶信息,在步驟3210中,通過分詞方法將文本類型的客戶信息切分成一個或多個字段。這里,分詞方法可以是現(xiàn)有技術(shù)中的任意分詞方法,本申請不限于任何特定的分詞算法。在步驟3220中,根據(jù)過濾詞表去除一個或多個字段中應(yīng)過濾的字段,以得到與文本類型的客戶信息對應(yīng)的一個或多個關(guān)鍵字。在一個實施方式中,可預(yù)先設(shè)置過濾詞表,過濾詞表可包括應(yīng)過濾的字、詞、標(biāo)點符號、特殊字符等。通常,切分的第一個詞為前綴,最后一個詞為后綴,將切分后的所有詞根據(jù)過濾詞表去除應(yīng)該過濾的詞之后,即可得到與該客戶信息對應(yīng)的一個或多個關(guān)鍵字。接下來,在步驟3230中,將至少有部分關(guān)鍵字相同的客戶信息確定為相同的客戶信息。這里,至少有部分關(guān)鍵字相同例如可包括:全部關(guān)鍵字都相同、部分關(guān)鍵字相同、前綴相同或后綴相同等。
[0018]例如,對于北京北大方正電子有限公司,通過公知的分詞方法,可以分為北京、北大方正、電子、有限公司,北京是前綴,有限公司是后綴,北大方正是關(guān)鍵字。
[0019]再參見圖2,對于數(shù)值類型的客戶信息,在步驟3240中,將數(shù)值相同的客戶信息確定為相同的客戶信息;或者將數(shù)值差處于預(yù)定范圍內(nèi)的客戶信息確定為相同的客戶信息。
[0020]接下來,進(jìn)行以上參照圖1已描述的步驟3120和步驟3130,從而完成對客戶信息的查重。
[0021]根據(jù)本申請的查重方法,用戶可根據(jù)需要針對不同類型的客戶信息確定不同的查重規(guī)則,并且能夠自行組合,因此能夠更靈活且更有效地查找出重復(fù)的客戶信息
[0022]在一個實施方式中,按預(yù)設(shè)的優(yōu)先級組合成查重規(guī)則的步驟可包括將子規(guī)則以邏輯與、邏輯或、邏輯非進(jìn)行組合;和將組合后的子規(guī)則按預(yù)設(shè)的優(yōu)先級進(jìn)行組合。要充分考慮哪幾個屬性字段組合可以查詢最多的重復(fù)數(shù)據(jù),盡量避免單一字段查重
[0023]在一個實施方式中,對客戶信息進(jìn)行查重的方法還可包括將在查重中多個被確定為相同的客戶信息的信息進(jìn)行合并。例如,可以以列表的形式導(dǎo)出查重的結(jié)果。在另一實施方式中,執(zhí)行查重操作后,可自動清空所有歷史重復(fù)記錄,僅存儲當(dāng)前執(zhí)行所產(chǎn)生的重復(fù)記錄,即,系統(tǒng)僅存儲最近一次查重操作的結(jié)果。這樣,在查看任務(wù)歷史執(zhí)行記錄時,只需提供歷史執(zhí)行結(jié)果的描述信息(如執(zhí)行結(jié)果,重復(fù)性規(guī)則,重復(fù)記錄數(shù)等),而無需提供每次執(zhí)行時產(chǎn)生的重復(fù)性記錄。
[0024]在一個實施方式中,可選擇兩條或更多條的“未處理”狀態(tài)的客戶進(jìn)行查重,然后將被確定為相同的客戶信息的信息進(jìn)行合并操作。例如,當(dāng)某條重復(fù)記錄的所有相似客戶中,僅存在一條或零條“未處理”狀態(tài)的相似客戶時,此重復(fù)記錄狀態(tài)會變更為“已合并”,在其它情況下,此重復(fù)記錄的狀態(tài)都是“未處理”狀態(tài)。
[0025]在另一實施方式中,可對一條或多條相似客戶進(jìn)行移除操作,被移除的相似客戶不能進(jìn)行合并操作。
[0026]以上參照圖1和圖2描述了根據(jù)本申請的實施方式的對系統(tǒng)中的客戶信息進(jìn)行查重的方法,下面將參照圖3描述根據(jù)本申請的對系統(tǒng)中的客戶信息進(jìn)行查重的系統(tǒng) 1000。
[0027]參見圖3,系統(tǒng)1000可包括確定子規(guī)則模塊310、組合模塊320以及查重模塊330。確定子規(guī)則模塊310可用于針對不同類型的客戶信息,確定出用于在客戶關(guān)系管理0?系統(tǒng)中查找是否為相同的客戶信息的多個客戶信息的子規(guī)則。組合模塊320可用于將確定出的子規(guī)則按預(yù)設(shè)的優(yōu)先級組合成查重規(guī)則。查重模塊330可用于根據(jù)所組合的查重規(guī)則對客戶信息進(jìn)行查重。
[0028]客戶信息可包括文本類型和數(shù)值類型。應(yīng)該理解,本申請不限于這兩種類型的客戶信息,本申請還適用于日期類型的客戶信息??梢园磁c數(shù)值類型的客戶信息的相同的方法對日期類型的客戶信息進(jìn)行處理。
[0029]對于文本類型的客戶信息,系統(tǒng)1000還包括切分模塊340和過濾模塊350。切分模塊340可用于通過分詞方法將文本類型的客戶信息切分成一個或多個字段。這里,分詞方法可以是現(xiàn)有技術(shù)中的任意分詞方法,本申請不限于任何特定的分詞算法。過濾模塊350可用于根據(jù)過濾詞表去除一個或多個字段中應(yīng)過濾字段,以得到與文本類型的客戶信息的一個或多個關(guān)鍵字。這樣,確定子規(guī)則模塊310可將至少有部分關(guān)鍵字相同的客戶信息確定為相同的客戶信息。這里,至少有部分關(guān)鍵字相同例如可包括:全部關(guān)鍵字都相同、部分關(guān)鍵字相同、前綴相同或后綴相同等。
[0030]對于數(shù)值類型的客戶信息,確定子規(guī)則模塊還可將數(shù)值相同的客戶信息確定為相同的客戶信息;或者將數(shù)值差處于預(yù)定范圍內(nèi)的客戶信息確定為相同的客戶信息。
[0031]在一個實施方式中,組合模塊320還可將子規(guī)則以邏輯與、邏輯或、邏輯非進(jìn)行組合;以及將組合后的子規(guī)則按預(yù)設(shè)的優(yōu)先級進(jìn)行組合。
[0032]在一個實施方式中,系統(tǒng)1000還可包括合并模塊(未示出),其可將在查重中多個被確定為相同的客戶信息的信息進(jìn)行合并。
[0033]以上所述僅為一些具體的實施方式,并非用來限制本發(fā)明的專利范圍,凡是利用本申請說明書及附圖內(nèi)容所作的等效變換,或直接或間接運(yùn)用在其他相關(guān)的【技術(shù)領(lǐng)域】的等同技術(shù)特征對本申請文件公開的技術(shù)方案進(jìn)行的修改,均包括在本發(fā)明的保護(hù)范圍內(nèi)。
【權(quán)利要求】
1.一種對客戶信息進(jìn)行查重的方法,包括: 針對不同類型的客戶信息,確定出用于在客戶關(guān)系管理CRM系統(tǒng)中查找是否為相同的客戶信息的多個客戶信息的子規(guī)則; 將所述子規(guī)則按預(yù)設(shè)的優(yōu)先級組合成查重規(guī)則;以及 根據(jù)所組合的查重規(guī)則對所述客戶信息進(jìn)行查重。
2.如權(quán)利要求1所述的方法,其中,所述客戶信息的類型包括文本類型,所述確定子規(guī)則的步驟包括: 通過分詞方法將所述文本類型的客戶信息切分成一個或多個字段, 根據(jù)過濾詞表去除所述一個或多個字段中應(yīng)過濾的字段,以得到與所述文本類型的客戶信息對應(yīng)的一個或多個關(guān)鍵字;以及 將至少有部分關(guān)鍵字相同的客戶信息確定為相同的客戶信息。
3.如權(quán)利要求1所述的方法,其中,所述客戶信息的類型包括數(shù)值類型,所述確定子規(guī)則的步驟包括: 將數(shù)值相同的客戶信息確定為相同的客戶信息;或者 將數(shù)值差處于預(yù)定范圍內(nèi)的客戶信息確定為相同的客戶信息。
4.如權(quán)利要求1所述的方法,其中,所述按預(yù)設(shè)的優(yōu)先級組合成查重規(guī)則的步驟包括: 將所述子規(guī)則以邏輯與、邏輯或、邏輯非進(jìn)行組合;和將組合后的所述子規(guī)則按預(yù)設(shè)的優(yōu)先級進(jìn)行組合。
5.如權(quán)利要求1所述的方法,還包括: 將在所述查重中多個被確定為相同的客戶信息的信息進(jìn)行合并。
6.一種對客戶信息進(jìn)行查重的系統(tǒng),包括: 確定子規(guī)則模塊,用于針對不同類型的客戶信息,確定出用于在客戶關(guān)系管理CRM系統(tǒng)中查找是否為相同的客戶信息的多個客戶信息的子規(guī)則; 組合模塊,用于將所述子規(guī)則按預(yù)設(shè)的優(yōu)先級組合成查重規(guī)則;以及 查重模塊,用于根據(jù)所組合的查重規(guī)則對所述客戶信息進(jìn)行查重。
7.如權(quán)利要求6所述的系統(tǒng),其中,所述客戶信息的類型包括文本類型,所述系統(tǒng)還包括: 切分模塊,用于通過分詞方法將所述文本類型的客戶信息切分成一個或多個字段,以及 過濾模塊,用于根據(jù)過濾詞表去除所述一個或多個字段中應(yīng)過濾字段,以得到與所述文本類型的客戶信息的一個或多個關(guān)鍵字; 其中,所述確定子規(guī)則模塊將至少有部分關(guān)鍵字相同的客戶信息確定為相同的客戶信肩、O
8.如權(quán)利要求6所述的系統(tǒng),其中,所述客戶信息的類型包括數(shù)值類型,所述確定子規(guī)則模塊還將數(shù)值相同的客戶信息確定為相同的客戶信息;或者將數(shù)值差處于預(yù)定范圍內(nèi)的客戶信息確定為相同的客戶信息。
9.如權(quán)利要求7或8所述的系統(tǒng),其中,所述組合模塊還將所述子規(guī)則以邏輯與、邏輯或、邏輯非進(jìn)行組合;以及將組合后的所述子規(guī)則按預(yù)設(shè)的優(yōu)先級進(jìn)行組合。
10.如權(quán)利要求6所述的系統(tǒng),還包括合并模塊,所述合并模塊將在查重中多個被確定 為相同的客戶信息的信息進(jìn)行合并。
【文檔編號】G06F17/30GK104424202SQ201310367451
【公開日】2015年3月18日 申請日期:2013年8月21日 優(yōu)先權(quán)日:2013年8月21日
【發(fā)明者】劉勝飏 申請人:北大方正集團(tuán)有限公司, 方正信息產(chǎn)業(yè)控股有限公司, 北京北大方正電子有限公司