數(shù)據(jù)信息分類方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明的實(shí)施例公開一種數(shù)據(jù)信息分類方法,屬于信息處理技術(shù)領(lǐng)域,包括:獲取待分類數(shù)據(jù)信息的特征信息;根據(jù)所述特征信息和預(yù)設(shè)的數(shù)據(jù)信息分類樣本確定所述待分類數(shù)據(jù)信息的目標(biāo)類別,所述數(shù)據(jù)信息分類樣本中至少存儲(chǔ)有各類數(shù)據(jù)信息的樣本特征信息以及相應(yīng)于每一類數(shù)據(jù)信息的樣本特征信息所屬的類別;另一方面,本發(fā)明的實(shí)施例還提供一種數(shù)據(jù)信息分類系統(tǒng);本發(fā)明實(shí)施例的數(shù)據(jù)信息分類方法及系統(tǒng)通過預(yù)先存儲(chǔ)針對(duì)所有類別數(shù)據(jù)信息的樣本特征信息以及樣本特征信息所對(duì)應(yīng)的數(shù)據(jù)信息所屬的類別,以用于自動(dòng)獲取待分類數(shù)據(jù)信息的特征信息后確定待分類數(shù)據(jù)信息的類別,保證了數(shù)據(jù)信息分類的準(zhǔn)確性,提升了數(shù)據(jù)信息分類的效率。
【專利說明】
數(shù)據(jù)信息分類方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001]本發(fā)明涉及信息處理技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)信息分類方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著電子商務(wù)的發(fā)展,越來越多的品類的商品在線上進(jìn)行出售,為了能夠讓消費(fèi)者從品類眾多的商品中迅速的找到自己的目標(biāo)商品,就需要電商平臺(tái)將線上的產(chǎn)品進(jìn)行歸類管理,并對(duì)數(shù)據(jù)信息進(jìn)行分類管理。
[0003]然而,發(fā)明人在實(shí)踐中發(fā)現(xiàn),目前線上銷售服務(wù)在建立商品的數(shù)據(jù)庫時(shí),需要人員手動(dòng)設(shè)置、指定商品的分類并修改系統(tǒng)中關(guān)于商品分類的數(shù)據(jù)信息,這就需要人員對(duì)商品分類的規(guī)則十分熟悉,否則可能導(dǎo)致商品分類錯(cuò)誤,并且人工進(jìn)行商品分類,工作量大且效率低下。
【發(fā)明內(nèi)容】
[0004]本發(fā)明的實(shí)施例提供一種數(shù)據(jù)信息分類方法及系統(tǒng),以用于至少解決上述技術(shù)問題之一。
[0005]—方面,本發(fā)明的實(shí)施例提供一種數(shù)據(jù)信息分類方法,包括:獲取待分類數(shù)據(jù)信息的特征信息;
[0006]根據(jù)所述特征信息和預(yù)設(shè)的數(shù)據(jù)信息分類樣本確定所述待分類數(shù)據(jù)信息的目標(biāo)類別,所述數(shù)據(jù)信息分類樣本中至少存儲(chǔ)有各類數(shù)據(jù)信息的樣本特征信息以及相應(yīng)于每一類數(shù)據(jù)信息的樣本特征信息所屬的類別。
[0007]另一方面,本發(fā)明的實(shí)施例還提供一種數(shù)據(jù)信息分類系統(tǒng),其包括:
[0008]特征信息獲取模塊,用于獲取待分類數(shù)據(jù)信息的特征信息;
[0009]目標(biāo)類別確定模塊,用于根據(jù)所述特征信息和預(yù)設(shè)的數(shù)據(jù)信息分類樣本確定所述待分類數(shù)據(jù)信息的目標(biāo)類別,所述數(shù)據(jù)信息分類樣本中至少存儲(chǔ)有各類數(shù)據(jù)信息的樣本特征信息以及相應(yīng)于每一類數(shù)據(jù)信息的樣本特征信息所屬的類別。
[0010]本發(fā)明實(shí)施例的數(shù)據(jù)信息分類方法及系統(tǒng)通過預(yù)先存儲(chǔ)針對(duì)所有類別數(shù)據(jù)信息的樣本特征信息以及樣本特征信息所對(duì)應(yīng)的數(shù)據(jù)信息所屬的類別,以用于自動(dòng)獲取待分類數(shù)據(jù)信息的特征信息后確定待分類數(shù)據(jù)信息的類別,保證了數(shù)據(jù)信息分類的準(zhǔn)確性,提升了數(shù)據(jù)信息分類的效率。
【附圖說明】
[0011]為了更清楚地說明本發(fā)明實(shí)施例的技術(shù)方案,下面將對(duì)實(shí)施例描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0012]圖1為本發(fā)明的數(shù)據(jù)信息分類方法一實(shí)施例的流程圖;
[0013]圖2為本發(fā)明的數(shù)據(jù)信息分類方法另一實(shí)施例的流程圖;
[0014]圖3為本發(fā)明的數(shù)據(jù)信息分類方法再一實(shí)施例的流程圖;
[0015]圖4為本發(fā)明的數(shù)據(jù)信息分類系統(tǒng)一實(shí)施例的原理框圖;
[0016]圖5為本發(fā)明的數(shù)據(jù)信息分類系統(tǒng)中的目標(biāo)類別確定模塊一實(shí)施例的原理框圖;
[0017]圖6為本發(fā)明的數(shù)據(jù)信息分類系統(tǒng)中的相似度計(jì)算單元的一實(shí)施例的原理框圖;
[0018]圖7為本發(fā)明的服務(wù)器的一實(shí)施例的結(jié)構(gòu)示意圖。
具體實(shí)施例
[0019]為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0020]需要說明的是,在不沖突的情況下,本申請中的實(shí)施例及實(shí)施例中的特征可以相互組合。
[0021]本發(fā)明可用于眾多通用或?qū)S玫挠?jì)算系統(tǒng)環(huán)境或配置中。例如:個(gè)人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、置頂盒、可編程的消費(fèi)電子設(shè)備、網(wǎng)絡(luò)PC、小型計(jì)算機(jī)、大型計(jì)算機(jī)、包括以上任何系統(tǒng)或設(shè)備的分布式計(jì)算環(huán)境等等。
[0022]本發(fā)明可以在由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計(jì)算環(huán)境中實(shí)踐本發(fā)明,在這些分布式計(jì)算環(huán)境中,由通過通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序模塊可以位于包括存儲(chǔ)設(shè)備在內(nèi)的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。
[0023]在本發(fā)明中,“組件”、“裝置”、“系統(tǒng)”等等指應(yīng)用于計(jì)算機(jī)的相關(guān)實(shí)體,如硬件、硬件和軟件的組合、軟件或執(zhí)行中的軟件等。詳細(xì)地說,例如,組件可以、但不限于是運(yùn)行于處理器的過程、處理器、對(duì)象、可執(zhí)行組件、執(zhí)行線程、程序和/或計(jì)算機(jī)。還有,運(yùn)行于服務(wù)器上的應(yīng)用程序或腳本程序、服務(wù)器都可以是組件。一個(gè)或多個(gè)組件可在執(zhí)行的過程和/或線程中,并且組件可以在一臺(tái)計(jì)算機(jī)上本地化和/或分布在兩臺(tái)或多臺(tái)計(jì)算機(jī)之間,并可以由各種計(jì)算機(jī)可讀介質(zhì)運(yùn)行。組件還可以根據(jù)具有一個(gè)或多個(gè)數(shù)據(jù)包的信號(hào),例如,來自一個(gè)與本地系統(tǒng)、分布式系統(tǒng)中另一組件交互的,和/或在因特網(wǎng)的網(wǎng)絡(luò)通過信號(hào)與其它系統(tǒng)交互的數(shù)據(jù)的信號(hào)通過本地和/或遠(yuǎn)程過程來進(jìn)行通信。
[0024]最后,還需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”,不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0025]如圖1所示,本發(fā)明的一實(shí)施例的數(shù)據(jù)信息分類方法,包括:
[0026]S11、獲取待分類數(shù)據(jù)信息的特征信息;
[0027]S12、根據(jù)所述特征信息和預(yù)設(shè)的數(shù)據(jù)信息分類樣本確定所述待分類數(shù)據(jù)信息的目標(biāo)類別,所述數(shù)據(jù)信息分類樣本中至少存儲(chǔ)有各類數(shù)據(jù)信息的樣本特征信息以及相應(yīng)于每一類數(shù)據(jù)信息的樣本特征信息所屬的類別。
[0028]本實(shí)施例的數(shù)據(jù)信息分類方法由處理器自動(dòng)執(zhí)行,當(dāng)工作人員將待分類數(shù)據(jù)信息的特征信息輸入至處理器后,處理器將根據(jù)預(yù)設(shè)的數(shù)據(jù)信息分類樣本中存儲(chǔ)的相應(yīng)于每一類數(shù)據(jù)信息的樣本特征信息與待分類數(shù)據(jù)信息的特征信息進(jìn)行比較,從而確定出待分類數(shù)據(jù)信息所屬的目標(biāo)類別。
[0029]待分類數(shù)據(jù)信息的特征信息至少包括數(shù)據(jù)信息名稱、數(shù)據(jù)信息圖片、數(shù)據(jù)信息文本信息;樣本特征信息至少包括樣本數(shù)據(jù)信息名稱、樣本數(shù)據(jù)信息圖片、樣本數(shù)據(jù)信息文本?目息O
[0030]本發(fā)明實(shí)施例的數(shù)據(jù)信息分類方法通過預(yù)先存儲(chǔ)針對(duì)所有類別數(shù)據(jù)信息的樣本特征信息以及樣本特征信息所對(duì)應(yīng)的數(shù)據(jù)信息所屬的類別,以用于自動(dòng)獲取待分類數(shù)據(jù)信息的特征信息后確定待分類數(shù)據(jù)信息的類別,保證了數(shù)據(jù)信息分類的準(zhǔn)確性,提升了數(shù)據(jù)信息分類的效率。
[0031 ]在一些實(shí)施例中,數(shù)據(jù)信息分類方法,包括:
[0032]獲取待分類數(shù)據(jù)信息的特征信息;
[0033]根據(jù)所述特征信息和預(yù)設(shè)的數(shù)據(jù)信息分類樣本確定所述待分類數(shù)據(jù)信息的目標(biāo)類別,所述數(shù)據(jù)信息分類樣本中至少存儲(chǔ)有各類數(shù)據(jù)信息的樣本特征信息以及相應(yīng)于每一類數(shù)據(jù)信息的樣本特征信息所屬的類別。
[0034]如圖2所示,在本實(shí)施例中,根據(jù)所述特征信息和預(yù)設(shè)的數(shù)據(jù)信息分類樣本確定所述待分類數(shù)據(jù)信息的目標(biāo)類別包括:
[0035]S21、計(jì)算所述特征信息與所述數(shù)據(jù)信息分類樣本中存儲(chǔ)的樣本特征信息的相似度;
[0036]S22、確定最大相似度所對(duì)應(yīng)的數(shù)據(jù)信息特征信息所屬的類別為所述特征信息所對(duì)應(yīng)的待分類數(shù)據(jù)信息的目標(biāo)類別。
[0037]上述實(shí)施例的數(shù)據(jù)信息分類方法可以用于實(shí)現(xiàn)商品的分類,此時(shí),本實(shí)施例數(shù)據(jù)信息分類方法即為:商品分類方法。商品分類方法由處理器自動(dòng)執(zhí)行,當(dāng)工作人員將待分類商品的特征信息輸入至處理器后,處理器將根據(jù)預(yù)設(shè)的商品分類樣本中存儲(chǔ)的相應(yīng)于每一類商品的樣本特征信息與待分類商品的特征信息進(jìn)行比較,從而確定出待分類商品所屬的目標(biāo)類別。
[0038]待分類商品的特征信息至少包括商品名稱、商品圖片、商品文本信息;樣本特征信息至少包括樣本商品名稱、樣本商品圖片、樣本商品文本信息。
[0039]本發(fā)明實(shí)施例的商品分類方法通過預(yù)先存儲(chǔ)針對(duì)所有類別商品的樣本特征信息以及樣本特征信息所對(duì)應(yīng)的商品所屬的類別,以用于自動(dòng)獲取待分類商品的特征信息后確定待分類商品的類別,保證了商品分類的準(zhǔn)確性,提升了商品分類的效率。
[0040]在上述實(shí)施例中計(jì)算待分類商品的特征信息與預(yù)設(shè)商品分類樣本中存儲(chǔ)的所有類別的商品的樣本特征信息的相似度,從計(jì)算得到的多個(gè)相似度值中選出相似度最大的一個(gè),并且將這個(gè)最大的相似度值所對(duì)應(yīng)的樣本特征信息的商品所述的類別確定為待分類商品的目標(biāo)類別。本實(shí)施例中計(jì)算相似度的方法為首先對(duì)待分類商品的特征信息進(jìn)行量化,生成相應(yīng)的一個(gè)向量,同樣將商品分類樣本中存儲(chǔ)的所有類別的商品的樣本特征信息進(jìn)行量化,生成相應(yīng)的多個(gè)樣本向量,然后將根據(jù)待分類商品的特征信息生成的向量分別與商品分類樣本中存儲(chǔ)的所有類別的商品的樣本特征信息進(jìn)行量化生成相應(yīng)的多個(gè)樣本向量逐個(gè)計(jì)算出多個(gè)相似度值。
[0041 ]本實(shí)施例中通過分別將待分類商品的特征信息和商品分類樣本中存儲(chǔ)的所有類別的商品的樣本特征信息進(jìn)行量化,然后再計(jì)算根據(jù)待分類商品的特征信息確定的向量與根據(jù)已知分類的樣本特征信息確定的向量的相似度的方法將對(duì)商品的分類實(shí)現(xiàn)了量化的考量,從而更加保證了對(duì)商品分類的準(zhǔn)確性與高效性。
[0042]在一些實(shí)施例中,數(shù)據(jù)信息分類方法包括:
[0043]獲取待分類商品的特征信息;
[0044]計(jì)算所述特征信息與所述商品分類樣本中存儲(chǔ)的樣本特征信息的相似度;
[0045]確定最大相似度所對(duì)應(yīng)的商品特征信息所屬的類別為所述特征信息所對(duì)應(yīng)的待分類商品的目標(biāo)類別,所述商品分類樣本中至少存儲(chǔ)有各類商品的樣本特征信息以及相應(yīng)于每一類商品的樣本特征信息所屬的類別。
[0046]如圖3所示,其中,計(jì)算所述特征信息與所述商品分類樣本中存儲(chǔ)的商品特征信息的相似度包括:
[0047]S31、根據(jù)所述商品名稱和所述樣本商品名稱確定第一相似度;本步驟中可以采用文本相似度計(jì)算方法來計(jì)算第一相似度;
[0048]S32、根據(jù)所述商品圖片和所述樣品商品圖片確定第二相似度;本步驟中可以采用圖像相似度計(jì)算方法來計(jì)算第二相似度;
[0049]S33、根據(jù)所述商品文本信息和所述樣本商品文本信息確定第三相似度;本步驟中可以采用文本相似度計(jì)算方法來計(jì)算第一相似度;
[0050]S34、對(duì)所述第一相似度、第二相似度和第三相似度進(jìn)行加權(quán)求和以確定所述相似度。
[0051 ]本實(shí)施例中在確定待分類商品與商品分類樣本中存儲(chǔ)的已知分類的商品中的哪一種更相似時(shí)同時(shí)考慮了三個(gè)不同的維度:商品名稱、商品圖片、商品文本信息,然后通過加權(quán)求和的方式綜合考慮三個(gè)維度得出的三個(gè)相似度值來度量待分類商品與已知類別的商品的相似度,從而用于確定出與待分類商品的相似度最高的已知分類的商品,以完成對(duì)待分類商品的分類。本實(shí)施例避免了單一比較一個(gè)維度無法確定待分類商品類別的情況的發(fā)生,例如,當(dāng)商品分類樣本中存儲(chǔ)的已知分類的商品中有兩類“電影”和“玩具”,并且商品名稱都是“鋼鐵俠”,這時(shí)如果待分類商品也是“鋼鐵俠”,則只通過商品名稱進(jìn)行相似度的計(jì)算,最后確定的結(jié)果必然是,待是被商品可能屬于“電影”也可能屬于“玩具”,這時(shí)候就不能確定了。
[0052]本實(shí)施例中在計(jì)算三個(gè)維度的相似度值時(shí),還可以:首先分別將商品名稱、商品圖片和商品文本信息量化為向量,然后將樣本商品名稱、樣本商品圖片和樣本商品文本信息量化為向量,最后采用余弦相似度算法再分別計(jì)算出三個(gè)相似度值。
[0053]本實(shí)施例中對(duì)三個(gè)相似度值進(jìn)行加權(quán)求和的時(shí)分別為三個(gè)相似度值分配一個(gè)加權(quán)系數(shù),三個(gè)加權(quán)系數(shù)的取值可以根據(jù)三個(gè)相似度值在確定待分類商品的分類中所起的作用的大小來具體確定,例如:三個(gè)加權(quán)系數(shù)可以分別為I,這時(shí)考慮的情況是三個(gè)相似度值在確定待分類商品的類別時(shí)所起的作用大小相同;也可以是三個(gè)加權(quán)系數(shù)之和為I,并且為對(duì)確定待分類商品的類別起決定性作用個(gè)相似度值分配較大的加權(quán)系數(shù)。
[°°54] 本發(fā)明實(shí)施例中可以通過硬件處理器(hardware processor)來實(shí)現(xiàn)相關(guān)功能模塊。
[0055]需要說明的是,對(duì)于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列的動(dòng)作合并,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本發(fā)明所必須的。
[0056]在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。
[0057]如圖4所示,本發(fā)明的實(shí)施例還提供一種數(shù)據(jù)信息分類系統(tǒng),包括:
[0058]特征信息獲取模塊,用于獲取待分類數(shù)據(jù)信息的特征信息;
[0059]目標(biāo)類別確定模塊,用于根據(jù)所述特征信息和預(yù)設(shè)的數(shù)據(jù)信息分類樣本確定所述待分類數(shù)據(jù)信息的目標(biāo)類別,所述數(shù)據(jù)信息分類樣本中至少存儲(chǔ)有各類數(shù)據(jù)信息的樣本特征信息以及相應(yīng)于每一類數(shù)據(jù)信息的樣本特征信息所屬的類別。
[0060]本發(fā)明實(shí)施例的數(shù)據(jù)信息分類系統(tǒng)中,通過預(yù)先存儲(chǔ)針對(duì)所有類別數(shù)據(jù)信息的樣本特征信息以及樣本特征信息所對(duì)應(yīng)的數(shù)據(jù)信息所屬的類別,以用于特征信息獲取模塊自動(dòng)獲取待分類數(shù)據(jù)信息的特征信息后,目標(biāo)類別確定模塊確定待分類數(shù)據(jù)信息的類別,保證了數(shù)據(jù)信息分類的準(zhǔn)確性,提升了數(shù)據(jù)信息分類的效率。
[0061]如圖5所示,在一些實(shí)施例中,目標(biāo)類別確定模塊包括:
[0062]相似度計(jì)算單元,用于計(jì)算所述特征信息與所述數(shù)據(jù)信息分類樣本中存儲(chǔ)的樣本特征信息的相似度;
[0063]目標(biāo)類別確定單元,用于確定最大相似度所對(duì)應(yīng)的數(shù)據(jù)信息特征信息所屬的類別為所述特征信息所對(duì)應(yīng)的待分類商品的目標(biāo)類別。
[0064]此時(shí),上述實(shí)施例的數(shù)據(jù)信息分類系統(tǒng)包括:特征信息獲取模塊和目標(biāo)類別確定模塊,而目標(biāo)類別確定模塊又進(jìn)一步包括相似度計(jì)算單元和目標(biāo)類別確定單元。
[0065]在本實(shí)施例中,數(shù)據(jù)信息為與商品的類別相關(guān)的信息,這時(shí)上述實(shí)施例中的數(shù)據(jù)信息分類系統(tǒng)就是商品類別分類系統(tǒng),本實(shí)施例的商品分類系統(tǒng)通過預(yù)先存儲(chǔ)針對(duì)所有類別商品的樣本特征信息以及樣本特征信息所對(duì)應(yīng)的商品所屬的類別,以用于特征信息獲取模塊自動(dòng)獲取待分類數(shù)據(jù)信息的特征信息后,相似度計(jì)算單元和目標(biāo)類別確定單元共同確定待分類商品的類別,保證了商品分類的準(zhǔn)確性,提升了商品分類的效率。
[0066]在一些實(shí)施例中,特征信息至少包括數(shù)據(jù)信息名稱、數(shù)據(jù)信息圖片、數(shù)據(jù)信息文本信息;所述樣本特征信息至少包括樣本數(shù)據(jù)信息名稱、樣本數(shù)據(jù)信息圖片、樣本數(shù)據(jù)信息文本信息。當(dāng)本實(shí)施例的數(shù)據(jù)信息分類系統(tǒng)用于商品分類時(shí),特征信息至少包括商品名稱、商品圖片、商品文本信息;所述樣本特征信息至少包括樣本商品名稱、樣本商品圖片、樣本商品文本信息。
[0067]如圖6所示,在一些實(shí)施例中,相似度計(jì)算單元包括:
[0068]第一相似度計(jì)算組件,用于根據(jù)所述商品名稱和所述樣本商品名稱確定第一相似度;
[0069]第二相似度計(jì)算組件,用于根據(jù)所述商品圖片和所述樣品商品圖片確定第二相似度;
[0070]第三相似度計(jì)算組件,用于根據(jù)所述商品文本信息和所述樣本商品文本信息確定第三相似度;
[0071]加權(quán)求和組件,用于對(duì)所述第一相似度、第二相似度和第三相似度進(jìn)行加權(quán)求和以確定所述相似度。
[0072]此時(shí),上述商品分類系統(tǒng)包括:特征信息獲取模塊和目標(biāo)類別確定模塊,而目標(biāo)類別確定模塊又進(jìn)一步包括相似度計(jì)算單元和目標(biāo)類別確定單元,相似度計(jì)算單元進(jìn)一步包括第一相似度計(jì)算組件、第二相似度計(jì)算組件、第三相似度計(jì)算組件和加權(quán)求和組件。
[0073]上述本發(fā)明實(shí)施例的商品分類系統(tǒng)可用于執(zhí)行本發(fā)明實(shí)施例的商品分類方法,并相應(yīng)的達(dá)到上述本發(fā)明實(shí)施例的商品分類方法所達(dá)到的技術(shù)效果,這里不再贅述。
[0074]另一方面,本發(fā)明的實(shí)施例還公開一種服務(wù)器,本發(fā)明的服務(wù)器布設(shè)了本發(fā)明上述任一實(shí)施例所述的商品分類系統(tǒng),并相應(yīng)的執(zhí)行本發(fā)明上述實(shí)施例所述的商品分類方法。
[0075]另一方面,本發(fā)明的實(shí)施例還公開一種機(jī)房,本發(fā)明的機(jī)房中包括了多個(gè)服務(wù)器,本實(shí)施例中的多個(gè)服務(wù)器中的至少一個(gè)布設(shè)了本發(fā)明上述任一實(shí)施例所述的商品分類系統(tǒng),并相應(yīng)的執(zhí)行本發(fā)明上述實(shí)施例所述的商品分類方法。
[0076]在一些實(shí)施例中,上述公開的服務(wù)器包括:
[0077]存儲(chǔ)器,用于存放計(jì)算機(jī)操作指令;
[0078]處理器,用于執(zhí)行所述存儲(chǔ)器存儲(chǔ)的計(jì)算機(jī)操作指令,以執(zhí)行:
[0079]獲取待分類商品的特征信息;
[0080]根據(jù)所述特征信息和預(yù)設(shè)的商品分類樣本確定所述待分類商品的目標(biāo)類別,所述商品分類樣本中至少存儲(chǔ)有各類商品的樣本特征信息以及相應(yīng)于每一類商品的樣本特征信息所屬的類別。
[0081]如圖7所示,為本發(fā)明上述實(shí)施例中服務(wù)器一實(shí)施例的結(jié)構(gòu)示意圖,本申請具體實(shí)施例并不對(duì)服務(wù)器700的具體實(shí)現(xiàn)做限定,其包括:
[0082]處理器(processor)710、通信接口(Communicat1nsInterface)720、存儲(chǔ)器(memory)730、以及通信總線740。其中:
[0083]處理器710、通信接口 720、以及存儲(chǔ)器730通過通信總線740完成相互間的通信。
[0084]通信接口720,用于與比如第三方訪問端等的網(wǎng)元通信。
[0085]處理器710,用于執(zhí)行程序732,具體可以執(zhí)行上述方法實(shí)施例中的相關(guān)步驟。
[0086]具體地,程序732可以包括程序代碼,所述程序代碼包括計(jì)算機(jī)操作指令。
[0087]處理器710可能是一個(gè)中央處理器CPU,或者是特定集成電路ASIC(Applicati0nSpecific Integrated Circuit),或者是被配置成實(shí)施本申請實(shí)施例的一個(gè)或多個(gè)集成電路。
[0088]以上所描述的方法實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性的勞動(dòng)的情況下,即可以理解并實(shí)施。
[0089]通過以上的實(shí)施例的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到各實(shí)施例可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件。基于這樣的理解,上述技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品可以存儲(chǔ)在計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,如R0M/RAM、磁碟、光盤等,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行各個(gè)實(shí)施例或者實(shí)施例的某些部分所述的方法。
[0090]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本發(fā)明可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。而且,本發(fā)明可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲(chǔ)介質(zhì)(包括但不限于磁盤存儲(chǔ)器和光學(xué)存儲(chǔ)器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。
[0091]本發(fā)明是參照根據(jù)本發(fā)明實(shí)施例的方法、設(shè)備(系統(tǒng))、和計(jì)算機(jī)程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計(jì)算機(jī)程序指令實(shí)現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合??商峁┻@些計(jì)算機(jī)程序指令到通用計(jì)算機(jī)、專用計(jì)算機(jī)、嵌入式處理機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn)生一個(gè)機(jī)器,使得通過計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的裝置。
[0092]這些計(jì)算機(jī)程序指令也可存儲(chǔ)在能引導(dǎo)計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計(jì)算機(jī)可讀存儲(chǔ)器中,使得存儲(chǔ)在該計(jì)算機(jī)可讀存儲(chǔ)器中的指令產(chǎn)生包括指令裝置的制造品,該指令裝置實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能。這些計(jì)算機(jī)程序指令也可裝載到計(jì)算機(jī)或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計(jì)算機(jī)實(shí)現(xiàn)的處理,從而在計(jì)算機(jī)或其他可編程設(shè)備上執(zhí)行的指令提供用于實(shí)現(xiàn)在流程圖一個(gè)流程或多個(gè)流程和/或方框圖一個(gè)方框或多個(gè)方框中指定的功能的步驟。
[0093]最后應(yīng)說明的是:以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。
【主權(quán)項(xiàng)】
1.一種數(shù)據(jù)信息分類方法,包括: 獲取待分類數(shù)據(jù)信息的特征信息; 根據(jù)所述特征信息和預(yù)設(shè)的數(shù)據(jù)信息分類樣本確定所述待分類數(shù)據(jù)信息的目標(biāo)類別,所述數(shù)據(jù)信息分類樣本中至少存儲(chǔ)有各類數(shù)據(jù)信息的樣本特征信息以及相應(yīng)于每一類數(shù)據(jù)信息的樣本特征信息所屬的類別。2.根據(jù)權(quán)利要求1所述的方法,其中,所述根據(jù)所述特征信息和預(yù)設(shè)的數(shù)據(jù)信息分類樣本確定所述待分類數(shù)據(jù)信息的目標(biāo)類別包括: 計(jì)算所述特征信息與所述數(shù)據(jù)信息分類樣本中存儲(chǔ)的樣本特征信息的相似度; 確定最大相似度所對(duì)應(yīng)的樣本特征信息所屬的類別為所述特征信息所對(duì)應(yīng)的待分類數(shù)據(jù)信息的目標(biāo)類別。3.根據(jù)權(quán)利要求2所述的方法,其中,所述特征信息至少包括數(shù)據(jù)信息名稱、數(shù)據(jù)信息圖片、數(shù)據(jù)信息文本信息;所述樣本特征信息至少包括樣本數(shù)據(jù)信息名稱、樣本數(shù)據(jù)信息圖片、樣本數(shù)據(jù)信息文本信息。4.根據(jù)權(quán)利要求3所述的方法,其中,所述計(jì)算所述特征信息與所述數(shù)據(jù)信息分類樣本中存儲(chǔ)的樣本特征信息的相似度包括: 根據(jù)所述數(shù)據(jù)信息名稱和所述樣本數(shù)據(jù)信息名稱確定第一相似度; 根據(jù)所述數(shù)據(jù)信息圖片和所述樣品數(shù)據(jù)信息圖片確定第二相似度; 根據(jù)所述數(shù)據(jù)信息文本信息和所述樣本數(shù)據(jù)信息文本信息確定第三相似度; 對(duì)所述第一相似度、第二相似度和第三相似度進(jìn)行加權(quán)求和以確定所述相似度。5.—種商品分類系統(tǒng),包括: 特征信息獲取模塊,用于獲取待分類數(shù)據(jù)信息的特征信息; 目標(biāo)類別確定模塊,用于根據(jù)所述特征信息和預(yù)設(shè)的數(shù)據(jù)信息分類樣本確定所述待分類數(shù)據(jù)信息的目標(biāo)類別,所述數(shù)據(jù)信息分類樣本中至少存儲(chǔ)有各類數(shù)據(jù)信息的樣本特征信息以及相應(yīng)于每一類數(shù)據(jù)信息的樣本特征信息所屬的類別。6.根據(jù)權(quán)利要求5所述的系統(tǒng),其中,所述目標(biāo)類別確定模塊包括: 相似度計(jì)算單元,用于計(jì)算所述特征信息與所述數(shù)據(jù)信息分類樣本中存儲(chǔ)的樣本特征信息的相似度; 目標(biāo)類別確定單元,用于確定最大相似度所對(duì)應(yīng)的樣本特征信息所屬的類別為所述特征信息所對(duì)應(yīng)的待分類數(shù)據(jù)信息的目標(biāo)類別。7.根據(jù)權(quán)利要求6所述的系統(tǒng),其中,所述特征信息至少包括數(shù)據(jù)信息名稱、數(shù)據(jù)信息圖片、數(shù)據(jù)信息文本信息;所述樣本特征信息至少包括樣本數(shù)據(jù)信息名稱、樣本數(shù)據(jù)信息圖片、樣本數(shù)據(jù)信息文本信息。8.根據(jù)權(quán)利要求7所述的系統(tǒng),其中,所述相似度計(jì)算單元包括: 第一相似度計(jì)算組件,用于根據(jù)所述數(shù)據(jù)信息名稱和所述樣本數(shù)據(jù)信息名稱確定第一相似度; 第二相似度計(jì)算組件,用于根據(jù)所述數(shù)據(jù)信息圖片和所述樣品數(shù)據(jù)信息圖片確定第二相似度; 第三相似度計(jì)算組件,用于根據(jù)所述數(shù)據(jù)信息文本信息和所述樣本數(shù)據(jù)信息文本信息確定第三相似度; 加權(quán)求和組件,用于對(duì)所述第一相似度、第二相似度和第三相似度進(jìn)行加權(quán)求和以確定所述相似度。
【文檔編號(hào)】G06Q30/06GK106096042SQ201610487619
【公開日】2016年11月9日
【申請日】2016年6月28日
【發(fā)明人】范興杰
【申請人】樂視控股(北京)有限公司, 樂視電子商務(wù)(北京)有限公司