貨物分類檢驗方法及檢驗裝置制造方法
【專利摘要】本發(fā)明揭示了一種貨物分類檢驗方法,包括如下的步驟:在已分類的貨物中提取貨物的標簽,從每一類的貨物中提取的標簽被歸類并與所述貨物的分類關(guān)聯(lián);對歸類后的標簽進行篩選,濾除標簽中的干擾信息;對篩選后的標簽進行統(tǒng)計,確定每一類的高頻標簽庫;獲取新貨物,提取新貨物的新標簽和新貨物的預(yù)分類;根據(jù)預(yù)分類選擇對應(yīng)的高頻標簽庫,比對高頻標簽庫中的標簽和新標簽;如果新標簽與高頻標簽庫中的標簽匹配,則發(fā)出檢驗通過信號。本發(fā)明還揭示了一種貨物分類檢驗方法。
【專利說明】貨物分類檢驗方法及檢驗裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及計算機輔助的檢驗【技術(shù)領(lǐng)域】,尤其涉及一種貨物分類檢驗方法及檢驗裝置。【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)購物越來越普及,各種類型的網(wǎng)絡(luò)購物網(wǎng)站也不斷興起。網(wǎng)絡(luò)購物能夠給人足不出戶的體驗,十分方便。為了使得網(wǎng)絡(luò)購物的體驗更加真實,也更有傳統(tǒng)實體店的購物感覺,購物網(wǎng)站會將網(wǎng)頁進行設(shè)計,使得各種貨物的介紹能夠被分別放置,形成類似實體店中柜臺和購物區(qū)域的感覺。
[0003]隨著網(wǎng)站規(guī)模的擴大,網(wǎng)頁的結(jié)構(gòu)會越來越復(fù)雜,在網(wǎng)頁上進行展示的商品也會越來越多。如同在實體店中物品會被擺錯位置一樣,在網(wǎng)頁上進行展示的貨物的介紹也有可能出現(xiàn)擺放錯誤的情況。這種錯誤多見的情況是放置在錯誤的類別下。比如,在“床上四件套”的類別下放置了 “三件套”的貨物介紹。或者在“筆記本電腦”的類別下放置了紙張筆記本的貨物介紹等等。這種錯誤的發(fā)生會給客戶的使用體驗帶來不便,也會給網(wǎng)站的管理和正常運行帶來困擾。在現(xiàn)有技術(shù)中,只能通過人工操作來發(fā)現(xiàn)并消除這些錯誤。人工操作的效率低下,并且容易發(fā)生疏漏的情況,這個問題給購物網(wǎng)站帶來了很大的困擾,因此業(yè)內(nèi)希望有能夠解決這個問題的方法。
【發(fā)明內(nèi)容】
[0004]本發(fā)明旨在提出一種實現(xiàn)簡便,準確有效的貨物分類檢驗技術(shù)。
[0005]根據(jù)本發(fā)明的一實施例,提出一種貨物分類檢驗方法,包括如下的步驟:
[0006]在已分類的貨物中提取貨物的標簽,從每一類的貨物中提取的標簽被歸類并與所述貨物的分類關(guān)聯(lián);
[0007]對歸類后的標簽進行篩選,濾除標簽中的干擾信息;
[0008]對篩選后的標簽進行統(tǒng)計,確定每一類的聞頻標簽庫;
[0009]獲取新貨物,提取新貨物的新標簽和新貨物的預(yù)分類;
[0010]根據(jù)預(yù)分類選擇對應(yīng)的聞頻標簽庫,比對聞頻標簽庫中的標簽和新標簽;
[0011]如果新標簽與高頻標簽庫中的標簽匹配,則發(fā)出檢驗通過信號。
[0012]在一個實施例中,確定每一類的高頻標簽庫包括累加每一個標簽出現(xiàn)的次數(shù),選取出現(xiàn)次數(shù)最多的五個標簽建立高頻標簽庫。
[0013]在一個實施例中,確定每一類的聞頻標簽庫還包括檢索每一類貨物的錯誤標簽庫,以及依據(jù)錯誤標簽庫對高頻標簽庫進行調(diào)整。
[0014]在一個實施例中,依據(jù)錯誤標簽庫對高頻標簽庫進行調(diào)整包括在高頻標簽庫中添加聞頻錯誤標簽。
[0015]在一個實施例中,如果新標簽與高頻標簽庫中的高頻錯誤標簽匹配,則發(fā)出錯誤信號;如果新標簽與高頻標簽庫中的高頻標簽和高頻錯誤標簽均不匹配,則發(fā)出警示信號。[0016]在一個實施例中,標簽是貨物名稱。
[0017]在一個實施例中,干擾信息包括對貨物名稱的修飾。
[0018]根據(jù)本發(fā)明的一實施例,提出一種貨物分類檢驗裝置,包括標簽提取裝置、標簽歸類裝置、標簽篩選裝置、高頻標簽庫和標簽對比裝置。標簽提取裝置在已分類的貨物中提取貨物的標簽,標簽提取裝置還提取新貨物的新標簽。標簽歸類裝置連接到標簽提取裝置,將從每一類的貨物中提取的標簽歸類并與所述貨物的分類關(guān)聯(lián)。標簽篩選裝置連接到標簽歸類裝置,對歸類后的標簽進行篩選,濾除標簽中的干擾信息。高頻標簽庫連接到標簽篩選裝置,對篩選后的標簽進行統(tǒng)計,形成每一類的高頻標簽庫。標簽比對裝置連接到標簽提取裝置和高頻標簽庫,標簽比對裝置從標簽提取裝置獲得新貨物的新標簽,并根據(jù)新貨物的預(yù)分類選擇對應(yīng)的高頻標簽庫,標簽比對裝置比對高頻標簽庫中的標簽和新標簽;如果新標簽與高頻標簽庫中的標簽匹配,標簽比對裝置發(fā)出檢驗通過信號。
[0019]在一個實施例中,高頻標簽庫包括累加器,累加器累加每一個標簽出現(xiàn)的次數(shù),選取出現(xiàn)次數(shù)最多的五個標簽建立高頻標簽庫。
[0020]在一個實施例中,高頻標簽庫連接到錯誤標簽庫和調(diào)整器。錯誤標簽庫記錄每一類貨物的錯誤標簽。調(diào)整器連接到錯誤標簽庫,調(diào)整器依據(jù)錯誤標簽庫對高頻標簽庫進行調(diào)整。
[0021 ] 在Iv實施例中,調(diào)整器在聞頻標簽庫中添加聞頻錯誤標簽。
[0022]在一個實施例中,標簽比對裝置比對新標簽與高頻標簽庫中的高頻錯誤標簽匹配,則標簽比對裝置發(fā)出錯誤信號;標簽比對裝置比對新標簽與高頻標簽庫中的高頻標簽和高頻錯誤標簽均不匹配,則標簽比對裝置發(fā)出警示信號。
[0023]在一個實施例中,標簽是貨物名稱。
[0024]在一個實施例中,干擾信息包括對貨物名稱的修飾。
[0025]本發(fā)明的貨物分類檢驗方法和貨物分類檢驗裝置由計算機輔助實現(xiàn)貨物分類的檢驗,取代了現(xiàn)有技術(shù)中的人工操作。該檢驗方法和檢驗裝置利用已分類的貨物作為依據(jù),建立每一個分類的高頻詞庫,可以避免大量詞庫的使用,降低了實現(xiàn)和維護成本。
【專利附圖】
【附圖說明】
[0026]圖1揭示了根據(jù)本發(fā)明的貨物分類檢驗方法的第一實施例的流程圖。
[0027]圖2揭示了根據(jù)本發(fā)明的貨物分類檢驗方法的第二實施例的流程圖。
[0028]圖3揭示了根據(jù)本發(fā)明的貨物分類檢驗裝置的第一實施例的結(jié)構(gòu)圖。
[0029]圖4揭示了根據(jù)本發(fā)明的貨物分類檢驗裝置的第二實施例的結(jié)構(gòu)圖。
【具體實施方式】
[0030]參考圖1所示,圖1揭示了根據(jù)本發(fā)明的貨物分類檢驗方法的第一實施例的流程圖。該貨物分類檢驗方法100包括如下的步驟:
[0031]102.在已分類的貨物中提取貨物的標簽,從每一類的貨物中提取的標簽被歸類并與貨物的分類關(guān)聯(lián)。步驟102是基于已經(jīng)進行分類的貨物而進行。在每一個分類中,提取該分類下的所有貨物并且獲取這些獲取的標簽。在一個實施例中,標簽是貨物名稱。已分類的貨物都是該分類下面正確的貨物,因此在步驟102中可以提取到每一個分類下的正確的貨物的標簽。這些被提取的標簽也會被分類,分類參照貨物的分類進行,并且標簽的分類與貨物的分類相關(guān)聯(lián)。
[0032]104.對歸類后的標簽進行篩選,濾除標簽中的干擾信息。如上面所述,因為標簽的一個實施例是貨物名稱,而對于網(wǎng)絡(luò)購物來說,通常會對貨物名稱進行修飾,以便于宣傳。這些修飾會對標簽造成干擾,因此,干擾信息是對貨物名稱的修飾。在步驟104中,會濾除這些修飾。比如“優(yōu)質(zhì)”、“豪華”等,干擾信息的濾除方式有如下的幾種:1)根據(jù)一個干擾信息庫,將干擾信息庫中的信息與標簽進行比對,濾除一些常見的形容詞和修飾用語。2)使用語義分析軟件對標簽進行語義分析,將標簽中的主體名詞提取出來,除了主體名詞意外的部分視為干擾信息濾除。3)對于個別罕見的干擾信息,以人工輔助的方式加以濾除。
[0033]106.對篩選后的標簽進彳丁統(tǒng)計,確定每一類的聞頻標簽庫。在個實施例中,步驟106執(zhí)行如下:累加每一個標簽出現(xiàn)的次數(shù),在對一個分類中的所有貨物的標簽完成統(tǒng)計后,選取出現(xiàn)次數(shù)最多的五個標簽建立高頻標簽庫。
[0034]108.獲取新貨物,提取新貨物的新標簽和新貨物的預(yù)分類。在獲得一個新貨物時,比如一個新貨物將被加入到網(wǎng)站并在網(wǎng)頁上進行展示的時候,提取該新貨物的新標簽,以及該新貨物的預(yù)分類。所謂的預(yù)分類是指該新貨物準備要被安排的分類。
[0035]110.根據(jù)預(yù)分類選擇對應(yīng)的聞頻標簽庫,比對聞頻標簽庫中的標簽和新標簽。在步驟110中對新貨物的預(yù)分類是否正確進行核實。核實的方式是將新標簽與對應(yīng)的高頻標簽庫中的標簽進行比對。
[0036]112.如果新標簽與高頻標簽庫中的標簽匹配,則發(fā)出檢驗通過信號。如果新標簽與高頻標簽庫中的某一個標簽匹配,則說明該新貨物的預(yù)分類是正確的,可以發(fā)出檢驗通過信號。
[0037]參考圖2所示,圖2揭示了根據(jù)本發(fā)明的貨物分類檢驗方法的第二實施例的流程圖。該貨物分類檢驗方法200與第一實施例的方法100相比,在確定高頻標簽庫的時候還考慮了常見的錯誤標簽。該貨物分類檢驗方法200包括如下的步驟:
[0038]202.在已分類的貨物中提取貨物的標簽,從每一類的貨物中提取的標簽被歸類并與貨物的分類關(guān)聯(lián)。步驟202是基于已經(jīng)進行分類的貨物而進行。在每一個分類中,提取該分類下的所有貨物并且獲取這些獲取的標簽。在一個實施例中,標簽是貨物名稱。已分類的貨物都是該分類下面正確的貨物,因此在步驟202中可以提取到每一個分類下的正確的貨物的標簽。這些被提取的標簽也會被分類,分類參照貨物的分類進行,并且標簽的分類與貨物的分類相關(guān)聯(lián)。
[0039]204.對歸類后的標簽進行篩選,濾除標簽中的干擾信息。如上面所述,因為標簽的一個實施例是貨物名稱,而對于網(wǎng)絡(luò)購物來說,通常會對貨物名稱進行修飾,以便于宣傳。這些修飾會對標簽造成干擾,因此,干擾信息是對貨物名稱的修飾。在步驟204中,會濾除這些修飾。比如“優(yōu)質(zhì)”、“豪華”等,干擾信息的濾除方式有如下的幾種:1)根據(jù)一個干擾信息庫,將干擾信息庫中的信息與標簽進行比對,濾除一些常見的形容詞和修飾用語。2)使用語義分析軟件對標簽進行語義分析,將標簽中的主體名詞提取出來,除了主體名詞意外的部分視為干擾信息濾除。3)對于個別罕見的干擾信息,以人工輔助的方式加以濾除。
[0040]206.對篩選后的標簽進彳丁統(tǒng)計,確定每一類的聞頻標簽庫。在個實施例中,步驟206執(zhí)行如下:累加每一個標簽出現(xiàn)的次數(shù),在對一個分類中的所有貨物的標簽完成統(tǒng)計后,選取出現(xiàn)次數(shù)最多的五個標簽建立高頻標簽庫。檢索每一類貨物的錯誤標簽庫,以及依據(jù)錯誤標簽庫對高頻標簽庫進行調(diào)整。比如,依據(jù)錯誤標簽庫對高頻標簽庫進行調(diào)整包括在高頻標簽庫中添加高頻錯誤標簽。根據(jù)步驟206得到的高頻標簽庫中不但包括了五個出現(xiàn)次數(shù)最多的標簽(正確標簽),還包括聞頻錯誤標簽,在聞頻標簽庫中增加聞頻錯誤標簽的目的是為了使得對于標簽的檢驗更加具有針對性。
[0041]208.獲取新貨物,提取新貨物的新標簽和新貨物的預(yù)分類。在獲得一個新貨物時,比如一個新貨物將被加入到網(wǎng)站并在網(wǎng)頁上進行展示的時候,提取該新貨物的新標簽,以及該新貨物的預(yù)分類。所謂的預(yù)分類是指該新貨物準備要被安排的分類。
[0042]210.根據(jù)預(yù)分類選擇對應(yīng)的聞頻標簽庫,比對聞頻標簽庫中的標簽和新標簽。在步驟210中對新貨物的預(yù)分類是否正確進行核實。核實的方式是將新標簽與對應(yīng)的高頻標簽庫中的標簽,包括正確標簽和錯誤標簽進行比對。
[0043]212.如果新標簽與高頻標簽庫中的標簽匹配,則發(fā)出檢驗通過信號。如果新標簽與高頻標簽庫中的高頻錯誤標簽匹配,則發(fā)出錯誤信號。如果新標簽與高頻標簽庫中的高頻標簽和高頻錯誤標簽均不匹配,則發(fā)出警示信號。在步驟212中,會根據(jù)比對檢驗的結(jié)果發(fā)出三種不同的信號:
[0044]I)如果新標簽與高頻標簽庫中的某一個標簽匹配,則說明該新貨物的預(yù)分類是正確的,可以發(fā)出檢驗通過信號。
[0045]2)如果新標簽與高頻標簽庫中記錄的高頻錯誤標簽匹配,則說明該新貨物的預(yù)分類是一個典型的錯誤分類,相應(yīng)地發(fā)出錯誤信號。
[0046]3)如果新標簽與高頻標簽庫中所記錄的所有標簽均不匹配,則需要進行進一步核實,發(fā)出警示信號。
[0047]圖3揭示了根據(jù)本發(fā)明的貨物分類檢驗裝置的第一實施例的結(jié)構(gòu)圖。如圖3所示,該貨物分類檢驗裝置300包括標簽提取裝置302、標簽歸類裝置304、標簽篩選裝置306、高頻標簽庫308和標簽對比裝置310。
[0048]標簽提取裝置302在已分類的貨物中提取貨物的標簽,標簽提取裝置302還提取新貨物的新標簽。在一個實施例中,標簽提取裝置302提取的標簽是貨物名稱。
[0049]標簽歸類裝置304連接到標簽提取裝置302,標簽歸類裝置304將從每一類的貨物中提取的標簽歸類并與貨物的分類關(guān)聯(lián)。標簽歸類裝置304的作用是對提取的標簽進行歸類。標簽提取裝置302所提取的一部分標簽是在已分類的貨物中提取標簽,在每一個分類中,提取該分類下的所有貨物并且獲取這些獲取的標簽。已分類的貨物都是該分類下面正確的貨物,因此可以提取到每一個分類下的正確的貨物的標簽。標簽歸類裝置304對這些被提取的標簽進行分類,分類參照貨物的分類進行,并且標簽的分類與貨物的分類相關(guān)聯(lián)。
[0050]標簽篩選裝置306連接到標簽歸類裝置304,標簽篩選裝置306對歸類后的標簽進行篩選,濾除標簽中的干擾信息。如上面所述,因為標簽的一個實施例是貨物名稱,而對于網(wǎng)絡(luò)購物來說,通常會對貨物名稱進行修飾,以便于宣傳。這些修飾會對標簽造成干擾,因此,干擾信息是對貨物名稱的修飾。標簽篩選裝置306的作用是濾除這些修飾。比如“優(yōu)質(zhì)”、“豪華”等。標簽篩選裝置306使用如下的幾種方式來濾除干擾信息:根據(jù)一個干擾信息庫,將干擾信息庫中的信息與標簽進行比對,濾除一些常見的形容詞和修飾用語。2)使用語義分析軟件對標簽進行語義分析,將標簽中的主體名詞提取出來,除了主體名詞意外的部分視為干擾信息濾除。
[0051]聞頻標簽庫308連接到標簽篩選裝直306。聞頻標簽庫308對篩選后的標簽進打統(tǒng)計,形成每一類的聞頻標簽庫。在圖3所不的實施例中,聞頻標簽庫308包括累加器380,累加器380累加每一個標簽出現(xiàn)的次數(shù),選取出現(xiàn)次數(shù)最多的五個標簽建立高頻標簽庫。
[0052]標簽比對裝置310連接到標簽提取裝置302和高頻標簽庫308。標簽比對裝置310從標簽提取裝置302獲得新貨物的新標簽,并根據(jù)新貨物的預(yù)分類選擇對應(yīng)的高頻標簽庫308。在獲得一個新貨物時,比如一個新貨物將被加入到網(wǎng)站并在網(wǎng)頁上進行展示的時候,標簽提取裝置302會提取該新貨物的新標簽,以及該新貨物的預(yù)分類。所謂的預(yù)分類是指該新貨物準備要被安排的分類。對新貨物的預(yù)分類是否正確需要進行核實。核實的方式是由標簽比對裝置310將新標簽與對應(yīng)的高頻標簽庫308中的標簽進行比對。標簽比對裝置310比對聞頻標簽庫308中的標簽和新標簽。如果新標簽與聞頻標簽庫308中的標簽匹配,標簽比對裝置310發(fā)出檢驗通過信號。如果新標簽與高頻標簽庫中的某一個標簽匹配,則說明該新貨物的預(yù)分類是正確的,可以發(fā)出檢驗通過信號。
[0053]圖4揭示了根據(jù)本發(fā)明的貨物分類檢驗裝置的第二實施例的結(jié)構(gòu)圖。如圖4所示,該貨物分類檢驗裝置400包括標簽提取裝置402、標簽歸類裝置404、標簽篩選裝置406、高頻標簽庫408和標簽對比裝置410。該貨物分類檢驗裝置400與第一實施例的裝置300相匕匕,聞頻標簽庫408中除了包含正確的聞頻標簽意外,還包括了聞頻錯誤標簽。
[0054]標簽提取裝置402在已分類的貨物中提取貨物的標簽,標簽提取裝置402還提取新貨物的新標簽。在一個實施例中,標簽提取裝置402提取的標簽是貨物名稱。
[0055]標簽歸類裝置404連接到標簽提取裝置402,標簽歸類裝置404將從每一類的貨物中提取的標簽歸類并與貨物的分類關(guān)聯(lián)。標簽歸類裝置404的作用是對提取的標簽進行歸類。標簽提取裝置402所提取的一部分標簽是在已分類的貨物中提取標簽,在每一個分類中,提取該分類下的所有貨物并且獲取這些獲取的標簽。已分類的貨物都是該分類下面正確的貨物,因此可以提取到每一個分類下的正確的貨物的標簽。標簽歸類裝置404對這些被提取的標簽進行分類,分類參照貨物的分類進行,并且標簽的分類與貨物的分類相關(guān)聯(lián)。
[0056]標簽篩選裝置406連接到標簽歸類裝置404,標簽篩選裝置406對歸類后的標簽進行篩選,濾除標簽中的干擾信息。如上面所述,因為標簽的一個實施例是貨物名稱,而對于網(wǎng)絡(luò)購物來說,通常會對貨物名稱進行修飾,以便于宣傳。這些修飾會對標簽造成干擾,因此,干擾信息是對貨物名稱的修飾。標簽篩選裝置406的作用是濾除這些修飾。比如“優(yōu)質(zhì)”、“豪華”等。標簽篩選裝置406使用如下的幾種方式來濾除干擾信息:根據(jù)一個干擾信息庫,將干擾信息庫中的信息與標簽進行比對,濾除一些常見的形容詞和修飾用語。2)使用語義分析軟件對標簽進行語義分析,將標簽中的主體名詞提取出來,除了主體名詞意外的部分視為干擾信息濾除。
[0057]聞頻標簽庫408連接到標簽篩選裝直406。聞頻標簽庫408對篩選后的標簽進打統(tǒng)計,形成每一類的聞頻標簽庫。在圖4所不的實施例中,聞頻標簽庫408包括累加器480。累加器480累加每一個標簽出現(xiàn)的次數(shù),選取出現(xiàn)次數(shù)最多的五個標簽建立高頻標簽庫。在圖4所示的實施例中,高頻標簽庫408連接到錯誤標簽庫481和調(diào)整器482。錯誤標簽庫481記錄每一類貨物的錯誤標簽。調(diào)整器482連接到錯誤標簽庫481,調(diào)整器482依據(jù)錯誤標簽庫481對高頻標簽庫408進行調(diào)整。在一個實施例中,調(diào)整器482在高頻標簽庫408中添加高頻錯誤標簽。在圖4所示的實施例中,高頻標簽庫408中不但包括了五個出現(xiàn)次數(shù)最多的標簽(正確標簽),還包括聞頻錯誤標簽,在聞頻標簽庫408中增加聞頻錯誤標簽的目的是為了使得對于標簽的檢驗更加具有針對性。
[0058]標簽比對裝置410連接到標簽提取裝置402和高頻標簽庫408。標簽比對裝置410從標簽提取裝置402獲得新貨物的新標簽,并根據(jù)新貨物的預(yù)分類選擇對應(yīng)的高頻標簽庫408。在獲得一個新貨物時,比如一個新貨物將被加入到網(wǎng)站并在網(wǎng)頁上進行展示的時候,標簽提取裝置402會提取該新貨物的新標簽,以及該新貨物的預(yù)分類。所謂的預(yù)分類是指該新貨物準備要被安排的分類。對新貨物的預(yù)分類是否正確需要進行核實。核實的方式是由標簽比對裝置410將新標簽與對應(yīng)的高頻標簽庫408中的標簽進行比對。標簽比對裝置410比對聞頻標簽庫408中的標簽和新標簽。在圖4所不的實施例中,標簽比對裝直410存在三種不同的比對結(jié)果:
[0059]I)如果新標簽與高頻標簽庫408中的標簽(正確標簽)匹配,標簽比對裝置410發(fā)出檢驗通過信號。如果新標簽與高頻標簽庫中的某一個標簽匹配,則說明該新貨物的預(yù)分類是正確的,可以發(fā)出檢驗通過信號。
[0060]2)如果新標簽與高頻標簽庫408中的高頻錯誤標簽比配,則說明該新貨物的預(yù)分類是一個典型的錯誤分類,標簽比對裝置410發(fā)出錯誤信號。
[0061]3)如果新標簽與聞頻標簽庫408中的聞頻標簽和聞頻錯誤標簽均不匹配,則需要進行進一步核實,標簽比對裝置410發(fā)出警示信號。
[0062]本發(fā)明的貨物分類檢驗方法和貨物分類檢驗裝置由計算機輔助實現(xiàn)貨物分類的檢驗,取代了現(xiàn)有技術(shù)中的人工操作。該檢驗方法和檢驗裝置利用已分類的貨物作為依據(jù),建立每一個分類的高頻詞庫,可以避免大量詞庫的使用,降低了實現(xiàn)和維護成本。
【權(quán)利要求】
1.一種貨物分類檢驗方法,其特征在于,包括: 在已分類的貨物中提取貨物的標簽,從每一類的貨物中提取的標簽被歸類并與所述貨物的分類關(guān)聯(lián); 對歸類后的標簽進行篩選,濾除標簽中的干擾信息; 對篩選后的標簽進行統(tǒng)計,確定每一類的聞頻標簽庫; 獲取新貨物,提取新貨物的新標簽和新貨物的預(yù)分類; 根據(jù)預(yù)分類選擇對應(yīng)的高頻標簽庫,比對高頻標簽庫中的標簽和新標簽; 如果新標簽與高頻標簽庫中的標簽匹配,則發(fā)出檢驗通過信號。
2.如權(quán)利要求1所述的貨物分類檢驗方法,其特征在于,確定每一類的高頻標簽庫包括: 累加每一個標簽出現(xiàn)的次數(shù),選取出現(xiàn)次數(shù)最多的五個標簽建立高頻標簽庫。
3.如權(quán)利要求2所述的貨物分類檢驗方法,其特征在于,確定每一類的高頻標簽庫還包括: 檢索每一類貨物的錯誤標簽庫; 依據(jù)錯誤標簽庫對聞頻標簽庫進行調(diào)整。
4.如權(quán)利要求3所述的貨物分類檢驗方法,其特征在于,所述依據(jù)錯誤標簽庫對高頻標簽庫進行調(diào)整包括在聞頻標簽庫中添加聞頻錯誤標簽。
5.如權(quán)利要求4所述的貨物分類檢驗方法,其特征在于, 如果新標簽與高頻標簽庫中的高頻錯誤標簽匹配,則發(fā)出錯誤信號; 如果新標簽與高頻標簽庫中的高頻標簽和高頻錯誤標簽均不匹配,則發(fā)出警示信號。
6.如權(quán)利要求1所述的貨物分類檢驗方法,其特征在于,所述標簽是貨物名稱。
7.如權(quán)利要求6所述的貨物分類檢驗方法,其特征在于,所述干擾信息包括對貨物名稱的修飾。
8.—種貨物分類檢驗裝置,其特征在于,包括: 標簽提取裝置,在已分類的貨物中提取貨物的標簽,標簽提取裝置還提取新貨物的新標簽; 標簽歸類裝置,連接到標簽提取裝置,將從每一類的貨物中提取的標簽歸類并與所述貨物的分類關(guān)聯(lián); 標簽篩選裝置,連接到標簽歸類裝置,對歸類后的標簽進行篩選,濾除標簽中的干擾信息; 高頻標簽庫,連接到標簽篩選裝置,對篩選后的標簽進行統(tǒng)計,形成每一類的高頻標簽庫; 標簽比對裝置,連接到標簽提取裝置和高頻標簽庫,標簽比對裝置從標簽提取裝置獲得新貨物的新標簽,并根據(jù)新貨物的預(yù)分類選擇對應(yīng)的高頻標簽庫,標簽比對裝置比對高頻標簽庫中的標簽和新標簽;如果新標簽與高頻標簽庫中的標簽匹配,標簽比對裝置發(fā)出檢驗通過信號。
9.如權(quán)利要求8所述的貨物分類檢驗裝置,其特征在于,高頻標簽庫包括: 累加器,累加器累加每一個標簽出現(xiàn)的次數(shù),選取出現(xiàn)次數(shù)最多的五個標簽建立高頻標簽庫。
10.如權(quán)利要求9所述的貨物分類檢驗裝置,其特征在于,高頻標簽庫連接到錯誤標簽庫和調(diào)整器, 錯誤標簽庫記錄每一類貨物的錯誤標簽; 調(diào)整器連接到錯誤標簽庫,調(diào)整器依據(jù)錯誤標簽庫對高頻標簽庫進行調(diào)整。
11.如權(quán)利要求10所述的貨物分類檢驗裝置,其特征在于,所述調(diào)整器在高頻標簽庫中添加聞頻錯誤標簽。
12.如權(quán)利要求11所述的貨物分類檢驗裝置,其特征在于, 標簽比對裝置比對新標簽與高頻標簽庫中的高頻錯誤標簽匹配,則標簽比對裝置發(fā)出錯誤信號; 標簽比對裝直比對新標簽與聞頻標簽庫中的聞頻標簽和聞頻錯誤標簽均不匹配,則標簽比對裝置發(fā)出警示信號。
13.如權(quán)利要求8所述的貨物分類檢驗裝置,其特征在于,所述標簽是貨物名稱。
14.如權(quán)利要求13所述的貨物分類檢驗裝置,其特征在于,所述干擾信息包括對貨物名稱的修飾。
【文檔編號】G06F17/30GK104008101SQ201310056267
【公開日】2014年8月27日 申請日期:2013年2月21日 優(yōu)先權(quán)日:2013年2月21日
【發(fā)明者】陳璐 申請人:紐海信息技術(shù)(上海)有限公司