系術(shù)語(yǔ)僅僅用來(lái)將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開(kāi)來(lái),而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語(yǔ)“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過(guò)程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒(méi)有明確列出的其他要素,或者是還包括為這種過(guò)程、方法、物品或者設(shè)備所固有的要素。在沒(méi)有更多限制的情況下,由語(yǔ)句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過(guò)程、方法、物品或者設(shè)備中還存在另外的相同要素。
[0102]對(duì)所公開(kāi)的實(shí)施例的上述說(shuō)明,使本領(lǐng)域技術(shù)人員能夠?qū)崿F(xiàn)或使用本發(fā)明。對(duì)這些實(shí)施例的多種修改對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)將是顯而易見(jiàn)的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實(shí)施例中實(shí)現(xiàn)。因此,本發(fā)明將不會(huì)被限制于本文所示的這些實(shí)施例,而是要符合與本文所公開(kāi)的原理和新穎特點(diǎn)相一致的最寬的范圍。
[0103]以上所述僅是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。
【主權(quán)項(xiàng)】
1.一種信息匹配方法,其特征在于,所述方法包括: 對(duì)用戶輸入的關(guān)鍵詞以及基于所述搜索關(guān)鍵詞選取的篩選詞進(jìn)行組合,得到搜索詞組; 基于所述搜索詞組,與客戶端的內(nèi)存中存儲(chǔ)的每條第一摘要信息進(jìn)行匹配,得到第一匹配結(jié)果,其中所述第一摘要信息是對(duì)內(nèi)存中存儲(chǔ)的每條原始信息進(jìn)行語(yǔ)義分析后分詞重組的信息; 當(dāng)所述第一匹配結(jié)果表明所述內(nèi)存中存在與所述搜索詞組匹配的第一摘要信息時(shí),將所述第一摘要信息對(duì)應(yīng)的原始信息進(jìn)行展示; 當(dāng)所述第一匹配結(jié)果表明所述內(nèi)存中不存在與所述搜索詞組匹配的第一摘要信息時(shí),基于所述搜索詞組與客戶端的磁盤(pán)中存儲(chǔ)的每條第二摘要信息進(jìn)行匹配,得到第二匹配結(jié)果,其中所述第二摘要信息是對(duì)磁盤(pán)中存儲(chǔ)的每條原始信息進(jìn)行語(yǔ)義分析后分詞重組的信息,且所述第一摘要信息為從所述磁盤(pán)中提取出的匹配次數(shù)大于第一預(yù)設(shè)次數(shù)的第二摘要信息; 當(dāng)所述第二匹配結(jié)果表明所述磁盤(pán)中存在與所述搜索詞組匹配的第二摘要信息時(shí),展示所述第二摘要信息對(duì)應(yīng)的所述原始信息; 當(dāng)所述第二匹配結(jié)果表明所述磁盤(pán)中不存在與所述搜索詞組匹配的第二摘要信息時(shí),向與所述客戶端通信的服務(wù)器發(fā)送搜索請(qǐng)求,由所述服務(wù)器基于所述搜索詞組與所述服務(wù)器內(nèi)的多個(gè)分區(qū)中存儲(chǔ)的每條第三摘要信息進(jìn)行并行匹配,其中所述第三摘要信息是對(duì)分區(qū)中存儲(chǔ)的每條原始信息進(jìn)行語(yǔ)義分析后分詞重組的信息,且所述第二摘要信息為從所述服務(wù)器中提取出的匹配次數(shù)大于第二預(yù)設(shè)次數(shù)的第三摘要信息。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:當(dāng)所述第一匹配結(jié)果表明所述內(nèi)存中存在所述搜索詞組匹配的第一摘要信息時(shí),對(duì)所述第一摘要信息的匹配次數(shù)進(jìn)行更新。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法還包括:當(dāng)所述第二匹配結(jié)果表明所述磁盤(pán)中存在所述搜索詞組匹配的第二摘要信息時(shí),對(duì)所述第二摘要信息的匹配次數(shù)進(jìn)行更新; 基于更新后的每條第二摘要信息的匹配次數(shù),將匹配次數(shù)大于第一預(yù)設(shè)次數(shù)的第二摘要信息標(biāo)識(shí)為所述第一摘要信息添加至所述內(nèi)存中; 獲取添加至所述內(nèi)存中的所述第一摘要信息的個(gè)數(shù),基于所述個(gè)數(shù)從所述匹配次數(shù)排序的最后一位開(kāi)始選取第一摘要信息為第二摘要信息添加至所述磁盤(pán)中,所選取的所述第一摘要信息的個(gè)數(shù)為添加至內(nèi)存中的第二摘要信息的個(gè)數(shù)。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:從所述磁盤(pán)中匹配次數(shù)排序的最后一位開(kāi)始,將所述磁盤(pán)中的第二摘要信息替換為所述服務(wù)器中匹配次數(shù)大于所述第二預(yù)設(shè)次數(shù)的第三摘要信息。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,預(yù)先為每條第三摘要信息分配一標(biāo)識(shí)符,所述方法還包括:基于所述標(biāo)識(shí)符確定更新的第三摘要信息,并將所述服務(wù)器中所述標(biāo)識(shí)符對(duì)應(yīng)的所述第三摘要信息進(jìn)行替換。
6.一種信息匹配裝置,其特征在于,所述裝置包括: 組合單元,用于對(duì)用戶輸入的關(guān)鍵詞以及基于所述搜索關(guān)鍵詞選取的篩選詞進(jìn)行組合,得到搜索詞組; 第一匹配單元,用于基于所述搜索詞組,與客戶端的內(nèi)存中存儲(chǔ)的每條第一摘要信息進(jìn)行匹配,得到第一匹配結(jié)果,其中所述第一摘要信息是對(duì)內(nèi)存中存儲(chǔ)的每條原始信息進(jìn)行語(yǔ)義分析后分詞重組的信息; 第一展示單元,用于當(dāng)所述第一匹配結(jié)果表明所述內(nèi)存中存在與所述搜索詞組匹配的第一摘要信息時(shí),將所述第一摘要信息對(duì)應(yīng)的原始信息進(jìn)行展示; 第二匹配單元,用于當(dāng)所述第一匹配結(jié)果表明所述內(nèi)存中不存在與所述搜索詞組匹配的第一摘要信息時(shí),基于所述搜索詞組與客戶端的磁盤(pán)中存儲(chǔ)的每條第二摘要信息進(jìn)行匹配,得到第二匹配結(jié)果,其中所述第二摘要信息是對(duì)磁盤(pán)中存儲(chǔ)的每條原始信息進(jìn)行語(yǔ)義分析后分詞重組的信息,且所述第一摘要信息為從所述磁盤(pán)中提取出的匹配次數(shù)大于第一預(yù)設(shè)次數(shù)的第二摘要信息; 第二展示單元,用于當(dāng)所述第二匹配結(jié)果表明所述磁盤(pán)中存在與所述搜索詞組匹配的第二摘要信息時(shí),展示所述第二摘要信息對(duì)應(yīng)的所述原始信息; 發(fā)送單元,用于當(dāng)所述第二匹配結(jié)果表明所述磁盤(pán)中不存在與所述搜索詞組匹配的第二摘要信息時(shí),向與所述客戶端通信的服務(wù)器發(fā)送搜索請(qǐng)求,由所述服務(wù)器基于所述搜索詞組與所述服務(wù)器內(nèi)的多個(gè)分區(qū)中存儲(chǔ)的每條第三摘要信息進(jìn)行并行匹配,其中所述第三摘要信息是對(duì)分區(qū)中存儲(chǔ)的每條原始信息進(jìn)行語(yǔ)義分析后分詞重組的信息,且所述第二摘要信息為從所述服務(wù)器中提取出的匹配次數(shù)大于第二預(yù)設(shè)次數(shù)的第三摘要信息。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括:第一更新單元,用于當(dāng)所述第一匹配結(jié)果表明所述內(nèi)存中存在所述搜索詞組匹配的第一摘要信息時(shí),對(duì)所述第一摘要信息的匹配次數(shù)進(jìn)行更新。
8.根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述裝置還包括:第二更新單元,用于當(dāng)所述第二匹配結(jié)果表明所述磁盤(pán)中存在所述搜索詞組匹配的第二摘要信息時(shí),對(duì)所述第二摘要信息的匹配次數(shù)進(jìn)行更新; 第一添加單元,用于基于更新后的每條第二摘要信息的匹配次數(shù),將匹配次數(shù)大于第一預(yù)設(shè)次數(shù)的第二摘要信息標(biāo)識(shí)為所述第一摘要信息添加至所述內(nèi)存中; 第二添加單元,用于獲取添加至所述內(nèi)存中的所述第一摘要信息的個(gè)數(shù),基于所述個(gè)數(shù)從所述匹配次數(shù)排序的最后一位開(kāi)始選取第一摘要信息為第二摘要信息添加至所述磁盤(pán)中,所選取的所述第一摘要信息的個(gè)數(shù)為添加至內(nèi)存中的第二摘要信息的個(gè)數(shù)。
9.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括:替換單元,用于從所述磁盤(pán)中匹配次數(shù)排序的最后一位開(kāi)始,將所述磁盤(pán)中的第二摘要信息替換為所述服務(wù)器中匹配次數(shù)大于所述第二預(yù)設(shè)次數(shù)的第三摘要信息。
10.根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述裝置還包括:分配單元,用于預(yù)先為每條第三摘要信息分配一標(biāo)識(shí)符; 確定單元,用于基于所述標(biāo)識(shí)符確定更新的第三摘要信息,并將所述服務(wù)器中所述標(biāo)識(shí)符對(duì)應(yīng)的所述第三摘要信息進(jìn)行替換。
【專利摘要】本發(fā)明提供一種信息匹配方法及裝置,可以基于語(yǔ)義進(jìn)行分詞得到各個(gè)摘要信息,從而能夠基于原始信息建立適當(dāng)?shù)恼畔?,提高匹配?zhǔn)確度和召回率。對(duì)于歷史的匹配結(jié)果如第一摘要信息和第二摘要信息采用了基于內(nèi)存和磁盤(pán)的分布式存儲(chǔ)方式,這樣在匹配時(shí)可以優(yōu)先從內(nèi)存再到磁盤(pán)進(jìn)行匹配以提高匹配速度,并且服務(wù)器側(cè)也可以基于搜索請(qǐng)求進(jìn)行多分區(qū)的并行匹配,使得服務(wù)器側(cè)可以處理近1000倍的并發(fā)請(qǐng)求量,進(jìn)一步提高匹配速度。
【IPC分類】G06F17-27, G06F17-30
【公開(kāi)號(hào)】CN104794227
【申請(qǐng)?zhí)枴緾N201510219260
【發(fā)明人】劉建輝, 文帥營(yíng), 王華偉
【申請(qǐng)人】鄭州悉知信息技術(shù)有限公司
【公開(kāi)日】2015年7月22日
【申請(qǐng)日】2015年5月4日