国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      一種聊天信息的檢索方法及檢索系統(tǒng)的制作方法

      文檔序號(hào):6609647閱讀:281來(lái)源:國(guó)知局
      專利名稱:一種聊天信息的檢索方法及檢索系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及即時(shí)通訊領(lǐng)域,特別是涉及一種聊天信息的檢索方法及檢索系統(tǒng)。
      背景技術(shù)
      網(wǎng)絡(luò)即時(shí)通訊系統(tǒng)是人們?cè)诰W(wǎng)上進(jìn)行溝通、聯(lián)系的重要工具之一。許多用戶在固定的客戶端使用某一即時(shí)通訊系統(tǒng)與好友溝通,一段時(shí)間后,即時(shí)通訊系統(tǒng)就積累了相當(dāng)數(shù)量的聊天信息。如果該用戶還加入一些人數(shù)較多的群組,聊天信息在短時(shí)間就可能達(dá)到幾十萬(wàn)、甚至上百萬(wàn)條。用戶有時(shí)要在以往的聊天信息中檢索所需信息,這就需要一種針對(duì)聊天信息的檢索方法,能夠在數(shù)據(jù)量龐大的聊天信息中準(zhǔn)確、迅速地檢索到所需信息。
      參閱圖1,為現(xiàn)有的聊天信息的檢索方法流程圖,具體步驟如下所述。
      步驟S101、將用戶的聊天信息保存到數(shù)據(jù)庫(kù)中。
      即時(shí)通訊系統(tǒng)將用戶所有的聊天信息保存到一個(gè)固定的數(shù)據(jù)庫(kù)中,并將該數(shù)據(jù)庫(kù)與檢索系統(tǒng)建立鏈接。
      步驟S102、用戶使用關(guān)鍵詞進(jìn)行檢索。
      用戶啟動(dòng)檢索系統(tǒng),輸入檢索關(guān)鍵詞,在保存聊天信息的數(shù)據(jù)庫(kù)中進(jìn)行檢索。如,用戶輸入關(guān)鍵詞“買房”進(jìn)行檢索。
      步驟S103、檢索系統(tǒng)遍歷所有的聊天信息,查找與關(guān)鍵詞相匹配的聊天信息。
      為不漏掉所需的信息,檢索系統(tǒng)通常采用模糊匹配法,將與關(guān)鍵詞相關(guān)的信息都檢索出來(lái)。
      如,關(guān)鍵詞是“買房”,檢索系統(tǒng)將包括“買車”、“買禮品”、“住房”、“租房”等詞語(yǔ)的信息都檢索出來(lái),顯示給用戶。
      上述方法是在保存全部聊天信息的數(shù)據(jù)庫(kù)中進(jìn)行檢索,檢索時(shí),需掃描的數(shù)據(jù)量極其龐大,因此檢索速度相對(duì)較慢,有時(shí)要在10秒以上,造成用戶等待時(shí)間過(guò)長(zhǎng),降低用戶的體驗(yàn)感。

      發(fā)明內(nèi)容
      本發(fā)明所要解決的技術(shù)問題是提供一種聊天信息的檢索方法,該方法能夠快速在聊天信息中檢索到所需信息,減少用戶的等待時(shí)間,提高用戶的體驗(yàn)感。
      本發(fā)明的另一個(gè)目的是提供一種聊天信息的檢索系統(tǒng),該系統(tǒng)能夠快速在聊天信息中檢索到所需信息,減少用戶的等待時(shí)間,提高用戶的體驗(yàn)感。
      本發(fā)明公開一種聊天信息的檢索方法,包括將預(yù)設(shè)數(shù)量的聊天信息處理成索引文件,記錄所述索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系;將所述索引詞保存到創(chuàng)建的第一索引庫(kù);在所述第一索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞;獲取該索引詞對(duì)應(yīng)的序號(hào),并調(diào)取該序號(hào)對(duì)應(yīng)的聊天信息。
      優(yōu)選的,還包括將達(dá)到預(yù)置數(shù)量的新生成聊天信息處理成索引文件;記錄上述索引文件的索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系;將上述索引詞保存到創(chuàng)建的第二索引庫(kù)。
      優(yōu)選的,還包括在第二索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞。
      優(yōu)選的,還包括合并第一索引庫(kù)與第二索引庫(kù),作為第一索引庫(kù)。
      優(yōu)選的,還包括獲取沒有建立索引的聊天信息;在上述聊天信息中調(diào)取包含檢索關(guān)鍵詞的聊天信息。
      優(yōu)選的,按下述步驟,將預(yù)設(shè)數(shù)量的聊天信息處理成索引文件在聊天信息中不重復(fù)地提取各個(gè)詞語(yǔ),并將上述各個(gè)詞語(yǔ)與包含該詞語(yǔ)的聊天信息的序號(hào)建立對(duì)應(yīng)關(guān)系。
      優(yōu)選的,調(diào)取該序號(hào)對(duì)應(yīng)的聊天信息之后,還包括調(diào)取該聊天信息之前及之后設(shè)置數(shù)量的聊天信息。
      優(yōu)選的,還包括對(duì)索引文件中的索引詞進(jìn)行加密處理。
      本發(fā)明還公開一種聊天信息的檢索系統(tǒng),包括索引文件處理單元、第一索引詞保存單元、檢索單元、及聊天信息獲取單元所述索引文件處理單元,用于將預(yù)設(shè)數(shù)量的聊天信息處理成索引文件,記錄所述索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系;所述第一索引詞保存單元,用于將所述索引詞保存到創(chuàng)建的第一索引庫(kù);所述檢索單元,用于在所述第一索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞;所述聊天信息獲取單元,用于獲取該索引詞對(duì)應(yīng)的序號(hào),并調(diào)取該序號(hào)對(duì)應(yīng)的聊天信息。
      優(yōu)選的,還包括聊天信息發(fā)送單元,用于將達(dá)到預(yù)置數(shù)量的、新生成的聊天信息發(fā)送到所述索引文件處理單元;所述第二索引詞保存單元,用于將所述索引文件處理單元返回的索引詞保存到創(chuàng)建的第二索引庫(kù)。
      與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點(diǎn)本發(fā)明將預(yù)設(shè)數(shù)量的聊天信息處理成索引文件,記錄所述索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系,將索引詞保存到創(chuàng)建的第一索引庫(kù),在第一索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞,獲取該索引詞對(duì)應(yīng)的序號(hào),并調(diào)取該序號(hào)對(duì)應(yīng)的聊天信息。檢索時(shí),本發(fā)明是在第一索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞,再根據(jù)該索引詞對(duì)應(yīng)的聊天信息序號(hào)調(diào)取聊天信息。相對(duì)于現(xiàn)有技術(shù)在保存全部聊天信息的數(shù)據(jù)庫(kù)中查找包含檢索關(guān)鍵詞的聊天信息,本發(fā)明因第一索引庫(kù)只保存預(yù)設(shè)數(shù)量聊天信息的索引詞,其數(shù)據(jù)量相對(duì)較小,系統(tǒng)在檢索時(shí)所需掃描的數(shù)據(jù)量相對(duì)較少,因此檢索時(shí)間就相對(duì)較短,使用戶等待的時(shí)間減少,提高用戶的體驗(yàn)感。


      圖1為現(xiàn)有的聊天信息的檢索方法流程圖;圖2為本發(fā)明第一實(shí)施例提供的聊天信息的檢索方法流程圖;圖3為本發(fā)明第二實(shí)施例提供的聊天信息的檢索方法流程圖;圖4為本發(fā)明第三實(shí)施例提供的聊天信息的檢索方法流程圖;圖5為本發(fā)明第四實(shí)施例提供的聊天信息的檢索方法流程圖;圖6為本發(fā)明第五實(shí)施例提供的聊天信息的檢索系統(tǒng)示意圖;圖7為本發(fā)明第六實(shí)施例提供的聊天信息的檢索系統(tǒng)示意圖。
      具體實(shí)施例方式
      為使本發(fā)明的上述目的、特征和優(yōu)點(diǎn)能夠更加明顯易懂,下面結(jié)合附圖和具體實(shí)施方式
      對(duì)本發(fā)明作進(jìn)一步詳細(xì)的說(shuō)明。
      本發(fā)明將預(yù)設(shè)數(shù)量的聊天信息處理成索引文件,記錄所述索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系,將索引詞保存到創(chuàng)建的第一索引庫(kù),在第一索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞,獲取該索引詞對(duì)應(yīng)的序號(hào),并調(diào)取該序號(hào)對(duì)應(yīng)的聊天信息。
      參照?qǐng)D2,為本發(fā)明第一實(shí)施例提供的聊天信息的檢索方法流程圖,具體步驟如下所述。
      步驟S201、將預(yù)設(shè)數(shù)量的聊天信息處理成索引文件。
      即時(shí)通訊系統(tǒng)中的聊天系統(tǒng)將預(yù)設(shè)數(shù)量的、生成時(shí)間相對(duì)靠前的聊天信息發(fā)送給索引系統(tǒng),索引系統(tǒng)在聊天信息中不重復(fù)地提取各個(gè)詞語(yǔ),并將上述各個(gè)詞語(yǔ)與包含該詞語(yǔ)的聊天信息的序號(hào)建立對(duì)應(yīng)關(guān)系。上述各個(gè)詞語(yǔ)作為索引詞,將索引詞與聊天信息序號(hào)建立對(duì)應(yīng)關(guān)系的聊天信息作為索引文件。
      聊天信息包括文字記錄、生成時(shí)間、及發(fā)送用戶和接收用戶,每條聊天信息都對(duì)應(yīng)一個(gè)唯一的序號(hào)。序號(hào)可以按聊天信息的生成時(shí)間順序排列。預(yù)設(shè)數(shù)量為1萬(wàn)條聊天信息。
      步驟S202、記錄索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系。
      每個(gè)索引詞可能對(duì)應(yīng)一個(gè)或多個(gè)聊天信息序號(hào)。索引系統(tǒng)記錄各個(gè)索引詞與聊天信息序號(hào)的對(duì)應(yīng)關(guān)系,并保存該對(duì)應(yīng)關(guān)系。
      步驟S203、將索引詞保存到創(chuàng)建的第一索引庫(kù)。
      創(chuàng)建一用于保存索引詞的數(shù)據(jù)庫(kù),作為第一索引庫(kù)。將索引詞按一定的順序保存在第一索引庫(kù)。一定的順序包括按索引詞首個(gè)字母的排序、按索引詞字?jǐn)?shù)排序、及按索引詞的筆畫排序等方式。為保證聊天信息的保密性,本發(fā)明對(duì)索引詞進(jìn)行加密,加密后再保存到第一索引庫(kù)。
      步驟S204、在第一索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞。
      檢索時(shí),系統(tǒng)獲取檢索關(guān)鍵詞,在第一索引庫(kù)中查找與該檢索關(guān)鍵詞相匹配的索引詞。相匹配是指索引詞與檢索關(guān)鍵詞相同。
      步驟S205、獲取該索引詞對(duì)應(yīng)的序號(hào),并調(diào)取該序號(hào)對(duì)應(yīng)的聊天信息。
      獲取查找到的索引詞對(duì)應(yīng)的聊天信息序號(hào),再調(diào)取上述序號(hào)對(duì)應(yīng)的聊天信息。
      本發(fā)明是在第一索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞,再根據(jù)該索引詞對(duì)應(yīng)的聊天信息序號(hào)調(diào)取聊天信息。因第一索引庫(kù)只保存預(yù)設(shè)數(shù)量聊天信息的索引詞,系統(tǒng)在檢索時(shí)所需掃描的數(shù)據(jù)量相對(duì)較少,因此檢索時(shí)間就相對(duì)較短,使用戶等待的時(shí)間減少,提高用戶的體驗(yàn)感。
      本發(fā)明即時(shí)通訊系統(tǒng)中的聊天系統(tǒng)在最新生成的聊天信息達(dá)到預(yù)置數(shù)量時(shí),將新生成的聊天信息發(fā)送到索引系統(tǒng),索引系統(tǒng)將接收到的聊天信息處理成索引文件。
      參照?qǐng)D3,為本發(fā)明第二實(shí)施例提供的聊天信息的檢索方法流程圖,具體步驟如下所述。
      步驟S301、將預(yù)設(shè)數(shù)量的聊天信息處理成索引文件。
      如,即時(shí)通訊系統(tǒng)中的聊天系統(tǒng)將序號(hào)A1到A10000的1萬(wàn)條聊天信息發(fā)送到索引系統(tǒng),索引系統(tǒng)在不重復(fù)地提取該1萬(wàn)條聊天信息所包含的全部詞語(yǔ),并將各個(gè)詞語(yǔ)與包含該詞語(yǔ)的聊天信息的序號(hào)建立對(duì)應(yīng)關(guān)系。例如,序號(hào)為A1、A16、A520、A634、A1206、A7265等6條聊天信息包含詞語(yǔ)“中國(guó)”,將“中國(guó)”與A1、A16、A520、A634、A1206、A7265等6個(gè)序號(hào)建立對(duì)應(yīng)關(guān)系。
      步驟S302、記錄索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系。
      如,將索引詞“中國(guó)”與A1、A16、A520、A634、A1206、A7265等6個(gè)序號(hào)相對(duì)應(yīng)的對(duì)應(yīng)關(guān)系記錄到保存聊天信息的數(shù)據(jù)庫(kù)。
      步驟S303、將索引詞保存到第一索引庫(kù)。
      如,將上述索引詞“中國(guó)”保存到創(chuàng)建的第一索引庫(kù)。
      步驟S304、將達(dá)到預(yù)置數(shù)量的新生成的聊天信息處理成索引文件。
      即時(shí)通訊系統(tǒng)在應(yīng)用時(shí),不斷生成聊天信息,當(dāng)其生成的聊天信息達(dá)到預(yù)置數(shù)量時(shí),聊天系統(tǒng)將這些新生成的聊天信息發(fā)送到索引系統(tǒng),索引系統(tǒng)將上述聊天信息處理成索引文件。預(yù)置數(shù)量?jī)?yōu)選為200條聊天信息。
      如,即時(shí)通訊系統(tǒng)中的聊天系統(tǒng)將序號(hào)B1到B200的200條聊天信息發(fā)送到索引系統(tǒng),索引系統(tǒng)不重復(fù)地提取該200條聊天信息中所包含的全部詞語(yǔ),并將各個(gè)詞語(yǔ)與包含該詞語(yǔ)的聊天信息的序號(hào)建立對(duì)應(yīng)關(guān)系。例如,序號(hào)為B1、B16、B35、B92等4條聊天信息包含詞語(yǔ)“中國(guó)”,將“中國(guó)”與B1、B16、B35、B92等4個(gè)序號(hào)建立對(duì)應(yīng)關(guān)系。
      步驟S305、記錄上述索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系。
      如,將詞語(yǔ)“中國(guó)”與B1、B16、B35、B92等4個(gè)序號(hào)相對(duì)應(yīng)的對(duì)應(yīng)關(guān)系記錄到保存聊天信息的數(shù)據(jù)庫(kù)。
      步驟S306、將上述索引詞保存到創(chuàng)建的第二索引庫(kù)。
      如,將上述索引詞“中國(guó)”保存到創(chuàng)建的第二索引庫(kù)。
      步驟S307、在第一索引庫(kù)和第二索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞。
      如,用戶輸入檢索關(guān)鍵詞“中國(guó)”,在第一索引庫(kù)中查找到與其匹配的索引詞“中國(guó)”;在第二索引庫(kù)中也查找到與其匹配的索引詞“中國(guó)”。
      步驟S308、依據(jù)查找到的索引詞對(duì)應(yīng)的序號(hào)調(diào)取聊天信息。
      如,獲取第一索引庫(kù)中的索引詞“中國(guó)”對(duì)應(yīng)聊天信息的序號(hào)為A1、A16、A520、A634、A1206、A7265;獲取第二索引庫(kù)中的索引詞“中國(guó)”對(duì)應(yīng)聊天信息的序號(hào)B1、B16、B35、B92,再將獲取的序號(hào)合并,在保存聊天信息的數(shù)據(jù)庫(kù)中調(diào)取序號(hào)為A1、A16、A520、A634、A1206、A7265、B1、B16、B35、B92的聊天信息。
      當(dāng)正在運(yùn)行的即時(shí)通訊系統(tǒng)生成的聊天信息達(dá)到一定數(shù)量時(shí),本發(fā)明將這些新生成的聊天信息處理成索引文件參與檢索,擴(kuò)大檢索范圍,保證檢索的全面性。
      為方便用戶從調(diào)取的聊天信息中獲取到完整的資料,本發(fā)明還可在調(diào)取該序號(hào)對(duì)應(yīng)的聊天信息時(shí),調(diào)取該聊天信息之前及之后設(shè)置數(shù)量的聊天信息。設(shè)置數(shù)量?jī)?yōu)選為5條。如,在調(diào)取序號(hào)為B16的聊天信息時(shí),還調(diào)取該序號(hào)之前5條聊天信息,既序號(hào)為B11、B12、B13、B14、B15的聊天信息,及該序號(hào)之后5條聊天信息,既序號(hào)為B17、B18、B19、B20、B21的聊天信息。
      當(dāng)正在運(yùn)行的即時(shí)通訊系統(tǒng)生成的聊天信息再次達(dá)到預(yù)置數(shù)量時(shí),本發(fā)明將這些新生成的聊天信息也處理成索引文件參與檢索,將索引詞發(fā)送到第二索引庫(kù),第二索引庫(kù)更新保存上述索引詞。
      為防止第二索引庫(kù)的索引詞在更新時(shí)與檢索程序相沖突,本發(fā)明在第二索引庫(kù)每次更新后,將第一、第二索引庫(kù)中的內(nèi)容合并到第一索引庫(kù),檢索時(shí),只針對(duì)第一索引庫(kù)。
      參照?qǐng)D4,為本發(fā)明第三實(shí)施例提供的聊天信息的檢索方法流程圖,具體步驟如下所述。
      步驟S401、將預(yù)設(shè)數(shù)量的聊天信息處理成索引文件。預(yù)設(shè)數(shù)量為2萬(wàn)條聊天信息。
      如,即時(shí)通訊系統(tǒng)中的聊天系統(tǒng)將序號(hào)A1到A20000的2萬(wàn)條聊天信息發(fā)送到索引系統(tǒng),索引系統(tǒng)不重復(fù)地提取該2萬(wàn)條聊天信息中所包含的全部詞語(yǔ),并將各個(gè)詞語(yǔ)與包含該詞語(yǔ)的聊天信息的序號(hào)建立對(duì)應(yīng)關(guān)系。例如,序號(hào)為A50、A456、A592、A6634、A12106、A17265等6條聊天信息包含詞語(yǔ)“中國(guó)”,將“中國(guó)”與A50、A456、A592、A6634、A12106、A17265等6個(gè)序號(hào)建立對(duì)應(yīng)關(guān)系。
      步驟402、記錄索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系。
      如,將詞語(yǔ)“中國(guó)”與A50、A456、A592、A6634、A12106、A17265等6個(gè)序號(hào)相對(duì)應(yīng)的對(duì)應(yīng)關(guān)系記錄到保存聊天信息的數(shù)據(jù)庫(kù)。
      步驟S403、將索引詞保存到第一索引庫(kù)。
      索引詞按哈希列表的形式排列在第一索引庫(kù),記錄每個(gè)詞語(yǔ)在列表中的位置信息,并將該位置信息發(fā)送到保存聊天信息的數(shù)據(jù)庫(kù),使索引詞的位置信息與聊天信息的序號(hào)之間建立對(duì)應(yīng)關(guān)系。如,將上述索引詞“中國(guó)”的位置為“35、36”,第一索引庫(kù)的“35、36”位置直接對(duì)應(yīng)聊天信息的A50、A456、A592、A6634、A12106、A17265等6個(gè)序號(hào)。
      步驟S404、將達(dá)到預(yù)置數(shù)量的、新生成的聊天信息處理成索引文件,預(yù)置數(shù)量為300條聊天信息。
      即時(shí)通訊系統(tǒng)正在應(yīng)用時(shí),當(dāng)其生成的聊天信息再次達(dá)到預(yù)置數(shù)量時(shí),聊天系統(tǒng)將最近生成的聊天信息發(fā)送到索引系統(tǒng),索引系統(tǒng)將上述聊天信息處理成索引文件。
      如,即時(shí)通訊系統(tǒng)中的聊天系統(tǒng)將序號(hào)B1到B300的300條聊天信息發(fā)送到索引系統(tǒng),索引系統(tǒng)不重復(fù)地提取該300條聊天信息所包含的全部詞語(yǔ),并將各個(gè)詞語(yǔ)與包含該詞語(yǔ)的聊天信息的序號(hào)建立對(duì)應(yīng)關(guān)系。例如,序號(hào)為B21、B26、B65、B192等4條聊天信息包含詞語(yǔ)“北京”,將“北京”與B21、B26、B65、B192等4個(gè)序號(hào)建立對(duì)應(yīng)關(guān)系。
      步驟S405、記錄該索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系。
      如,將詞語(yǔ)“北京”與B21、B26、B65、B192等4個(gè)序號(hào)相對(duì)應(yīng)的對(duì)應(yīng)關(guān)系記錄到保存聊天信息的數(shù)據(jù)庫(kù)。
      步驟S406、將上述索引詞保存到第二索引庫(kù)。
      索引詞按哈希列表的形式排列在第二索引庫(kù),記錄每個(gè)詞語(yǔ)在列表中的位置信息,并將該位置信息發(fā)送到保存聊天信息的數(shù)據(jù)庫(kù),使索引詞的位置信息與聊天信息的序號(hào)之間建立對(duì)應(yīng)關(guān)系。如,將上述索引詞“北京”的位置為“15、16”,第二索引庫(kù)的“15、16”位置直接對(duì)應(yīng)聊天信息的B21、B26、B65、B192等4個(gè)序號(hào)。
      步驟S407、新生成的聊天信息達(dá)到預(yù)置數(shù)量時(shí),更新上述索引文件。
      即時(shí)通訊系統(tǒng)繼續(xù)生成新的聊天信息,當(dāng)聊天信息再次達(dá)到預(yù)置數(shù)量時(shí),索引系統(tǒng)更新在步驟S406建立的索引文件,并將更新后的索引詞發(fā)送到第二索引庫(kù),第二索引庫(kù)更新其保存的索引詞。
      步驟S408、合并第一索引庫(kù)與第二索引庫(kù),作為第一索引庫(kù)。
      第二索引庫(kù)更新完成后,合并第一、第二索引庫(kù)作為第一索引庫(kù),第一索引庫(kù)保存有原第一、第二索引庫(kù)的索引詞。如,合并后,索引詞“中國(guó)”的位置信息仍為“35、36”;索引詞“北京”的位置信息為“15、16”。
      步驟S409、在第一索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞。
      如,用戶輸入檢索關(guān)鍵詞“中國(guó)OR北京”,在第一索引庫(kù)中查找到與其匹配的索引詞“中國(guó)”,其位置信息為“35、36”;索引詞“北京”的位置信息為“15、16”。
      步驟S410、依據(jù)查找到的索引詞對(duì)應(yīng)的序號(hào)調(diào)取聊天信息。
      如,位置信息為“35、36”對(duì)應(yīng)聊天信息的序號(hào)為A50、A456、A592、A6634、A12106、A17265;位置信息為“15、16”對(duì)應(yīng)聊天信息的序號(hào)B21、B26、B65、B192。根據(jù)檢索要求,將檢索到的序號(hào)合并,在聊天信息數(shù)據(jù)庫(kù)中調(diào)取序號(hào)為A50、A456、A592、A6634、A12106、A17265、B21、B26、B65、B192的聊天信息。
      本發(fā)明將使用第一索引庫(kù)作為檢索專用數(shù)據(jù)庫(kù),使用第二索引庫(kù)接收聊天系統(tǒng)最近生成的聊天信息所對(duì)應(yīng)的索引詞,并在每次更新時(shí)將索引詞并入第一索引庫(kù)。用戶在檢索時(shí),只需針對(duì)第一索引庫(kù)進(jìn)行檢索,在同一索引庫(kù)內(nèi),有效的避免頻繁接收聊天系統(tǒng)發(fā)送的索引詞與檢索程序相沖突,保證檢索的正常、快速進(jìn)行。
      即時(shí)通訊系統(tǒng)在運(yùn)行時(shí),實(shí)時(shí)生成聊天信息,但實(shí)時(shí)生成的聊天信息在沒有達(dá)到預(yù)置數(shù)量時(shí),還不能將處理成索引文件,這些實(shí)時(shí)生成的聊天信息就會(huì)被遺漏在檢索范圍之內(nèi)。為保證能對(duì)上述實(shí)時(shí)生成的聊天信息進(jìn)行檢索,本發(fā)明直接在上述聊天信息中查找包含檢索關(guān)鍵詞的聊天信息。
      參照?qǐng)D5,為本發(fā)明第四實(shí)施例提供的聊天信息的檢索方法流程圖,具體步驟如下所述。
      步驟S501、將預(yù)設(shè)數(shù)量的聊天信息處理成索引文件,記錄索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系,并將索引詞保存到第一索引庫(kù)。
      步驟S502、將達(dá)到預(yù)置數(shù)量的新生成的聊天信息處理成索引文件,記錄該索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系,并將上述索引詞保存到第二索引庫(kù)。
      步驟S503、新生成的聊天信息再次達(dá)到預(yù)置數(shù)量時(shí),更新在步驟S502建立的索引文件,同時(shí)更新第二索引庫(kù)。
      步驟S504、合并第一索引庫(kù)與第二索引庫(kù),作為第一索引庫(kù)。
      步驟S505、在第一索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞。
      如,用戶輸入檢索關(guān)鍵詞“中國(guó)AND北京”,在第一索引庫(kù)中查找到與其匹配的索引詞“中國(guó)”和“北京”。
      步驟S506、依據(jù)查找到的索引詞對(duì)應(yīng)的序號(hào)調(diào)取聊天信息。
      如,獲取第一索引庫(kù)中的索引詞“中國(guó)”對(duì)應(yīng)聊天信息的序號(hào)為A50、A456、A592、A6634、A12106、A17265、B21、B26;“北京”對(duì)應(yīng)聊天信息的序號(hào)A12106、A17265、B21、B26、B65、B192。根據(jù)檢索要求,在檢索到的序號(hào)中取交集部分A12106、A17265、B21、B26,在聊天信息數(shù)據(jù)庫(kù)中調(diào)取序號(hào)為A12106、A17265、B21、B26的聊天信息。
      步驟S507、在沒有建立索引的聊天信息中檢索包含檢索關(guān)鍵詞的聊天信息。
      如,在聊天系統(tǒng)實(shí)時(shí)生成的、還沒有建立索引文件的聊天信息中檢索同時(shí)包含詞語(yǔ)“中國(guó)”和“北京”的聊天信息。
      步驟S508、將上述聊天信息調(diào)取出來(lái),與步驟S506中調(diào)取的聊天信息合并。
      本發(fā)明對(duì)即時(shí)通訊系統(tǒng)實(shí)時(shí)生成的聊天信息進(jìn)行檢索,因?qū)崟r(shí)生成的聊天信息量小于預(yù)置數(shù)值,在檢索時(shí)需掃描的數(shù)據(jù)量很小,并不影響整體的檢索速度。因此,本發(fā)明在不影響檢索速度的前提下,進(jìn)一步保證檢索的實(shí)時(shí)性和全面型。
      基于上述聊天信息的檢索方法,本發(fā)明還提供一種聊天信息的檢索系統(tǒng),該系統(tǒng)能夠快速在聊天信息中檢索到所需信息,減少用戶的等待時(shí)間,提高用戶的體驗(yàn)感。
      參照?qǐng)D6,為本發(fā)明第五實(shí)施例提供的聊天信息的檢索系統(tǒng)示意圖,包括索引文件處理單元61、第一索引詞保存單元62、檢索單元63、及聊天信息獲取單元64。
      索引文件處理單元61將預(yù)設(shè)數(shù)量的聊天信息處理成索引文件,記錄索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系。聊天系統(tǒng)將預(yù)設(shè)數(shù)量的、生成時(shí)間相對(duì)靠前的聊天信息發(fā)送給索引文件處理單元61,索引文件處理單元61在聊天信息中不重復(fù)地提取各個(gè)詞語(yǔ),并將上述各個(gè)詞語(yǔ)與包含該詞語(yǔ)的聊天信息的序號(hào)建立對(duì)應(yīng)關(guān)系。預(yù)設(shè)數(shù)量為1萬(wàn)條聊天信息。
      第一索引詞保存單元62將索引詞保存到創(chuàng)建的第一索引庫(kù)。第一索引詞保存單元62創(chuàng)建一用于保存索引詞的數(shù)據(jù)庫(kù),作為第一索引庫(kù),將索引詞按一定的順序保存在第一索引庫(kù)。
      檢索單元63在第一索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞。檢索時(shí),檢索單元63獲取檢索關(guān)鍵詞,在第一索引庫(kù)中查找與該檢索關(guān)鍵詞相匹配的索引詞。相匹配是指索引詞與檢索關(guān)鍵詞相同。
      聊天信息獲取單元64獲取該索引詞對(duì)應(yīng)的序號(hào),并調(diào)取該序號(hào)對(duì)應(yīng)的聊天信息。
      本發(fā)明可利用聊天信息發(fā)送單元在聊天系統(tǒng)最新生成的聊天信息達(dá)到預(yù)置數(shù)量時(shí),將新生成的聊天信息發(fā)送到索引文件處理單元61,索引文件處理單元61將接收到的聊天信息處理成索引文件。
      參照?qǐng)D7,為本發(fā)明第六實(shí)施例提供的聊天信息的檢索系統(tǒng)示意圖,包括索引文件處理單元61、第一索引詞保存單元62、檢索單元63、聊天信息獲取單元64、聊天信息發(fā)送單元65、及第二索引詞保存單元66。
      聊天信息發(fā)送單元65將達(dá)到預(yù)置數(shù)量的、新生成的聊天信息發(fā)送到索引文件處理單元61,索引文件處理單元61將上述聊天信息處理成索引文件,記錄索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系,并將索引詞發(fā)送到第二索引詞保存單元66。
      第二索引詞保存單元66將索引文件處理單元61返回的索引詞保存到創(chuàng)建的第二索引庫(kù)。
      當(dāng)正在運(yùn)行的即時(shí)通訊系統(tǒng)生成的聊天信息再次達(dá)到預(yù)置數(shù)量時(shí),聊天信息發(fā)送單元65將這些新生成的聊天信息也處理成索引文件參與檢索,將索引詞發(fā)送到第二索引庫(kù),第二索引庫(kù)更新保存上述索引詞。
      為防止第二索引庫(kù)的索引詞在更新時(shí)與檢索程序相沖突,本發(fā)明在第二索引庫(kù)每次更新后,利用加設(shè)的合并單元將第一、第二索引庫(kù)中的內(nèi)容合并到第一索引庫(kù),檢索時(shí),只針對(duì)第一索引庫(kù)。
      以上對(duì)本發(fā)明所提供的一種聊天信息的檢索方法及檢索系統(tǒng),進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了具體個(gè)例對(duì)本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說(shuō)明只是用于幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式
      及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。
      權(quán)利要求
      1.一種聊天信息的檢索方法,其特征在于,包括將預(yù)設(shè)數(shù)量的聊天信息處理成索引文件,記錄所述索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系;將所述索引詞保存到創(chuàng)建的第一索引庫(kù);在所述第一索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞;獲取該索引詞對(duì)應(yīng)的序號(hào),并調(diào)取該序號(hào)對(duì)應(yīng)的聊天信息。
      2.如權(quán)利要求1所述的方法,其特征在于,還包括將達(dá)到預(yù)置數(shù)量的新生成聊天信息處理成索引文件;記錄上述索引文件的索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系;將上述索引詞保存到創(chuàng)建的第二索引庫(kù)。
      3.如權(quán)利要求2所述的方法,其特征在于,還包括在第二索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞。
      4.如權(quán)利要求2所述的方法,其特征在于,還包括合并第一索引庫(kù)與第二索引庫(kù),作為第一索引庫(kù)。
      5.如權(quán)利要求1所述的方法,其特征在于,還包括獲取沒有建立索引的聊天信息;在上述聊天信息中調(diào)取包含檢索關(guān)鍵詞的聊天信息。
      6.如權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,按下述步驟,將預(yù)設(shè)數(shù)量的聊天信息處理成索引文件在聊天信息中不重復(fù)地提取各個(gè)詞語(yǔ),并將上述各個(gè)詞語(yǔ)與包含該詞語(yǔ)的聊天信息的序號(hào)建立對(duì)應(yīng)關(guān)系。
      7.如權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,調(diào)取該序號(hào)對(duì)應(yīng)的聊天信息之后,還包括調(diào)取該聊天信息之前及之后設(shè)置數(shù)量的聊天信息。
      8.如權(quán)利要求1至5任一項(xiàng)所述的方法,其特征在于,還包括對(duì)索引文件中的索引詞進(jìn)行加密處理。
      9.一種聊天信息的檢索系統(tǒng),其特征在于,包括索引文件處理單元、第一索引詞保存單元、檢索單元、及聊天信息獲取單元所述索引文件處理單元,用于將預(yù)設(shè)數(shù)量的聊天信息處理成索引文件,記錄所述索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系;所述第一索引詞保存單元,用于將所述索引詞保存到創(chuàng)建的第一索引庫(kù);所述檢索單元,用于在所述第一索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞;所述聊天信息獲取單元,用于獲取該索引詞對(duì)應(yīng)的序號(hào),并調(diào)取該序號(hào)對(duì)應(yīng)的聊天信息。
      10.如權(quán)利要求9所述的系統(tǒng),其特征在于,還包括聊天信息發(fā)送單元,用于將達(dá)到預(yù)置數(shù)量的、新生成的聊天信息發(fā)送到所述索引文件處理單元;所述第二索引詞保存單元,用于將所述索引文件處理單元返回的索引詞保存到創(chuàng)建的第二索引庫(kù)。
      全文摘要
      本發(fā)明涉及一種聊天信息的檢索方法,包括將預(yù)設(shè)數(shù)量的聊天信息處理成索引文件,記錄所述索引文件中索引詞與聊天信息的序號(hào)之間的對(duì)應(yīng)關(guān)系;將所述索引詞保存到創(chuàng)建的第一索引庫(kù);在所述第一索引庫(kù)中查找與檢索關(guān)鍵詞相匹配的索引詞;獲取該索引詞對(duì)應(yīng)的序號(hào),并調(diào)取該序號(hào)對(duì)應(yīng)的聊天信息。同時(shí)本發(fā)明還公開一種聊天信息的檢索系統(tǒng)。本發(fā)明能夠快速在聊天信息中檢索到所需信息,減少用戶的等待時(shí)間,提高用戶的體驗(yàn)感。
      文檔編號(hào)G06F17/30GK101072205SQ200710109448
      公開日2007年11月14日 申請(qǐng)日期2007年6月21日 優(yōu)先權(quán)日2007年6月21日
      發(fā)明者唐年鵬, 孫良, 李強(qiáng) 申請(qǐng)人:騰訊科技(深圳)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
      1