專利名稱:搜索系統(tǒng)及搜索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及搜索引擎領(lǐng)域,尤其涉及一種在搜索引擎系統(tǒng)中實(shí) 現(xiàn)關(guān)聯(lián)4臾索的系統(tǒng)及方法。
背景技術(shù):
搜索引擎系統(tǒng)是對(duì)不同格式、不同載體、不同來(lái)源的信息進(jìn)行 整合,將這些信息索引存儲(chǔ),并通過(guò)接收用戶的查詢指令向用戶提 供符合其查詢要求的信息資源的系統(tǒng)。
搜索引擎系統(tǒng)需要為用戶提供一個(gè)信息查詢界面。現(xiàn)有的搜索 引擎系統(tǒng)主要包括分類目錄及關(guān)鍵詞兩種信息查詢途徑。分類目錄 查詢是以資源結(jié)構(gòu)為線索,將信息資源按照內(nèi)容進(jìn)行層次分類,使 用戶能依現(xiàn)行結(jié)構(gòu)逐層逐類檢索信息。并且,關(guān)4建詞查詢是利用建 立的索引庫(kù)來(lái)向用戶提供查詢服務(wù)的。用戶只要把想要查找的關(guān)鍵 詞或者短語(yǔ)輸入查詢?cè)~中,搜索引擎就會(huì)根據(jù)用戶輸入在索引庫(kù)中 查找相應(yīng)的詞語(yǔ),并進(jìn)行必要的邏輯運(yùn)算,最后^合出查詢的命中結(jié) 果。
4旦是,在上述幾種方式都存在一些缺陷
(1 )利用信息資源進(jìn)行層次分類的方式,如果分類較少,用戶 無(wú)法準(zhǔn)確獲取所需要的信息。如果分類較多,用戶選擇需要的分類 信息要花費(fèi)較多的時(shí)間。
(2)采取層次分類的方式,還對(duì)信息的整合要求較高。搜索引 擎系統(tǒng)必須在進(jìn)行信息收集、整合的時(shí)候提取信息的分類信息,這 需要采取人工干預(yù)的方式,或者僅整合可靠信息來(lái)源的信息的方式 來(lái)保障分類信息的準(zhǔn)確度。
(3 )采用用戶輸入關(guān)鍵字進(jìn)行查詢,搜索結(jié)果的質(zhì)量同用戶描 述關(guān)系很大。如果用戶輸入越簡(jiǎn)潔、準(zhǔn)確,那么得到的搜索結(jié)果的 準(zhǔn)確度越高。若用戶輸入不準(zhǔn)確,則用戶可能無(wú)法得到真正需要的 信息,而且垃;及信息眾多。
(4) 用戶有可能不確定自己到底想搜索的內(nèi)容是什么,只有一 個(gè)大致方向,這時(shí)不容易得到理想的搜索結(jié)果。
(5) 用戶若使用的查詢?cè)~不妥當(dāng),容易造成垃圾結(jié)果眾多?;?者是使用的查詢?cè)~較生僻,不能搜索到所需要的結(jié)果。
發(fā)明內(nèi)容
鑒于上述問(wèn)題,本發(fā)明目的在于提供一種根據(jù)用戶的輸入內(nèi)容 提取用戶搜索關(guān)鍵詞,根據(jù)該關(guān)鍵詞進(jìn)行擴(kuò)展并進(jìn)行相關(guān)搜索以達(dá) 到最大限度的利用用戶關(guān)鍵詞得到用戶所需要信息的搜索系統(tǒng)及搜 索方法。
根據(jù)本發(fā)明的一個(gè)方面,提供了一種搜索系統(tǒng),其包括輸入 輸出模塊,連接到分詞模塊和查詢模塊,用于接收來(lái)自外部網(wǎng)絡(luò)的 用戶的查詢內(nèi)容,以及將最終的查詢結(jié)果返回給用戶;分詞才莫塊, 連接到輸入輸出模塊,用于接收來(lái)自輸入輸出模塊的用戶的查詢內(nèi) 容,并在對(duì)其進(jìn)行分詞、搜索、整合后,將關(guān)鍵詞信息發(fā)送給輸入 輸出模塊;以及查詢模塊,連接到輸入輸出才莫塊,用于將通過(guò)輸入 輸出模塊接收到的、來(lái)自分詞模塊的關(guān)鍵詞信息在索引庫(kù)中進(jìn)行索 引,然后將查詢結(jié)果發(fā)送給輸入輸出模塊。
此外,本發(fā)明的搜索系統(tǒng)還包括關(guān)聯(lián)索引維護(hù)才莫塊,用于維護(hù)所述關(guān)聯(lián)詞信息:溲索時(shí)所需的關(guān)聯(lián)詞索引庫(kù)。其中,在上述分詞模塊中包括中文分詞模塊,用于根據(jù)不同 的分詞方法對(duì)用戶的查詢內(nèi)容進(jìn)行分詞,并輸出分詞信息給整合沖莫 塊;關(guān)聯(lián)搜索處理才莫塊,用于接收分詞才莫塊的分詞信息,利用分詞 信息在關(guān)聯(lián)詞索引庫(kù)中進(jìn)行搜索,并輸出關(guān)聯(lián)詞信息給整合才莫塊; 以及整合模塊,用于將作為分詞結(jié)果的分詞信息、和作為搜索結(jié)果 的關(guān)聯(lián)詞信息整合為關(guān)鍵詞信息。并且,在查詢模塊中包括索引模塊,用于對(duì)需要搜索的內(nèi)容 建立索引庫(kù),對(duì)索引進(jìn)行維護(hù),并當(dāng)源信息更新時(shí),同步更新索引 庫(kù)的信息。其中,上述分詞方法包括才幾才成分詞法中的最大左匹配法。根據(jù)本發(fā)明的另一方面,提供了一種搜索方法,其包括步驟 一,用戶通過(guò)外部網(wǎng)絡(luò)與輸入輸出模塊交互,向輸入輸出才莫塊4是交 查詢內(nèi)容;步驟二,輸入輸出模塊接收查詢內(nèi)容,并發(fā)送給分詞模 塊,分詞才莫塊對(duì)查詢內(nèi)容進(jìn)行分詞、搜索、整合后發(fā)送關(guān)^T建詞信息 給輸入輸出模塊;步驟三,輸入輸出模塊將關(guān)4建詞信息發(fā)送給查詢 模塊,查詢模塊在索引庫(kù)中對(duì)關(guān)鍵詞信息進(jìn)行索引,并將查詢結(jié)果 發(fā)送給輸入輸出模塊;步驟四,輸入輸出模塊將查詢結(jié)果進(jìn)行調(diào)整 后返回纟會(huì)用戶。在上述的搜索方法中,還包括由關(guān)聯(lián)索引維護(hù)才莫塊維護(hù)所述 關(guān)聯(lián)詞信息搜索時(shí)所需的關(guān)聯(lián)詞索引庫(kù)。并且,在步驟二中還包括以下步驟4艮據(jù)不同的分詞方法由中 文分詞才莫塊對(duì)用戶的查詢內(nèi)容進(jìn)行分詞,并輸出分詞信息給分詞才莫 塊;由關(guān)聯(lián)搜索處理模塊接收分詞模塊的分詞信息,利用分詞信息 在關(guān)聯(lián)詞索引庫(kù)中進(jìn)行搜索,并輸出關(guān)聯(lián)詞信息給分詞^f莫塊;以及 通過(guò)整合模塊將作為分詞結(jié)果的分詞信息、和作為搜索結(jié)果的關(guān)聯(lián) 詞信息整合為關(guān)鍵詞信息。此外,在上述步驟三中還包括由索引模塊對(duì)需要搜索的內(nèi)容 建立所述索引庫(kù),對(duì)索引進(jìn)行維護(hù),并當(dāng)源信息更新時(shí),同步更新 所述索引庫(kù)的信息。其中,上述分詞方法包括才幾4成分詞法中的最大左匹配法。因此,通過(guò)本發(fā)明,用戶可通過(guò)l命入準(zhǔn)確、簡(jiǎn)潔的關(guān)4建字得到 盡可能多的結(jié)果,同時(shí),也可通過(guò)輸入關(guān)注的關(guān)4建字得到潛在相關(guān) 的搜索結(jié)果,比如,搜索重慶小吃,可能得到重慶火鍋的相關(guān)信息 等。并且,當(dāng)用戶l俞入的信息不準(zhǔn)確時(shí),系統(tǒng)可以通過(guò)該詞的關(guān)聯(lián) 搜索,進(jìn)行自動(dòng)糾正,并得到正確的搜索結(jié)果。本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的i兌明書(shū)中闡述,并且,部 分地從說(shuō)明書(shū)中變得顯而易見(jiàn),或者通過(guò)實(shí)施本發(fā)明而了解。本發(fā) 明的目的和其他優(yōu)點(diǎn)可通過(guò)在所寫(xiě)的說(shuō)明書(shū)、權(quán)利要求書(shū)、以及附 圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。
附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,并且構(gòu)成i兌明書(shū)的一部 分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的 限制。在附圖中圖1是根據(jù)本發(fā)明的搜索系統(tǒng)的構(gòu)成的框圖;圖2是根據(jù)本發(fā)明的搜索方法的流程圖3是根據(jù)本發(fā)明實(shí)施例的搜索系統(tǒng)的結(jié)構(gòu)框圖;圖4是圖3的搜索系統(tǒng)中各組成才莫塊的具體結(jié)構(gòu)框圖;以及圖5是4艮據(jù)本發(fā)明實(shí)施例的搜索方法的流程圖。
具體實(shí)施方式
以下結(jié)合附圖對(duì)本發(fā)明的優(yōu)選實(shí)施例進(jìn)行說(shuō)明,應(yīng)當(dāng)理解,此 處所描述的優(yōu)選實(shí)施例僅用于說(shuō)明和解釋本發(fā)明,并不用于限定本 發(fā)明。圖1是根據(jù)本發(fā)明的搜索系統(tǒng)的構(gòu)成的框圖。如圖l所示,根據(jù)本發(fā)明的搜索系統(tǒng),其包括輸入輸出模塊 102,連接到分詞模塊104和查詢模塊106,用于接收來(lái)自外部網(wǎng)絡(luò) 的用戶的查詢內(nèi)容,以及將最終的查詢結(jié)果返回^合用戶;分詞才莫塊 104,連接到輸入輸出模塊102,用于接收來(lái)自輸入輸出模塊102的 用戶的查詢內(nèi)容,并在對(duì)其進(jìn)行分詞、搜索、整合后,將關(guān)鍵詞信 息發(fā)送給輸入輸出模塊102;以及查詢模塊104,連接到輸入輸出模 塊102,用于將通過(guò)輸入輸出模塊102接收到的、來(lái)自分詞模塊104 的關(guān)鍵詞信息在索引庫(kù)中進(jìn)行索引,然后將查詢結(jié)果發(fā)送給輸入輸 出沖莫塊102。此外,本發(fā)明的搜索系統(tǒng)還包括關(guān)聯(lián)索引維護(hù)模塊,用于維 護(hù)所述關(guān)聯(lián)詞信息搜索時(shí)所需的關(guān)聯(lián)詞索引庫(kù)。其中,在上述分詞才莫塊104中包括中文分詞沖莫塊,用于才艮據(jù) 不同的分詞方法對(duì)用戶的查詢內(nèi)容進(jìn)行分詞,并輸出分詞信息給整 合模塊;關(guān)聯(lián)搜索處理模塊,用于接收分詞模塊的分詞信息,利用 分詞信息在關(guān)聯(lián)詞索引庫(kù)中進(jìn)行搜索,并輸出關(guān)聯(lián)詞信息給整合模塊;以及整合模塊,用于將作為分詞結(jié)果的分詞信息、和作為搜索 結(jié)果的關(guān)聯(lián)詞信息整合為關(guān)鍵詞信息。并且,在上述查詢模塊106中包括索引模塊,用于對(duì)需要搜 索的內(nèi)容建立索引庫(kù),對(duì)索引進(jìn)行維護(hù),并當(dāng)源信息更新時(shí),同步 更新索引庫(kù)的信息。其中,上述分詞方法包括坤幾才戒分詞法中的最大左匹配法。具體而言,利用本發(fā)明的搜索系統(tǒng)和搜索方法,搜索引擎在對(duì) 用戶的輸入進(jìn)行分析的時(shí)候,可以對(duì)用戶輸入的關(guān)鍵詞進(jìn)行諸如同 義詞、近義詞、相關(guān)詞等進(jìn)行處理,自動(dòng)對(duì)用戶輸入的內(nèi)容擴(kuò)展多 個(gè)同義詞或者近義詞或者相關(guān)詞,并在另用這些詞在搜索引擎系統(tǒng) 的索引庫(kù)中進(jìn)行擴(kuò)展搜索,返回用戶查詢結(jié)果,對(duì)用戶的擴(kuò)展搜索 進(jìn)4亍纟是示。通過(guò)上述系統(tǒng),用戶可以快才走方1"更的4叟索到自己需要的 信息,同時(shí)降低了搜索引擎對(duì)使用者的門(mén)榲。通過(guò)該系統(tǒng),用戶可 以得到盡可能多的感興趣的信息。圖3是根據(jù)本發(fā)明實(shí)施例的搜索系統(tǒng)的結(jié)構(gòu)框圖,圖4是圖3 的搜索系統(tǒng)中各組成模塊的具體結(jié)構(gòu)框圖。如圖3及圖4所示,本發(fā)明實(shí)施例的4臾索系統(tǒng)包括輸入輸出 才莫塊302、分詞才莫塊304、中文分詞才莫塊3042、關(guān)聯(lián)4叟索處理才莫塊 3044、整合模塊3046、關(guān)聯(lián)索引維護(hù)模塊、查詢模塊306、以及索 引模塊3062。本發(fā)明所述的4叟索系統(tǒng)各組成部分的功能及連4矣關(guān)系如下輸入輸出才莫塊302,通過(guò)與外部系統(tǒng)的交互完成對(duì)用戶輸入內(nèi) 容的接收,并將接收到的文字內(nèi)容發(fā)送給分詞模塊304。接收從分 詞模塊304返回的分詞信息,并將分詞結(jié)果作為關(guān)鍵字進(jìn)行搜索。
分詞模塊304,調(diào)用中文分詞模塊3042得到初步的分詞結(jié)果, 并將初步分詞結(jié)果發(fā)送給在關(guān)聯(lián)搜索處理模塊3044,接受從該關(guān)聯(lián) 搜索處理才莫塊3044返回的關(guān)聯(lián)詞信息。并通過(guò)整合模塊3046將關(guān) 聯(lián)詞信息與其他分詞信息整合后, 一同返回纟合輸入輸出才莫塊302。中文分詞模塊3042,根據(jù)不同的分詞方法,對(duì)用戶的輸入信息 進(jìn)行切分。關(guān)聯(lián)搜索處理模塊3044,接受來(lái)自分詞模塊304的文字信息, 利用文字信息在關(guān)聯(lián)詞索引庫(kù)內(nèi)進(jìn)行搜索,并將得到的關(guān)聯(lián)詞信息 返回鄉(xiāng)會(huì)整合才莫塊3046 。關(guān)聯(lián)索引維護(hù)模塊,維護(hù)關(guān)聯(lián)詞搜索所需的關(guān)聯(lián)詞索引庫(kù)。在 關(guān)聯(lián)詞索引庫(kù)中,維護(hù)關(guān)鍵詞的相關(guān)搜索關(guān)4建詞的信息。相關(guān)的搜 索的關(guān)4建詞可以是該關(guān)4建詞的同義詞、同音詞、近義詞或者是其他 相關(guān)的纟叟索詞。查詢模塊306,接受輸入輸出模塊302的關(guān)4建字,并根據(jù)關(guān)4建 字形成查詢條件對(duì)索引文件進(jìn)4亍查詢。得到匹配用戶查詢要求的結(jié) 果,并將查詢結(jié)果返回給用戶。索引^^莫塊3062,用于維護(hù)全文索引。索引才莫塊3062通過(guò)掃描 需要搜索的信息中的每一個(gè)詞,對(duì)每一個(gè)詞建立索引,指明該詞在 文章中出現(xiàn)的次數(shù)和位置。其中,輸入輸出才莫塊302完成4妄收用戶的輸入。用戶通過(guò)外部 網(wǎng)絡(luò)與輸入輸出模塊進(jìn)行交互。外部網(wǎng)絡(luò)包括IP網(wǎng)絡(luò)、WAP網(wǎng)絡(luò) 等多種網(wǎng)絡(luò),通過(guò)HTTP、 TCP/IP等協(xié)議接入關(guān)聯(lián)搜索系統(tǒng)。
分詞才莫塊304的查找算法可采用積4成分詞法中的最大左匹配法 的方式對(duì)用戶輸入進(jìn)行分詞才喿作。將匹配上字典條目分詞結(jié)果標(biāo)識(shí) 上需要進(jìn)行關(guān)聯(lián)查找。關(guān)聯(lián)搜索處理才莫塊3044利用從分詞才莫塊304中得到的分詞信 息為最小查找單位,在關(guān)聯(lián)詞的索引庫(kù)內(nèi)進(jìn)行快速查詢,并得到分 詞信息的關(guān)聯(lián)詞信息。此外,利用關(guān)聯(lián)索引維護(hù)模塊形成關(guān)聯(lián)詞索引庫(kù),該關(guān)聯(lián)詞索 引庫(kù)中的一個(gè)詞條可對(duì)應(yīng)多個(gè)詞語(yǔ),每個(gè)詞語(yǔ)有對(duì)應(yīng)的詞頻、關(guān)聯(lián) 詞的類別(可包含同義詞、同音詞、近義詞、關(guān)聯(lián)詞等類別)。索引才莫塊3062通過(guò)掃描文章中的每一個(gè)詞,對(duì)每一個(gè)詞建立一 個(gè)索引,指明該詞在文章中出現(xiàn)的次凄t和位置,當(dāng)用戶查詢時(shí),查 詢模塊306就根據(jù)事先建立的索引進(jìn)行查詢,并將查找的結(jié)果發(fā)送 給輸入輸出模塊302,從而反饋給用戶。下面,參照?qǐng)D2對(duì)本發(fā)明涉及的搜索方法進(jìn)行說(shuō)明。圖2是才艮 據(jù)本發(fā)明的4叟索方法的流程圖。如圖2所示,才艮據(jù)本發(fā)明的搜索方法,其包括步驟S02,用 戶通過(guò)外部網(wǎng)絡(luò)與輸入輸出模塊交互,向輸入輸出模塊提交查詢內(nèi) 容;步驟S204,輸入輸出模塊接收查詢內(nèi)容,并發(fā)送給分詞模塊, 分詞模塊對(duì)查詢內(nèi)容進(jìn)行分詞、搜索、整合后發(fā)送關(guān)鍵詞信息給輸 入輸出模塊;步驟S206,輸入輸出模塊將關(guān)鍵詞信息發(fā)送給查詢模 塊,查詢模塊在索引庫(kù)中對(duì)關(guān)鍵詞信息進(jìn)行索引,并將查詢結(jié)果發(fā) 送給輸入輸出模塊;步驟S208,輸入輸出模塊將查詢結(jié)果進(jìn)行調(diào)整 后返回給用戶。在上述的搜索方法中,還包括由關(guān)聯(lián)索引維護(hù)模塊維護(hù)所述 關(guān)聯(lián)詞信息搜索時(shí)所需的關(guān)聯(lián)詞索引庫(kù)。 并且,在步驟S204中還包括以下步驟才艮據(jù)不同的分詞方法 由中文分詞才莫塊對(duì)用戶的查詢內(nèi)容進(jìn)4亍分詞,并輸出分詞信息給分 詞沖莫塊;由關(guān)聯(lián)4叟索處理才莫塊4妄收分詞;溪塊的分詞信息,利用分詞 信息在關(guān)聯(lián)詞索引庫(kù)中進(jìn)行搜索,并輸出關(guān)聯(lián)詞信息給分詞模塊; 以及通過(guò)整合模塊將作為分詞結(jié)果的的分詞信息、和作為搜索結(jié)果 的關(guān)聯(lián)詞信息整合為關(guān)鍵詞信息。此外,在上述步驟S206中還包括由索引才莫塊對(duì)需要搜索的 內(nèi)容建立所述索引庫(kù),對(duì)索引進(jìn)行維護(hù),并當(dāng)源信息更新時(shí),同步 更新所述索引庫(kù)的信息。其中,上述分詞方法包括才幾4成分詞法中的最大左匹配法。具體而言,上述4叟索方法包括(1)用戶與輸入輸出^^莫塊交互,向輸入輸出才莫塊4是交查詢串;(2 )輸入輸出模塊將查詢串發(fā)送給分詞模塊,分詞模塊調(diào)用中 文分詞才莫塊沖艮據(jù)不同的分詞策略對(duì)用戶的查詢串進(jìn)4亍分詞;(3 )分詞模塊的整合模塊接收中文分詞模塊的分詞結(jié)果,則將 該信息發(fā)送給關(guān)聯(lián)搜索處理模塊;(4 )關(guān)聯(lián)搜索處理模塊接受從分詞模塊的文字信息,利用文字 信息在關(guān)聯(lián)詞索引庫(kù)內(nèi)進(jìn)行搜索,并將得到的關(guān)聯(lián)詞信息返回給整 合模塊;(5 )分詞模塊的整合模塊整合從關(guān)聯(lián)搜索處理模塊返回的信息 與其他分詞所得的關(guān)鍵詞信息,作為搜索的關(guān)鍵詞返回給輸入輸出 模塊; (6)輸入輸出模塊將關(guān)鍵詞發(fā)送給查詢模塊。(7 )查詢模塊利用得到的關(guān)鍵詞對(duì)索引庫(kù)進(jìn)行查找,并將索引 庫(kù)中匹配的信息返回給輸入輸出模塊。由輸入輸出模塊對(duì)結(jié)果進(jìn)行 調(diào)整,返回癥會(huì)用戶;(8 )后臺(tái)處理系統(tǒng)利用索引模塊對(duì)需要搜索的資料建立索引, 對(duì)索引進(jìn)行維護(hù),當(dāng)源信息更新時(shí),同步更新索引庫(kù)信息。下面,參照?qǐng)D5對(duì)本發(fā)明實(shí)施例涉及的搜索方法進(jìn)行說(shuō)明。如圖5所示,該關(guān)聯(lián)搜索方法包括以下步驟步驟S502,接收 用戶欲查詢的查詢串;步驟S504,對(duì)查詢串進(jìn)行初步分詞,步驟 S506,對(duì)初步分詞結(jié)果在關(guān)聯(lián)詞索引庫(kù)內(nèi)進(jìn)行搜索,得到最終分詞 結(jié)果;以及步驟S508,根據(jù)經(jīng)過(guò)處理的最終分詞結(jié)果進(jìn)行數(shù)據(jù)查詢。其中,在步驟S506中,還對(duì)關(guān)聯(lián)詞建立索引庫(kù),并對(duì)關(guān)聯(lián)詞 索引進(jìn)行維護(hù)。在步驟S508中,還對(duì)需要查詢的資料建立索引庫(kù), 并對(duì)索引進(jìn)行維護(hù)。綜上所述,通過(guò)本發(fā)明,用戶可通過(guò)輸入準(zhǔn)確、簡(jiǎn)潔的關(guān)4建字 得到盡可能多的結(jié)果,同時(shí),也可通過(guò)輸入關(guān)注的關(guān)4建字得到潛在 相關(guān)的搜索結(jié)果,比如,搜索重慶小吃,可能得到重慶火鍋的相關(guān) 信息等。并且,當(dāng)用戶ilr入的信息不準(zhǔn)確時(shí),系統(tǒng)可以通過(guò)該詞的 關(guān)聯(lián)搜索,進(jìn)行自動(dòng)糾正,并得到正確的搜索結(jié)果。以上4又為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì) 于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),本發(fā)明可以有各種更改和變化。凡在本 發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均 應(yīng)包含在本發(fā)明的4呆護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種搜索系統(tǒng),其特征在于,包括輸入輸出模塊,連接到分詞模塊和查詢模塊,用于接收來(lái)自外部網(wǎng)絡(luò)的用戶的查詢內(nèi)容,以及將最終的查詢結(jié)果返回給所述用戶;所述分詞模塊,連接到所述輸入輸出模塊,用于接收來(lái)自所述輸入輸出模塊的所述用戶的查詢內(nèi)容,并在對(duì)其進(jìn)行分詞、搜索、整合后,將關(guān)鍵詞信息發(fā)送給所述輸入輸出模塊;以及所述查詢模塊,連接到所述輸入輸出模塊,用于將通過(guò)所述輸入輸出模塊接收到的、來(lái)自所述分詞模塊的所述關(guān)鍵詞信息在索引庫(kù)中進(jìn)行索引,然后將所述查詢結(jié)果發(fā)送給所述輸入輸出模塊。
2. 根據(jù)權(quán)利要求1所述的搜索系統(tǒng),其特征在于,還包括:關(guān)聯(lián)索引維護(hù)模塊,用于維護(hù)所述關(guān)聯(lián)詞信息搜索時(shí)所需 的關(guān)聯(lián)詞索引庫(kù)。
3. 根據(jù)權(quán)利要求1或2所述的搜索系統(tǒng),其特征在于,在所述分 詞才莫塊中包括中文分詞才莫塊,用于才艮據(jù)不同的分詞方法對(duì)所述用戶的查 詢內(nèi)容進(jìn)行分詞,并輸出分詞信息給整合模塊;關(guān)聯(lián)搜索處理模塊,用于接收所述分詞模塊的所述分詞信 息,利用所述分詞信息在所述關(guān)聯(lián)詞索引庫(kù)中進(jìn)行搜索,并輸 出所述關(guān)聯(lián)詞信息給所述整合模塊;以及 所述整合^f莫塊,用于將作為分詞結(jié)果的所述分詞信息、和 作為搜索結(jié)果的所述關(guān)聯(lián)詞信息整合為所述關(guān)鍵詞信息。
4. 根據(jù)權(quán)利要求1或2所述的搜索系統(tǒng),其特征在于,在所述查 詢模塊中包括索引模塊,用于對(duì)需要搜索的內(nèi)容建立所述索引庫(kù),對(duì)索 引進(jìn)行維護(hù),并當(dāng)源信息更新時(shí),同步更新所述索引庫(kù)的信息。
5. 根據(jù)權(quán)利要求1所述的搜索系統(tǒng),其特征在于,所述分詞方法包括;t幾械分詞法中的最大左匹配法。
6. —種搜索方法,其特征在于,包括步驟一,用戶通過(guò)外部網(wǎng)絡(luò)與輸入輸出模塊交互,向所述 輸入輸出模塊提交查詢內(nèi)容;步驟二,所述輸入輸出^^塊接收所述查詢內(nèi)容,并發(fā)送給 分詞模塊,所述分詞模塊對(duì)所述查詢內(nèi)容進(jìn)行分詞、搜索、整 合后發(fā)送關(guān)鍵詞信息給所述輸入輸出模塊;步驟三,所述輸入輸出模塊將所述關(guān)鍵詞信息發(fā)送給所述 查詢模塊,所述查詢模塊在所述索引庫(kù)中對(duì)所述關(guān)鍵詞信息進(jìn) 行索引,并將查詢結(jié)果發(fā)送給所述輸入輸出^f莫塊;以及步驟四,所述輸入輸出模塊將所述查詢結(jié)果進(jìn)行調(diào)整后返 回給f斤述用戶。
7. 根據(jù)權(quán)利要求6所述的搜索方法,其特征在于,還包括由關(guān)聯(lián)索引維護(hù)模塊維護(hù)所述關(guān)聯(lián)詞信息搜索時(shí)所需的 關(guān)聯(lián)詞索引庫(kù)。
8. 根據(jù)權(quán)利要求6或7所述的搜索方法,其特征在于,在步驟二 中還包4舌以下步驟 才艮據(jù)不同的分詞方法由中文分詞才莫塊對(duì)所述用戶的查詢內(nèi)容進(jìn)行分詞,并輸出分詞信息給所述分詞才莫塊;由關(guān)聯(lián)搜索處理模塊接收所述分詞模塊的所述分詞信息, 利用所述分詞信息在所述關(guān)聯(lián)詞索引庫(kù)中進(jìn)行搜索,并輸出所 述關(guān)聯(lián)詞信息給所述分詞模塊;以及通過(guò)整合^^莫塊將作為分詞結(jié)果的所述分詞信息、和作為搜 索結(jié)果的所述關(guān)聯(lián)詞信息整合為所述關(guān)鍵詞信息。
9. 根據(jù)權(quán)利要求6或7所述的搜索方法,其特征在于,在所述步 驟三中還包4舌由索引模塊對(duì)需要搜索的內(nèi)容建立所述索引庫(kù),對(duì)索引進(jìn) 行維護(hù),并當(dāng)源信息更新時(shí),同步更新所述索引庫(kù)的信息。
10. 根據(jù)權(quán)利要求6所述的搜索方法,其特征在于,所述分詞方法包括「才幾4成分詞法中的最大左匹配法。
全文摘要
本發(fā)明提供了一種搜索系統(tǒng)及搜索方法,其中,搜索系統(tǒng)包括輸入輸出模塊,連接到分詞模塊和查詢模塊,用于接收來(lái)自外部網(wǎng)絡(luò)的用戶的查詢內(nèi)容,以及將最終的查詢結(jié)果返回給用戶;分詞模塊,連接到輸入輸出模塊,用于接收來(lái)自輸入輸出模塊的用戶的查詢內(nèi)容,并在對(duì)其進(jìn)行分詞、搜索、整合后,將關(guān)鍵詞信息發(fā)送給輸入輸出模塊;以及查詢模塊,連接到輸入輸出模塊,用于將通過(guò)輸入輸出模塊接收到的、來(lái)自分詞模塊的關(guān)鍵詞信息在索引庫(kù)中進(jìn)行查詢,然后將查詢結(jié)果發(fā)送給輸入輸出模塊,因此,采用本發(fā)明,用戶可通過(guò)輸入準(zhǔn)確、簡(jiǎn)潔的關(guān)鍵字得到盡可能多的結(jié)果。
文檔編號(hào)G06F17/30GK101149758SQ20071018152
公開(kāi)日2008年3月26日 申請(qǐng)日期2007年10月18日 優(yōu)先權(quán)日2007年10月18日
發(fā)明者劉麗麗, 軍 李 申請(qǐng)人:中興通訊股份有限公司