知識(shí)重組系統(tǒng)和知識(shí)重組方法
【專(zhuān)利摘要】本發(fā)明提供了一種知識(shí)重組系統(tǒng)和知識(shí)重組方法,知識(shí)重組系統(tǒng)包括:選擇單元,根據(jù)接收到的選擇命令,從預(yù)設(shè)的本體詞匯庫(kù)中選擇出目標(biāo)詞匯;查找單元,在預(yù)設(shè)的本體詞匯庫(kù)中查找出與目標(biāo)詞匯存在關(guān)聯(lián)關(guān)系的多個(gè)詞匯,以組成詞匯集;提取單元,在預(yù)設(shè)的知識(shí)條目庫(kù)中,查找與詞匯集中的每個(gè)詞匯相關(guān)聯(lián)的目標(biāo)知識(shí)條目,并在查找時(shí)提取出目標(biāo)知識(shí)條目對(duì)應(yīng)的條目?jī)?nèi)容;文件生成單元,對(duì)提取出的所有條目?jī)?nèi)容進(jìn)行匯總,并根據(jù)詞匯集中每個(gè)詞匯和其他詞匯之間的關(guān)聯(lián)關(guān)系確定所有條目?jī)?nèi)容的排列順序,以按照排列順序?qū)λ袟l目?jī)?nèi)容進(jìn)行組合,生成知識(shí)文件。通過(guò)該技術(shù)方案,不但降低了建立關(guān)聯(lián)關(guān)系的成本,而且可以生成滿(mǎn)足用戶(hù)不同需求的知識(shí)文件。
【專(zhuān)利說(shuō)明】知識(shí)重組系統(tǒng)和知識(shí)重組方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及數(shù)字出版【技術(shù)領(lǐng)域】,具體而言,涉及一種知識(shí)重組系統(tǒng)和一種知識(shí)重組方法。
【背景技術(shù)】
[0002]數(shù)字出版應(yīng)用主要面向?qū)I(yè)出版、教育出版以及大眾出版三個(gè)領(lǐng)域,在專(zhuān)業(yè)出版領(lǐng)域中,尤其是科教領(lǐng)域,知識(shí)的獲取方式正在從傳統(tǒng)的標(biāo)準(zhǔn)化推送方式向個(gè)性化獲取方式轉(zhuǎn)變,基于個(gè)性化需求的知識(shí)動(dòng)態(tài)重組裝置逐漸成為一個(gè)重要的研究課題。通過(guò)動(dòng)態(tài)重組裝置,出版機(jī)構(gòu)能夠快速滿(mǎn)足讀者的個(gè)性化需求。
[0003]目前知識(shí)重組主要是基于檢索引擎實(shí)現(xiàn)的,通過(guò)檢索引擎把相關(guān)主題詞的內(nèi)容聚合到一起,然后經(jīng)過(guò)人工篩選形成新的出版物。現(xiàn)在主流的檢索引擎都是基于分詞技術(shù)來(lái)實(shí)現(xiàn)的,會(huì)存在以下幾方面問(wèn)題:中文分詞不準(zhǔn)確,導(dǎo)致查詢(xún)的知識(shí)不夠準(zhǔn)確,增加人工篩選的難度和工作量;只能檢索包含檢索詞或者有相似詞的內(nèi)容,導(dǎo)致有些看似無(wú)關(guān),但是實(shí)際和當(dāng)前知識(shí)密切相關(guān)的知識(shí)不能被檢索到。
[0004]除了通過(guò)正文內(nèi)容進(jìn)行全文檢索外,也可以通過(guò)給知識(shí)條目添加關(guān)鍵詞或者分類(lèi)屬性方式使檢索的結(jié)果更加精確,不過(guò)由于關(guān)鍵詞之間是相互獨(dú)立的,也只能獲取被標(biāo)注了關(guān)鍵詞的知識(shí)內(nèi)容,導(dǎo)致獲取的結(jié)果內(nèi)容不夠全面。
[0005]隨著信息技術(shù)的發(fā)展,本體論逐步被引入到信息【技術(shù)領(lǐng)域】,尤其是人工智能領(lǐng)域,通過(guò)領(lǐng)域本體能夠更好的描述知識(shí)以及知識(shí)之間的關(guān)聯(lián)關(guān)系,由于領(lǐng)域不同,該方式還沒(méi)有在數(shù)字出版領(lǐng)域進(jìn)行大規(guī)模應(yīng)用,并且在應(yīng)用時(shí)需要根據(jù)實(shí)際情況進(jìn)行完善、改進(jìn)。
[0006]因此,需要一種新的技術(shù)方案,可以通過(guò)領(lǐng)域本體建立知識(shí)之間的關(guān)聯(lián),為用戶(hù)提供更加精準(zhǔn)的個(gè)性化服務(wù),使平臺(tái)能夠給其帶來(lái)更大的價(jià)值,提升平臺(tái)的粘性。
【發(fā)明內(nèi)容】
[0007]本發(fā)明正是基于上述問(wèn)題,提出了一種新的技術(shù)方案,可以通過(guò)領(lǐng)域本體建立知識(shí)之間的關(guān)聯(lián),為用戶(hù)提供更加精準(zhǔn)的個(gè)性化服務(wù),使平臺(tái)能夠給其帶來(lái)更大的價(jià)值,提升平臺(tái)的粘性。
[0008]有鑒于此,本發(fā)明提出了一種知識(shí)重組系統(tǒng),包括:選擇單元,用于根據(jù)接收到的選擇命令,從預(yù)設(shè)的本體詞匯庫(kù)中選擇出目標(biāo)詞匯;查找單元,連接至所述選擇單元,用于在所述預(yù)設(shè)的本體詞匯庫(kù)中查找出與所述目標(biāo)詞匯存在關(guān)聯(lián)關(guān)系的多個(gè)詞匯,以組成詞匯集;提取單元,連接至所述查找單元,用于在預(yù)設(shè)的知識(shí)條目庫(kù)中,查找與所述詞匯集中的每個(gè)詞匯相關(guān)聯(lián)的目標(biāo)知識(shí)條目,并在查找到所述目標(biāo)知識(shí)條目時(shí),提取出所述目標(biāo)知識(shí)條目對(duì)應(yīng)的條目?jī)?nèi)容;文件生成單元,連接至所述提取單元,用于對(duì)所述提取單元提取出的所有條目?jī)?nèi)容進(jìn)行匯總,并根據(jù)所述詞匯集中每個(gè)詞匯和其他詞匯之間的關(guān)聯(lián)關(guān)系確定所述所有條目?jī)?nèi)容的排列順序,以按照所述排列順序?qū)λ鏊袟l目?jī)?nèi)容進(jìn)行組合,生成知識(shí)文件。[0009]在該技術(shù)方案中,從預(yù)設(shè)的本體詞匯庫(kù)中選擇出目標(biāo)詞匯,通過(guò)目標(biāo)詞匯則可在本體詞匯庫(kù)中找到多個(gè)詞匯,這樣,根據(jù)多個(gè)詞匯查找出與其關(guān)聯(lián)的知識(shí)條目,通過(guò)各詞匯之間的關(guān)聯(lián)關(guān)系(關(guān)聯(lián)關(guān)系包括上位關(guān)系,下位關(guān)系和同位關(guān)系),確定各個(gè)知識(shí)條目的順序,從而生成一個(gè)符合用戶(hù)要求的知識(shí)文件。這樣,不但降低了建立關(guān)聯(lián)關(guān)系的成本,而且可以生成滿(mǎn)足用戶(hù)不同需求的知識(shí)文件,即快速生成面向某個(gè)主題的出版物,為用戶(hù)提供更加個(gè)性化及精準(zhǔn)的服務(wù),提升用戶(hù)的使用體驗(yàn)。在上述技術(shù)方案中,優(yōu)選地,還包括:第一關(guān)聯(lián)單元,連接至所述查找單元,用于根據(jù)接收到的關(guān)聯(lián)命令,建立所述預(yù)設(shè)的本體詞匯庫(kù)中多個(gè)詞匯之間的關(guān)聯(lián)關(guān)系;第二關(guān)聯(lián)單元,連接至所述提取單元,用于根據(jù)接收到的關(guān)聯(lián)命令,將所述預(yù)設(shè)的本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行關(guān)聯(lián)。
[0010]在該技術(shù)方案中,為本體詞匯庫(kù)中的多個(gè)詞匯設(shè)置關(guān)聯(lián)關(guān)系,并在本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的知識(shí)條目建立關(guān)聯(lián),這樣,只要用戶(hù)選擇目標(biāo)詞匯,就可以在本體詞匯庫(kù)中找到與目標(biāo)詞匯關(guān)聯(lián)的所有詞匯,進(jìn)而根據(jù)這些詞匯找到對(duì)應(yīng)的知識(shí)條目,將這些知識(shí)條目按照順序組合,就可以生成知識(shí)文件。
[0011]在上述技術(shù)方案中,優(yōu)選地,所述第二關(guān)聯(lián)單元包括:關(guān)鍵詞提取單元,用于對(duì)所述知識(shí)條目庫(kù)中每個(gè)知識(shí)條目對(duì)應(yīng)的條目?jī)?nèi)容進(jìn)行解析,并獲取每個(gè)條目?jī)?nèi)容對(duì)應(yīng)的知識(shí)條目特征,其中,所述知識(shí)條目特征包括多個(gè)關(guān)鍵詞;確定單元,用于解析出所述知識(shí)條目特征中的多個(gè)關(guān)鍵詞,將所述多個(gè)關(guān)鍵詞中的每個(gè)關(guān)鍵詞和所述預(yù)設(shè)的本體詞匯庫(kù)中的每個(gè)詞匯進(jìn)行比較,并根據(jù)比較結(jié)果確定與所述知識(shí)條目特征對(duì)應(yīng)的詞匯,以確定與所述知識(shí)條目關(guān)聯(lián)的詞匯。
[0012]在該技術(shù)方案中,當(dāng)在本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的至少條目之間建立關(guān)聯(lián)時(shí),可以通過(guò)自動(dòng)推薦和人工調(diào)節(jié)相配合的方式建立,其中自動(dòng)推薦即解析知識(shí)條目中的關(guān)鍵詞,并將解析出的關(guān)鍵詞和本體詞匯庫(kù)中的詞匯進(jìn)行比較,從而為知識(shí)條目找到與其最匹配的詞匯,從而推薦給用戶(hù),這樣,用戶(hù)不需要自己一一建立關(guān)聯(lián)關(guān)系,降低了降低關(guān)聯(lián)關(guān)系的成本。
[0013]在上述技術(shù)方案中,優(yōu)選地,還包括:顯示單元,連接至所述選擇單元和所述文件生成單元,用于對(duì)所述知識(shí)文件、所述預(yù)設(shè)的本體詞匯庫(kù)中的詞庫(kù)和/或所述知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行顯示。
[0014]在該技術(shù)方案中,用戶(hù)可以直觀地查看到知識(shí)文件,預(yù)設(shè)的本體詞匯庫(kù)和知識(shí)條目中的內(nèi)容,這樣,為用戶(hù)提供可視化的界面,方便用戶(hù)的操作。
[0015]在上述技術(shù)方案中,優(yōu)選地,還包括:重組單元,連接至所述顯示單元,用于根據(jù)接收到的調(diào)整命令,對(duì)所述知識(shí)文件中的條目?jī)?nèi)容的排列順序進(jìn)行調(diào)整。
[0016]在該技術(shù)方案中,用戶(hù)還可以對(duì)生成的知識(shí)文件中的條目?jī)?nèi)容的順序進(jìn)行調(diào)整,從而保證知識(shí)文件的準(zhǔn)確性。
[0017]根據(jù)本發(fā)明的另一方面,還提供了一種知識(shí)重組方法,包括:根據(jù)接收到的選擇命令,從預(yù)設(shè)的本體詞匯庫(kù)中選擇出目標(biāo)詞匯;在所述預(yù)設(shè)的本體詞匯庫(kù)中查找出與所述目標(biāo)詞匯存在關(guān)聯(lián)關(guān)系的多個(gè)詞匯,以組成詞匯集;在預(yù)設(shè)的知識(shí)條目庫(kù)中,查找與所述詞匯集中的每個(gè)詞匯相關(guān)聯(lián)的目標(biāo)知識(shí)條目,并在查找到所述目標(biāo)知識(shí)條目時(shí),提取出所述目標(biāo)知識(shí)條目對(duì)應(yīng)的條目?jī)?nèi)容;對(duì)提取出的所有條目?jī)?nèi)容進(jìn)行匯總,并根據(jù)所述詞匯集中每個(gè)詞匯和其他詞匯之間的關(guān)聯(lián)關(guān)系確定所述所有條目?jī)?nèi)容的排列順序,以按照所述排列順序?qū)λ鏊袟l目?jī)?nèi)容進(jìn)行組合,生成知識(shí)文件。
[0018]在該技術(shù)方案中,從預(yù)設(shè)的本體詞匯庫(kù)中選擇出目標(biāo)詞匯,通過(guò)目標(biāo)詞匯則可在本體詞匯庫(kù)中找到多個(gè)詞匯,這樣,根據(jù)多個(gè)詞匯查找出與其關(guān)聯(lián)的知識(shí)條目,通過(guò)各詞匯之間的關(guān)聯(lián)關(guān)系(聯(lián)關(guān)系包括上位關(guān)系,下位關(guān)系和同位關(guān)系),確定各個(gè)知識(shí)條目的順序,從而生成一個(gè)符合用戶(hù)要求的知識(shí)文件。這樣,不但降低了建立關(guān)聯(lián)關(guān)系的成本,而且可以生成滿(mǎn)足用戶(hù)不同需求的知識(shí)文件,即快速生成面向某個(gè)主題的出版物,為用戶(hù)提供更加個(gè)性化及精準(zhǔn)的服務(wù),提升用戶(hù)的使用體驗(yàn)。
[0019]在上述技術(shù)方案中,優(yōu)選地,還包括:根據(jù)接收到的關(guān)聯(lián)命令,建立所述預(yù)設(shè)的本體詞匯庫(kù)中多個(gè)詞匯之間的關(guān)聯(lián)關(guān)系;根據(jù)接收到的關(guān)聯(lián)命令,將所述本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行關(guān)聯(lián)。
[0020]在該技術(shù)方案中,為本體詞匯庫(kù)中的多個(gè)詞匯設(shè)置關(guān)聯(lián)關(guān)系,并在本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的知識(shí)條目建立關(guān)聯(lián),這樣,只要用戶(hù)選擇目標(biāo)詞匯,就可以在本體詞匯庫(kù)中找到與目標(biāo)詞匯關(guān)聯(lián)的所有詞匯,進(jìn)而根據(jù)這些詞匯找到對(duì)應(yīng)的知識(shí)條目,將這些知識(shí)條目按照順序組合,就可以生成知識(shí)文件。
[0021]在上述技術(shù)方案中,優(yōu)選地,根據(jù)接收到的關(guān)聯(lián)命令,將所述本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行關(guān)聯(lián),具體包括:對(duì)所述知識(shí)條目庫(kù)中每個(gè)知識(shí)條目對(duì)應(yīng)的條目?jī)?nèi)容進(jìn)行解析,并獲取每個(gè)條目?jī)?nèi)容對(duì)應(yīng)的知識(shí)條目特征,其中,所述知識(shí)條目特征包括多個(gè)關(guān)鍵詞;解析出所述知識(shí)條目特征中的多個(gè)關(guān)鍵詞,將所述多個(gè)關(guān)鍵詞中的每個(gè)關(guān)鍵詞和所述預(yù)設(shè)的本體詞匯庫(kù)中的每個(gè)詞匯進(jìn)行比較,并根據(jù)比較結(jié)果確定與所述知識(shí)條目特征對(duì)應(yīng)的詞匯,以確定與所述知識(shí)條目關(guān)聯(lián)的詞匯。
[0022]在該技術(shù)方案中,當(dāng)在本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的至少條目之間建立關(guān)聯(lián)時(shí),可以通過(guò)自動(dòng)推薦和人工調(diào)節(jié)相配合的方式建立,其中自動(dòng)推薦即解析知識(shí)條目中的關(guān)鍵詞,并將解析出的關(guān)鍵詞和本體詞匯庫(kù)中的詞匯進(jìn)行比較,從而為知識(shí)條目找到與其最匹配的詞匯,從而推薦給用戶(hù),這樣,用戶(hù)不需要自己一一建立關(guān)聯(lián)關(guān)系,降低了降低關(guān)聯(lián)關(guān)系的成本。
[0023]在上述技術(shù)方案中,優(yōu)選地,還包括:對(duì)所述知識(shí)文件、所述預(yù)設(shè)的本體詞匯庫(kù)中的詞庫(kù)和/或所述知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行顯示。
[0024]在該技術(shù)方案中,用戶(hù)可以直觀地查看到知識(shí)文件,預(yù)設(shè)的本體詞匯庫(kù)和知識(shí)條目中的內(nèi)容,這樣,為用戶(hù)提供可視化的界面,方便用戶(hù)的操作。
[0025]在上述技術(shù)方案中,優(yōu)選地,還包括:根據(jù)接收到的調(diào)整命令,對(duì)所述知識(shí)文件中的條目?jī)?nèi)容的排列順序進(jìn)行調(diào)整。
[0026]在該技術(shù)方案中,用戶(hù)還可以對(duì)生成的知識(shí)文件中的條目?jī)?nèi)容的順序進(jìn)行調(diào)整,從而保證知識(shí)文件的準(zhǔn)確性。
[0027]通過(guò)以上技術(shù)方案,可以通過(guò)領(lǐng)域本體建立知識(shí)之間的關(guān)聯(lián),為用戶(hù)提供更加精準(zhǔn)的個(gè)性化服務(wù),使平臺(tái)能夠給其帶來(lái)更大的價(jià)值,提升平臺(tái)的粘性。
【專(zhuān)利附圖】
【附圖說(shuō)明】
[0028]圖1示出了根據(jù)本發(fā)明的實(shí)施例的知識(shí)重組系統(tǒng)的框圖;
[0029]圖2示出了根據(jù)本發(fā)明的實(shí)施例的知識(shí)重組方法的流程圖;[0030]圖3示出了根據(jù)本發(fā)明的實(shí)施例的知識(shí)重組系統(tǒng)的結(jié)構(gòu)圖;
[0031]圖4示出了根據(jù)本發(fā)明的實(shí)施例的知識(shí)重組方法的具體流程圖。
【具體實(shí)施方式】
[0032]為了能夠更清楚地理解本發(fā)明的上述目的、特征和優(yōu)點(diǎn),下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本發(fā)明進(jìn)行進(jìn)一步的詳細(xì)描述。需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)的實(shí)施例及實(shí)施例中的特征可以相互組合。
[0033]在下面的描述中闡述了很多具體細(xì)節(jié)以便于充分理解本發(fā)明,但是,本發(fā)明還可以采用其他不同于在此描述的其他方式來(lái)實(shí)施,因此,本發(fā)明的保護(hù)范圍并不受下面公開(kāi)的具體實(shí)施例的限制。
[0034]圖1示出了根據(jù)本發(fā)明的實(shí)施例的知識(shí)重組系統(tǒng)的框圖。
[0035]如圖1所示,根據(jù)本發(fā)明的實(shí)施例的知識(shí)重組系統(tǒng)100,包括:選擇單元102,用于根據(jù)接收到的選擇命令,從預(yù)設(shè)的本體詞匯庫(kù)中選擇出目標(biāo)詞匯;查找單元104,連接至所述選擇單元102,用于在所述預(yù)設(shè)的本體詞匯庫(kù)中查找出與所述目標(biāo)詞匯存在關(guān)聯(lián)關(guān)系的多個(gè)詞匯,以組成詞匯集;提取單元106,連接至所述查找單元104,用于在預(yù)設(shè)的知識(shí)條目庫(kù)中,查找與所述詞匯集中的每個(gè)詞匯相關(guān)聯(lián)的目標(biāo)知識(shí)條目,并在查找到所述目標(biāo)知識(shí)條目時(shí),提取出所述目標(biāo)知識(shí)條目對(duì)應(yīng)的條目?jī)?nèi)容;文件生成單元108,連接至所述提取單元106,用于對(duì)所述提取單元提取出的所有條目?jī)?nèi)容進(jìn)行匯總,并根據(jù)所述詞匯集中每個(gè)詞匯和其他詞匯之間的關(guān)聯(lián)關(guān)系確定所述所有條目?jī)?nèi)容的排列順序,以按照所述排列順序?qū)λ鏊袟l目?jī)?nèi)容進(jìn)行組合,生成知識(shí)文件。
[0036]在該技術(shù)方案中,從預(yù)設(shè)的本體詞匯庫(kù)中選擇出目標(biāo)詞匯,通過(guò)目標(biāo)詞匯則可在本體詞匯庫(kù)中找到多個(gè)詞匯,這樣,根據(jù)多個(gè)詞匯查找出與其關(guān)聯(lián)的知識(shí)條目,通過(guò)各詞匯之間的關(guān)聯(lián)關(guān)系(關(guān)聯(lián)關(guān)系包括上位關(guān)系,下位關(guān)系和同位關(guān)系),確定各個(gè)知識(shí)條目的順序,從而生成一個(gè)符合用戶(hù)要求的知識(shí)文件。這樣,不但降低了建立關(guān)聯(lián)關(guān)系的成本,而且可以生成滿(mǎn)足用戶(hù)不同需求的知識(shí)文件,即快速生成面向某個(gè)主題的出版物,為用戶(hù)提供更加個(gè)性化及精準(zhǔn)的服務(wù),提升用戶(hù)的使用體驗(yàn)。
[0037]在上述技術(shù)方案中,優(yōu)選地,還包括:第一關(guān)聯(lián)單元110,連接至所述查找單元104,用于根據(jù)接收到的關(guān)聯(lián)命令,建立所述預(yù)設(shè)的本體詞匯庫(kù)中多個(gè)詞匯之間的關(guān)聯(lián)關(guān)系;第二關(guān)聯(lián)單元112,連接至所述提取單元106,用于根據(jù)接收到的關(guān)聯(lián)命令,將所述預(yù)設(shè)的本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行關(guān)聯(lián)。
[0038]在該技術(shù)方案中,為本體詞匯庫(kù)中的多個(gè)詞匯設(shè)置關(guān)聯(lián)關(guān)系,并在本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的知識(shí)條目建立關(guān)聯(lián),這樣,只要用戶(hù)選擇目標(biāo)詞匯,就可以在本體詞匯庫(kù)中找到與目標(biāo)詞匯關(guān)聯(lián)的所有詞匯,進(jìn)而根據(jù)這些詞匯找到對(duì)應(yīng)的知識(shí)條目,將這些知識(shí)條目按照順序組合,就可以生成知識(shí)文件。
[0039]在上述技術(shù)方案中,優(yōu)選地,所述第二關(guān)聯(lián)單元112包括:關(guān)鍵詞提取單元1122,用于對(duì)所述知識(shí)條目庫(kù)中每個(gè)知識(shí)條目對(duì)應(yīng)的條目?jī)?nèi)容進(jìn)行解析,并獲取每個(gè)條目?jī)?nèi)容對(duì)應(yīng)的知識(shí)條目特征,其中,所述知識(shí)條目特征包括多個(gè)關(guān)鍵詞;確定單元1124,用于解析出所述知識(shí)條目特征中的多個(gè)關(guān)鍵詞,將所述多個(gè)關(guān)鍵詞中的每個(gè)關(guān)鍵詞和所述預(yù)設(shè)的本體詞匯庫(kù)中的每個(gè)詞匯進(jìn)行比較,并根據(jù)比較結(jié)果確定與所述知識(shí)條目特征對(duì)應(yīng)的詞匯,以確定與所述知識(shí)條目關(guān)聯(lián)的詞匯。
[0040]在該技術(shù)方案中,當(dāng)在本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的至少條目之間建立關(guān)聯(lián)時(shí),可以通過(guò)自動(dòng)推薦和人工調(diào)節(jié)相配合的方式建立,其中自動(dòng)推薦即解析知識(shí)條目中的關(guān)鍵詞,并將解析出的關(guān)鍵詞和本體詞匯庫(kù)中的詞匯進(jìn)行比較,從而為知識(shí)條目找到與其最匹配的詞匯,從而推薦給用戶(hù),這樣,用戶(hù)不需要自己一一建立關(guān)聯(lián)關(guān)系,降低了降低關(guān)聯(lián)關(guān)系的成本。
[0041 ] 在上述技術(shù)方案中,優(yōu)選地,還包括:顯示單元114,連接至所述選擇單元102和所述文件生成單元108,用于對(duì)所述知識(shí)文件、所述預(yù)設(shè)的本體詞匯庫(kù)中的詞庫(kù)和/或所述知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行顯示。
[0042]在該技術(shù)方案中,用戶(hù)可以直觀地查看到知識(shí)文件,預(yù)設(shè)的本體詞匯庫(kù)和知識(shí)條目中的內(nèi)容,這樣,為用戶(hù)提供可視化的界面,方便用戶(hù)的操作。
[0043]在上述技術(shù)方案中,優(yōu)選地,還包括:重組單元116,連接至所述顯示單元114,用于根據(jù)接收到的調(diào)整命令,對(duì)所述知識(shí)文件中的條目?jī)?nèi)容的排列順序進(jìn)行調(diào)整。
[0044]在該技術(shù)方案中,用戶(hù)還可以對(duì)生成的知識(shí)文件中的條目?jī)?nèi)容的順序進(jìn)行調(diào)整,從而保證知識(shí)文件的準(zhǔn)確性。
[0045]圖2示出了根據(jù)本發(fā)明的實(shí)施例的知識(shí)重組方法的流程圖。
[0046]如圖2所示,根據(jù)本發(fā)明的實(shí)施例的知識(shí)重組方法,包括:步驟202,根據(jù)接收到的選擇命令,從預(yù)設(shè)的本體詞匯庫(kù)中選擇出目標(biāo)詞匯;步驟204,在所述預(yù)設(shè)的本體詞匯庫(kù)中查找出與所述目標(biāo)詞匯存在關(guān)聯(lián)關(guān)系的多個(gè)詞匯,以組成詞匯集;步驟206,在預(yù)設(shè)的知識(shí)條目庫(kù)中,查找與所述詞匯集中的每個(gè)詞匯相關(guān)聯(lián)的目標(biāo)知識(shí)條目,并在查找到所述目標(biāo)知識(shí)條目時(shí),提取出所述目標(biāo)知識(shí)條目對(duì)應(yīng)的條目?jī)?nèi)容;步驟208,對(duì)提取出的所有條目?jī)?nèi)容進(jìn)行匯總,并根據(jù)所述詞匯集中每個(gè)詞匯和其他詞匯之間的關(guān)聯(lián)關(guān)系確定所述所有條目?jī)?nèi)容的排列順序,以按照所述排列順序?qū)λ鏊袟l目?jī)?nèi)容進(jìn)行組合,生成知識(shí)文件。
[0047]在該技術(shù)方案中,從預(yù)設(shè)的本體詞匯庫(kù)中選擇出目標(biāo)詞匯,通過(guò)目標(biāo)詞匯則可在本體詞匯庫(kù)中找到多個(gè)詞匯,這樣,根據(jù)多個(gè)詞匯查找出與其關(guān)聯(lián)的知識(shí)條目,通過(guò)各詞匯之間的關(guān)系,確定各個(gè)知識(shí)條目的順序,從而生成一個(gè)符合用戶(hù)要求的知識(shí)文件。這樣,不但降低了建立關(guān)聯(lián)關(guān)系的成本,而且可以生成滿(mǎn)足用戶(hù)不同需求的知識(shí)文件,即快速生成面向某個(gè)主題的出版物,為用戶(hù)提供更加個(gè)性化及精準(zhǔn)的服務(wù),提升用戶(hù)的使用體驗(yàn)。
[0048]在上述技術(shù)方案中,優(yōu)選地,還包括:根據(jù)接收到的關(guān)聯(lián)命令,建立所述預(yù)設(shè)的本體詞匯庫(kù)中多個(gè)詞匯之間的關(guān)聯(lián)關(guān)系;根據(jù)接收到的關(guān)聯(lián)命令,將所述本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行關(guān)聯(lián)。
[0049]在該技術(shù)方案中,為本體詞匯庫(kù)中的多個(gè)詞匯設(shè)置關(guān)聯(lián)關(guān)系,并在本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的知識(shí)條目建立關(guān)聯(lián),這樣,只要用戶(hù)選擇目標(biāo)詞匯,就可以在本體詞匯庫(kù)中找到與目標(biāo)詞匯關(guān)聯(lián)的所有詞匯,進(jìn)而根據(jù)這些詞匯找到對(duì)應(yīng)的知識(shí)條目,將這些知識(shí)條目按照順序組合,就可以生成知識(shí)文件。
[0050]在上述技術(shù)方案中,優(yōu)選地,根據(jù)接收到的關(guān)聯(lián)命令,將所述本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行關(guān)聯(lián),具體包括:對(duì)所述知識(shí)條目庫(kù)中每個(gè)知識(shí)條目對(duì)應(yīng)的條目?jī)?nèi)容進(jìn)行解析,并獲取每個(gè)條目?jī)?nèi)容對(duì)應(yīng)的知識(shí)條目特征,其中,所述知識(shí)條目特征包括多個(gè)關(guān)鍵詞;解析出所述知識(shí)條目特征中的多個(gè)關(guān)鍵詞,將所述多個(gè)關(guān)鍵詞中的每個(gè)關(guān)鍵詞和所述預(yù)設(shè)的本體詞匯庫(kù)中的每個(gè)詞匯進(jìn)行比較,并根據(jù)比較結(jié)果確定與所述知識(shí)條目特征對(duì)應(yīng)的詞匯,以確定與所述知識(shí)條目關(guān)聯(lián)的詞匯。
[0051]在該技術(shù)方案中,當(dāng)在本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的至少條目之間建立關(guān)聯(lián)時(shí),可以通過(guò)自動(dòng)推薦和人工調(diào)節(jié)相配合的方式建立,其中自動(dòng)推薦即解析知識(shí)條目中的關(guān)鍵詞,并將解析出的關(guān)鍵詞和本體詞匯庫(kù)中的詞匯進(jìn)行比較,從而為知識(shí)條目找到與其最匹配的詞匯,從而推薦給用戶(hù),這樣,用戶(hù)不需要自己一一建立關(guān)聯(lián)關(guān)系,降低了降低關(guān)聯(lián)關(guān)系的成本。
[0052]在上述技術(shù)方案中,優(yōu)選地,還包括:對(duì)所述知識(shí)文件、所述預(yù)設(shè)的本體詞匯庫(kù)中的詞庫(kù)和/或所述知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行顯示。
[0053]在該技術(shù)方案中,用戶(hù)可以直觀地查看到知識(shí)文件,預(yù)設(shè)的本體詞匯庫(kù)和知識(shí)條目中的內(nèi)容,這樣,為用戶(hù)提供可視化的界面,方便用戶(hù)的操作。
[0054]在上述技術(shù)方案中,優(yōu)選地,還包括:根據(jù)接收到的調(diào)整命令,對(duì)所述知識(shí)文件中的條目?jī)?nèi)容的排列順序進(jìn)行調(diào)整。
[0055]在該技術(shù)方案中,用戶(hù)還可以對(duì)生成的知識(shí)文件中的條目?jī)?nèi)容的順序進(jìn)行調(diào)整,從而保證知識(shí)文件的準(zhǔn)確性。
[0056]圖3示出了根據(jù)本發(fā)明的實(shí)施例的知識(shí)重組系統(tǒng)的結(jié)構(gòu)圖。
[0057]如圖3所示,根據(jù)本發(fā)明的實(shí)施例的知識(shí)重組系統(tǒng)300包括:
[0058]科教領(lǐng)域本體構(gòu)建裝置302:用于構(gòu)建科教領(lǐng)域本體模型,包括領(lǐng)域詞匯的構(gòu)建、詞匯類(lèi)別的劃分以及詞匯關(guān)聯(lián)關(guān)系的構(gòu)建。
[0059]領(lǐng)域本體與知識(shí)條目關(guān)聯(lián)裝置304:用戶(hù)構(gòu)建領(lǐng)域本體與知識(shí)條目的關(guān)聯(lián)關(guān)系,根據(jù)知識(shí)條目特征,把知識(shí)條目劃分到某個(gè)本體下。
[0060]產(chǎn)品動(dòng)態(tài)重組裝置304:根據(jù)個(gè)性化需求,動(dòng)態(tài)生成數(shù)字產(chǎn)品內(nèi)容。
[0061]其中,科教領(lǐng)域本地構(gòu)建裝置302提供領(lǐng)域詞匯批量導(dǎo)入和手工錄入工具,實(shí)現(xiàn)領(lǐng)域詞匯的快速錄入。錄入過(guò)程中自動(dòng)與已經(jīng)存在的領(lǐng)域詞匯進(jìn)行比較,判斷是否已經(jīng)存在,如果存在給予提示。再進(jìn)一步,還可以對(duì)已經(jīng)錄入的領(lǐng)域詞匯進(jìn)行類(lèi)別劃分。再進(jìn)一步,建立領(lǐng)域詞匯之間的關(guān)聯(lián)關(guān)系,包括上位關(guān)系、下位關(guān)系、同位關(guān)系等。
[0062]領(lǐng)域本體與知識(shí)條目關(guān)聯(lián)裝置304根據(jù)分詞技術(shù)自動(dòng)對(duì)知識(shí)條目進(jìn)行分詞,提取知識(shí)條目的關(guān)鍵特征。根據(jù)知識(shí)條目提取的關(guān)鍵特征,自動(dòng)獲取相似的本體詞匯作為推薦。其可以提供可視化的頁(yè)面顯示知識(shí)條目、知識(shí)條目特征以及推薦的默認(rèn)本體詞匯,還可以提供本體詞匯手工修正裝置,使用戶(hù)可以對(duì)知識(shí)條目的本體詞匯進(jìn)行調(diào)整。
[0063]產(chǎn)品動(dòng)態(tài)重組裝置306根據(jù)當(dāng)前用戶(hù)選擇的本體詞匯,獲取本體詞匯相關(guān)的知識(shí)條目展現(xiàn)給用戶(hù)。產(chǎn)品動(dòng)態(tài)重組裝置306可以提供本體詞匯選擇,用戶(hù)可以快速選擇自己感興趣的詞匯,其可以根據(jù)用戶(hù)選擇的本體詞匯獲取與其密切關(guān)聯(lián)的本體詞匯,構(gòu)成領(lǐng)域本體詞匯表,繼而根據(jù)領(lǐng)域本體詞匯表,從條目索引庫(kù)中獲取條目ID集合,并根據(jù)條目ID集合獲取條目?jī)?nèi)容,返回給頁(yè)面供用戶(hù)瀏覽。進(jìn)一步第,產(chǎn)品動(dòng)態(tài)重組裝置306提供可視化的調(diào)整功能,用戶(hù)調(diào)整完畢后,完成整個(gè)知識(shí)文件的內(nèi)容重組。
[0064]圖4示出了根據(jù)本發(fā)明的實(shí)施例的知識(shí)重組方法的具體流程圖。
[0065]如圖4所示,根據(jù)本發(fā)明的實(shí)施例的知識(shí)重組方法的具體流程如下:
[0066]步驟402,接收用戶(hù)錄入的科教領(lǐng)域詞匯,其中用戶(hù)可以采用詞匯表批量導(dǎo)入以及手工創(chuàng)建的方式進(jìn)行錄入,從而建立科教領(lǐng)域詞匯表,并對(duì)錄入的詞匯根據(jù)科教領(lǐng)域分類(lèi)體系對(duì)詞匯進(jìn)行分類(lèi)劃分。
[0067]步驟404,建立領(lǐng)域詞匯的關(guān)聯(lián)關(guān)系:對(duì)錄入的領(lǐng)域詞匯設(shè)置關(guān)聯(lián)關(guān)系,包括上位詞、下位詞、同位詞等。
[0068]步驟406,提取知識(shí)條目的特征:依據(jù)分詞技術(shù),從知識(shí)條目的全文內(nèi)容中提取知識(shí)條目的特征,每個(gè)知識(shí)條目特征由十個(gè)關(guān)鍵詞組成。
[0069]步驟408,匹配相似領(lǐng)域詞匯:用知識(shí)條目特征和領(lǐng)域詞匯進(jìn)行比較,形成相似領(lǐng)域詞表作為推薦詞匯集合。
[0070]步驟410,人工對(duì)條目的關(guān)聯(lián)的領(lǐng)域詞匯進(jìn)行調(diào)整,確認(rèn)最終標(biāo)注的領(lǐng)域詞匯。
[0071]步驟412,選擇要獲取的領(lǐng)域詞匯:顯示領(lǐng)域詞匯,從領(lǐng)域詞匯中選擇自己要獲取知識(shí)的領(lǐng)域。并根據(jù)所選領(lǐng)域詞匯,從領(lǐng)域本體中獲取相關(guān)度比較高的詞匯作為領(lǐng)域詞匯
口 O
[0072]步驟414,獲取知識(shí)條目,進(jìn)行重組。根據(jù)領(lǐng)域詞匯集合,從知識(shí)條目的存儲(chǔ)索引中,獲取符合領(lǐng)域詞匯的知識(shí)條目ID集合,根據(jù)知識(shí)條目ID集合,獲取知識(shí)條目?jī)?nèi)容,將獲取的知識(shí)條目?jī)?nèi)容按照領(lǐng)域詞匯的關(guān)聯(lián)關(guān)系及類(lèi)別進(jìn)行分類(lèi)重組,形成結(jié)構(gòu)化的動(dòng)態(tài)出版物,通過(guò)終端展示最終的動(dòng)態(tài)出版物內(nèi)容。
[0073]采用本發(fā)明的所述的動(dòng)態(tài)重組方法,提升了動(dòng)態(tài)重組的準(zhǔn)確性,通過(guò)對(duì)知識(shí)條目進(jìn)行本體詞匯標(biāo)引,建立起知識(shí)條目之間的關(guān)聯(lián)關(guān)系,從而不僅降低了建立關(guān)聯(lián)關(guān)系的成本,而且通過(guò)動(dòng)態(tài)重組,可以快速生成面向某個(gè)主題的出版物,為用戶(hù)提供更加個(gè)性化及精準(zhǔn)的服務(wù),提高平臺(tái)的粘性。
[0074]以上結(jié)合附圖詳細(xì)說(shuō)明了本發(fā)明的技術(shù)方案,通過(guò)本發(fā)明的技術(shù)方案,不但降低了建立關(guān)聯(lián)關(guān)系的成本,而且可以生成滿(mǎn)足用戶(hù)不同需求的知識(shí)文件,即快速生成面向某個(gè)主題的出版物,為用戶(hù)提供更加個(gè)性化及精準(zhǔn)的服務(wù),提升用戶(hù)的使用體驗(yàn)。
[0075]以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。
【權(quán)利要求】
1.一種知識(shí)重組系統(tǒng),其特征在于,包括: 選擇單元,用于根據(jù)接收到的選擇命令,從預(yù)設(shè)的本體詞匯庫(kù)中選擇出目標(biāo)詞匯; 查找單元,連接至所述選擇單元,用于在所述預(yù)設(shè)的本體詞匯庫(kù)中查找出與所述目標(biāo)詞匯存在關(guān)聯(lián)關(guān)系的多個(gè)詞匯,以組成詞匯集; 提取單元,連接至所述查找單元,用于在預(yù)設(shè)的知識(shí)條目庫(kù)中,查找與所述詞匯集中的每個(gè)詞匯相關(guān)聯(lián)的目標(biāo)知識(shí)條目,并在查找到所述目標(biāo)知識(shí)條目時(shí),提取出所述目標(biāo)知識(shí)條目對(duì)應(yīng)的條目?jī)?nèi)容; 文件生成單元,連接至所述提取單元,用于對(duì)所述提取單元提取出的所有條目?jī)?nèi)容進(jìn)行匯總,并根據(jù)所述詞匯集中每個(gè)詞匯和其他詞匯之間的關(guān)聯(lián)關(guān)系確定所述所有條目?jī)?nèi)容的排列順序,以按照所述排列順序?qū)λ鏊袟l目?jī)?nèi)容進(jìn)行組合,生成知識(shí)文件。
2.根據(jù)權(quán)利要求1所述的知識(shí)重組系統(tǒng),其特征在于,還包括: 第一關(guān)聯(lián)單元,連接至所述查找單元,用于根據(jù)接收到的關(guān)聯(lián)命令,建立所述預(yù)設(shè)的本體詞匯庫(kù)中多個(gè)詞匯之間的關(guān)聯(lián)關(guān)系; 第二關(guān)聯(lián)單元,連接至所述提取單元,用于根據(jù)接收到的關(guān)聯(lián)命令,將所述預(yù)設(shè)的本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行關(guān)聯(lián)。
3.根據(jù)權(quán)利要求2所述的知識(shí)重組系統(tǒng),其特征在于,所述第二關(guān)聯(lián)單元包括: 關(guān)鍵詞提取單元,用于對(duì)所述知識(shí)條目庫(kù)中每個(gè)知識(shí)條目對(duì)應(yīng)的條目?jī)?nèi)容進(jìn)行解析,并獲取每個(gè)條目?jī)?nèi)容對(duì)應(yīng)的知識(shí)條目特征,其中,所述知識(shí)條目特征包括多個(gè)關(guān)鍵詞; 確定單元,用于解析出所述知識(shí)條目特征中的多個(gè)關(guān)鍵詞,將所述多個(gè)關(guān)鍵詞中的每個(gè)關(guān)鍵詞和所述預(yù)設(shè)的本體詞匯庫(kù)中的每個(gè)詞匯進(jìn)行比較,并根據(jù)比較結(jié)果確定與所述知識(shí)條目特征對(duì)應(yīng)的詞匯,以確定與所述知識(shí)條目關(guān)聯(lián)的詞匯。
4.根據(jù)權(quán)利要求1至3中任一項(xiàng)所述的知識(shí)重組系統(tǒng),其特征在于,還包括: 顯示單元,連接至所述選擇單元和所述文件生成單元,用于對(duì)所述知識(shí)文件、所述預(yù)設(shè)的本體詞匯庫(kù)中的詞庫(kù)和/或所述知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行顯示。
5.根據(jù)權(quán)利要求4所述的知識(shí)重組系統(tǒng),其特征在于,還包括: 重組單元,連接至所述顯示單元,用于根據(jù)接收到的調(diào)整命令,對(duì)所述知識(shí)文件中的條目?jī)?nèi)容的排列順序進(jìn)行調(diào)整。
6.一種知識(shí)重組方法,其特征在于,包括: 根據(jù)接收到的選擇命令,從預(yù)設(shè)的本體詞匯庫(kù)中選擇出目標(biāo)詞匯; 在所述預(yù)設(shè)的本體詞匯庫(kù)中查找出與所述目標(biāo)詞匯存在關(guān)聯(lián)關(guān)系的多個(gè)詞匯,以組成詞匯集,其中,所述關(guān)聯(lián)關(guān)系包括上位關(guān)系,下位關(guān)系和同位關(guān)系; 在預(yù)設(shè)的知識(shí)條目庫(kù)中,查找與所述詞匯集中的每個(gè)詞匯相關(guān)聯(lián)的目標(biāo)知識(shí)條目,并在查找到所述目標(biāo)知識(shí)條目時(shí),提取出所述目標(biāo)知識(shí)條目對(duì)應(yīng)的條目?jī)?nèi)容; 對(duì)提取出的所有條目?jī)?nèi)容進(jìn)行匯總,并根據(jù)所述詞匯集中每個(gè)詞匯和其他詞匯之間的關(guān)聯(lián)關(guān)系確定所述所有條目?jī)?nèi)容的排列順序,以按照所述排列順序?qū)λ鏊袟l目?jī)?nèi)容進(jìn)行組合,生成知識(shí)文件。
7.根據(jù)權(quán)利要求6所述的知識(shí)重組方法,其特征在于,還包括: 根據(jù)接收到的關(guān)聯(lián)命令,建立所述預(yù)設(shè)的本體詞匯庫(kù)中多個(gè)詞匯之間的關(guān)聯(lián)關(guān)系; 根據(jù)接收到的關(guān)聯(lián)命令,將所述本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行關(guān)聯(lián)。
8.根據(jù)權(quán)利要求7所述的知識(shí)重組方法,其特征在于,根據(jù)接收到的關(guān)聯(lián)命令,將所述本體詞匯庫(kù)中的詞匯和知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行關(guān)聯(lián),具體包括: 對(duì)所述知識(shí)條目庫(kù)中每個(gè)知識(shí)條目對(duì)應(yīng)的條目?jī)?nèi)容進(jìn)行解析,并獲取每個(gè)條目?jī)?nèi)容對(duì)應(yīng)的知識(shí)條目特征,其中,所述知識(shí)條目特征包括多個(gè)關(guān)鍵詞; 解析出所述知識(shí)條目特征中的多個(gè)關(guān)鍵詞,將所述多個(gè)關(guān)鍵詞中的每個(gè)關(guān)鍵詞和所述預(yù)設(shè)的本體詞匯庫(kù)中的每個(gè)詞匯進(jìn)行比較,并根據(jù)比較結(jié)果確定與所述知識(shí)條目特征對(duì)應(yīng)的詞匯,以確定與所述知識(shí)條目關(guān)聯(lián)的詞匯。
9.根據(jù)權(quán)利要求6至8中任一項(xiàng)所述的知識(shí)重組方法,其特征在于,還包括: 對(duì)所述知識(shí)文件、所述預(yù)設(shè)的本體詞匯庫(kù)中的詞庫(kù)和/或所述知識(shí)條目庫(kù)中的知識(shí)條目進(jìn)行顯示。
10.根據(jù)權(quán)利要求9所述的知識(shí)重組方法,其特征在于,還包括: 根據(jù)接收到的調(diào)整命令,對(duì)所述知識(shí)文件中的條目?jī)?nèi)容的排列順序進(jìn)行調(diào)整。
【文檔編號(hào)】G06F17/30GK103927339SQ201410119484
【公開(kāi)日】2014年7月16日 申請(qǐng)日期:2014年3月27日 優(yōu)先權(quán)日:2014年3月27日
【發(fā)明者】陳長(zhǎng)剛, 百華睿 申請(qǐng)人:北大方正集團(tuán)有限公司, 北京北大方正電子有限公司