国产精品1024永久观看,大尺度欧美暖暖视频在线观看,亚洲宅男精品一区在线观看,欧美日韩一区二区三区视频,2021中文字幕在线观看

  • <option id="fbvk0"></option>
    1. <rt id="fbvk0"><tr id="fbvk0"></tr></rt>
      <center id="fbvk0"><optgroup id="fbvk0"></optgroup></center>
      <center id="fbvk0"></center>

      <li id="fbvk0"><abbr id="fbvk0"><dl id="fbvk0"></dl></abbr></li>

      文字作品數(shù)字指紋庫的比對方法及系統(tǒng)的制作方法

      文檔序號:6435600閱讀:231來源:國知局
      專利名稱:文字作品數(shù)字指紋庫的比對方法及系統(tǒng)的制作方法
      技術(shù)領(lǐng)域
      本發(fā)明涉及數(shù)字指紋應(yīng)用領(lǐng)域,尤其涉及一種文字作品數(shù)字指紋庫的比對方法及系統(tǒng)。
      背景技術(shù)
      網(wǎng)絡(luò)文學(xué),是隨著互聯(lián)網(wǎng)的普及而產(chǎn)生的?;ヂ?lián)網(wǎng)絡(luò)為上億網(wǎng)民提供了多如恒沙的各類文學(xué)資料信息,與此同時(shí),一種以這種新興媒體為載體、依托、手段,以網(wǎng)民為接受對象,具有不同于傳統(tǒng)文學(xué)特點(diǎn)的網(wǎng)絡(luò)文學(xué)悄然勃興。由于借助強(qiáng)大的網(wǎng)絡(luò)媒介,網(wǎng)絡(luò)文學(xué)具有多樣性、互動(dòng)性和知識產(chǎn)權(quán)保護(hù)困難的特點(diǎn)。其形式可以類似傳統(tǒng)文學(xué),也可以是博文、帖子等非傳統(tǒng)文體。實(shí)時(shí)回復(fù)、實(shí)時(shí)評論和投票是網(wǎng)絡(luò)文學(xué)的重要特征。目前,網(wǎng)絡(luò)書站的數(shù)據(jù)庫收錄大量原創(chuàng)網(wǎng)絡(luò)文字作品,網(wǎng)絡(luò)書站負(fù)有保護(hù)其版權(quán)的責(zé)任,但是由于網(wǎng)絡(luò)文學(xué)的易獲性使得盜版復(fù)制行為越來越猖獗。這種行為不僅危及著作者的切身利益,而且影響了科學(xué)文化的健康發(fā)展。文字作品對比,就是判斷一個(gè)文字作品的內(nèi)容是否是盜版復(fù)制。當(dāng)網(wǎng)絡(luò)書站的數(shù)據(jù)庫收錄作品量達(dá)到一定級別時(shí),從該數(shù)據(jù)庫中進(jìn)行文字作品對比時(shí)通常會(huì)花費(fèi)較長的時(shí)間,這將造成高額的時(shí)間成本,數(shù)據(jù)庫系統(tǒng)的性能和數(shù)據(jù)組織管理能力也會(huì)因此大大的減弱,甚至?xí)斐上到y(tǒng)的崩潰。因此,需要一種文字作品比對方法及系統(tǒng),能夠優(yōu)化大規(guī)模文字作品數(shù)據(jù)庫查詢, 實(shí)現(xiàn)文字作品的高效地查詢比對。

      發(fā)明內(nèi)容
      本發(fā)明的目的在于提供一種文字作品數(shù)字指紋庫的比對方法及系統(tǒng),利用數(shù)字指紋的顆粒度大小,優(yōu)化大規(guī)模文字作品數(shù)據(jù)庫查詢,實(shí)現(xiàn)文字作品的高效地查詢比對。為解決上述問題,本發(fā)明提供一種文字作品數(shù)字指紋庫的比對方法,包括步驟Sl 對已有文字作品進(jìn)行分類,建立分類數(shù)據(jù)庫;步驟S2 采集所述分類數(shù)據(jù)庫中的每部已有文字作品的大小不同的顆粒度數(shù)字指紋,建立所述分類數(shù)據(jù)庫的數(shù)字指紋庫;步驟S3 根據(jù)待比對的文字作品的分類確定其所屬的分類數(shù)據(jù)庫;步驟S4 采集所述待比對的文字作品的大小不同的顆粒度數(shù)字指紋;步驟S5 按照所述待比對的文字作品的顆粒度數(shù)字指紋由大到小的順序,完成待比對的文字作品在其所屬的分類數(shù)據(jù)庫的數(shù)字指紋庫中的查詢比對。進(jìn)一步的,所述顆粒度數(shù)字指紋按照由大到小的順序依次為整部數(shù)字指紋、章節(jié)數(shù)字指紋和段落數(shù)字指紋。進(jìn)一步的,所述步驟S5具體包括步驟S51 將所述待比對的文字作品的整部數(shù)字指紋與其所屬的分類數(shù)據(jù)庫的數(shù)
      4字指紋庫中的整部數(shù)字指紋進(jìn)行比對,若不匹配,比對結(jié)束;若匹配,繼續(xù)步驟S52 ;步驟S52 將所述待比對的文字作品的章節(jié)數(shù)字指紋與整部數(shù)字指紋匹配的已有文字作品的章節(jié)數(shù)字指紋進(jìn)行比對,若不匹配,比對結(jié)束;若匹配,繼續(xù)步驟S53 ;步驟S53 將所述待比對的文字作品的段落數(shù)字指紋與章節(jié)數(shù)字指紋匹配的已有文字作品的段落數(shù)字指紋進(jìn)行比對,若不匹配,比對結(jié)束;若匹配,將所述待比對的文字作品的來源進(jìn)行標(biāo)記和存檔。進(jìn)一步的,所屬同一分類數(shù)據(jù)庫的已有文字作品,按照存取的頻率不同存放在其所屬的分類數(shù)據(jù)庫的不同位置。相應(yīng)的,本發(fā)明還提供一種文字作品數(shù)字指紋庫的比對系統(tǒng),包括分類數(shù)據(jù)庫模塊,用于對已有文字作品進(jìn)行分類,建立分類數(shù)據(jù)庫;數(shù)字指紋庫模塊,用于采集所述分類數(shù)據(jù)庫中的每部已有文字作品的大小不同的顆粒度數(shù)字指紋,建立所述分類數(shù)據(jù)庫的數(shù)字指紋庫;分類查詢模塊,用于根據(jù)待比對的文字作品的分類確定其所屬的分類數(shù)據(jù)庫;指紋采集模塊,用于采集所述待比對的文字作品的大小不同的顆粒度數(shù)字指紋;指紋比對模塊,用于按照所述待比對的文字作品的顆粒度數(shù)字指紋由大到小的順序,完成待比對的文字作品在其所屬的分類數(shù)據(jù)庫的數(shù)字指紋庫中的查詢比對。進(jìn)一步的,所述顆粒度數(shù)字指紋按照顆粒度由大到小的順序依次為整部數(shù)字指紋、章節(jié)數(shù)字指紋和段落數(shù)字指紋。進(jìn)一步的,所述指紋采集模塊包括整部數(shù)字指紋采集單元,用于采集所述待比對的文字作品的整部數(shù)字指紋;章節(jié)數(shù)字指紋采集單元,用于采集所述待比對的文字作品的章節(jié)數(shù)字指紋;段落數(shù)字指紋采集單元,用于采集所述待比對的文字作品的段落數(shù)字指紋。進(jìn)一步的,所述指紋比對模塊包括整部數(shù)字指紋比對單元,用于將所述待比對的文字作品的整部數(shù)字指紋與其所屬的分類數(shù)據(jù)庫的數(shù)字指紋庫中的整部數(shù)字指紋進(jìn)行比對;章節(jié)數(shù)字指紋比對單元,用于將所述待比對的文字作品的章節(jié)數(shù)字指紋與整部數(shù)字指紋匹配的已有文字作品的章節(jié)數(shù)字指紋進(jìn)行比對;段落數(shù)字指紋比對單元,用于將所述待比對的文字作品的段落數(shù)字指紋與章節(jié)數(shù)字指紋匹配的已有文字作品的段落數(shù)字指紋進(jìn)行比對,若不匹配,比對結(jié)束;若匹配,將所述待比對的文字作品的來源進(jìn)行標(biāo)記和存檔。進(jìn)一步的,所屬同一分類數(shù)據(jù)庫的文字作品,按照存取的頻率不同存放在其所屬的分類數(shù)據(jù)庫的不同位置。與現(xiàn)有技術(shù)相比,本發(fā)明的文字作品數(shù)字指紋庫的比對方法及系統(tǒng),通過建立已有文字作品的分類數(shù)據(jù)庫的物理優(yōu)化,以及采集各級顆粒度數(shù)字指紋并按照顆粒度數(shù)字指紋的由大到小的順序比對的代數(shù)優(yōu)化,改變大規(guī)模文字作品數(shù)據(jù)庫查詢方式,實(shí)現(xiàn)文字作品的高效查詢比對,提高文字作品版權(quán)追蹤的效率。


      圖1是本發(fā)明的文字作品數(shù)字指紋庫的比對方法流程圖2是本發(fā)明的顆粒度數(shù)字指紋從大到小的示意圖;圖3是本發(fā)明的按顆粒度數(shù)字指紋從大到小的比對方法流程圖;圖4是本發(fā)明具體實(shí)施例的章節(jié)數(shù)字指紋和段落數(shù)字指紋比對示意圖;圖5是本發(fā)明的文字作品數(shù)字指紋庫的比對系統(tǒng)的結(jié)構(gòu)示意圖。
      具體實(shí)施例方式以下結(jié)合附圖和具體實(shí)施例對本發(fā)明提出的文字作品數(shù)字指紋庫的比對方法及系統(tǒng)作進(jìn)一步詳細(xì)說明,凡是以文字形式表現(xiàn)的作品,都是本發(fā)明所要保護(hù)的文字作品,例如文學(xué)作品、歷史著作、回憶錄、教科書、期刊、論文等等。如圖1所示,本發(fā)明提出一種文字作品數(shù)字指紋庫的比對方法,包括步驟Sl 對已有文字作品進(jìn)行分類,建立分類數(shù)據(jù)庫,優(yōu)選的,所屬同一分類數(shù)據(jù)庫的已有文字作品,按照存取的頻率不同存放在其所屬的分類數(shù)據(jù)庫的不同位置,進(jìn)一步的,所述已有文字作品為文學(xué)作品、歷史著作、回憶錄、教科書、期刊、論文等形式中的一種文字作品;步驟S2 采集所述分類數(shù)據(jù)庫中的每部已有文字作品的大小不同的顆粒度數(shù)字指紋,建立所述分類數(shù)據(jù)庫的數(shù)字指紋庫;步驟S3 根據(jù)待比對的文字作品的分類確定其所屬的分類數(shù)據(jù)庫,所述待比對的文字作品為文學(xué)作品、歷史著作、回憶錄、教科書、期刊、論文等形式中的一種文字作品;步驟S4 采集所述待比對的文字作品的大小不同的顆粒度數(shù)字指紋;步驟S5 按照所述待比對的文字作品的顆粒度數(shù)字指紋由大到小的順序,完成待比對的文字作品在其所屬的分類數(shù)據(jù)庫的數(shù)字指紋庫中的查詢比對。如圖2所示,根據(jù)文字作品的文章結(jié)構(gòu)整篇、章節(jié)、段落提取數(shù)字指紋提取和采集大小不同的顆粒度數(shù)字指紋,該顆粒度數(shù)字指紋按照由大到小的順序依次為整部數(shù)字指紋、章節(jié)數(shù)字指紋和段落數(shù)字指紋。相應(yīng)的,如圖3所示,所述步驟S5具體包括步驟S51 將所述待比對的文字作品的整部數(shù)字指紋與其所屬的分類數(shù)據(jù)庫的數(shù)字指紋庫中的整部數(shù)字指紋進(jìn)行比對,若不匹配,比對結(jié)束;若匹配,繼續(xù)步驟S52 ;步驟S52 將所述待比對的文字作品的章節(jié)數(shù)字指紋與整部數(shù)字指紋匹配的已有文字作品的章節(jié)數(shù)字指紋進(jìn)行比對,若不匹配,比對結(jié)束;若匹配,繼續(xù)步驟S53 ;步驟S53 將所述待比對的文字作品的段落數(shù)字指紋與章節(jié)數(shù)字指紋匹配的已有文字作品的段落數(shù)字指紋進(jìn)行比對,若不匹配,比對結(jié)束;若匹配,將所述待比對的文字作品的來源進(jìn)行標(biāo)記和存檔。圖4所示為本發(fā)明一具體實(shí)施的比對流程,圖中分類數(shù)據(jù)庫中的已有文學(xué)作品的整部數(shù)字指紋與待比對文學(xué)作品的整部數(shù)字指紋經(jīng)比對后匹配,接下來進(jìn)行章節(jié)數(shù)字指紋的比對,查詢該分類數(shù)據(jù)庫的數(shù)字指紋庫獲得該已有文學(xué)作品的章節(jié)數(shù)字指紋(如圖中所示),采集得到待比對文學(xué)作品的章節(jié)數(shù)字指紋(如圖所示),比對后發(fā)現(xiàn)該已有文學(xué)作品的章節(jié)數(shù)字指紋與待比對文學(xué)作品的章節(jié)數(shù)字指紋匹配,那么需要繼續(xù)比對該已有文學(xué)作品的段落數(shù)字指紋與待比對文學(xué)作品的段落數(shù)字指紋;查詢該分類數(shù)據(jù)庫的數(shù)字指紋庫獲得該已有文學(xué)作品的段落數(shù)字指紋(如圖中所示),采集得到待比對文學(xué)作品的段落數(shù)字指紋(如圖所示),比對后發(fā)現(xiàn)該待比對文學(xué)作品的段落數(shù)字指紋與該已有文學(xué)作品的段落數(shù)字指紋匹配,那么說明該待比對文學(xué)作品有盜版侵權(quán)行為,需要對該待比對文學(xué)作品的來源(一般為網(wǎng)站網(wǎng)址)進(jìn)行標(biāo)記和存檔。需要說明的是,步驟Sl和S3屬于物理優(yōu)化,其余步驟為代數(shù)優(yōu)化。在實(shí)際運(yùn)行中, 步驟Sl的分類數(shù)據(jù)庫和步驟S2的數(shù)字指紋庫首次建立后,只需要及時(shí)更新即可,后續(xù)的每一個(gè)待比對的文字作品進(jìn)行比對時(shí),可直接執(zhí)行步驟S3至步驟S5。步驟S51中,將待比對的文字作品和其所屬分類的分類數(shù)據(jù)庫中的已有文字作品的整部數(shù)字指紋進(jìn)行比對,可過濾掉絕大部分的已有文字作品;然后在步驟S52中,再將待比對的文字作品的章節(jié)數(shù)字指紋和整部數(shù)字指紋匹配的已有文字作品的章節(jié)數(shù)字指紋進(jìn)行比對,可過濾掉一部分整部數(shù)字指紋匹配的已有文字作品;最后在步驟S53中,對將待比對的文字作品的段落數(shù)字指紋和章節(jié)數(shù)字指紋匹配的已有文字作品的段落數(shù)字指紋進(jìn)行查詢比對,從而判斷待比對的文字作品和某部已有文字作品的數(shù)字指紋是否匹配。步驟S51至步驟S53可以采用map/reduce完成。Map/reduce是將一個(gè)任務(wù)切分為很多份,交給η臺計(jì)算機(jī)并行執(zhí)行,返回的結(jié)果再并行的歸并,最后得到運(yùn)算結(jié)果。其算法過程是步驟101 partition (劃分?jǐn)?shù)據(jù))將數(shù)據(jù)劃分為m份;步驟102 =Map (映射)將運(yùn)算數(shù)據(jù)的代碼map到每個(gè)運(yùn)算節(jié)點(diǎn)上并發(fā)執(zhí)行。每個(gè)運(yùn)算節(jié)點(diǎn)各自執(zhí)行自己的任務(wù),執(zhí)行完畢后將執(zhí)行結(jié)果返回。步驟103 =Partition (歸并數(shù)據(jù))對m份結(jié)果進(jìn)行歸并。步驟104 :reduce (化簡)把reduce代碼和reduce數(shù)據(jù)分發(fā)到每個(gè)運(yùn)算節(jié)點(diǎn)執(zhí)行,每個(gè)運(yùn)算節(jié)點(diǎn)執(zhí)行完畢返回?cái)?shù)據(jù)。在實(shí)際進(jìn)行時(shí),對于一部待比對文字作品的比對,可以采用map/reduce首先將分類數(shù)據(jù)庫的已存文字作品數(shù)據(jù)劃分到不同的服務(wù)器上。在不同的服務(wù)器上分別執(zhí)行步驟 S51至步驟S53,最后將匹配結(jié)果匯總,進(jìn)行標(biāo)記和保存;對于多部待比對文字作品的比對, 可以采用map/reduce首先將每部待比對文字作品以及其所屬的分類數(shù)據(jù)庫的數(shù)字指紋庫劃分到一服務(wù)器上。在不同的服務(wù)器上分別執(zhí)行每部待比對文字作品的步驟S51至步驟 S53,最后將匹配結(jié)果匯總,進(jìn)行標(biāo)記和保存,這樣就進(jìn)一步提高比對效率。相應(yīng)的,本發(fā)明還提供一種文字作品數(shù)字指紋庫的比對系統(tǒng),如圖5所示,包括 分類數(shù)據(jù)庫模塊10、數(shù)字指紋庫模塊11、分類查詢模塊12、指紋采集模塊13以及指紋比對模塊14。分類數(shù)據(jù)庫模塊10用于對已有文字作品進(jìn)行分類,建立分類數(shù)據(jù)庫1,2,. . .,η。數(shù)字指紋庫模塊11用于采集分類數(shù)據(jù)庫1,2,. . .,η中的每部已有文字作品的大小不同的顆粒度數(shù)字指紋,建立分類數(shù)據(jù)庫1,2,. . .,η對應(yīng)的數(shù)字指紋庫1,2,. . .,η。若所述顆粒度數(shù)字指紋按照由大到小的順序依次為整部數(shù)字指紋、章節(jié)數(shù)字指紋和段落數(shù)字指紋,每個(gè)數(shù)字指紋庫中均存儲有整部數(shù)字指紋、章節(jié)數(shù)字指紋和段落數(shù)字指紋,如圖4所示,數(shù)字指紋庫1中存儲有整部數(shù)字指紋1、章節(jié)數(shù)字指紋1和段落數(shù)字指紋1,數(shù)字指紋庫 2中存儲有整部數(shù)字指紋2、章節(jié)數(shù)字指紋2和段落數(shù)字指紋2,數(shù)字指紋庫η中存儲有整部數(shù)字指紋η、章節(jié)數(shù)字指紋η和段落數(shù)字指紋η。分類查詢模塊12用于根據(jù)待比對的文字作品的分類確定其所屬的分類數(shù)據(jù)庫。
      指紋采集模塊13用于采集所述待比對的文字作品的大小不同的顆粒度數(shù)字指紋,對應(yīng)于數(shù)字指紋庫模塊11中對已有文字作品的顆粒度數(shù)字指紋的采集,對待比對的文字作品采集相同大小的顆粒度數(shù)字指紋。指紋采集模塊13可包括整部數(shù)字指紋采集單元131,用于采集所述待比對的文字作品的整部數(shù)字指紋;章節(jié)數(shù)字指紋采集單元132,用于采集所述待比對的文字作品的章節(jié)數(shù)字指紋;段落數(shù)字指紋采集單元133,用于采集所述待比對的文字作品的段落數(shù)字指紋。指紋比對模塊14,用于按照所述待比對的文字作品的顆粒度數(shù)字指紋由大到小的順序,完成待比對的文字作品在其所屬的分類數(shù)據(jù)庫的數(shù)字指紋庫中的查詢比對,包括整部數(shù)字指紋比對單元141,用于將所述待比對的文字作品的整部數(shù)字指紋與其所屬的分類數(shù)據(jù)庫的數(shù)字指紋庫中的整部數(shù)字指紋進(jìn)行比對;章節(jié)數(shù)字指紋比對單元142,用于將所述待比對的文字作品的章節(jié)數(shù)字指紋與整部數(shù)字指紋匹配的已有文字作品的章節(jié)數(shù)字指紋進(jìn)行比對;段落數(shù)字指紋比對單元143,用于將所述待比對的文字作品的段落數(shù)字指紋與章節(jié)數(shù)字指紋匹配的已有文字作品的段落數(shù)字指紋進(jìn)行比對,若不匹配,比對結(jié)束;若匹配, 將所述待比對的文字作品的來源進(jìn)行標(biāo)記和存檔。綜上所述,本發(fā)明的文字作品數(shù)字指紋庫的比對方法及系統(tǒng),通過建立已存文字作品的分類數(shù)據(jù)庫,采集分類數(shù)據(jù)庫中每部已存文字作品的各級顆粒度數(shù)字指紋建立數(shù)字指紋庫,比對時(shí)按照顆粒度數(shù)字指紋由大到小的順序,即整部數(shù)字指紋、章節(jié)數(shù)字指紋、段落數(shù)字指紋的順序,若大顆粒的數(shù)字指紋不匹配,則小顆粒的數(shù)字指紋就不匹配,來優(yōu)化大規(guī)模文字作品數(shù)據(jù)庫查詢,實(shí)現(xiàn)文字作品的高效地查詢比對,提高文字作品版權(quán)追蹤的效率,適用于所有以文字形式表達(dá)內(nèi)容的數(shù)字作品,包括文學(xué)作品、歷史著作、回憶錄、教科書、期刊、論文等形式的文字作品。顯然,本領(lǐng)域的技術(shù)人員可以對發(fā)明進(jìn)行各種改動(dòng)和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動(dòng)和變型在內(nèi)。
      權(quán)利要求
      1.一種文字作品數(shù)字指紋庫的比對方法,其特征在于,包括 步驟Sl 對已有文字作品進(jìn)行分類,建立分類數(shù)據(jù)庫;步驟S2 采集所述分類數(shù)據(jù)庫中的每部已有文字作品的大小不同的顆粒度數(shù)字指紋, 建立所述分類數(shù)據(jù)庫的數(shù)字指紋庫;步驟S3 根據(jù)待比對的文字作品的分類確定其所屬的分類數(shù)據(jù)庫; 步驟S4 采集所述待比對的文字作品的大小不同的顆粒度數(shù)字指紋; 步驟S5 按照所述待比對的文字作品的顆粒度數(shù)字指紋由大到小的順序,完成待比對的文字作品在其所屬的分類數(shù)據(jù)庫的數(shù)字指紋庫中的查詢比對。
      2.如權(quán)利要求1所述的文字作品數(shù)字指紋庫的比對方法,其特征在于,所述顆粒度數(shù)字指紋按照由大到小的順序依次為整部數(shù)字指紋、章節(jié)數(shù)字指紋和段落數(shù)字指紋。
      3.如權(quán)利要求2所述的文字作品數(shù)字指紋庫的比對方法,其特征在于,所述步驟S5具體包括步驟S51 將所述待比對的文字作品的整部數(shù)字指紋與其所屬的分類數(shù)據(jù)庫的數(shù)字指紋庫中的整部數(shù)字指紋進(jìn)行比對,若不匹配,比對結(jié)束;若匹配,繼續(xù)步驟S52 ;步驟S52 將所述待比對的文字作品的章節(jié)數(shù)字指紋與整部數(shù)字指紋匹配的已有文字作品的章節(jié)數(shù)字指紋進(jìn)行比對,若不匹配,比對結(jié)束;若匹配,繼續(xù)步驟S53 ;步驟S53 將所述待比對的文字作品的段落數(shù)字指紋與章節(jié)數(shù)字指紋匹配的已有文字作品的段落數(shù)字指紋進(jìn)行比對,若不匹配,比對結(jié)束;若匹配,將所述待比對的文字作品的來源進(jìn)行標(biāo)記和存檔。
      4.如權(quán)利要求1所述的文字作品數(shù)字指紋庫的比對方法,其特征在于,所屬同一分類數(shù)據(jù)庫的已有文字作品,按照存取的頻率不同存放在其所屬的分類數(shù)據(jù)庫的不同位置。
      5.一種文字作品數(shù)字指紋庫的比對系統(tǒng),其特征在于,包括 分類數(shù)據(jù)庫模塊,用于對已有文字作品進(jìn)行分類,建立分類數(shù)據(jù)庫;數(shù)字指紋庫模塊,用于采集所述分類數(shù)據(jù)庫中的每部已有文字作品的大小不同的顆粒度數(shù)字指紋,建立所述分類數(shù)據(jù)庫的數(shù)字指紋庫;分類查詢模塊,用于根據(jù)待比對的文字作品的分類確定其所屬的分類數(shù)據(jù)庫; 指紋采集模塊,用于采集所述待比對的文字作品的大小不同的顆粒度數(shù)字指紋; 指紋比對模塊,用于按照所述待比對的文字作品的顆粒度數(shù)字指紋由大到小的順序, 完成待比對的文字作品在其所屬的分類數(shù)據(jù)庫的數(shù)字指紋庫中的查詢比對。
      6.如權(quán)利要求5所述的文字作品數(shù)字指紋庫的比對系統(tǒng),其特征在于,所述顆粒度數(shù)字指紋按照由大到小的順序依次為整部數(shù)字指紋、章節(jié)數(shù)字指紋和段落數(shù)字指紋。
      7.如權(quán)利要求6所述的文字作品數(shù)字指紋庫的比對系統(tǒng),其特征在于,所述指紋采集模塊包括整部數(shù)字指紋采集單元,用于采集所述待比對的文字作品的整部數(shù)字指紋; 章節(jié)數(shù)字指紋采集單元,用于采集所述待比對的文字作品的章節(jié)數(shù)字指紋; 段落數(shù)字指紋采集單元,用于采集所述待比對的文字作品的段落數(shù)字指紋。
      8.如權(quán)利要求6所述的文字作品數(shù)字指紋庫的比對系統(tǒng),其特征在于,所述指紋比對模塊包括整部數(shù)字指紋比對單元,用于將所述待比對的文字作品的整部數(shù)字指紋與其所屬的分類數(shù)據(jù)庫的數(shù)字指紋庫中的整部數(shù)字指紋進(jìn)行比對;章節(jié)數(shù)字指紋比對單元,用于將所述待比對的文字作品的章節(jié)數(shù)字指紋與整部數(shù)字指紋匹配的已有文字作品的章節(jié)數(shù)字指紋進(jìn)行比對;段落數(shù)字指紋比對單元,用于將所述待比對的文字作品的段落數(shù)字指紋與章節(jié)數(shù)字指紋匹配的已有文字作品的段落數(shù)字指紋進(jìn)行比對,若不匹配,比對結(jié)束;若匹配,將所述待比對的文字作品的來源進(jìn)行標(biāo)記和存檔。
      9.如權(quán)利要求5所述的文字作品數(shù)字指紋庫的比對系統(tǒng),其特征在于,所屬同一分類數(shù)據(jù)庫的文字作品,按照存取的頻率不同存放在其所屬的分類數(shù)據(jù)庫的不同位置。
      全文摘要
      本發(fā)明提供一種文字作品數(shù)字指紋庫的比對方法及系統(tǒng),通過建立已有文字作品的分類數(shù)據(jù)庫的物理優(yōu)化,以及采集各級顆粒度數(shù)字指紋并按照顆粒度數(shù)字指紋的由大到小的順序比對的代數(shù)優(yōu)化,改變大規(guī)模文字作品數(shù)據(jù)庫查詢方式,實(shí)現(xiàn)文字作品的高效查詢比對,提高文字作品版權(quán)追蹤的效率。
      文檔編號G06F21/00GK102509042SQ20111031285
      公開日2012年6月20日 申請日期2011年10月14日 優(yōu)先權(quán)日2011年10月14日
      發(fā)明者鄭達(dá)韡, 陸堅(jiān) 申請人:盛樂信息技術(shù)(上海)有限公司
      網(wǎng)友詢問留言 已有0條留言
      • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
      1