專利名稱:用于多媒體對象的數(shù)字水印搜索引擎的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于版權(quán)保護領(lǐng)域,具體涉及使用數(shù)字水印搜索引擎,在 因特網(wǎng)或者局域網(wǎng)等網(wǎng)絡環(huán)境中搜索包含特定數(shù)字水印的視頻、聲音 和圖形等多媒體數(shù)據(jù),從而實現(xiàn)非法使用的追蹤以及對多媒體對象的 非法使用情況進行統(tǒng)計。
背景技術(shù):
隨著信息時代的到來,媒體的數(shù)字化傳播已成為可能,數(shù)字化的 媒體具有強大的可移植性、高效性、快捷性及精確性。此外,網(wǎng)絡的
進一步發(fā)展與完善,使得系統(tǒng)間的互連變得非常容易,極大地方便了 信息交換與資源共享,這種迅捷的信息傳播與筒易的操作正改變著人 們傳統(tǒng)的工作與生活方式,但同時也帶來了許多負面的影響,諸如侵 犯版權(quán),信息篡改等,開放性給知識產(chǎn)權(quán)保護及敏感信息的保密工作 帶來了極大的困難和挑戰(zhàn)。近年來,國內(nèi)外許多學者提出了一系列新 的信息安全保護思想,特別是在知識產(chǎn)權(quán)保護,防篡改及信息內(nèi)嵌式 注釋等領(lǐng)域提出了新的防范與保護措施。信息隱藏與數(shù)字水印技術(shù)就 是新的數(shù)字媒體保護措施,它是將特定的信息(如版權(quán)信息、秘密信 息等)嵌入到圖像、語音、視頻及文本文件等各種數(shù)字媒體中,以達 到標識、注釋及版權(quán)保護等目的,同時,這種信息對宿主媒體的影響 不足以引起人們的注意且具有特定的恢復方法,此信息對非法接受者 應該是不可見,不可覺察的。
加水印是將數(shù)據(jù)隱藏或插入到諸如音頻、視頻和靜止圖像內(nèi)容中
的過程, 一個被插入的水印有各種用途,包括(l)驗證,即識別內(nèi) 容的合法所有者并保護其中的版權(quán);以及(2)鑒別,即保證內(nèi)容不 遭受變更。
在為驗證而加水印的情況下,所插入的水印可以;故用于識別內(nèi)容 的所有者。明確地,通過插入一個水印到內(nèi)容中,所有者后來可以通 過提取水印并表明該水印與最初被插入的 一 個相匹配來證明其所有 權(quán)。在為鑒別而加水印的情況下,所插入的水印可以用于通過識別被 損害的內(nèi)容而驗證內(nèi)容的真實性。獲得此目的的一種方法是提供以來 于內(nèi)容的水印。在這種情況下,水印是內(nèi)容的簽名(或者簽名的一個 函數(shù)),選擇該簽名,以便它反映內(nèi)容的顯著特性。因此,如果內(nèi)容 已經(jīng)被變更,則反映內(nèi)容的初始簽名的初始水印將不匹配新水印,從 而反映被損害內(nèi)容的簽名。
用于將水印插入到多媒體成分中的許多不同的技術(shù)是已知的。一 個典型的水印包括用于驗證的能識別所有者的數(shù)據(jù)(例如視覺標志); 或者用于內(nèi)容鑒別的捕獲多媒體部分的顯著視覺或聽覺特性的數(shù)據(jù)。
在許多情況下,在不引起對于實際的音頻或者視頻內(nèi)容的任何可察覺 的改變的情況下,將水印插入到該內(nèi)容中。這樣,終端用戶通常不知 道該水印。
為避免未經(jīng)授權(quán)的拷貝制作和發(fā)行,出品人可以將不同用戶的 ID或序列號作為不同的水印嵌入作品的合法拷貝中。 一旦發(fā)現(xiàn)未經(jīng) 授權(quán)的拷貝,就可以根據(jù)此拷貝所恢復出來的水印來確定它的來源。
由于數(shù)字水印中嵌入了用戶的身份等信息, 一旦發(fā)生版權(quán)爭議時,可 用于證明能提取標記者,便是合法擁有者,否則便是非法使用者。
但是孤立的數(shù)字水印技術(shù)本身是不能證明作品版權(quán)歸屬的,它只 是為數(shù)字作品版權(quán)保護提供了一種有力的工具,必須有一套完整的系 統(tǒng)相配合才能使數(shù)字水印這個工具發(fā)揮作用。目前比較有影響的數(shù)字
作品版權(quán)保護體系是由歐洲委員會DGIII計劃制定的網(wǎng)絡數(shù)字產(chǎn)品 的知識產(chǎn)權(quán)保護(IPR)認證和保護體系標準,簡記為IMPRIMATUR。 該體系定義了發(fā)行商、購買者以及可信任第三方之間的關(guān)系。該系統(tǒng) 解決的是數(shù)字作品發(fā)行和發(fā)現(xiàn)非法拷貝時的版權(quán)確認處理方式,但是 并沒有從技術(shù)上解決如何發(fā)現(xiàn)非法拷貝的問題。
目前的互聯(lián)網(wǎng)用戶在查找自己需要的信息時,最普遍使用的工具 就是搜索引擎,如傳統(tǒng)的搜索引擎AltaVista, Yahoo和新一代的搜 索引擎Google, Baidu等。目前非法拷貝的數(shù)字作品大多數(shù)都在網(wǎng)絡 上流通,因此搜索引擎可以作為網(wǎng)絡非法拷貝來源追蹤的一個有力工 具,為數(shù)字作品的版權(quán)保護提供幫助。
本發(fā)明的目的之一就是在于提供一種用于搜索包含指定水印的 多媒體對象的數(shù)字水印搜索引擎,用以進行非法拷貝的來源追蹤,從 而確定多媒體對象非法拷貝的位置,并且統(tǒng)計多々某體對象的非法使用 情況。 一般的公共搜索引擎只能查到HTML格式,本發(fā)明則開創(chuàng)性地 將對數(shù)字水印的搜索功能增加到搜索引擎中,并將其應用到版權(quán)保護 中,這對版權(quán)保護是一個開創(chuàng)性的工作。
發(fā)明內(nèi)容
本發(fā)明提供一種使用具有聯(lián)網(wǎng)功能的終端搜索包含數(shù)字水印的 多媒體對象的方法,其中數(shù)字水印用于確定多媒體對象的所有權(quán)。這 種方法包括,從多媒體對象中提取出數(shù)字水印,將提取出來的數(shù)字水 印存儲在數(shù)據(jù)庫中。這種方法還包括,接收搜索標準,在數(shù)據(jù)庫中搜 索數(shù)字水印以選4奪符合用戶要求的內(nèi)容。然后將搜索結(jié)果發(fā)送或呈現(xiàn) 給用戶。
這里所述的"具有聯(lián)網(wǎng)功能的終端"包括各種可以接入局域網(wǎng)或
者互聯(lián)網(wǎng)等各種網(wǎng)絡環(huán)境的終端,如計算機、手機、PDA等。
本發(fā)明提供了一種用于搜索加水印多媒體對象的系統(tǒng)和方法。這 里所述的"多媒體對象"包括一種或多種類型的無限類型的多媒體成 分,如音頻、視頻、固定圖象、封閉標題(closed caption)數(shù)據(jù)、 壓縮數(shù)據(jù)、電子郵件等。多媒體對象可以以任何形式存在,包括數(shù)據(jù) 文件、數(shù)據(jù)信號、數(shù)據(jù)流、數(shù)據(jù)對象、數(shù)據(jù)結(jié)構(gòu)、傳輸或者程序。多 媒體對象可以以數(shù)字格式或者模擬格式存在。
本發(fā)明的各方面內(nèi)容結(jié)合下面的圖解和詳細說明將更加容易理
圖1為系統(tǒng)示意圖。
圖2為使用數(shù)字水印搜索引擎進行包含特定數(shù)字水印的多媒體 對象的搜索流程。
圖3為數(shù)字水印搜索引擎的工作過程。詳細說明
圖1展示了使用本發(fā)明的數(shù)字水印搜索引擎進行數(shù)字水印搜索 的流程。11為用戶輸入搜索條件的過程,搜索條件主要是數(shù)字水印, 如果該數(shù)字水印采用的不是標準的數(shù)字水印提取算法,則還需要提供
相應的數(shù)字水印提取算法。12為將搜索條件發(fā)送給搜索引擎的過程。 13為搜索引擎根據(jù)所接收到的搜索條件,在Internet或者局域網(wǎng)中 搜索與搜索條件相匹配的內(nèi)容的過程。14為搜索引擎將搜索結(jié)果發(fā) 送到與用戶交流的界面系統(tǒng)的過程,搜索結(jié)果包括搜索到與搜索條件 相匹配的內(nèi)容或者沒有找到相關(guān)內(nèi)容。15為搜索結(jié)果的顯示過程, 系統(tǒng)將搜索結(jié)果以某種方式呈現(xiàn)給用戶,從而完成一次搜索過程。
圖2展示了按照本發(fā)明的用于搜索包含數(shù)字水印的多媒體對象 的搜索引擎系統(tǒng),包括以下三個模塊。21為用戶查詢和瀏覽接口模 塊,提供給用戶方便易用的交互界面,提供多特征融合的查詢方式。 22數(shù)字水印數(shù)據(jù)庫系統(tǒng)模塊,其中的221數(shù)字水印數(shù)據(jù)庫,用于存 儲數(shù)字水印搜索器(Watermark Spider/Crawler)從網(wǎng)絡中搜集到的 包含數(shù)字水印的多媒體對象的相關(guān)信息。222的索引數(shù)據(jù)庫模塊主要 的工作是對數(shù)字水印數(shù)據(jù)庫中的信息進行排序索引。22 3檢索匹配子 系統(tǒng)的主要工作是接收用戶的檢索條件,然后在數(shù)據(jù)庫中搜索與檢索 條件相匹配的內(nèi)容。23為多媒體對象搜集子系統(tǒng)模塊,網(wǎng)絡蜘蛛不 間斷的遍歷網(wǎng)絡,抓取最新的多媒體對象并檢驗其是否包含數(shù)字水 印,如果包含數(shù)字水印,則將該多媒體對象的相關(guān)信息提取出來并存 入數(shù)據(jù)庫。
圖3展示了本發(fā)明的數(shù)字水印搜索引擎數(shù)據(jù)庫的工作流程。
從用戶向數(shù)字水印搜索引擎提出問題,到數(shù)字水印搜索引擎解決 問題,整個過程分為兩大部分,即包含數(shù)字水印的多媒體對象的搜 集過程(服務器端)和數(shù)字水印的查詢過程(用戶端)。
月艮務器端的工作流程為水印蜘蛛/爬蟲(Watermark Spider/Crawler)通過一個元URL,每隔一定的時間在Internet上漫 游,不斷地查詢能夠關(guān)聯(lián)到的站點,搜索出新的多媒體對象的URL, 然后利用特定算法檢測該多媒體對象是否包含數(shù)字水印,如果包含數(shù) 字水印,則將將多媒體對象的相關(guān)信息,如多媒體對象或者其URL、 發(fā)現(xiàn)時間等,送往數(shù)字水印數(shù)據(jù)庫;數(shù)據(jù)水印數(shù)據(jù)庫系統(tǒng)從多媒體對 象中提取出數(shù)字水印,并進行索引,然后將索引向量送往索引數(shù)據(jù)庫; 數(shù)據(jù)庫管理系統(tǒng)對這些索引向量進行周期性的分析和比較,刪除舊的 和無效的記錄,添加新的索引向量。
客戶端的工作流程,即數(shù)字水印的查詢過程為搜索匹配子系統(tǒng) 接收用戶提交的示例^:字水印,產(chǎn)生索引向量。該索引向量祐:傳送到 索引數(shù)據(jù)庫,系統(tǒng)將該索引向量與索引數(shù)據(jù)庫里面的索引向量進行 比較,然后將相同的和相似的解傳遞給用戶,從而完成一次數(shù)字水印 的搜索過程。
權(quán)利要求
1.一種使用具有聯(lián)網(wǎng)功能的終端搜索包含特定數(shù)字水印的多媒體對象的方法,其中數(shù)字水印用于標識該多媒體對象的所有權(quán),該方法包括步驟搜索包含數(shù)字水印的多媒體對象利用水印蜘蛛/爬蟲(Watermark Spider/Crawler)在網(wǎng)絡上主動、實時地進行數(shù)字水印的檢測,它通過請求站點上的連接訪問某一站點,在該站點上對多媒體對象進行數(shù)字水印檢測。它遍歷Web空間,不斷從一個站點移動到另一個站點,對網(wǎng)絡上包含數(shù)字水印的多媒體對象進行地毯式搜索,一旦發(fā)現(xiàn)多媒體對象中包含數(shù)字水印就將該多媒體對象的相關(guān)信息存入數(shù)據(jù)庫。建立數(shù)字水印索引數(shù)據(jù)庫水印蜘蛛/爬蟲(WatermarkSpider/Crawler)在對Web的搜索過程中,將每次搜索的結(jié)果(多媒體對象名稱、URL、概述、鏈接等信息)存放到數(shù)字水印數(shù)據(jù)庫中,然后由分析索引系統(tǒng)程序?qū)κ占貋淼男畔⑦M行分析,提取相關(guān)的數(shù)字水印信息,然后根據(jù)提取出來的數(shù)字水印信息建立網(wǎng)絡數(shù)字水印索引數(shù)據(jù)庫。按用戶需求在索引數(shù)據(jù)庫中搜索排序當用戶提供數(shù)字水印并要求搜索保含該水印的多媒體對象時,由搜索系統(tǒng)程序從數(shù)字水印索引數(shù)據(jù)庫中找到符合搜索條件的所有相關(guān)多媒體對象的信息,然后由頁面生成系統(tǒng)將搜索結(jié)果的鏈接地址和多媒體對象的相關(guān)信息組織起來返回給用戶。
2. 根據(jù)權(quán)利要求l的方法,其中包括用于搜索包含數(shù)字水印的多媒體對象的搜索器稱為水印蜘蛛/爬蟲(Watermark Spider/Crawler ),該搜索器的功能是在網(wǎng)絡中漫游,發(fā)現(xiàn)和搜 集信息,該搜索器可以通過特定算法檢測多媒體對象是否包含 數(shù)字水印信息。
3. 根據(jù)權(quán)利要求1的方法,其中包括數(shù)字水印提取機制,用于從 多媒體對象中提取出數(shù)字水印。
4. 根據(jù)權(quán)利要求1的方法,其中包括索引器,用于從數(shù)字水印中 抽取出索引項,用于表示數(shù)字水印以及生成數(shù)字水印數(shù)據(jù)庫的 索引表。
5. 根據(jù)權(quán)利要求1的方法,其中包括檢索器,用于根據(jù)用戶的查 詢在索引庫中快速檢出包含搜索條件的多媒體對象,對將要輸 出的結(jié)果進行排序,并實現(xiàn)某種用戶相關(guān)性反饋機制。
6. 根據(jù)權(quán)利要求1的方法,其中包含了用戶接口,用于輸入用戶 查詢、顯示查詢結(jié)果、提供用戶相關(guān)性反饋機制。
7. 根據(jù)權(quán)利要求6的方法,進一步包括重配置用戶接口提供不同 數(shù)字水印檢測算法的步驟。
8. 根據(jù)權(quán)利要求1所述的方法,數(shù)字水印搜索引擎有兩個基本功 能非法拷貝的確認通過搜索,確認多媒體數(shù)字作品的非法拷貝 所在的位置,如非法拷貝的鏈接。多媒體數(shù)字作品的非法拷貝使用情況統(tǒng)計通過搜索包含特定 數(shù)字水印的多媒體對象,可以統(tǒng)計出該多媒體對象在網(wǎng)絡中的 使用情況,然后與經(jīng)過合法授權(quán)的多媒體對象的數(shù)據(jù)進行對比, 可以統(tǒng)計出當前在網(wǎng)絡中對多媒體對象的非法使用情況。
9.一種通用的數(shù)字水印搜索引擎,包括一個機制,用于檢測多媒體對象中是否包含數(shù)字水??; 一個機制,用于從多士某體對象中提取出數(shù)字水??; 一個存儲數(shù)字水印的數(shù)據(jù)庫; 一個用于接收用戶搜索標準的輸入; 一個在數(shù)據(jù)庫中搜索數(shù)字水印的搜索引擎; 一個發(fā)送或呈現(xiàn)搜索結(jié)果的輸出。
全文摘要
本發(fā)明涉及一種使用具有聯(lián)網(wǎng)功能的終端搜索包含特定數(shù)字水印的多媒體對象的搜索引擎。該搜索引擎可以用于進行多媒體數(shù)字作品的版權(quán)保護。該引擎的工作步驟包括通過接收用戶搜索包含特定數(shù)字水印的多媒體對象內(nèi)容的請求,數(shù)字水印數(shù)據(jù)庫搜索即啟動,尋找符合用戶標準的多媒體對象,然后將多媒體對象內(nèi)容及相關(guān)的一些信息提供給用戶,這些信息包括多媒體對象的位置、發(fā)現(xiàn)的時間等。
文檔編號G06F17/30GK101169783SQ200710042048
公開日2008年4月30日 申請日期2007年6月15日 優(yōu)先權(quán)日2007年6月15日
發(fā)明者袁佳寧, 海 黃 申請人:黃 海;袁佳寧