專利名稱:元信息的不可見的編碼的制作方法
技術領域:
本發(fā)明涉及通信領域,具體地涉及與電子內容材料有關的元信息(meta-information)的編碼,諸如數(shù)字水印。
水印在傳統(tǒng)上被用作為文件源的一種驗證形式。由特定的機構使用的、用于貨幣和其它可通行的法定文件的紙張,一般包含難以偽造的水印;缺乏水印是該法定文件不是由該特定的機構發(fā)布的明顯的表示。例如,通過對于貨幣的每個面額的不同的水印的使用,某些水印也被使用來驗證文件的內容。最好,水印是在視覺上不引人注目的。
數(shù)字水印被使用來驗證電子編碼的內容材料(諸如報文文件)的來源或原著者。為了易于參考,術語“文件”在這里被用來表示加上數(shù)字水印的內容材料。還將數(shù)字水印用來證實自從文件被原著者編碼以來文件未被改變。也就是,數(shù)字水印典型地包括標識原著者的數(shù)字簽名,以及內容驗證符,雖然它可能只包含這一個或另一個。
數(shù)字水印是與內容材料有關的元信息的一個例子。元信息的其它的例子包括,例如,該內容材料的概述或摘要,對該內容材料的索引,用于由另一個程序識別和使用的識別標記或標簽,諸如HTML識別標簽,等等。該數(shù)字水印在這里被用作為對于元信息的范例,它打算以非妨礙的方式被附著到該內容材料上。
各種各樣的技術可供用于建立數(shù)字水印。用于驗證文件的原著者和內容的、通用的技術是原著者使用公共-專用密鑰對的專用密鑰來加密文件,將該文件用相應于這個公共-專用密鑰對的公共密鑰進行解密。正如該名稱暗示的,該公共密鑰是公共已知的,并可供文件的任何或所有的接收者使用,而只有該原著者知道該專用密鑰。因為只有原著者知道該專用密鑰,故只有該原著者能加密可由原著者的公共密鑰解密的文件。具有該用戶的公共密鑰的任何人可以解密該文件。如果接收者改變該文件,該接收者將不能重新加密該修改的文件,使它可被原著者的公共密鑰解密,因為只有該原著者具有該專用密鑰來實施這樣的重新加密。因此,原著者不能拒絕發(fā)送該文件,也不能聲稱該文件已被改變。
整個文件的加密,僅僅為了鑒權,是費時和費資源的處理過程。另一種,原著者可能僅僅只加密該文件的一部分。這樣的加密證實原著者發(fā)送了該文件,但并不證實文件的未加密的部分的內容未被改變。再一種,與文件有關的參量,諸如它的長度,或它的“檢驗和”,可以由原著者加密,并與該文件相通信。
圖1顯示現(xiàn)有技術水印產生器110的示例性方框圖。該水印產生器110包括處理器130,它確定與文件150有關的參量,諸如它的長度或檢驗和;以及加密器140,它根據(jù)只有文件150的原著者知道的專用密鑰141A把參量131加密到水印111中。通過使用這個水印產生器110,該加密證實該原著者發(fā)送具有這個特定的長度或檢驗和參量131的文件150。如果該接收的文件(未示出)具有不同的長度或檢驗和,則它必定是由該原著者發(fā)送的文件的改變的版本。然而,具有適當?shù)拈L度或檢驗和的文件的接收不一定驗證該文件的內容,因為該原先的文件的接收可以產生具有相同的長度或檢驗和的、改變的文件,諸如轉置數(shù)字的文件。同樣地,加密長度或檢驗和的接收不一定證實該文件的原著者,因為這個水印可能僅僅是具有相同的長度或檢驗和的、原著者的另一個文件的水印的復制品。
雖然不能確保安全,考慮長度或檢驗和的方法,常常被使用于匆忙的內容驗證,類似于對其中丟失的頁是明顯的、打印的文件中頁的計數(shù)。同樣地,考慮加密的長度或檢驗和的方法,常常被使用于匆忙的原著者驗證,類似于查驗打印的文件中可能是偽造的個人簽名。
對包括有文件的長度或檢驗和的另一種方法是包括有文件的“雜亂的數(shù)值”,作為參量131。在接收后,接收者把相同的雜亂函數(shù)加到該文件上,而不用所包括的雜亂數(shù)值參量131,并把結果的雜亂數(shù)值與被包括在文件內的水印111的解密結果進行比較。優(yōu)選的雜亂函數(shù)是不容易反轉的和不容易確定的函數(shù)。也就是,具有與未修改的文件完全相同的雜亂數(shù)值的修改的文件的建立在計算上是困難的、且通常是不可行的任務。因此,文件150的雜亂數(shù)值參量131提供了內容的有效驗證。使用原著者專用密鑰141A的雜亂數(shù)值參量131的以后的加密提供了該原著者的有效驗證,因為先前的文件非常不可能具有相同的雜亂數(shù)值參量131。
用于建立數(shù)字水印和其它類型的元信息的、這些和其它方法在該技術上是普通的。通常,將該元信息包括在該通信文件的分開的段內,例如,使用MIME,HTML,或其它編碼標準。標識該段的開始點的“標簽”,和標識該段的結束點的相應的標簽,用來識別文件的每個段,在本例中,是內容材料和每個元信息項。與編碼標準兼容的接收應用項分離該文件并相應地處理每個段。例如,在一個文件中在“開始文本”標簽與“結束文本”標簽之間的材料將被顯示在顯示裝置上;在“開始水印”標簽與“結束水印”標簽之間的材料將被處理,以驗證內容或原著者,或二者,以及相應的文件,諸如“本文件被驗證為從Alice傳送來的”也將被顯示在顯示裝置上或作為聲音消息提供。
然而,與特定的標準不兼容的裝置將不識別分段標簽,通常把該文件連同包括的元信息和上述的標簽顯示在顯示裝置上。雖然通常文本是可識到的,但包括有元信息和標簽的顯示在視覺上是無吸引力的。在許多情形下,這種“外部的”信息的顯示具有使得文件的文本對于計算機編碼的文件的原始形式不習慣的接收者是不認識的效果。如上所述,在另一方面,電子文件中理想的元信息項,在視覺上是不引人注目的。
本發(fā)明的一個目的是提供用于把基本上“不可見的”數(shù)字水印或其它元信息包括在電子文件內的裝置。本發(fā)明的另一個目的是提供用于把元信息編碼成“不可見的”形式的裝置。
通過對諸如數(shù)字水印的元信息進行編碼,使用在文件被提交時視覺上不可見的字符,和把這個編碼的元信息附著到文件上,達到了這些和其它目的。將諸如空格、表格、回車、回退、行饋送等等字符用來編碼該元信息。與這種編碼兼容的接收設備能夠譯碼和處理該元信息;例如譯碼水印并驗證該文件的內容和/或原著者。與這種編碼不兼容的接收設備將只顯示或打印附加的“白色空格”。最好,通過把這個不可見的編碼附著到文件,這種附加的白色空格將在顯示或打印該文件后以視覺上不引人注目的形式出現(xiàn)。
下面通過舉例,參照附圖,更詳細地描述本發(fā)明,其中圖1顯示現(xiàn)有技術水印產生器的示例性方框圖。
圖2顯示使用水印作為示例的元信息,按照本發(fā)明的編碼器的示例性方框圖。
圖3A和3B顯示按照本發(fā)明的二進制數(shù)字的示例性不可見的編碼。
圖4顯示按照本發(fā)明的不可見水印編碼器的示例性流程圖。
圖5顯示按照本發(fā)明的不可見水印編碼器的示例性方框圖。
在所有圖中,相同的參考數(shù)字表示相同的或相應的特性或功能。
圖2顯示按照本發(fā)明的編碼器200的示例性方框圖。示例的編碼器200包括示例的元信息產生器和不可見的編碼器220。為了易于參考起見,圖1的示例的水印產生器110被用作為典型的元信息產生器的代表。圖1的水印產生器包含內容驗證處理器130和加密器140,雖然某些傳統(tǒng)的水印產生器只具有這一個或那一個,或可被配置成不同于圖上顯示的。正如本領域技術人員將會看到的,元信息產生器110的特定的實施例對于本技術說明中給出的原理不是本質的。為了易于了解起見,此后,一般地通過作為元信息的范例的數(shù)字水印來說明本發(fā)明。
水印產生器110提供與文件250的內容250A有關的水印111,正如數(shù)目參照圖1討論的。不可見的編碼器220把水印111編碼為一組不可見的字符,當提交時,產生不可見的水印22L圖3A和3B顯示按照本發(fā)明的、二進制數(shù)字311的示例的不可見的編碼。二進制數(shù)字311,例如,代表具有二進制數(shù)值“01100100”的數(shù)字水印111的單個字節(jié)。如圖3A所示,如果“空格(spce)”字符(Sp)被使用來代表比特值“0”,以及“回車(carriage return)”字符(CR)被使用來代表比特值“1”,則二進制數(shù)值“01100100”311的編碼是“Sp-CR-CR-Sp-Sp-CR-Sp-Sp”321。“空格”和“回車”字符在本發(fā)明的上下文中是“不可見的”的字符,因為它們在顯示器或打印機中除了“白色空格”以外不產生視覺上的效果。圖3B顯示通過使用四個可能的“不可見的”字符“空格”(Sp),“行饋送”(LF),“表格”(Tb),和“回車”(CR),分別相應于二進制對“00”,“01”,“10”和“11”,同一個二進制數(shù)值“01100100”的另一個編碼方案。如圖3B所示,通過使用這四個不可見的表示法,二進制數(shù)值“01100100”311是“Lf-Tb-LF-Sp”(01-10-01-00)321’??紤]到本揭示內容,使用這些和其它“不可見的”字符(諸如回退等等)的編碼數(shù)值的其它方法對于本領域技術人員是明顯的。共同待決的美國專利申請“Invisible Encoding of Attribute Data inCharacter Based Documents and Files(基于字符的資料和文件中屬性數(shù)據(jù)的不可見的編碼)”,序列號09/333,632,Keith Ahern6/15/99提交,代理人文件夾PHA 23,675,給出屬性的編碼,諸如字體尺寸,粗黑,斜體等等,它通過使用各種各樣的不可見的編碼技術,影響文件中的文本元素的外觀,該專利申請在此引用,以供參考。例如,使用在參考的共同待決的專利申請中給出的原理的另一個不可見的編碼,是使用用于擦除的“回退”,所以,提交不可見的、可見字符序列。在這樣的實施例中,例如,如果水印111包括六十個(可見的)字符,不可見的水印221是在這六十個(可見的)字符后面跟隨,或插入,六十個“回退”字符,它們具有從顯示器上擦除可見的字符的效果??紤]到本揭示內容,用于在傳統(tǒng)的顯示裝置上提交時,提供一組不可見的字符的這些和其它技術,對于本領域技術人員是顯而易見的。
不可見的水印221被附著到文件250的內容250A,如圖2上的分段250B或文件250顯示的。術語“附著”在這里在“附加到”的最一般的意義上被使用,用來加上、合并、附著、聯(lián)編不可見的水印221的特定的方法是與本發(fā)明無關的。在優(yōu)選實施例中,不可見的水印221被附著到文件的末尾,以便易于識別和處理,以及允許在水印處理之前處理和給出內容材料。為了易于譯碼,該不可見的水印221包括輪廓符,它也被不可見地編碼,標志不可見水印221的開始點。輪廓符是在任何文件250的內容250A內很不可能看出,優(yōu)選地決不會看出的,預定的編碼。例如,如果空格(S)和表格(T)被使用來不可見地編碼水印,則“STSSTTTSTSTST”的序列,或其它看上去隨機的、不可見的字符種類,可被使用來描述不可見水印221的開始點。替換地,在不可見水印221中最后的不可見序列可以包含不可見的水印221的長度的指示,譯碼器可通過它確定不可見水印221的開始點,由此,消除對獨特的輪廓符的需要。區(qū)分文件的分段的這些和其它方法在技術上是普通的。應當指出,不可見的編碼不需要是鄰接的;例如,不可見的編碼可被附著在文件的每個角落、邊緣、在段落之間的空格中,等等。
結果的文件250包括文件內容250A和不可見的編碼的水印250B,隨后通過發(fā)射機260被傳送到接收設備(未示出)。應當指出,通過以視覺上“不可見”的形式包括水印,文件的接收者將能夠看到文件的內容250A,而不用任何視覺上打擾與水印的包括有關的添加物,不管被使用來接收文件250的接收設備是否能夠處理不可見編碼的水印。雖然通過無能力的接收設備接收文件250的用戶將不能處理水印來驗證內容或原著者,但將不妨礙觀看文件內容。
圖4顯示按照本發(fā)明的不可見水印編碼器(諸如在圖2的編碼器200中可能被使用的)的示例性流程圖。在410,文件被編碼器接收,以及在420,根據(jù)文件內容確定內容驗證參量。內容驗證參量是長度,檢驗和,雜亂的數(shù)值,或相應于也可被文件的接收者確定的文件的其它參量,以便與這個參量進行比較。在430,內容驗證參量被加密,優(yōu)選地是通過只有文件的原著者,或簽名者知道的、公共-專用密鑰對中的專用密鑰。在440,通過使用不可見編碼技術,加密的內容驗證參量形成水印,以及被編碼為一組在提交時不可見的字符,正如上面參照圖2描述的。應當指出,選擇的不可見編碼技術對于文件的接收者也是知道的,以便利用不可見編碼的水印用于驗證的目的。在450,相應于水印的不可見的序列被附著到文件上,以及在460,帶有附著的不可見水印的結果的文件被發(fā)送到一個或多個接收者。在460時的傳輸可以是通過互聯(lián)網的文件的傳輸,點對點傳輸?shù)教囟ǖ慕邮照?,通過局域網的文件傳送等等。
圖5顯示按照本發(fā)明的不可見水印編碼器的示例性方框圖。接收機510接收(圖2的)發(fā)送的文件261,它包括內容材料250A和不可見編碼的驗證序列250B。分析程序520把結束點文件分離成這些分段250A,250B。分析程序520根據(jù)被使用來勾劃分段250A,250B的技術來實施分離,如上面參照圖2討論的。內容材料250A被直接顯示在顯示裝置580上。應當指出,術語“顯示裝置”被通用地使用;裝置580可以是便攜式或固定的,以及可包括顯示監(jiān)視器,諸如在TV中的,或PC、PDA、尋呼機、打印機、電視等等的監(jiān)視器,以及也可包括音頻或其它能力。不可見序列譯碼器530根據(jù)被使用來編碼水印的方法來譯碼不可見序列250B,如上面參照圖3A、3B和4討論的,以及產生譯碼的水印531。解密器540通過使用相應于被使用來加密內容驗證參量的專用密鑰141A的公共密鑰141B(圖1和2)來解密水印531。
比較器560把解密的內容驗證參量545與由內容驗證處理器550產生的內容參量555進行比較。內容驗證處理器550執(zhí)行與圖1的內容驗證處理器相同的功能。所以,如果圖5的內容參量250A與圖2的內容參量250A相同,因為它應當是相同的,則由內容驗證處理器550產生的內容參量555與解密的內容驗證參量545相同。驗證通知器570把比較的結果通知用戶,可任選地作為通過顯示裝置580的通信。
上述的內容僅僅說明本發(fā)明的原理。因此,將會看到,本領域技術人員將能夠提出各種實施本發(fā)明的原理和屬于本發(fā)明的精神和范圍的裝置,雖然這里沒有明顯地描述或顯示。例如,在圖2上,不可見水印的產生可以在發(fā)射機260內實施,以及被附著到文件250形成傳輸261,留下原先的文件250不受影響。同樣地,可以創(chuàng)建分開的文件250’,包括原先的文件250加上附著的不可見水印250B,而不影響原先的文件250。也應當指出,本發(fā)明的原理可以與其它不可見編碼技術相組合。例如,通過使用上述的共同待決的美國專利申請“Invisible Encoding of Attribute Data in Character BasedDocuments and Files(基于字符的資料和文件中屬性數(shù)據(jù)的不可見的編碼)”,序列號09/333,632,Keith Ahern 6/15/99提交,代理人文件夾PHA 23,675,中給出的原理,內容文件250A可以包含影響文件250A在顯示裝置580上的外貌的不可見編碼的結果。類似地,共同待決的美國專利申請“Script Embedded in ElectronicDocuments as Invisible Encoding(作為不可見編碼結果被嵌入在電子文件中的書寫字符)”,序列號_________,Keith Ahern_______提交,代理人文件夾PHA 23,778,給出通過不可見編碼結果的書寫字符的編碼,以及共同待決的美國專利申請“InvisibleEncoding for Control of Delivery(用于控制傳遞的不可見的編碼)”,序列號09/425,652,Keith Ahern 10/22/99提交,代理人文件夾PHA 23,777,給出通過不可見編碼結果的文件傳遞任選項的編碼,這些專利申請在此引用,以供參考。
附圖上給出的特定的結構和功能是用于說明的目的,根據(jù)本揭示內容,各種各樣的系統(tǒng)配置和最佳化特性對于本領域技術人員是顯然的,它們都被包括在以下的權利要求的范圍內。
權利要求
1.一種用于編碼與文件(250)有關的元信息(111)的編碼器(200),該編碼器(200)包括不可見性編碼器(220),它被配置來接收元信息(111)和由此產生一組當與文件(250)一起被提交時不可見的元信息字符(221)。
2.如權利要求1的編碼器(200),還包括元信息產生器(110),它被配置來接收文件(250)和由此產生元信息(111)。
3.如權利要求2的編碼器(200),其中該元信息產生器(110)包括內容驗證處理器(130),它提供相應于該文件(250)內容的參量(131),以及加密器(140),運行時被耦合到內容驗證處理器(130),加密該參量(131),形成該元信息(111)。
4.如權利要求1的編碼器(200),其中還將該不可見性編碼器(220)配置來把該元信息符號組(221)與該文件(250)相組合。
5.如權利要求1的編碼器(200),其中該元信息符號組(221)相應于該元信息(111)的二進制代表(311)。
6.一種對元信息(111)進行編碼的方法,該方法包括使得產生(440)一組當與涉及該元信息(111)的文件(250)一起被提交時的不可見元信息字符組(221),該元信息符號組(221)相應于該元信息(111)。
7.如權利要求6的方法,還包括使得根據(jù)文件(250)的內容產生(420-430)該元信息(111)。
8.如權利要求7的方法,其中使得產生(420-430)該元信息(111)包括使得確定(420)相應于該文件(250)內容的參量(131),以及使得加密(430)該參量(131),形成該元信息(111)。
9.如權利要求6的方法,還包括使得把該元信息符號組(221)附著(450)到該文件上(250)。
10.如權利要求6的方法,其中該元信息符號組(221)相應于該元信息(111)的二進制代表(311)。
11.一種譯碼器(500)包括接收機(510),被配置來接收文件(250),該文件包括內容材料(250A)和當與該文件(250)一起被提交時不可見的元信息字符組(250B),該元信息符號組(250B)相應于同該文件(250)有關的元信息(531)。不可見性譯碼器(530),運行時被耦合到接收機(510),被配置來對該元信息符號組(250B)進行譯碼,形成該元信息(531)。
12.權利要求11的譯碼器(500),其中該元信息(531)包括第一內容參量(545),該譯碼器(500)還包括處理器(550),被配置來處理內容材料(250A),形成相應于該文件(250)的第二內容參量(555),以及比較器(560),被配置來把第一內容參量(545)與第二內容參量(555)進行比較,以便實行該文件(250)的內容材料(250A)的驗證。
13.如權利要求12的譯碼器(500),還包括解密器(540),被配置來解密該元信息(531),以提供第一內容參量(545)。
14.如權利要求11的譯碼器(500),還包括顯示裝置(580),顯示該內容材料(250A)。
15.一種對與文件(250)有關的元信息(531)進行譯碼的方法,該方法包括使得接收文件(250),該文件包括內容材料(250A)和當與文件(250)一起被提交時不可見的元信息字符組(250B),該元信息字符組(250B)相應于該元信息(531),使得對該元信息符號組(250B)進行譯碼,形成元信息(531)。
16.如權利要求15的方法,其中該元信息(531)包括第一內容參量(545),且該方法還包括使得處理該內容材料(250A),形成相應于該文件(250)的第二內容參量(555),以及使得把第一內容參量(545)與第二內容參量(555)進行比較,以便實行文件(250)的內容材料(250A)的驗證。
17.如權利要求16的方法,還包括使得對該元信息(531)進行解密,提供第一內容參量(545)。
18.一種編碼文件(250),包括內容材料(250A),以及當與內容材料(250A)一起被提交時不可見的元信息字符組(250B),該元信息符號組(250B)相應于同該內容材料(250A)有關的元信息(111)。
19.如權利要求18的編碼文件(250),其中該元信息符號組(250B)相應于一個不可見字符碼序列,其后者相應于該元信息(111)的二進制代表。
20.如權利要求18的編碼文件(250),其中該元信息符號組(250B)包括以下字符中的至少一個字符空格字符,行饋送字符,表格字符,回車字符,和回退字符。
全文摘要
將與文件有關的元信息(諸如數(shù)字水印),通過使用在被提交時“不可見的”字符或字符序列進行編碼。將諸如空格、表格、回車、回退、行饋送等等的字符用來對該水印進行編碼。最好將編碼的“不可見的”元信息附著到該文件上。與這種編碼兼容的接收設備能夠譯碼和處理該元信息,例如驗證該文件的內容和/或原著者。與這種編碼不兼容的接收設備將只顯示或打印相應于該“不可見的”元信息的、附加的“白色空格”。通過把這個不可見的編碼附著到該文件上,在顯示或打印文件后這種附加的白色空格將以視覺上不引人注目的形式出現(xiàn)。
文檔編號G09C5/00GK1344462SQ00805218
公開日2002年4月10日 申請日期2000年12月22日 優(yōu)先權日2000年1月19日
發(fā)明者K·埃亨 申請人:皇家菲利浦電子有限公司