TOP > 中国の大学の特許 > 北京大学の特許一覧 > デジタル透かしをテキスト文書に埋め込むためのおよびそのデジタル透かしを検出するための方法およびデバイス > 明細書

明細書 :デジタル透かしをテキスト文書に埋め込むためのおよびそのデジタル透かしを検出するための方法およびデバイス

発行国 日本国特許庁(JP)
公表番号 特表2009-517929 (P2009-517929A)
公報種別 特許公報(B2)
公表日 平成21年4月30日(2009.4.30)
特許番号 特許第4603079号 (P4603079)
登録日 平成22年10月8日(2010.10.8)
発行日 平成22年12月22日(2010.12.22)
発明の名称または考案の名称 デジタル透かしをテキスト文書に埋め込むためのおよびそのデジタル透かしを検出するための方法およびデバイス
国際特許分類 H04N   1/387       (2006.01)
FI H04N 1/387
請求項の数または発明の数 21
全頁数 16
出願番号 特願2008-542576 (P2008-542576)
出願日 平成18年4月29日(2006.4.29)
国際出願番号 PCT/CN2006/000858
国際公開番号 WO2007/062554
国際公開日 平成19年6月7日(2007.6.7)
優先権出願番号 200510125727.3
優先日 平成17年12月1日(2005.12.1)
優先権主張国 中華人民共和国(CN)
審査請求日 平成20年6月2日(2008.6.2)
特許権者または実用新案権者 【識別番号】507231932
【氏名又は名称】北大方正集▲団▼有限公司
【氏名又は名称】PEKING UNIVERSITY FOUNDER GROUP CO., LTD
【識別番号】507232456
【氏名又は名称】北京北大方正▲電▼子有限公司
【氏名又は名称】BEIJING FOUNDER ELECTRONICS CO., LTD.
【識別番号】507232478
【氏名又は名称】北京大学
【氏名又は名称】PEKING UNIVERSITY
発明者または考案者 【氏名】ヤン ビン
【氏名】シ ウェンヂ
【氏名】チー ウェンファ
【氏名】チェン シェンユエン
【氏名】ワン リートン
個別代理人の代理人 【識別番号】100077481、【弁理士】、【氏名又は名称】谷 義一
【識別番号】100088915、【弁理士】、【氏名又は名称】阿部 和夫
審査官 【審査官】渡辺 努
参考文献・文献 特開2004-228896(JP,A)
米国特許出願公開第2005/0169499(US,A1)
特開2005-057797(JP,A)
特開2002-232688(JP,A)
特開平11-205579(JP,A)
特開平06-178098(JP,A)
国際公開第2004/084125(WO,A1)
特開2003-152987(JP,A)
特開2005-277807(JP,A)
特開2005-123974(JP,A)
特開2002-077587(JP,A)
調査した分野 H04N 1/387
特許請求の範囲 【請求項1】
テキスト文書にデジタル透かしを埋め込むための方法であって、
(1)ドットによって構成されるビットマップイメージを準備するステップであって、それらの符号化ドットの偏移が前記透かしを表すステップ、
(2)前記透かしを獲得し、前記獲得された透かしを前処理するステップ、
(3)前記ビットマップイメージに前記前処理された透かしを埋め込むステップ、
(4)前記透かしが埋め込まれた前記ビットマップイメージを含む前記テキスト文書を印刷するステップ
を有し、
前記ステップ(4)は、
前記テキスト文書の1つのページを、1つのビットマップイメージにそれぞれが対応する複数のユニットに分割するステップ、
各ユニットに対応する前記ビットマップイメージを90度、180度、または270度、ランダムに回転させるステップ、および
各ユニットに対応する前記回転されたビットマップイメージをモザイク化して、前記ページの背景シェードを形成するステップ
を含むことを特徴とする方法。
【請求項2】
前記ステップ(1)において、前記ビットマップイメージにおける前記ドットは、
偏移が前記透かしを表し、1つの符号化ドットと前記符号化ドット以外の1つの隣接するドットとの間の間隔が、2ドットから5ドットまでのサイズである符号化ドット、
前記透かしが生成されても偏移しないアンカドット、
符号化プロセス中にランダムに偏移して、符号化様式が解読されるのを防止し、前記ビットマップイメージの視覚的効果を調整するようにする摂動ドット
に分類されることを特徴とする請求項1に記載の方法。
【請求項3】
前記ステップ(1)において、前記ビットマップイメージは、AMスクリーニングドット、FMスクリーニングドット、FM-AM混合スクリーニングドット、および設計可能なドットのうち少なくとも1つを有することを特徴とする請求項2に記載の方法。
【請求項4】
前記ステップ(1)において、前記ビットマップイメージにおける前記ドットによって表されるグレーレベルは、3%から15%までの間であることを特徴とする請求項2に記載の方法。
【請求項5】
前記ステップ(2)は、
a.隠される文字を獲得し、埋め込まれる前記透かしを形成するステップ、
b.前記文字をバイナリビットストリングフローに変換するステップ、
c.前記バイナリビットストリングフローを暗号化して、暗号文ビットストリングフローを生成するステップ
をさらに有することを特徴とする請求項2に記載の方法。
【請求項6】
前記文字は、ユーザ名、ユーザパスワード、ネットワークカードのMACアドレス、コンピュータのIPアドレス、印刷時刻、ジョブ名、ジョブID、ユーザによって定義された文字ストリング、またはテキスト文書から入力されたテキスト情報を有することを特徴とする請求項5に記載の方法。
【請求項7】
前記ステップ(2)は、
d.前記ステップcで獲得された前記暗号文ビットストリングフローに基づいてデータ検出検査符号を計算し、次に、前記検査符号を前記暗号文ビットストリングフローの前部に追加するステップ
をさらに有することを特徴とする請求項5に記載の方法。
【請求項8】
前記ステップ(2)において、バイトフローが、すべての文字サブストリングの長さを記録するために、前記文字から変換されたビットストリングフローの前部に挿入されることを特徴とする請求項5に記載の方法。
【請求項9】
前記ステップ(3)において、前記オリジナルのビットマップイメージにおける前記ドットのいくつかが、偏移されるドットの偏移を介して前記暗号文ビットストリングフローを埋め込むために、それぞれ、異なる8つの方向で偏移することを特徴とする請求項8に記載の方法。
【請求項10】
前記ステップ(4)において、前記テキスト文書が出力されてメモリの中に格納され、
1つのページの前記背景シェードが利用可能であるときに前記格納された文書の対応する部分が前記メモリから出力されて前記背景シェードと組み合わされ、
前記背景シェードと組み合わされた前記文書はページ記述言語によって再変換され、次に、印刷のために、対応するページ記述ファイルに出力されることを特徴とする請求項1に記載の方法。
【請求項11】
テキスト文書にデジタル透かしを埋め込むための装置であって、
処理されるコンピュータデータをキャプチャし、メモリから取り出されたデータコードに従って前記コンピュータデータをビットストリングフローに変換し、前記ビットストリングフローを暗号化して暗号文ビットストリングフローを生成するように構成されたキャプチャデバイスと、
前記暗号文ビットストリングフローを受け取り、前記暗号文ビットストリングフローのビット数に照らして前記暗号文ビットストリングフローをいくつかのサブストリングに分割し、選択されたビットマップイメージにおけるすべての前記サブストリングによって表される透かしを、前記ビットマップイメージのドットを偏移させることによって隠すように構成された埋め込みデバイスと、
前記透かしがそれぞれに埋め込まれた複数のビットマップイメージをモザイク化して、ページの背景シェードを生成するように構成されたシェード生成デバイスであって、前記ビットマップイメージは、90度、180度、または270度、ランダムに回転される、シェード生成デバイスと、
前記背景シェードを受け取り、複数の前記透かしを含む前記背景シェードを有する前記テキスト文書をページ記述ファイルに組み込み、次に、前記ページ記述ファイルを印刷するように構成された印刷デバイスと
を備えることを特徴とする装置。
【請求項12】
前記コンピュータデータには、語、数字、文字、字、ならびに、デジタル化が可能な他の情報であってビデオ情報および/またはオーディオ情報を含む情報が含まれることを特徴とする請求項1に記載の装置。
【請求項13】
前記シェード生成デバイスは、背景シェード上で警告テキスト情報を生成するためのデバイスをさらに備えることを特徴とする請求項1または1に記載の装置。
【請求項14】
請求項1に記載の方法を使用してテキスト文書に埋め込まれたデジタル透かしを検出するための方法であって、
(1)前記透かしを含む前記テキスト文書をスキャンまたは抽出することにより、前記テキスト文書における複数のデジタルイメージの1つを獲得するステップ、
(2)前記獲得されたデジタルイメージを処理することにより、暗号文ビットストリングフローを獲得するステップ、
(3)特別なキーを使用することにより、前記暗号文ビットストリングフローを解読して、文字ストリングを獲得するステップ
を有することを特徴とする方法。
【請求項15】
前記ステップ(2)において、前記獲得されたデジタルイメージの回転角度およびズーム倍率が、前記透かしを含む前記獲得されたデジタルイメージにおいてアンカドットを識別することにより計算されることを特徴とする請求項1に記載の方法。
【請求項16】
前記ステップ(2)において、前記獲得されたデジタルイメージにおける符号化ドットのそれぞれがスキャンされ、前記符号化ドットの各ドットの偏移が前記スキャンされたデジタルイメージの回転角度およびズーム倍率に基づいて計算されて、ビットストリングフローに組み込まれるサブストリングが獲得されることを特徴とする請求項1に記載の方法。
【請求項17】
前記ステップ(2)において、前記複数のデジタルイメージにおける前記アンカドットがスキャンされて、前記イメージの1つにおける符号化ドットの偏移を使用して、前記文書の前景の内容または干渉要因によってもたらされる、別のイメージにおける符号化ドットの偏移のドロップアウトを補償することを特徴とする請求項1または1に記載の方法。
【請求項18】
前記ステップ(3)において、検査データを格納するためのバイトフローが前記暗号文ビットストリングフローの前部から抽出され、データ検査アルゴリズムを適用して前記暗号文ビットストリングフローの妥当性が検査されることを特徴とする請求項1に記載の方法。
【請求項19】
前記ステップ(3)において、前記特別なキーを使用して、平文ビットストリングフローを獲得するために前記検査データが除去された前記暗号文ビットストリングフローを解読して、平文ビットストリングフローにおける様々な長さのフィールドがそれぞれ抽出され、次に、前記フィールドのすべてによって構成される前記文字ストリングが獲得されることを特徴とする請求項1に記載の方法。
【請求項20】
請求項1に記載の方法を使用してテキスト文書に埋め込まれた透かしを検出するための装置であって、
シェードを含む前記文書をスキャンして、前記文書におけるデジタルイメージを獲得するように構成されたテキストデジタル化デバイスと、
前記デジタルイメージを処理することによって暗号文ビットストリングフローを獲得するように構成されたイメージ識別デバイスと、
特別なキーを使用することにより前記暗号文ビットストリングフローを解読して、文字ストリングを獲得するように構成された情報解読デバイスと
を備えることを特徴とする装置。
【請求項21】
前記イメージ識別デバイスは、
前記イメージの中央部分における帯状の領域を選択し、ピクセルのグレーレベルの間隔およびドットの半径を計算するように構成されたサンプリングデバイスと、
前記イメージの回転角度およびズーム倍率を計算するように構成された前処理デバイスと
をさらに備えることを特徴とする請求項2に記載の装置。
発明の詳細な説明 【技術分野】
【0001】
本発明は、デジタル透かし技術に関し、より詳細には、デジタル透かしをテキスト文書に埋め込み、または検出するための方法および装置に関する。
【背景技術】
【0002】
テキスト文書は、デジタルフォーマットでコンピュータの中に格納され、印刷すること、スキャン(走査)すること、複製することなどによって流布される。実際、多くの紙の文書(契約書や請求書など)は、オーディオ、ビデオ、およびイメージなどのマルチメディアよりもはるかに価値がある。コンピュータ、プリンタ、およびスキャナのようなデバイスが、応用され、普及するにつれ、コピーすること、および複製することは、比較的容易になる。その結果、重要なテキスト文書のセキュリティが、緊急の要件となる。
【0003】
他方、全く保護のない複製されたテキスト文書の出所をたどることは、困難である。例えば、オフィスオートメーションデバイスにおける不可欠な補助デバイスである複写機は、特に注目に値し、際立っている。最新のコピー機は、高度な機能で高品質のコピーを行う高い能力を有し、これらのコピー機の一部は、インテリジェント編集能力を有し、他のピアとの通信を実現する。一部の高性能のコピー機は、銀行券のコピーを作成することすらできる。そのようなコピー機は、様々な文書を高品質で印刷することができ、これにより、転記の作業負荷が大幅に軽減され、効率が改善する。しかし、コピー機の、この能力は、重要な文書のセキュリティに関して問題を生じさせる、つまり、機密文書が、伝達中に容易にコピーされて、セキュリティが失われるようになる可能性がある。すると、そのコピー機は、秘密を漏らすため、または盗むための便利なツールとなる。近年、税関によって押収される機密文書のほとんどは、出所を検査できないコピーである。したがって、犯罪者の有罪を証明することができない。印刷する個人の名前、プリンタの名前、印刷時刻、コンピュータの物理的アドレスなどの、いくらかの重要な情報が紙の文書から検出可能である場合、違法な伝達の出所をたどることは容易であろう。
【0004】
他方、ある文書が印刷される際、貸し出し限度額、預金金額、銀行顧客の自宅アドレスのような、銀行証書上の重要なプライベート情報などの、その文書のテキストの中に現れることが望ましくなく、必要なときに再記入されることが所望される、いくらかのさらなる情報が要求される。このため、所定の量の情報が、印刷される文書に、前もって隠されることが要求される。この情報は、人間の目によって識別されてはならないが、必要な場合、関係するスキャンデバイス、または特定の読み取りツールによって便利に獲得されることが可能である。その結果、大量の繰り返しの入力が回避され、多くの人的資源、物的資源、および時間がある程度節約される。
【0005】
以上の2つの問題は、基本的に同一であり、すなわち、テキスト文書が、所定の量の透かしを隠す担体(carrier)として使用される。そのような文書が、不正に複製されて、流布させられ、深刻な結末がもたらされたとき、前述の情報を使用して、その犯罪の源をたどることができる。その文書が、意図的に細工されている場合、前述の情報が違法な侵害に関する起訴の証拠として使用されることが可能である。
【発明の開示】
【発明が解決しようとする課題】
【0006】
この目的を達成するために、デジタル透かしとしてデジタルイメージを取得して、情報を隠す技術が開発された。まず、文書に内のイメージ(顔写真、会社ロゴ、背景パターンなどの)が選択される。事前入力された情報ストリング(文字列)が、特殊なプロセスによってそのイメージに埋め込まれ、次に、そのイメージが、高精度のプリンタまたは印刷デバイスを介して出力される。オリジナルの文書が印刷、スキャンまたは複製される際、数学的モデルによって正確に記述することが不可能であり、プリンタ、スキャナ、および複写機などのデバイスの固有のパフォーマンスと関係する無数のランダムノイズが加えられる。さらに、印刷されたイメージに関して、透かしはしばしば、回転、2値化、過剰な偏移、明らかな歪み、幾何学的変換などによって、しばしば歪められる。いくつかのプロセスがスキャンしたイメージに対して行われることが可能であるが、情報識別の誤り率は、高いままである。特に、何度も複製されたテキスト文書に対する検出結果は、容認できない。一部の人々は、テキスト文書の固有の特徴に応じて透かしを設計しようと試みて、高度にフォーマットされたファイルレイアウト(レターシフトまたはラインシフトなど)またはファイルフォーマットを変更することによって透かしが埋め込まれる。しかし、この方法は、深刻な欠点も有する。最初は、極めて複雑である特殊なプロセスが、先行テキスト編集-レイアウトソフトウェアにおいて要求される。第2に、通常の文書の効果に影響を与えるのを回避するため、レターシフトまたはラインシフトは、大き過ぎてはならない。その場合、スキャンされたイメージはやはり、深刻なノイズに悩み、一般に、透かしを検出するのが困難である。第3に、文書における行の数は通常、一定であるので、隠すことが可能な情報は、比較的少ない。最後に、複数ページテキストの場合、この方法はさらに複雑である。
【0007】
さらに、この方法は、文書の内容に依存する。文書にイメージが全く含まれない場合、透かしは担体を全く有さない。文書において担体が存在する場合でも、透かしがイメージの中に隠される際に、イメージが文書からコピーされて特別な処理が施されなければならない。再び編集された後、そのイメージを印刷することが可能である。その上、高精細度デバイスが、この方法における印刷中に要求される。したがって、この方法は、オフィスにおいて文書を印刷するのに適していない。
【0008】
さらに、透かしを検出するための方法および対応するデバイスの動作は、以下のとおりである。すなわち、検出される文書およびオリジナルの文書をスキャンして対応するイメージを取得すること、そのイメージを前処理して、減衰、偏移、ズーム、不明瞭化などの要因、特に、解消されなければならないソルトペッパノイズ(salt-pepper noises)および偏光によって生じる影響を補うこと、および埋込み方法に基づいてそのイメージの中に隠された情報を抽出することである。この検出方法は、比較的厳格な要件と、大量の前処理とを有する。この前処理の精度は、検出結果に直接に影響する。さらに、オリジナルのイメージがこの方法において必要とされ、これにより、検出プロセスが複雑になる。一般に、これらの条件は極めて厳格であるため、特に、ズームまたは複製された文書に関して、識別率は低い。
【課題を解決するための手段】
【0009】
従来技術の欠点を克服するために、本発明は、テキスト文書にデジタル透かしを埋め込むための、またはテキスト文書におけるデジタル透かしを検出するための方法および装置を提供することである。本方法および装置は、ある量の透かし情報を記録するために通常の文書の背景にシェードの層を埋め込むことができる。透かしが埋め込まれた文書が汚れ、折り曲げられ、またはズーム複写(zoom-duplicated)された場合でも、文書に隠された透かしを高い精度で検出することが可能である。
【0010】
これを目的として、本発明は、テキスト文書にデジタル透かしを埋め込むための方法を提供し、当該方法は、
(1)ドットによって構成されるビットマップイメージを準備するステップであって、それらの符号化ドットの偏移(シフト)が前記透かしを表すステップ、
(2)前記透かしを獲得し、前記獲得された透かしを前処理するステップ、
(3)ビットマップイメージに前処理された透かしを埋め込むステップ、
(4)前記透かしが埋め込まれた前記ビットマップイメージを含む前記テキスト文書を印刷するステップ
を有する。
【0011】
さらに、ステップ(1)において、ビットマップイメージは、AMスクリーニングドット、FMスクリーニングドット、FM-AM混合スクリーニングドット、および設計可能なドットのうち少なくとも1つを有する。
【0012】
さらに、ステップ(1)において、ビットマップイメージは、事前設計され、または所定の規則に基づいて動的に生成され、ビットマップイメージにおけるドットによって表されるグレーレベルは、3%から15%までの間である。
【0013】
さらに、ステップ(1)において、ビットマップイメージにおけるドットは、以下に分類される。すなわち、偏移が透かしを表し、1つの符号化ドットとその符号化ドット以外の隣接する1つのドットとの間の間隔が2ドットから5ドットまでのサイズである符号化ドット、透かしが生成されても偏移しないアンカドット、符号化プロセス中にランダムに偏移して、符号化様式が解読されるのを防止し、ビットマップイメージの視覚的効果を調整するようにする摂動ドットである。
【0014】
さらに、ステップ(2)は、以下をさらに含む。すなわち、
a.隠される文字を獲得し、埋め込まれる透かしを形成するステップ、
b.それらの文字をバイナリビットストリングフローに変換するステップ、
c.そのバイナリビットストリングフローを暗号化して、暗号文ビットストリングフローを生成するステップ、
d.ステップcで獲得された暗号文ビットストリングフローに基づいてデータ検出検査符号を計算し、次に、その検査符号を、その暗号文ビットストリングフローの前部に追加するステップである。
【0015】
さらに、ステップaにおいて、それらの文字には、ユーザ名、ユーザパスワード、ネットワークカードのMACアドレス、コンピュータのIPアドレス、印刷時刻、ジョブ名、ジョブID、ユーザによって定義された文字ストリング、またはテキスト文書から入力されたテキスト情報が含まれる。
【0016】
ステップ(2)において、バイトフローが、すべての文字サブストリングの長さを記録するために、それらの文字から変換されたビットストリングフローの前部に挿入される。
【0017】
ステップ(3)において、オリジナルのビットマップイメージにおけるドットのいくつかが、偏移させられるドットの偏移を介して暗号文ビットストリングフローを埋め込むために、それぞれ異なる8つの方向で偏移する。
【0018】
さらに、ステップ(4)は、以下をさらに含む。すなわち、テキスト文書の1つのページを、1つのビットマップイメージにそれぞれが対応する複数のユニットに分割するステップ、各ユニットに対応するビットマップイメージを90度、180度、または270度、ランダムに回転させるステップ、および各ユニットに対応する回転されたビットマップイメージをモザイク化して、そのページの背景シェードを形成するステップである。
【0019】
ステップ(4)において、そのテキスト文書が出力されてメモリの中に格納され、1つのページの背景シェードが利用可能であるときにその格納された文書の対応する部分がそのメモリから出力されて背景シェードと組み合わされ、背景シェードと組み合わされた文書はページ記述言語によって再変換され、次に、印刷のために、対応するページ記述ファイルに出力される。
【0020】
テキスト文書にデジタル透かしを埋め込むための装置は、
処理されるコンピュータデータをキャプチャし、メモリから取り出されたデータコードに従ってそのコンピュータデータをビットストリングフローに変換し、そのビットストリングフローを暗号化して暗号文ビットストリングフローを生成するように構成されたキャプチャデバイスと、
その暗号文ビットストリングフローを受け取り、その暗号文ビットストリングフローのビット数に照らしてその暗号文ビットストリングフローをいくつかのサブストリングに分割し、選択されたビットマップイメージにおけるすべてのサブストリングによって表される透かしを、そのビットマップイメージのドットを偏移させることによって隠すように構成された埋め込みデバイスと、
透かしがそれぞれに埋め込まれた複数のビットマップイメージをモザイク化して、ページの背景シェードを生成するように構成されたシェード生成デバイスと、
その背景シェードを受け取り、複数の透かしを含むその背景シェードを有するテキスト文書をページ記述ファイルに組み込み、次に、そのページ記述ファイルを印刷するように構成された印刷デバイスと
を備える。
【0021】
さらに、コンピュータデータには、語、数字、文字、字、ならびに、デジタル化されることが可能な他の情報であってビデオ情報および/またはオーディオ情報を含む情報が含まれる。
【0022】
シェード生成デバイスは、背景シェード上で警告テキスト情報を生成するためのデバイスをさらに備える。
【0023】
テキスト文書におけるデジタル透かしを検出するための方法は、
(1)透かしを含むテキスト文書をスキャンまたは抽出することにより、テキスト文書における複数のデジタルイメージの1つを獲得するステップ、
(2)その獲得されたデジタルイメージを処理することにより、暗号文ビットストリングフローを獲得するステップ、
(3)特別なキーを使用することにより、その暗号文ビットストリングフローを解読して、文字ストリングを獲得するステップ
を有する。
【0024】
さらに、ステップ(2)において、その獲得されたデジタルイメージの回転角度およびズーム倍率が、透かしを含む獲得されたデジタルイメージにおいてアンカドットを識別することにより計算される。
【0025】
ステップ(2)において、その獲得されたデジタルイメージにおける符号化ドットのそれぞれがスキャンされ、符号化ドットの各ドットの偏移がそのスキャンされたデジタルイメージの回転角度およびズーム倍率に基づいて計算されて、ビットストリングフローに組み込まれるサブストリングが獲得される。
【0026】
ステップ(2)において、複数のデジタルイメージにおけるアンカドットがスキャンされて、それらのイメージの1つにおける符号化ドットの偏移を使用して、その文書の前景(foreground)の内容または干渉要因によってもたらされる、別のイメージにおける符号化ドットの偏移のドロップアウトを補償する。
【0027】
ステップ(3)において、検査データを格納するためのバイトフローが、暗号文ビットストリングフローの前部から抽出され、データ検査アルゴリズムが適用されて、暗号文ビットストリングフローの妥当性を検査する。
【0028】
ステップ(3)において、特別なキーを使用して、平文ビットストリングフローを獲得するように検査データが除去された暗号文ビットストリングフローを解読して、平文ビットストリングフローにおける様々な長さのフィールドがそれぞれ抽出され、次に、それらのフィールドのすべてによって構成される文字ストリングが獲得される。
【0029】
テキスト文書における透かしを検出するための装置は、
シェードを含む文書をスキャンして、その文書におけるデジタルイメージを獲得するように構成されたテキストデジタル化デバイスと、
デジタルイメージを処理することによって暗号文ビットストリングフローを獲得するように構成されたイメージ識別デバイスと、
特別なキーを使用することにより暗号文ビットストリングフローを解読して、文字ストリングを獲得するように構成された情報解読デバイスと
を備える。
【0030】
さらに、イメージ識別デバイスは、イメージの中央部分における帯状の領域を選択してピクセルのグレーレベルの間隔およびドットの半径を計算するように構成されたサンプリングデバイスと、そのイメージの回転角度およびズーム倍率を計算するように構成された前処理デバイスとを備える。
【0031】
本発明は、以下の効果を有する。本発明において提供される方法および装置によれば、文書のシェードに埋め込まれる情報の量が増加し、そのシェードに埋め込まれた透かしはその文書と一緒に流布させられる。その文書は、検出が行われるために、スキャナによってデジタル化することが可能である。誤り訂正符号化技術が本発明のシェードを生成するためのプロセスにおいて適用されるので、文書が汚れ、折り曲げられ、またはズーム複写された場合でも、隠された透かしが高い精度で検出されることが可能である。したがって、本発明は、文書を暗号化または追跡するため、文書の不正な流布を規制するため、および文書の著作権を保護するために、広く使用することが可能である。
【発明を実施するための最良の形態】
【0032】
以下に、本発明の実施形態を添付の図面を参照して説明する。
【0033】
図7に示すように、テキスト文書にデジタル透かしを埋め込むための方法は、以下のステップを含む。
【0034】
(1)ステップ1は、ドットによって構成されるビットマップイメージを準備することであり、それらの符号化ドットの偏移(シフト)は、透かしを表す。
【0035】
本発明のオリジナルのビットマップイメージは、AM(振幅変調)スクリーニングドット、FM(周波数変調)スクリーニングドット、FM-AM混合スクリーニングドット、および設計可能な(designable)ドットを有することが可能である。ビットマップイメージは、事前設計され、または所定の規則に基づいて動的に生成されることが可能である。この実施形態では、FMスクリーニングによって形成される事前設計された円形ドットのセットが、選択される。これらのドットによって表されるグレーレベルは、6%である(一般に、3%~15%のグレーレベルを有するドットが、好ましい)。オリジナルのビットマップイメージの部分的に拡大された図が、図3に示される。すべてのドットは、以下の3つのタイプ、すなわち、符号化ドット、アンカドット、および摂動ドットに分類することが可能である。符号化ドット101の位置の偏移は、埋め込まれるべき透かしを表す。透かしが生成されても、アンカドット102の位置は偏移しない。透かしを表さない、摂動ドット103の位置の偏移は、ランダムである。概ね、摂動ドット103の位置の偏移は、符号化ドットの偏移によって影響を受ける視覚的効果を改善する。加えて、摂動ドット103の偏移により、符号化されたビットマップイメージの規則性が回避される。したがって、同一のオリジナルのビットマップイメージからの符号化されたビットマップイメージは、同一の透かしが埋め込まれているものの、同一ではない。さらに、FMドットの固有のランダム性により、解析することによって透かしを表す符号化ドットの動きの特性を得ることが困難であり、その結果、セキュリティが、ある程度向上する。
【0036】
(2)ステップ2は、透かしを獲得し、その獲得された透かしを前処理することである。
【0037】
図1に示すように、プリンタドライバは、コンピュータのユーザ名、ネットワークカードのMAC(メディアアクセス制御)アドレス、コンピュータのIPアドレス、文書を印刷する時刻、印刷の日付、ジョブ名、ジョブIDの全部または一部、ドライバのGUIユーザインタフェースから得られたユーザによって入力されたパスワード、ユーザによって定義された文字ストリング、または他の任意のテキスト文書から読み取られるテキスト情報を読み取る。例えば、この実施形態に埋め込まれる文字ストリングの情報は、以下のとおりである。
ユーザ名 「SuperMan」
MACアドレス 「00-0F-1F-CC-15-D7」
コンピュータのIPアドレス 「172.16.8.102」
印刷時刻 「2005-10-24」
ジョブ名 「secret document.doc」
ユーザによって定義された文字ストリング 「Do not reveal the information recorded in this document,or bear your own consequence.」
【0038】
前述のすべての文字サブストリングが組み合わされて、文字ストリングになる。次に、各文字に対応するデータコードが、バイナリビットストリングフロー(0と1によって構成される)を得るようにコンピュータのメモリから読み取られる。好都合な復号化のため、所定のサイズを有するバイトフローが、ビットストリングフローの前部に挿入されて、前述の文字サブストリングの各サブストリングの長さを記録する。セキュリティのため、組み合わされたビットストリングフローは、プレーン符号の役割をしてバイトフローの前部に挿入されるキーを使用して暗号化される。検出が実行されると、ユーザによって入力されたキーが、読み取られたプレーン符号キーと同一であるかどうかを検証する認証が、要求される。この認証を通過した場合、検出プログラムは、そのキーを使用することによって、その読み取られた暗号文ビットストリングフローを解読して、元の平文ビットストリングフローを得る。その他の場合、暗号文バイトフローの中の情報は、文書と検出プログラムの両方が知られている場合でも、識別することができない。その後、一般的なデータ検査アルゴリズムが、暗号化された暗号文バイトフローに適用されて、検索データが計算される。ここで、16ビット検査符号を計算するCRC(巡回冗長検査)符号が選択され、次に、この検査符号が、隠されるべきビットストリングフローを形成するように暗号文ビットストリングフローの前部に追加される。この検査符号は主に、検出中にデータの正しさを検査するものある。実際、暗号文バイトフローの前部に2つのプレーン符号バイトフロー(すなわち、キーおよびデータ検査符号)が存在する。
【0039】
(3)ステップ3は、ビットマップイメージに、前処理された透かしを埋め込むことである。
【0040】
図2に示される透かしを埋め込むプロセスの流れ図を参照すると、暗号文ビットストリングフローはまず、その暗号文ビットストリングフローのビット数に照らして、いくつかのサブストリングに分割される。図4に示すように、各ドットの偏移が、本発明における符号化プロセスに従って、3つのビットを反映する。つまり、1バイトの符号化情報が、3つのドットの偏移によって表される。3つのドットの偏移は、9ビットの情報を表すので、最後のビットは残余であり、パリティ検査ビットとして使用される。もちろん、このビットは、符号化プロセスの要件に関する他の情報を表すこともできる。この実施形態において、暗号文ビットストリングフローは、バイト単位で分割され、各バイトは、最初の2つの符号化ドットが、そのバイトの6つのビットを表す3つの符号化ドットを属性とする。第3の符号化ドットによって表される3つのビットの最初の2つのビットは、そのバイトの終わりの2つのビットである一方で、それらのビットの第3のビットは、パリティ検査ビットの役割をする。
【0041】
分割されたサブストリングの数に基づき、対応する数の符号化ドットが、選択される。これらの符号化ドットのそれぞれは、図4のとおり偏移する。すべてのサブストリングが、符号化ドットの偏移を表す。すべての符号化ドットが偏移した後、新たなビットマップイメージが獲得される。シェードの基本的な構成要素として、新たなビットマップイメージは、獲得された文字ストリングを既に隠している。
【0042】
(4)ステップ4は、透かしが埋め込まれたビットマップイメージを含むテキスト文書を印刷することである。
【0043】
ステップ(3)で形成された複数のビットマップイメージが、通常のデータのページ情報によってサイズが決定される大きい背景シェードにモザイク化される。この実施形態では、A4という通常のサイズが選択される。モザイク化中、様々なモザイク化方法を印刷ドライバの特定の要件に応じて選択することが可能である。最も単純な方法は、単位ビットマップイメージを複数コピーして、マトリックスのようなモザイク化を直接に実行することである。このモザイク化方法の主要な問題は、比較的大きい規則性である。この問題を解決するため、本発明の方法は、以下のとおりである。すなわち、テキスト文書の1つのページを1つのビットマップイメージにそれぞれが対応する複数のユニットに分割すること、各ユニットに対応するビットマップイメージを90度、180度、または270度、ランダムに回転させること、各ユニットに対応する回転したビットマップイメージをモザイク化して、そのページの背景シェードを形成することである。前述のとおり処理されて、シェードの規則性は大幅に減らされる。最後に、モザイク化された背景シェードが、印刷される。
【0044】
印刷プロセス中に、テキスト文書が出力され、メモリの中に格納される。1つのページの背景シェードが利用可能である場合、その格納された文書の対応する部分がそのメモリから出力されて、背景シェードと組み合わされる。次に、背景シェードと組み合わされた文書が、ページ記述言語によって再変換され、対応するページ記述ファイルに出力される。最後に、ページ記述ファイルが、印刷コントローラに送られて、印刷される。以上のプロセスの印刷効果が図5に示される。図5の部分的に拡大された図が、図6に示される。複数の透かしが、モザイク化されたビットマップイメージにおける複数の箇所に埋め込まれるので、あるデータブロック全体が他のデータブロックの補償を伴って獲得されて、シェードのある部分の汚れおよび前景の文字の影響を克服することが可能である。
【0045】
テキスト文書にデジタル透かしを埋め込むための装置は、前述のステップに従って、キャプチャデバイス、埋め込みデバイス、シェード生成デバイス、および印刷デバイスを備えており、概略図が図8に示されている。
(a)キャプチャデバイスは、処理されるコンピュータデータをキャプチャし、メモリから取り出されたデータコードに従ってそのコンピュータデータをビットストリングフローに変換し、そのビットストリングフローを暗号化して、暗号文ビットストリングフローを生成するように構成される。
(b)埋め込みデバイスは、その暗号文ビットストリングフローを受け取り、その暗号文ビットストリングフローのビット数に照らして、その暗号文ビットストリングフローをいくつかのサブストリングに分割し、選択されたビットマップイメージにおけるすべてのサブストリングによって表される透かしを、そのビットマップイメージのドットを偏移させることによって隠すように構成される。
(c)シェード生成デバイスは、透かしがそれぞれに埋め込まれた複数のビットマップイメージをモザイク化して、ページの背景シェードを生成するように構成される。
(d)印刷デバイスは、その背景シェードを受け取り、複数の透かしを含む、その背景シェードを有するテキスト文書をページ記述ファイルに組み込み、次に、そのページ記述ファイルを印刷するように構成される。
【0046】
コンピュータデータとしては、語、数字、文字、字、ならびに、デジタル化が可能な他の情報であってビデオ情報および/またはオーディオ情報を含む情報がある。シェード生成デバイスは、背景シェード上で警告テキスト情報を生成するためのデバイスをさらに備える。シェードを生成するためのデバイスによって生成されたビットマップイメージが印刷された後、背景シェード上の隠された警報テキスト情報は、肉眼で識別するのが困難である。しかし、ビットマップイメージが複製された後、その警報テキスト情報は、不正な複写が回避されるように、はっきりと明るみに出ることが可能である。
【0047】
図9に示されるとおり、テキスト文書におけるデジタル透かしを検出するための方法は、以下のステップを含む。
【0048】
(1)ステップ1は、透かしを含むテキスト文書をスキャン(走査)または抽出することにより、テキスト文書における複数のデジタルイメージの1つを獲得することである。
【0049】
テキスト文書のシェードに隠されたデジタル透かしの検出のため、テキスト文書は、イメージ入力デバイスまたはイメージ抽出デバイス(スキャナまたはデジタルカメラ)によってデジタル化される。獲得されたデジタルイメージは、少なくとも1つの暗号化されたデジタル透かしを含む。
【0050】
(2)ステップ2は、獲得されたデジタルイメージを処理することにより、暗号文ビットストリングフローを得ることである。
【0051】
このステップは、主に、コンピュータ上で実行される独立したアプリケーションプログラムによって実行される。このプログラムは、スキャンすることによって獲得されたデジタルイメージを扱うために使用される。そのイメージがそのプログラムによって入力された後、ユーザは、メモリの中に一時的に格納されるキーを入力するように求められる。いくつかの主観的理由または客観的理由により、文書は、スキャンまたは複製されている間に、通常、ある程度、傾きまたはズームされる。さらに、文書が、複数回におよぶ複製の結果もたらされるドットの拡大および歪みを被ることがある。埋め込まれた透かしの検出は、前述の要因のために影響を受ける可能性がある。隠された情報を正確に識別するために、獲得されたデジタルイメージの回転角度およびズーム倍率が、透かしを含む獲得されたデジタルイメージにおけるアンカドットを識別することによって検出されるべきであり、スキャン結果が、ある程度、補償されなければならない。次に、イメージ全体が、検出プログラムを使用してスキャンされる。ビットマップイメージの開始ドットの役割をするドットが識別された場合、あるイメージ、またはあるイメージの一部分が検出されたことが示される。すべての符号化ドットは、埋め込みプロセス中に偏移させられ、符号化ドットの理論上の位置は、空白の領域にある。次に、符号化ドットの探索が、それらの理論上の位置に隣接する領域において実行される。符号化ドットの各ドットの実際の位置を、対応する理論上の位置と比較して、その符号化ドットによって表されるビットストリングの情報が、特定される。すべての符号化ドットが処理された後、ビットストリングフローが、獲得され、次に、偏移操作を使用してバイトフローに変換される。固定長を有するプレーン符号キーが、バイトフローの前部から抽出される。暗号文バイトフロー全体の妥当性が、そのバイトフローの終端におけるデータ検査符号に基づいて検査される。データ検査を通過した場合、ユーザによって入力されたキーが、そのバイトフローから抽出されたキーと比較される。認証を通過した場合、暗号文バイトフローが、そのキーを使用して解読され、したがって、すべての隠された情報が、識別される。
【0052】
文書の通常の前景の内容の影響により、多くの場合において、文書全体がスキャンされた後、完全な状態のままの透かしを含むイメージが1つも見つからない可能性がある。この時点で、複数のイメージにおけるアンカドットが、スキャンされる必要がある。次に、それらのイメージの1つにおける符号化ドットの偏移が、前景の内容の干渉によってもたらされる別のイメージにおける符号化ドットの偏移のドロップアウトを補償するのに使用され、その結果、情報に関する識別率が、さらに向上する。
【0053】
(3)ステップ3は、ある特別なキーを使用することにより、暗号文ビットストリングフローを解読して、元の文字ストリングを獲得することである。
【0054】
解読動作の前に、データを検査するための情報が、暗号文ビットストリングフローの前部におけるバイトから抽出され、データ検査アルゴリズムが適用されて、暗号文ビットストリングフローの妥当性を検査する。その後、その特別なキーを使用して、平文ビットストリングフローを獲得するように検査データが除去された暗号文ビットストリングフローを解読して、平文ビットストリングフローにおけるフィールドの長さがそれぞれ抽出され、次に、それらのフィールドのすべてによって構成される文字ストリングが獲得される。
【0055】
前述のステップに従ってテキスト文書における透かしを検出するための装置は、
シェードを含む文書をスキャンして、その文書におけるデジタルイメージを獲得するように構成されたテキストデジタル化デバイスと、
デジタルイメージを処理することによって暗号文ビットストリングフローを獲得するように構成されたイメージ識別デバイスと、
特別なキーを使用することにより、暗号文ビットストリングフローを解読して、文字ストリングを獲得するように構成された情報解読デバイスと
を備える。
【0056】
イメージ識別デバイスは、イメージにおける指定された領域に関するサンプリングデバイスと、イメージに関する前処理デバイスとを備える。サンプリングデバイスは、イメージの中央部分における帯状の領域を選択し、サンプリングされたピクセルのグレーレベルの間隔および対応するドットの半径を計算することができる。前処理デバイスは、サンプリングの結果に基づき、そのイメージの回転角度およびズーム倍率を計算することができる。
【0057】
大量の情報が、本発明に従って、複製防止の強力な能力を有するビットマップイメージに埋め込まれることが可能である。透かしは、5回複製されている文書からでさえ、正確に検出されることが可能である。本発明の方法は、ピクセルの情報埋込み以外のドットレベルの符号化に基づく。その結果、本発明によれば、透かしは、イメージが、ある倍率でズームされている場合でさえ、検出されることが可能である。
【0058】
以上の実施形態は、本発明の好ましい実施形態である。当業者が、本発明の趣旨を逸脱することなく、他の実施形態を得ることが可能であり、ここで、
FMスクリーニングによって生成されたビットマップイメージ、またはドットによって構成され所望に応じて設計された任意の規則的なもしくは不規則なビットマップイメージなど、別のタイプのビットマップイメージが、オリジナルのビットマップイメージとして使用されることも可能であり、
様々な距離のドット偏移が様々なビットストリングを表す方法などの、別の符号化方法が適用されることも可能であり、ビットストリングの分解モードが、例えば、所定の規則に従って「0」または「1」を表すように変更されることが可能であり、
*.dot、*.txtなどの、他のテキストフォーマットを有する文書から読み取られた任意の文字フローを含む、任意の文字ストリングを隠すことが可能であり、
パリティ検査方法、または巡回符号を使用する他の検査方法などの、ビットストリングフローの妥当性を検査するための別の方法を適用することが可能である。
【図面の簡単な説明】
【0059】
【図1】情報を獲得して処理するためのプロセスの概略図である。
【図2】情報を埋め込むためのプロセスの概略図である。
【図3】オリジナルのビットマップイメージの概略図である。
【図4】符号化のためのドットの偏移を示す概略図である。
【図5】情報が埋め込まれた文書の概略図である。
【図6】図5を部分的に拡大した図である。
【図7】透かしを埋め込むためのプロセスの概略図である。
【図8】透かしを埋め込むためのプロセスの概略図である。
【図9】透かしを検出するためのデバイスの概略図である。
【図10】透かしを検出するためのプロセスの概略図である。
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5
【図7】
6
【図8】
7
【図9】
8
【図10】
9