TOP > 中国の大学の特許 > 北京大学の特許一覧 > 西洋語の透かし処理をするための透かし画像の分割方法と装置

西洋語の透かし処理をするための透かし画像の分割方法と装置

国内特許コード P150011769
掲載日 2015年3月30日
出願番号 特願2013-545033
公表番号 特表2014-500688
登録番号 特許第5669957号
出願日 平成23年12月23日(2011.12.23)
公表日 平成26年1月9日(2014.1.9)
登録日 平成26年12月26日(2014.12.26)
国際出願番号 CN2011084577
国際公開番号 WO2012083882
国際出願日 平成23年12月23日(2011.12.23)
国際公開日 平成24年6月28日(2012.6.28)
優先権データ
  • 201010620424.X (2010.12.23) CN
発明者
  • 王高▲陽▼
  • ▲其▼文法
  • 王立▲東▼
  • ▲楊▼斌
出願人
  • 北大方正集▲団▼有限公司
  • 北京大学
  • 北京北大方正▲電▼子有限公司
  • 北京北大方正技▲術▼研究院有限公司
発明の名称 西洋語の透かし処理をするための透かし画像の分割方法と装置
発明の概要 本発明は西洋語の透かし処理をするための透かし画像の分割方法を提供し、この方法は、西洋語画像を行列分割によって複数の文字画像ブロックを取得するステップと、文字画像ブロックから有効な文字画像ブロックを識別するステップと、西洋語画像がラージフォントテキストに対応するか、スモールフォントテキストに対応するかを判断するように、有効な文字画像ブロックのサイズを統計するステップと、ラージフォントテキストとスモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うステップと、単語グループを、透かし画像ブロックに対応する複数の部分に均等に分割するステップとを備える。また、本発明は西洋語の透かし処理をするための透かし画像の分割装置を提供する。本発明は透かしの埋め込み処理の操作性を確保することができる。
従来技術、競合技術の概要


デジタル透かしでは、特定の情報をオーディオ、画像、または映像などのデジタル信号に埋め込む。デジタル透かしを有する信号をコピーすると、埋め込まれた情報も同時にコピーされる。デジタル透かしは、見える透かしと隠す透かしとに分類され、見える透かしは可視の透かし(visible watermarking)であり、それに含まれる情報が画像または映像を見るのと同時に見られる。通常、見える透かしに版権所有者の名前またはシンボルが含まれる。テレビ局はテレビ画面の隅で配置するシンボルも見える透かしの一種である。



隠す透かしがデジタルデータの形でオーディオ、画像、または映像に埋め込まれるが、一般的な状況では見えない。隠す透かしの一つの重要な応用が版権保護であり、これによって、権限のないまま無断でデジタル媒質を複製やコピーすることを避けたり、防止したりする。ステガノグラフィー(Steganography)もデジタル透かしの一つの応用であり、デジタル信号に隠される情報によって互いに交流できる。デジタル写真に含まれる注釈データは写真を取る時間、使用されるレンズの絞りとカメラのシャッター、更にカメラのブランドなどの情報を記録でき、これもデジタル透かしの一つの応用である。ある書類フォーマットにこれらの「metadata(メタデータ)」と呼ばれる付加情報が含まれる。



なお、たくさんのテキスト書類はデジタル形で存在するだけではなく、また印刷、コピーすることによって紙の形で伝播し、その中に、西洋語のテキストがかなりある。国際化がますます進んでいるのに伴い、西洋語のテキストを通じて交流することも頻繁になるので、これらのテキストに対する安全保護が強く要求される。デジタル化技術が非常に速く発展するにつれて、印刷、コピーすることによって紙の形を通じて交流することが既にかなり普及されており、たくさんの重要な情報または機密情報が紙書類の形で漏洩される。そのため、紙書類に基づいて、印刷とコピーを防止できる2値テキストの透かし技術を研究することが特に重要である。



1.出願番号が200710121642.7である特許文献は2値画像におけるデジタル透かしを埋め込む方法を開示し、この方法は、2値画像の一部または全部を少なくとも二つの透かし画像ブロックを分割するステップと、それぞれの透かし画像ブロックにおける黒い画素点の数に基づいてグループに分けて、複数のグループを取得するステップと、それぞれの前記グループにおけるデータに対してアダマール(hadamard)変換を行うステップとを備える。量子化方法を使用し、埋め込み待ちの透かし信号を埋め込み、逆アダマール変換を行ってそれぞれの透かし画像ブロックにおける変更すべき画素点の数を取得することによって、透かしを埋め込んだり、抽出したりする目的を達する。



2.出願番号が200810055770.0である特許文献は2値テキスト画像におけるデジタル透かしを埋め込む方法と装置を開示し、この方法は、2値画像の一部または全部を埋め込む部分と調整部分とを分割するステップと、前記埋め込む部分と調整部分におけるそれぞれの集合に含まれる黒い画素点の数の平均値を計算するステップと、前記平均値と埋め込む部分におけるそれぞれの集合に含まれる黒い画素点の数に基づいて色変更パラメータを計算するステップと、前記色変更パラメータに基づいて埋め込む部分と調整部分におけるそれぞれの集合に含まれる黒い画素点の数を変更し、透かしの埋め込みを実現するステップとを備える。



3.出願番号が200610114048.0である特許文献はモノクロ2値テキスト画像におけるデジタル透かしの埋め込みと抽出を行う方法と装置を開示し、この埋め込み方法は、テキスト画像における有効文字エリアの位置を測定するステップと、有効文字エリアをグループに分け、それぞれの文字エリアにおける黒点の数を統計するステップと、グループ内の文字エリアにおける黒点の数の間の関係、透かしのビット・ストリング(bit string)及び第一ステップ長さに基づいて、それぞれの文字エリアにおける変転すべき画素の第一数を算出するステップと、第一数に従ってそれぞれの文字エリアにおける画素を変転するステップとを備える。また、この抽出する方法は、テキスト画像における有効文字エリアの位置を測定するステップと、有効文字エリアをグループに分け、それぞれの文字エリアにおける黒点の数を統計するステップと、それぞれのグループ内の文字エリアにおける黒点の数の間の相対関係及び第一ステップ長さに基づいて、埋め込まれた透かし情報のビット・ストリングを抽出するステップとを備える。



上記の2値テキスト透かしの技術において、透かし画像ブロックは透かしを埋め込むエリアとして特に重要である。上記の特許出願1において、透かし画像ブロックを直接的に透かしを埋め込むエリアとする。特許出願2において、2値テキスト画像部分を透かし画像ブロックである埋め込む部分に分割する。特許出願3において、テキスト画像において、グループ分けされた有効文字エリアが透かし画像ブロックとする。上記の特許出願がいずれも透かし画像ブロックにおける黒い画素点の数を変更することによって透かしを埋め込み、透かし画像ブロックにおける黒い画素点の数を量子化することによって透かしを抽出する。



そのため、上記の方法はいずれも二つの前提に基づく。即ち、
1.文字を分割する結果が正しくなければならない。現在の文字分割アルゴリズムは大体光学式文字識別OCR(Optical Character Recognition)システムの文字識別結果に依存するが、OCR識別の速度と効率を考慮し、それに、接触している西洋語に対して、OCR識別も一定のエラー率があるため、通常はデジタル透かしシステムにおいてOCRメカニズムを使用しない。



2.透かし画像ブロックの黒い画像点の数の変化範囲が大きくない。例えば、中国語のテキストにおいて、一つの漢字を一つの透かし画像ブロックとする。中国語が角張った文字であり、各文字の面積差が少ないため、透かし画像ブロックにおける黒い画素点の数の差も少なく、透かしの埋め込みと抽出の正確さを確保することができる。



しかしながら、以下の問題によって、上記の方法は西洋語にあまり適応しない。即ち、
(a)西洋語は印刷される前後に接触現象がよく発生し、例えば、「mn」、「tt」などが挙げられ、印刷・スキャンされる前後に文字分割の一致性を確保できない。シングルの西洋語を透かし画像ブロックとすれば、文字の接触は必ず透かしが埋め込まれると抽出される前後の文字画像ブロックを分割する系列の再同期性に影響し、透かしを埋め込むと抽出する成功率に影響する。



(b)それぞれの西洋語単語の長さの差が大きく、単語に含まれる文字画像ブロックの黒い点数の変化範囲も大きい。例えば、「My extraordinary power」が挙げられ、それぞれの単語の長さの差が数倍になる。シングルの西洋語単語を透かし画像ブロックとすれば、透かし画像ブロックにおける黒い画素点の数が不安定であり、透かし操作を完成できない。



(c)西洋語テキストのフォントサイズが変化することによって文字サイズが変化する。例えば、「Here」と「Here」に含まれる黒い画素点の数の差がかなり大きい。異なるフォントサイズのテキストによって、異なる量子化方法を使用すべきである。



そのため、西洋テキストに対して、透かし画像ブロックを得るために、以下の条件を満足すべきであり、
1.文字接触による透かし画像ブロックが非同期の影響を避けることができる。



2.透かし画像ブロックにおける黒い画素点の数の差が大きくない。
3.異なるフォントサイズのテキストに対して、サイズの大きさを順番にして透かし画像ブロックを適応的に分割できる。

産業上の利用分野


本発明は、デジタル組版分野に関し、具体的に、西洋語の透かし処理をするための透かし画像の分割方法と装置に関する。

特許請求の範囲 【請求項1】
西洋語の透かし処理をするための透かし画像の分割方法であって、
西洋語画像を行列分割によって複数の文字画像ブロックを取得するステップと、
前記文字画像ブロックから有効な文字画像ブロックを識別するステップと、
前記西洋語画像がラージフォントテキストに対応するか、スモールフォントテキストに対応するかを判断するように、前記有効な文字画像ブロックのサイズを統計するステップと、
前記ラージフォントテキストと前記スモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うステップと、
グループ分けされた単語グループを、透かし画像ブロックに対応する複数の部分に均等に分割するステップと、
を備えることを特徴とする方法。

【請求項2】
前記文字画像ブロックから有効な文字画像ブロックを識別するステップにおいては、
前記文字画像ブロックを句読点画像ブロックと前記有効な文字画像ブロックとに分けることを特徴とする請求項1に記載の方法。

【請求項3】
前記文字画像ブロックを句読点画像ブロックと前記有効な文字画像ブロックとに分ける際には、
条件1:w>Nt1×H
条件2:Uの下端と上端がどちらもmの同じ側に位置する
条件3:Uの下端と上端がそれぞれmの両側に位置し、かつ、w<Nt2×H
を満足するかを判断し、
条件1~3のいずれか1条件を満足する場合に、Uに対応する前記文字画像ブロックが句読点画像ブロックと判断され、条件1~3のいずれも満足しない場合に、Uに対応する前記文字画像ブロックが有効な文字画像ブロックと判断されており、
ここで、Uが前記文字画像ブロックの集合Ωにおける前記文字画像ブロックの外接長方形の枠であり、HはUが位置する行の行高さであり、mはUが位置する中線であり、hとwはそれぞれUの高さと幅であり、Nt1とNt2はプリセット係数であることを特徴とする請求項2に記載の方法。

【請求項4】
t1=4、Nt2=0.35に設定することを特徴とする請求項3に記載の方法。

【請求項5】
前記有効な文字画像ブロックのサイズを統計するステップにおいては、
【数1】


を計算し、
≧Thsize(Thsizeはプリセット閾値である)の場合に、Uが位置する行はラージフォントサイズの文字行と判断され、H<Thsizeの場合に、Uが位置する行はスモールフォントサイズの文字行と判断され、
前記西洋語画像における前記ラージフォントサイズの文字行の行数Nlargeと前記スモールフォントサイズの文字行の行数Nsmallとを統計し、
large≧Nsmallの場合に、前記西洋語画像は前記ラージフォントサイズテキストに対応すると判断され、Nlarge<Nsmallの場合に、前記西洋語画像は前記スモールフォントサイズテキストに対応すると判断されることを特徴とする請求項3に記載の方法。

【請求項6】
Thsize=88に設定することを特徴とする請求項5に記載の方法。

【請求項7】
前記単語グループを透かし画像ブロックに対応する複数の部分に均等に分割するステップにおいては、
単語列が投影する有効長さに基づいて前記単語グループを一定の数の部分に均等に分け、
前記数の部分の幅と、位置する文字の最大高さとを組合せて新たな外接長方形の枠が形成され、前記外接長方形の枠は透かし画像ブロックに対応することを特徴とする請求項1に記載の方法。

【請求項8】
西洋語画像を行列分割前に、
前記西洋語画像を取得し、
前記西洋語に対してノイズ除去処理を行い、2値化の前記西洋語画像を取得することを特徴とする請求項1に記載の方法。

【請求項9】
西洋語の透かし処理をするための透かし画像の分割装置であって、
西洋語画像を行列分割によって複数の文字画像ブロックを取得する分割モジュールと、
前記文字画像ブロックから有効な文字画像ブロックを識別する識別モジュールと、
前記西洋語画像はラージフォントサイズテキストに対応するか、スモールフォントサイズテキストに対応するかを判断するように、前記有効な文字画像ブロックのサイズを統計する統計モジュールと、
前記ラージフォントテキストと前記スモールフォントテキストに対して、それぞれ、異なる単語数でグループ分けを行うグループ分けモジュールと、
グループ分けされた単語グループを透かし画像ブロックに対応する複数の部分に均等に分割する均等分割モジュールと、
を備えることを特徴とする装置。

【請求項10】
前記識別モジュールは、
条件1:w>Nt1×H
条件2:Uの下端と上端がどちらもmの同じ側に位置する
条件3:Uの下端と上端がそれぞれにmの両側に位置し、かつ、w<Nt2×H
を満足するかを判断する判断モジュールと、
条件1~3のいずれか1条件を満足する場合に、Uに対応する前記文字画像ブロックを句読点画像ブロックと判断し、条件1~3のいずれも満足しない場合に、Uに対応する前記文字画像ブロックを有効な文字画像ブロックと判断する確定モジュールとを備えており、
ここで、Uが前記文字画像ブロックの集合Ωにおける前記文字画像ブロックの外接長方形の枠であり、HはUが位置する行の行高さであり、mはUが位置する中線であり、hとwはそれぞれUの高さと幅であり、Nt1とNt2はプリセット係数であることを特徴とする請求項9に記載の装置。

【請求項11】
前記統計モジュールは、
【数2】


を計算する計算モジュールと、
≧Thsize(Thsizeはプリセット閾値である)の場合に、Uが位置する行をラージフォントサイズの文字行と判断し、H<Thsizeの場合に、Uが位置する行をスモールフォントサイズの文字行と判断する行確定モジュールと、
前記西洋語画像における前記ラージフォントサイズの文字行の行数Nlargeと前記スモールフォントサイズの文字行の行数Nsmallとを統計する行数統計モジュールと、
large≧Nsmallの場合に、前記西洋語画像を前記ラージフォントサイズテキストに対応すると判断し、Nlarge<Nsmallの場合に、前記西洋語画像を前記スモールフォントサイズテキストに対応すると判断するテキスト確定モジュールと、
を備えることを特徴とする請求項10に記載の装置。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2013545033thum.jpg
出願権利状態 登録
分野
  • 電気
  • 物理学
※ 特許の内容に興味を持たれた方は、下記問合せ先にご相談下さい。


PAGE TOP

close
close
close
close
close
close