Top > Search of Japanese Patents > DOCUMENT DIFFERENCE DETECTION DEVICE AND PROGRAM

DOCUMENT DIFFERENCE DETECTION DEVICE AND PROGRAM commons

Patent code P140010719
File No. 02-113
Posted date Jul 7, 2014
Application number P2002-290946
Publication number P2004-126986A
Patent number P3682535
Date of filing Oct 3, 2002
Date of publication of application Apr 22, 2004
Date of registration Jun 3, 2005
Inventor
  • (In Japanese)村田 真樹
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title DOCUMENT DIFFERENCE DETECTION DEVICE AND PROGRAM commons
Abstract PROBLEM TO BE SOLVED: To provide an easy to understand display even if the characteristic of a document or a difference of new information is complicated.
SOLUTION: A document difference detection device includes an extraction/detection area setting means 21 for setting an extraction unit as a unit to be output as a difference of document data and for setting a detection area as the unit of an area to be compared for the detection of the difference of the document data; a storage means 3a for storing information; and an extraction means 2. The extraction means 2 extracts areas other than the current detection area of the input document data and corresponding to all the extraction units and stores the extracted areas in the storage means 3a. In the current detection area, the operation of outputting the document of the current detection area by highlighting areas not stored in the storage means 3a and corresponding to the extraction units is repeated for each detection area.
Outline of related art and contending technology (In Japanese)

従来、diffコマンドを用いて、入力された複数の文書データの差分を検出し、複数の文書データの差分の内で、共通部分は一つを出力し、不一致部分はそれぞれを並べて出力する技術があった。

ここで、diff(ディフ)とは、UNIX(ユニックス)(登録商標)のファイル比較ツールdiffのことである。このdiffコマンドは、与えられた二つのファイルの差分を順序情報を保持したまま行を単位として出力するものである。

diffコマンドには、-Dオプションという便利なオプションがある。このオプションを付けてdiffコマンドを使うと差分部分だけでなく共通部分も出力される。つまり、ファイルのマージが実現される。また、差分部分を見やすく表示するため、差分部分の始まり、差分部分の終わり、差分を構成する二つのデータの境界を表す表示を行う。このような、ファイルのマージを行う場合のdiffを、Mdiff (エムディフ)と呼ぶ(M はmerge の Mである)(例えば、非特許文献1及び特願2001-311329参照)。

この技術を用いて、一つの特許の複数の請求項の間の差分を検出する実験を行なった。これは新しい試みである。ある特許の二つの請求項を一行に1個の単語がはいるように変形してから、それらの Mdiffをとった(なお、以下の説明では請求項等のすみ付き括弧は「〔」又は「〕」に置き換えてある)。

例1、

〔請求項17〕 前記プリンタシステムは上位装置を有することを特徴とする請求項16記載のプリンタシステムの制御方法。

〔請求項18〕 前記プリンタシステムはプリンタを有することを特徴とする請求項16記載のプリンタシステムの制御方法。

(上記例1の Mdiff結果)

前記プリンタシステムは

;=====begin=====

上位装置

;────────

プリンタ

;=====end=====

を有することを特徴とする請求項16記載のプリンタシステムの制御方法

上記例1の請求項17と請求項18の Mdiffをとった結果から、たいへん容易に請求項17と請求項18の違いを理解することができる。即ち、;=====begin=====は差分部分の始まり、;=====end=====は差分部分の終わり、;────────は差分を構成する二つのデータの境界を表す。ここで、違いは「上位装置」と「プリンタ」である。しかし、違いがもっとややこしい場合は、Mdiff の結果は見にくいことになる。

例2、

〔請求項1〕

刃部材の先端の刃部を凹凸に形成し波状刃とするとともに螺旋状に湾曲させ、前記刃部材に取っ手を取り付けたことを特徴とする草取り鎌。

〔請求項2〕

取っ手の上部及び下部に滑り止め部を設けたことを特徴とする草取り鎌。

(上記例2の Mdiff結果)

;=====begin=====

刃部材

;────────

取っ手

;=====end=====



;=====begin=====

先端の刃

;────────

上部及び下部に滑り止め

;=====end=====

部を

;=====begin=====

凹凸に形成し波状刃とするとともに螺旋状に湾曲させ、前記刃部材に取っ 手を取り付け

;────────

設け

;=====end=====

たことを特徴とする草取り鎌。

上記例2の請求項1と請求項2の Mdiffをとった結果は、違いがややこしいので、Mdiff の結果は見にくいことになっている。即ち、Mdiff は、順序情報を保存する機構であるため、違いが複雑な場合に、違いがわかりにくく、このままでは問題があることがわかった。

【非特許文献1】

村田真樹,外1名, diffと言語処理「言語理解とコミュニケーショ

ン」社団法人電子情報通信学会2001年 7月17日(NLC2001-26 ) 電子

情報通信学会技術研究報告, p.29~36

Field of industrial application (In Japanese)

本発明は、文書(又は文章)の差分を検出して、文書の違いを容易に理解できるようにする文書差分検出装置及びプログラムに関する。

Scope of claims (In Japanese)
【請求項1】
 
情報の入力を行う入力手段と、
文書データの差分として出力する対象の単位である抽出単位と文書データの差分を検出するために比較する領域の単位である検出領域とが前記入力手段により設定される抽出・検出領域設定手段と、
情報を格納する格納手段と、
抽出手段とを備え、
前記抽出手段は、入力された文書データの現在の前記検出領域以外の領域から全ての前記抽出単位に相当するものを抽出して前記格納手段に格納し、現在の前記検出領域において、前記格納手段に格納されていない前記抽出単位に相当するものを強調表示して現在の検出領域の文書を出力することを、前記検出領域ごとに繰り返すことを特徴とした文書差分検出装置。

【請求項2】
 
情報の入力を行う入力手段と、
文書データの差分として出力する対象の単位である抽出単位と文書データの差分を検出するために比較する領域の単位である検出領域とが前記入力手段により設定される抽出・検出領域設定手段と、
情報を格納する格納手段と、
抽出手段とを備え、
前記抽出手段は、入力された文書データの現在の前記検出領域において、前記格納手段に格納されていない前記抽出単位に相当するものを強調表示して現在の検出領域の文書を出力し、前記強調表示したものを前記格納手段に格納することを、前記検出領域ごとに繰り返すことを特徴とした文書差分検出装置。

【請求項3】
 
前記格納手段に予め前記強調表示しない前記抽出単位のデータを格納することを特徴とした請求項1又は2記載の文書差分検出装置。

【請求項4】
 
前記抽出単位として、単語の単位とすることを特徴とした請求項1~3のいずれかに記載の文書差分検出装置。

【請求項5】
 
前記検出領域の単位として、箇条書きの単位とすることを特徴とした請求項1~4のいずれかに記載の文書差分検出装置。

【請求項6】
 
前記検出領域の単位として、特許請求の範囲の単位とすることを特徴とした請求項1~4のいずれかに記載の文書差分検出装置。

【請求項7】
 
文書データの差分として出力する対象の単位である抽出単位と文書データの差分を検出するために比較する領域の単位である検出領域とが入力手段により設定される抽出・検出領域設定手段と、
入力された文書データの現在の前記検出領域以外の領域から全ての前記抽出単位に相当するものを抽出して格納手段に格納し、現在の前記検出領域において、前記格納手段に格納されていない前記抽出単位に相当するものを強調表示して現在の検出領域の文書を出力することを、前記検出領域ごとに繰り返す抽出手段として、
コンピュータを機能させるためのプログラム。

【請求項8】
 
文書データの差分として出力する対象の単位である抽出単位と文書データの差分を検出するために比較する領域の単位である検出領域とが入力手段により設定される抽出・検出領域設定手段と、
入力された文書データの現在の前記検出領域において、格納手段に格納されていない前記抽出単位に相当するものを強調表示して現在の検出領域の文書を出力し、前記強調表示したものを前記格納手段に格納することを、前記検出領域ごとに繰り返す抽出手段として、
コンピュータを機能させるためのプログラム。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2002290946thum.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close