Top > Search of Japanese Patents > LANGUAGE PROCESSING SYSTEM AND PROGRAM

LANGUAGE PROCESSING SYSTEM AND PROGRAM commons

Patent code P140010742
File No. 03-173
Posted date Jul 7, 2014
Application number P2004-017845
Publication number P2004-158038A
Patent number P3740541
Date of filing Jan 27, 2004
Date of publication of application Jun 3, 2004
Date of registration Nov 18, 2005
Inventor
  • (In Japanese)村田 真樹
  • (In Japanese)井佐原 均
Applicant
  • (In Japanese)国立研究開発法人情報通信研究機構
Title LANGUAGE PROCESSING SYSTEM AND PROGRAM commons
Abstract PROBLEM TO BE SOLVED: To simply relate first language data of a preliminary manuscript and discourse data to second language data thereof.
SOLUTION: This language processing system is provided with: an input means 1 for inputting a plurality of language data of the first language data including signs used for marks for relating them to each other and the second language data not including the signs; and a difference detection means 4 for detecting common parts and difference parts. The detection means 4 extracts the language data from the common parts as they are, extracts the language data from the difference parts on the side related to the second language data from the difference parts, and extracts the signs from the difference parts on the side related to the first language data to arrange them in the order as it is, so that a plurality of the language data are related to one another by having the second language data with the signs inserted.
Outline of related art and contending technology (In Japanese)

従来、例えば、日本語文と英語文の対応付け、講演と予稿の対応付け、質問文と知識データの対応付け等は、判断処理としてのプログラムが複雑なものであった。

Field of industrial application (In Japanese)

本発明は、差分検出を行うdiff(ディフ)コマンドのような順序情報を保持したまま一致部分が最大になるように複数のデータの対応づけを行うシステムを用いた言語処理システム及びプログラムに関する。

Scope of claims (In Japanese)
【請求項1】
 
対応づけの目印になる記号を含む第一の言語データとその記号を含まない第二の言語データの複数の言語データを入力する入力手段と、
順序情報を保持したまま一致部分を最大になるように複数のデータの対応づけを行うシステムを用いて前記複数の言語データの共通部分と差分部分を検出する差分検出手段とを備え、
前記差分検出手段は、前記共通部分からはそのまま言語データを取り出し、前記差分部分からは前記第二の言語データが対応する側の差分部分から言語データを取り出し、かつ、前記第一の言語データが対応する側の差分部分からは前記記号を取り出してそれらをそのままの順番のまま並べることにより、前記記号が挿入された第二の言語データを持つことにより、前記複数の言語データを対応づけることを特徴とした言語処理システム。

【請求項2】
 
予稿データとその講演データを対応づけるためのシステムであって、
前記複数の言語データが、予稿データとその講演データであることを特徴とする請求項1記載の言語処理システム。

【請求項3】
 
前記順序情報を保持したまま一致部分を最大になるように複数のデータの対応づけを行うシステムとしてdiffコマンドを用いることを特徴とした請求項1又は2記載の言語処理システム。

【請求項4】
 
対応づけの目印になる記号を含む第一の言語データとその記号を含まない第二の言語データの複数の言語データを入力する処理と、
順序情報を保持したまま一致部分を最大になるように複数のデータの対応づけを行うシステムを用いて前記複数の言語データの共通部分と差分部分を検出する処理と、
前記共通部分からはそのまま言語データを取り出し、前記差分部分からは前記第二の言語データが対応する側の差分部分から言語データを取り出し、かつ、前記第一の言語データが対応する側の差分部分からは前記記号を取り出してそれらをそのままの順番のまま並べることにより、前記記号が挿入された第二の言語データを持つことにより、前記複数の言語データを対応づける処理とを、
コンピュータに実現させるためのプログラム。
IPC(International Patent Classification)
F-term
Drawing

※Click image to enlarge.

JP2004017845thum.jpg
State of application right Registered
Please contact us by E-mail if you have any interests on this patent


PAGE TOP

close
close
close
close
close
close
close