TOP > 国内特許検索 > 言語処理システム及びプログラム

言語処理システム及びプログラム コモンズ

国内特許コード P140010742
整理番号 03-173
掲載日 2014年7月7日
出願番号 特願2004-017845
公開番号 特開2004-158038
登録番号 特許第3740541号
出願日 平成16年1月27日(2004.1.27)
公開日 平成16年6月3日(2004.6.3)
登録日 平成17年11月18日(2005.11.18)
発明者
  • 村田 真樹
  • 井佐原 均
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 言語処理システム及びプログラム コモンズ
発明の概要 【課題】予稿と講演データ等の第一の言語データと第二の言語データとの対応付けを簡単に行うこと。
【解決手段】対応づけの目印になる記号を含む第一の言語データとその記号を含まない第二の言語データの複数の言語データを入力する入力手段1と、前記複数の言語データの共通部分と差分部分を検出する差分検出手段4とを備え、前記差分検出手段4は、前記共通部分からはそのまま言語データを取り出し、前記差分部分からは前記第二の言語データが対応する側の差分部分から言語データを取り出し、かつ、前記第一の言語データが対応する側の差分部分からは前記記号を取り出してそれらをそのままの順番のまま並べることにより、前記記号が挿入された第二の言語データを持つことにより、前記複数の言語データを対応づける。
【選択図】 図1
従来技術、競合技術の概要



従来、例えば、日本語文と英語文の対応付け、講演と予稿の対応付け、質問文と知識データの対応付け等は、判断処理としてのプログラムが複雑なものであった。

産業上の利用分野



本発明は、差分検出を行うdiff(ディフ)コマンドのような順序情報を保持したまま一致部分が最大になるように複数のデータの対応づけを行うシステムを用いた言語処理システム及びプログラムに関する。

特許請求の範囲 【請求項1】
対応づけの目印になる記号を含む第一の言語データとその記号を含まない第二の言語データの複数の言語データを入力する入力手段と、
順序情報を保持したまま一致部分を最大になるように複数のデータの対応づけを行うシステムを用いて前記複数の言語データの共通部分と差分部分を検出する差分検出手段とを備え、
前記差分検出手段は、前記共通部分からはそのまま言語データを取り出し、前記差分部分からは前記第二の言語データが対応する側の差分部分から言語データを取り出し、かつ、前記第一の言語データが対応する側の差分部分からは前記記号を取り出してそれらをそのままの順番のまま並べることにより、前記記号が挿入された第二の言語データを持つことにより、前記複数の言語データを対応づけることを特徴とした言語処理システム。

【請求項2】
予稿データとその講演データを対応づけるためのシステムであって、
前記複数の言語データが、予稿データとその講演データであることを特徴とする請求項1記載の言語処理システム。

【請求項3】
前記順序情報を保持したまま一致部分を最大になるように複数のデータの対応づけを行うシステムとしてdiffコマンドを用いることを特徴とした請求項1又は2記載の言語処理システム。

【請求項4】
対応づけの目印になる記号を含む第一の言語データとその記号を含まない第二の言語データの複数の言語データを入力する処理と、
順序情報を保持したまま一致部分を最大になるように複数のデータの対応づけを行うシステムを用いて前記複数の言語データの共通部分と差分部分を検出する処理と、
前記共通部分からはそのまま言語データを取り出し、前記差分部分からは前記第二の言語データが対応する側の差分部分から言語データを取り出し、かつ、前記第一の言語データが対応する側の差分部分からは前記記号を取り出してそれらをそのままの順番のまま並べることにより、前記記号が挿入された第二の言語データを持つことにより、前記複数の言語データを対応づける処理とを、
コンピュータに実現させるためのプログラム。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2004017845thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close