TOP > 国内特許検索 > データ表示装置及びデータ表示方法

データ表示装置及びデータ表示方法 コモンズ

国内特許コード P140010536
整理番号 04-56
掲載日 2014年5月13日
出願番号 特願2005-179703
公開番号 特開2006-350950
登録番号 特許第4229457号
出願日 平成17年6月20日(2005.6.20)
公開日 平成18年12月28日(2006.12.28)
登録日 平成20年12月12日(2008.12.12)
発明者
  • 村田 真樹
  • 白土 保
  • 井佐原 均
出願人
  • 国立研究開発法人情報通信研究機構
発明の名称 データ表示装置及びデータ表示方法 コモンズ
発明の概要 【課題】 第1データから第2データへのデータ変換及び、その逆方向のデータ変換が可能なデータ変換時に、変換適性を自動的に評価する技術を提供すること。
【解決手段】 科学記号を含むテキストデータを表示するデータ表示装置1において、テキストデータの入力処理部14と、科学記号データベース18と、データベースを参照してテキストデータから科学記号候補文字列を抽出する科学記号抽出処理部15と、発現条件と照合して科学記号候補文字列の表示態様を決定する文字列表示決定処理部16と、決定された表示態様の科学記号候補文字列を含むテキストデータを表示する表示部17・13とを備える。
【選択図】 図1
従来技術、競合技術の概要


自然科学論文には多くの数式や記号が記述されており、それらが論文の内容を端的に表現していることが多い。従って研究者は論文集など多数の論文から所望のトピックの論文を抽出する際に、数式や記号などを概観して選び出す作業を行うことがある。
近年では学会において発行される論文誌は従来の紙媒体からCD-ROMやインターネットに変わりつつあり、論文をパーソナルコンピュータ上で閲覧する機会も多い。



このような時に、論文を構成するテキストから数式や記号を迅速に識別することができれば効率がよい。しかし、特に英語などのラテン文字を用いる論文では、同じくラテン文字で記載されることの多い数式や記号がテキスト中に埋没してしまい、詳細に閲読しなければならなかったり、肝心の数式や記号を見落とす恐れがあった。



従来からワードプロセッサにおいて文字種別に応じて表示色を変えることは行われている。例えばひらがな及び漢字は黒色、カタカナは緑色、半角英数字は茶色などのように区別して表示する製品が知られている。これは特に日本語と英語等では半角と全角の区別や長音とハイフンの区別が不明確になりやすいために、入力者に分かりやすく表示するものである。



この方法は日本語論文中に半角の英数字が含まれている場合には、数式や記号をある程度見やすくすることには寄与するが、上述したようにすべてラテン文字で記述された論文の場合には全て同色となってしまうため判別しやすくならない。



また、特許文献1には化学式の中から任意の化学物質について、その化学物質が有する様々な特徴を容易に表示する技術が開示されている。すなわち、元素記号によって色を変えると共に、固体や気体などの場合には斜体や太字にするなどの書式を変化させることが記載されている。



【特許文献1】
特開平10-240748号公報



本技術ではテーブルデータに単に元素記号の文字列を備えて一致した文字列の色を変化させるだけであるため、偶然に元素記号等と一致した文字列がテキスト中に存在すれば誤って色を変化させることになり、誤解を生じさせたり、かえって読みにくくなる結果を招きやすい。特に、ラテン文字を用いたテキスト中ではその誤りが頻出する問題がある。

産業上の利用分野



本発明はコンピュータにおけるテキストデータの表示装置及び方法に関し、特に科学記号を視認しやすく表示する技術に係るものである。

特許請求の範囲 【請求項1】
少なくとも自然科学で用いられる記号又は式(以下、科学記号と呼ぶ)を含むテキストデータを表示するデータ表示装置であって、
テキストデータを入力する入力処理部と、
科学記号として用いる1文字以上の文字列と当該文字列が発現する発現条件とを予め格納した科学記号データベースと、
該科学記号データベースを参照して該テキストデータから科学記号候補文字列を抽出する科学記号抽出処理部と、
該発現条件と照合して該科学記号候補文字列の表示態様を決定する文字列表示決定処理部と、
決定された表示態様の科学記号候補文字列を含むテキストデータを表示する表示部と
を備える構成において、
前記発現条件が、少なくとも「当該文字列が文頭であるか」、「当該文字列が、ハイフン又は接続詞によって接続され並列しているか」、「イオン表記であるか」を組み合わせた条件を含む
ことを特徴とするデータ表示装置。

【請求項2】
前記文字列表示決定処理部において、
前記科学記号候補文字列が科学記号である確度を算出する科学記号確度算出部を備えると共に、
科学記号と判定されやすい特定の文字列について確度を下げるデータベースを備えて特定の文字列の確度が低く算出されるようにした
請求項1に記載のデータ表示装置。

【請求項3】
前記データ表示装置において、前記化学記号確度算出部の算出結果に基づいて確度が閾値よりも高い科学記号候補文字列については基本文字色と色相の異なる表示色を設定すると共に、確度が閾値よりも低い科学記号候補文字列については基本文字色と彩度又は明度が異なる表示色を設定する
請求項2に記載のデータ表示装置。

【請求項4】
前記科学記号抽出処理部が、
科学記号と共起しやすい手がかり表現文字列を自動的に抽出する構成であって、
着目している科学記号候補文字列と共に、テキストデータの同一文又は所定個数の形態素内に手がかり表現文字列候補が出現する回数N1を計数する一方、該手がかり表現文字列候補がその他の文において単独に出現する回数N2を計数し、N1/N2(N2≠0)又はN1/(N1+N2)(N2が0のときも含む)の少なくともいずれかの値が二項検定又はカイ二乗検定により有意に大きいと判定される場合に、該手がかり表現文字列データベースに格納する処理を含み、
前記科学記号確度算出部において、
該手がかり表現文字列が前後所定個数の形態素内、又は同一文、又は同一テキストデータ中に出現した場合に、当該科学記号候補文字列の確度を所定値だけ高める処理を含む
請求項2又は3のいずれかに記載のデータ表示装置。

【請求項5】
少なくとも自然科学で用いられる記号又は式(以下、科学記号と呼ぶ)を含むテキストデータを表示するデータ表示装置におけるデータ表示方法であって、
入力処理部がテキストデータを入力する入力ステップ、
科学記号として用いる1文字以上の文字列と当該文字列が発現する発現条件とを予め格納した科学記号データベースを参照し、科学記号抽出処理部が該テキストデータから科学記号候補文字列を抽出する科学記号抽出ステップ、
該発現条件と照合して文字列表示決定処理部が該科学記号候補文字列の表示態様を決定する文字列表示決定ステップ、
表示部が決定された表示態様の科学記号候補文字列を含むテキストデータを表示する表示ステップ
を含み、
前記発現条件が、少なくとも「当該文字列が文頭であるか」、「当該文字列が、ハイフン又は接続詞によって接続され並列しているか」、「イオン表記であるか」を組み合わせた条件を用いる
ことを特徴とするデータ表示方法。

【請求項6】
前記文字列表示決定ステップにおいて、
科学記号確度算出部が、科学記号候補文字列が科学記号である確度を算出する科学記号確度算出ステップを行う構成であって、
該科学記号確度算出ステップにおいて、科学記号と判定されやすい特定の文字列について確度を下げるデータベースを備えて特定の文字列の確度が低く算出されるようにした
請求項5に記載のデータ表示方法。

【請求項7】
前記文字列表示決定ステップにおいて、
前記科学記号確度算出ステップの算出結果に基づいて確度が閾値よりも高い科学記号候補文字列については基本文字色と色相の異なる表示色を設定すると共に、確度が閾値よりも低い科学記号候補文字列については基本文字色と彩度又は明度が異なる表示色を設定する
請求項6に記載のデータ表示方法。

【請求項8】
前記科学記号抽出ステップにおいて、
科学記号と共起しやすい手がかり表現文字列を自動的に抽出する構成であって、
着目している科学記号候補文字列と共に、テキストデータの同一文又は所定個数の形態素内に手がかり表現文字列候補が出現する回数N1を計数する一方、該手がかり表現文字列候補がその他の文において単独に出現する回数N2を計数し、N1/N2(N2≠0)又はN1/(N1+N2)(N2が0のときも含む)の少なくともいずれかの値が二項検定又はカイ二乗検定により有意に大きいと判定される場合に、該手がかり表現文字列データベースに格納する処理を含み、
前記科学記号確度算出ステップにおいて、
該手がかり表現文字列が前後所定個数の形態素内、又は同一文、又は同一テキストデータ中に出現した場合に、当該科学記号候補文字列の確度を所定値だけ高める処理を含む
請求項6又は7のいずれかに記載のデータ表示方法。
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2005179703thum.jpg
出願権利状態 登録
※ 詳細内容の開示にあたっては、別途、JSTと秘密保持契約を締結していただくことが必要となります。


PAGE TOP

close
close
close
close
close
close
close