TOP > 技術シーズ検索 > 辞書作成支援装置、辞書作成支援方法及び辞書作成支援プログラム

辞書作成支援装置、辞書作成支援方法及び辞書作成支援プログラム

シーズコード S130011545
掲載日 2013年6月7日
研究者
  • 立石 健二
  • 細見 格
  • 山名 早人
技術名称 辞書作成支援装置、辞書作成支援方法及び辞書作成支援プログラム
技術概要 同義語候補生成手段は、Webページの識別子である各資源位置指定子に対してリンクする文字列を表すアンカーテキストを用いて、同義語を生成する対象の語として入力される入力語の同義語候補を生成する。判定結果保持手段15は、同義語候補が入力語の同義語か非同義語かについて判定された結果を記憶する。リンク削除手段16は、一の資源位置指定子に対して、アンカーテキストが入力語もしくは同義語候補の中でその入力語の同義語と判定された同義語候補になっているリンクである第一のリンクと、アンカーテキストが同義語候補の中で入力語の非同義語と判定された同義語候補になっているリンクである第二のリンクのうち、少なくとも一方のリンクを削除する。このとき、リンク削除手段16は、アンカーテキストごとのリンクの数に基づいて、一の資源位置指定子とアンカーテキストとのリンクを削除する。そして、リンク情報抽出手段16、実体確率計算手段12、同義性計算手段13及び表示指示手段14は、各URLに対して残された(すなわち、削除対象から除かれた)リンクのアンカーテキストを用いて入力語の同義語候補を生成する。
画像

※ 画像をクリックすると拡大します。

thum_2010-036415.gif
研究分野
  • 自然語処理
展開可能なシーズ 生成される同義語候補の精度を向上させて辞書作成を支援できる辞書作成支援装置を提供する。
不要なリンク情報を削除して実体確率の推定精度を向上させることにより、同義語候補の精度を向上させることができる。
用途利用分野 辞書作成支援装置、同義語辞書
出願特許   特許 国際特許分類(IPC)
( 1 ) 日本電気株式会社, 学校法人早稲田大学, . 立石 健二, 細見 格, 山名 早人, . 辞書作成支援装置、辞書作成支援方法及び辞書作成支援プログラム. 特開2011-170790. 2011-09-01
  • G06F  17/27     

PAGE TOP