TOP > 技術シーズ検索 > 漢字複合語分割方法及び漢字複合語分割装置

漢字複合語分割方法及び漢字複合語分割装置

シーズコード S130011958
掲載日 2013年6月10日
研究者
  • 後藤 智範
  • 梅木 定博
技術名称 漢字複合語分割方法及び漢字複合語分割装置
技術概要 連続する漢字列で構成された漢字複合語を分割する場合の基となる基本単語と基本単語に該当する品詞を関連付けて記録した日本語辞書1と、漢字複合語を分割した後に構成される各漢字列の字数の配列を示した分割パターンと漢字複合語を分割した後に構成される各漢字列に該当する品詞の配列を表した品詞列パターンのうち当該分割パターンに存在するものを関連付ける。そして漢字複合語分割方法などにより、漢字複合語の字数毎に分類して記録した単語分割パターン辞書2とを参照して、分割対象の漢字複合語を分割する。
画像

※ 画像をクリックすると拡大します。

thum_2010-222057.gif
研究分野
  • 計算機利用技術
  • 自然語処理
展開可能なシーズ 日本語文書に含まれる連続する漢字列で構成された漢字複合語を超高精度で正しく分割することができ、分割した各漢字列の信頼性が実用化することができる程度まで高められた、漢字複合語分割方法及び漢字複合語分割装置を提供する。
日本語文書に含まれる漢字複合語を超高精度で正しく分割することができ、かつ分割した単語の信頼性が非常に高くなり、従来よりも、形態素解析、構文解析は勿論のこと、Web検索エンジン、音声認識、文字認識、仮名漢字変換などの精度が向上することができる。
用途利用分野 漢字複合語分割装置、形態素解析、構文解析、Web検索エンジン、音声認識、文字認識
出願特許   特許 国際特許分類(IPC)
( 1 ) 学校法人神奈川大学, . 後藤 智範, 梅木 定博, . 漢字複合語分割方法及び漢字複合語分割装置. 特開2011-096245. 2011-05-12
  • G06F  17/27     

PAGE TOP