TOP > 国内特許検索 > 会話表現生成装置、及び会話表現生成プログラム > 明細書

明細書 :会話表現生成装置、及び会話表現生成プログラム

発行国 日本国特許庁(JP)
公報種別 特許公報(B2)
特許番号 特許第3787623号 (P3787623)
公開番号 特開2004-102764 (P2004-102764A)
登録日 平成18年4月7日(2006.4.7)
発行日 平成18年6月21日(2006.6.21)
公開日 平成16年4月2日(2004.4.2)
発明の名称または考案の名称 会話表現生成装置、及び会話表現生成プログラム
国際特許分類 G06F  17/21        (2006.01)
G06F  17/28        (2006.01)
FI G06F 17/21 550A
G06F 17/28 Z
請求項の数または発明の数 32
全頁数 20
出願番号 特願2002-265209 (P2002-265209)
出願日 平成14年9月11日(2002.9.11)
新規性喪失の例外の表示 特許法第30条第1項適用 平成14年3月18日 言語処理学会発行の「言語処理学会第8回年次大会発表論文集」に発表
特許法第30条第1項適用 平成14年3月12日 社団法人情報処理学会発行の「第64回(平成14年)全国大会講演論文集(4)」に発表
特許法第30条第1項適用 平成14年4月25日 社団法人人工知能学会発行の「人工知能学会論文誌 Vol.17,No.3 J-stage (online ISSN:1346-8030)」に発表
審査請求日 平成14年9月11日(2002.9.11)
特許権者または実用新案権者 【識別番号】301022471
【氏名又は名称】独立行政法人情報通信研究機構
発明者または考案者 【氏名】久保田 秀和
【氏名】西田 豊明
【氏名】山下 耕二
【氏名】福原 知宏
個別代理人の代理人 【識別番号】100130498、【弁理士】、【氏名又は名称】佐野 禎哉
審査官 【審査官】和田 財太
参考文献・文献 久保田秀和・西田豊明,ユーザの過去発言を利用した複数エージェントによる創造的な対話,電子情報通信学会論文誌,日本,社団法人電子情報通信学会,2001年 8月 1日,Vol.J84-D-I,No.8,p.1222-p.1230
畦地真太郎・福原知宏・藤原伸彦・松村憲一・寺田和憲・久保田秀和・西田豊明,パブリック・オピニオン・チャンネル-情報工学/社会科学融合の見地から-,人工知能学会研究会資料AIチャレンジ研究会(第11回),日本,社団法人人工知能学会,2001年 3月12日,SIG-Challenge-0111-3,p.13-p.19
久保田秀和・西田豊明,分身エージェントを利用した仮想通信対話によるコミュニティ知識創出支援,第40回人工知能基礎論研究会資料,日本,社団法人人工知能学会,2000年 3月21日,SIG-FAI-9904-3,p.85-p.90
調査した分野 G06F 17/21-17/30
特許請求の範囲 【請求項1】
モノローグ的文章からなるモノローグテキストに基づいて、会話表現を生成するものであって、モノローグテキストを格納したモノローグテキスト格納部から取得するモノローグテキスト取得手段と、取得したモノローグテキストを単文形式に分割し一以上の単文テキストを生成する前処理手段と、生成された単文テキストの文末表現を解析し当該文末表現を予め設定された複数の文末表現パターンの何れか一つに対応付ける文末処理手段と、各文末表現パターンに対応付けてそれらに応答する表現として設定された複数のコメントテキストを格納するコメント格納部から前記何れかの一の文末表現パターンに対応付けられた単文テキストに対応する一のコメントテキストを選択するコメント選択手段と、前記単文テキストの後に選択されたコメントテキストを挿入し単文テキストとコメントテキストからなる会話テキストを生成する会話表現生成手段と、生成した会話テキストを出力する会話テキスト出力手段とを具備してなることを特徴とする会話表現生成装置。
【請求項2】
ユーザにより入力されたキーワードを取得するキーワード取得手段を更に具備し、前記モノローグテキスト取得手段が、前記モノローグテキスト格納部から前記キーワードに対応する一以上の前記モノローグテキストを取得するものであって、前記前処理手段が、取得されたモノローグテキストのそれぞれについて単文テキストを生成するものである請求項1記載の会話表現生成装置。
【請求項3】
前記モノローグテキスト格納部が、ユーザの入力により電子掲示板に投稿された意見文テキストを前記モノローグテキストとして格納するものであり、前記モノローグテキスト取得手段が、この意見文であるモノローグテキストを取得するものである請求項1又は2記載の会話表現生成装置。
【請求項4】
二以上の予め設定された話者エージェントのそれぞれに対して、出力された前記会話テキストのうち単文テキストの読み手として一の話者エージェントを対応付けるとともに、前記コメントテキストの読み手として他の話者エージェントを対応付ける処理を行う話者決定手段を更に具備している請求項1、2又は3記載の会話表現生成装置。
【請求項5】
前記話者決定手段で決定した各話者エージェントごとに異なる音声で対応する単文テキスト又はコメントテキストを音声出力する音声出力手段を更に具備している請求項4記載の会話表現生成装置。
【請求項6】
前記音声出力手段で出力される単文テキスト又はコメントテキストの音声に対応して、各話者エージェントに当該話者エージェントの画像のうち少なくとも口を動かせるアニメーション動作を付加し出力するアニメーション処理手段を更に具備している請求項5記載の会話表現生成装置。
【請求項7】
前記各話者エージェントと共に、対応する単文テキスト又はコメントテキストを画面表示可能な文字データとして出力する文字データ出力手段を更に具備している請求項4、5又は6記載の会話表現生成装置。
【請求項8】
前記話者エージェントの一つとして、会話表現の進行役となるメインキャスタエージェントを設定してあり、前記話者決定手段が、メインキャスタエージェントをコメントテキストの読み手として決定するものである請求項4、5、6又は7記載の会話表現生成装置。
【請求項9】
前記モノローグテキストが、その内容の本質的部分である本文部と概要を示す表題部とから構成されるものであり、前記話者決定手段が、メインキャスタエージェントを表題部の読み手として決定するものである請求項8記載の会話表現生成装置。
【請求項10】
前記コメント格納部に、会話表現の開始を示すコメントテキストが格納されており、前記コメント選択手段が、当該単文テキストの前に他の単文テキストがない場合に前記開始を示すコメントテキストを選択し、前記話者選択手段において、当該コメントテキストに表題部を合成したものをメインキャスタエージェントに対応付けるものである請求項9記載の会話表現生成装置。
【請求項11】
前記モノローグテキストが、その内容の本質的部分である本文部と概要を示す表題部とから構成されるものであり、前記メインキャスタエージェントとは異なる話者エージェントとして一以上のアナウンサーエージェントが設定されてあり、前記話者決定手段が、アナウンサーエージェントを本文部の読み手として決定するものである請求項8、9又は10記載の会話表現生成装置。
【請求項12】
前記モノローグテキストが画像データを伴っている場合、前記モノローグテキスト格納部から当該画像データを取得し出力する画像データ処理手段を更に具備している請求項1、2、3、4、5、6、7、8、9、10又は11記載の会話表現生成装置。
【請求項13】
前記コメント選択手段が、一のモノローグテキストにおける最終の単文テキストを認識し、最終の単文テキストにおける文末表現パターンに対応付けて次のモノローグテキストへ接続する表現として設定されコメント格納部に格納されたコメントテキストから当該最終の単文テキストの文末表現に対応するコメントテキストを選択するものである請求項1、2、3、4、5、6、7、8、9、10、11又は12記載の会話表現生成装置。
【請求項14】
前記文末表現パターンに、現象を述べ立てることを示す現象叙述形式と伝聞であることを示す伝聞形式とが少なくとも含まれるとともに、前記コメントテキストに、現象叙述形式に対応する質問文形式に該当するコメントテキストと伝聞形式に対応する予想文形式に該当するコメントテキストとが少なくとも含まれ、前記文末処理手段が、前記単文テキストの文末表現を現象叙述形式又は伝聞形式の何れかに対応付けるとともに、それに対応して前記コメント選択手段において、質問文形式又は予想文形式の何れか一方のコメントテキストを選択するものである請求項1、2、3、4、5、6、7、8、9、10、11、12又は13記載の会話表現生成装置。
【請求項15】
質問文形式及び予想文形式の前記コメントテキストを、それぞれ複数ずつ設定してあり、前記コメント選択手段が、それら複数のコメントテキストから何れか一のコメントテキストを選択するものである請求項14記載の会話表現生成装置。
【請求項16】
複数のユーザが入力することにより利用可能な電子掲示板に入力されたモノローグテキストを格納する前記モノローグテキスト格納部と、前記コメント格納部とを有し、且つ、入力されたモノローグテキストに基づいて生成される会話表現テキストを放送可能なインタラクティブ放送システムにおいて適用され、入力されたモノローグテキストに基づいて会話テキストを生成し、当該会話テキストを放送可能に出力するために用いられるものである請求項1、2、3、4、5、6、7、8、9、10、11、12、13、14又は15記載の会話表現生成装置。
【請求項17】
コンピュータを動作させることによって、当該コンピュータを、モノローグ的文章からなるモノローグテキストに基づいて会話表現を生成する会話表現生成装置として機能させるためのプログラムであって、前記コンピュータを、モノローグテキストを格納したモノローグテキスト格納部から取得するモノローグテキスト取得手段と、取得したモノローグテキストを単文形式に分割し一以上の単文テキストを生成する前処理手段と、生成された単文テキストの文末表現を解析し当該文末表現を予め設定された複数の文末表現パターンの何れか一つに対応付ける文末処理手段と、各文末表現パターンに対応付けてそれらに応答する表現として設定された複数のコメントテキストを格納するコメント格納部から前記何れかの一の文末表現パターンに対応付けられた単文テキストに対応する一のコメントテキストを選択するコメント選択手段と、前記単文テキストの後に選択されたコメントテキストを挿入し単文テキストとコメントテキストからなる会話テキストを生成する会話表現生成手段と、生成した会話テキストを出力する会話テキスト出力手段として機能させることを特徴とする会話表現生成プログラム。
【請求項18】
前記コンピュータを、ユーザにより入力されたキーワードを取得するキーワード取得手段として更に機能させ、前記モノローグテキスト取得手段において、前記モノローグテキスト格納部から前記キーワードに対応する一以上のモノローグテキストを取得し、前記前処理手段において、取得されたモノローグテキストのそれぞれについて単文テキストを生成するようにしている請求項17記載の会話表現生成プログラム。
【請求項19】
前記モノローグテキスト格納部が、ユーザの入力により電子掲示板に投稿された意見文テキストを前記モノローグテキストとして格納するものであり、前記モノローグテキスト取得手段において、この意見文であるモノローグテキストを取得するようにしている請求項17又は18記載の会話表現生成プログラム。
【請求項20】
前記コンピュータを、二以上の予め設定された話者エージェントのそれぞれに対して、出力された前記会話テキストのうち単文テキストの読み手として一の話者エージェントを対応付けるとともに、前記コメントテキストの読み手として他の話者エージェントを対応付ける処理を行う話者決定手段として更に機能させる請求項17、18又は19記載の会話表現生成プログラム。
【請求項21】
前記コンピュータを、前記話者決定手段で決定した各話者エージェントごとに異なる音声で対応する単文テキスト又はコメントテキストを音声出力する音声出力手段として更に機能させる請求項20記載の会話表現生成プログラム。
【請求項22】
前記コンピュータを、前記音声出力手段で出力される単文テキスト又はコメントテキストの音声に対応して、前記各話者エージェントに当該話者エージェントの画像のうち少なくとも口を動かせるアニメーション動作を付加し出力するアニメーション処理手段として更に機能させる請求項21記載の会話表現生成プログラム。
【請求項23】
前記コンピュータを、前記各話者エージェントと共に、対応する前記単文テキスト又は前記コメントテキストを画面表示可能な文字データとして出力する文字データ出力手段として更に機能させる請求項19、21又は22記載の会話表現生成プログラム。
【請求項24】
前記話者エージェントの一つとして、会話表現の進行役となるメインキャスタエージェントが設定されており、前記話者決定手段において、メインキャスタエージェントを前記コメントテキストの読み手として決定するようにしている請求項20、21、22又は23記載の会話表現生成プログラム。
【請求項25】
前記モノローグテキストが、その内容の本質的部分である本文部と概要を示す表題部とから構成されるものであり、前記話者決定手段において、前記メインキャスタエージェントを表題部の読み手として決定するようにしている請求項24記載の会話表現生成プログラム。
【請求項26】
前記コメント格納部に、会話表現の開始を示すコメントテキストが格納されており、前記コメント選択手段において当該単文テキストの前に他の単文テキストがない場合に前記開始を示すコメントテキストを選択し、前記話者選択手段において、当該コメントテキストに表題部を合成したものをメインキャスタエージェントに対応付けるようにしている請求項25記載の会話表現生成プログラム。
【請求項27】
前記モノローグテキストが、その内容の本質的部分である本文部と概要を示す表題部とから構成されるものであり、前記メインキャスタエージェントとは異なる話者エージェントとして一以上のアナウンサーエージェントが設定されてあり、前記話者決定手段において、前記アナウンサーエージェントを本文部の読み手として決定するようにしている請求項24、25又は26記載の会話表現生成プログラム。
【請求項28】
前記モノローグテキストが画像データを伴っている場合、前記コンピュータを、前記モノローグテキスト格納部から当該画像データを取得し出力する画像データ処理手段として更に機能させる請求項17、18、19、20、21、22、23、24、25、26又は27記載の会話表現生成プログラム。
【請求項29】
前記コメント選択手段において、一のモノローグテキストにおける最終の単文テキストを認識し、最終の単文テキストにおける文末表現パターンに対応付けて次のモノローグテキストへ接続する表現として設定され前記コメント格納部に格納されたコメントテキストから当該最終の単文テキストの文末表現に対応するコメントテキストを選択するようにしている請求項17、18、19、20、21、22、23、24、25、26、27又は28記載の会話表現生成プログラム。
【請求項30】
前記文末表現パターンに、現象を述べ立てることを示す現象叙述形式と伝聞であることを示す伝聞形式とが少なくとも含まれるとともに、前記コメントテキストに、現象叙述形式に対応する質問文形式に該当するコメントテキストと伝聞形式に対応する予想文形式に該当するコメントテキストとが少なくとも含まれ、前記文末処理手段において単文テキストの文末表現を現象叙述形式又は伝聞形式の何れかに対応付けるとともに、それに対応して前記コメント選択手段において、質問文形式又は予想文形式の何れか一方のコメントテキストを選択するようにしている請求項17、18、19、20、21、22、23、24、25、26、27、28又は29記載の会話表現生成プログラム。
【請求項31】
質問文形式及び予想文形式の前記コメントテキストを、それぞれ複数ずつ設定してあり、コ前記メント選択手段において、それら複数のコメントテキストから何れか一のコメントテキストを選択するようにしている請求項30記載の会話表現生成プログラム。
【請求項32】
複数のユーザが入力することにより利用可能な電子掲示板に入力されたモノローグテキストを格納する前記モノローグテキスト格納部と、前記コメント格納部とを有し、且つ、入力された前記モノローグテキストに基づいて生成される会話表現テキストを放送可能なインタラクティブ放送システムにおいて適用され、入力されたモノローグテキストに基づいて会話テキストを生成し、当該会話テキストを放送可能に出力するために用いられるものである請求項17、18、19、20、21、22、23、24、25、26、27、28、29、30又は31記載の会話表現生成プログラム。
発明の詳細な説明
【0001】
【発明の属する技術分野】
本発明は、モノローグ的な表現を元にして会話形式の表現を好適に生成し得る会話表現生成装置及びそのためのプログラムに関するものである。
【0002】
【従来の技術】
現在のところ、インターネット等の通信手段を介した情報提供の手段は、一部に画像を伴ったものはあるが、Webページ中の文章、電子メールやチャットや電子掲示板等の文字コミュニケーションが中心的である。特に、Webページ中の文章の多くは、単独の書き手が一方的に叙述するモノローグ的な文章であるといえる。また、電子メール等の文字コミュニケーションでは、一人の書き手(話者)の記述(発言)中に、他者が質問を差し挟むような対話(会話)の調整が、現実に対面して話し合う対面対話の場合よりも困難であるため、個々の発言は一般的に長く、発言毎に断片化されたモノローグ的な性質を有しているものと考えられる。このように、インターネット上には、モノローグ的な文章として蓄えられた情報が大量に存在しているのが現状である。しかしながら、モノローグ的な文章は、万人向けの情報提示手段ではなく、専門的なモノローグ的文章よりも、重要な部分を質問応答形式で表した会話形式の文章の方が一般的に親しみやすく、理解の度合いも高い傾向にある。ここで、会話形式の文章とは、インタビュー記事やテレビ番組の台本に代表されるように、複数の話し手が会話を積み重ねる形式の文章である、会話形式の文章は、モノローグ的な文章と比較して、客観的で厳密に構造化された叙述を行うことは困難であるが、重要な部分に焦点を当てた簡潔な情報提示を行うことができるという利点を有しており、また、日常的なコミュニケーションに利用する最も一般的な情報交換手段であるため、モノローグ的な文章よりも親しみやすく、対話相手や聞き手の理解も進みやすいという特徴がある。このことを、テレビ放送のニュース番組を例にして説明すると、日常的な話題についてはアナウンサーが一人でニュース原稿を読み上げるよりも、二人以上のパーソナリティが会話形式で紹介する方が親しみやすく感じられる。
【0003】
会話形式の表現を利用する方法としては、例えば、ユーザのWebブラウジングに対応して同一のキャラクタエージェント達に、当該ページに関連する会話や寸劇を行わせることによって、ユーザによるWebページの理解に一貫性を持たせようとするAgneta&Fridaという試みがなされている(非特許文献1)。また、サッカー中継の試合情報を元に、チームに対する各々の態度や性格に従って会話を生成するエージェント(Gerd&Matze)も考えられている(非特許文献2)。さらに、展示会参加者の個人情報に対し簡単な規則を適用して生成されたエージェント同士の会話を行わせるエージェントサロンも考えられている(非特許文献3)。
【0004】
【非特許文献1】
クリスティナ・フック(H"o"ok,K.)、他3名著「インタフェースにおける隠れルター派的な見方の取り扱い:アグネタ&フリーダシステムの評価(Dealing with the Lurking Lutheran view on Interfaces : Evaluation of the Agneta and Frida system)」,(スペイン・サイチェス(Sitges,Spain)),生命的合成キャラクターの行動プラン具に関するワークショップ(the workshop Behaviour Planning for Life-Like Synthetic Characters)」,1999年,p125-136
【非特許文献2】
エリザベス・アンドレ(Andr'e,E.)、他1名著,「パフォーマンスによる表現:知識ベースプレゼンテーションシステムにおける複数の生命的キャラクターの利用(Presenting Through Performin: On the Use of Multiple Lifelike Characters in Knowledge-Based Presentation Systems)」,(米国),第2回知的ユーザインタフェース国際会議論文集(the Second International Conference on Intelligent User Interfaces( IUI2000)),2000年,p.1-8
【非特許文献3】
角,間瀬著,「エージェントサロン:パーソナルエージェント同士のおしゃべりを利用した出会いと対話の促進」電子情報通信学会論文誌,第84巻D-I,第8号,2001年,p1231-1243
【0005】
【発明が解決しようとする課題】
ところが、Agneta&Fridaにおいて利用される発話内容は、予め定められており、新たに会話形式の文章を生成するものではない。また、Gerd&Matzeでは、発話はパスやインターセプト等のサッカーにおけるボールの移動に関する離散的なイベントに呼応したものであり、分野の制限されていない事象に関して述べられたモノローグ的な文章から会話形式の表現を生成することはできない。さらに、エージェントサロンにおいて会話に利用される項目は、個人の見学履歴と展示に対する評価データという離散的なものであるため、Gerd&Matzeと同様に、限定的な事象についてにのみ対応するものである。
【0006】
したがって、従来の何れの態様にしても、任意のモノローグ的文章を元にして理解が容易で親しみやすい会話表現を生成することはできないものであった。
【0007】
そこで本発明は、以上のような問題に鑑みて、分野の制限されない任意のモノローグ的文章に基づいて、それをより親しみやすく理解しやすい会話表現に変換することができるようにすることを主たる目的としている。
【0008】
【課題を解決するための手段】
すなわち、本発明において第1の態様に係る会話表現生成装置A1は、図1に示すように、モノローグ的文章からなるモノローグテキストに基づいて、会話表現を生成するものであって、モノローグテキストを格納したモノローグテキスト格納部MTDから取得するモノローグテキスト取得手段1と、取得したモノローグテキストを単文形式に分割し一以上の単文テキストを生成する前処理手段2と、生成された単文テキストの文末表現を解析し当該文末表現を予め設定された複数の文末表現パターンの何れか一つに対応付ける文末処理手段3と、各文末表現パターンに対応付けてそれらに応答する表現として設定された複数のコメントテキストを格納するコメント格納部CMDから前記何れかの一の文末表現パターンに対応付けられた単文テキストに対応する一のコメントテキストを選択するコメント選択手段4と、前記単文テキストの後に選択されたコメントテキストを挿入し単文テキストとコメントテキストからなる会話テキストを生成する会話表現生成手段5と、生成した会話テキストを出力する会話テキスト出力手段6とを具備してなることを特徴とするものであり、コンピュータをこの会話表現生成装置A1用のプログラムに基づいて動作させることによって上述の機能を奏する。以下に説明する各会話表現生成装置においてもそれ専用のプログラムに基づいて機能する点で同様である。
【0009】
ここで、モノローグ的な文章とは、上述したように、単独の書き手が一方的に叙述した文章であり、モノローグテキストとは、このような文章からなるテキストデータを意味している。また、単文テキストとは、句点で終了する一文のみからなるテキストを意味している。また、モノローグテキスト格納部MTDは、モノローグテキストをデータベースとして格納してあるものであってもよいし、入力されたモノローグテキストを一時的なメモリに格納するものであってもよい。
【0010】
このような会話表現生成装置A1であれば、一般には理解しづらいモノローグテキストを、より理解の容易な会話形式の表現からなる会話テキストに自動変換することができるので、出力された会話テキストの利用者の情報理解に要する負担を軽減することができる。特に、従来の会話形式を利用した各システムとは異なり、モノローグテキストを単文化したうえでその文末表現に着目することによって、適切な会話テキストを生成するようにしているため、予め用意された会話文をそのまま利用したり定まった分野の会話表現のみを実現するのではなく、新規に作成された分野の制限のないモノローグ的な文章にも容易に対応できる点で、従来のものとは全く異なり且つ応用範囲の広いものである。
【0011】
本発明の第2の態様に係る会話表現生成装置A2は、図2に示すように、前記会話表現生成装置A1の構成に加えて、ユーザにより入力されたキーワードを取得するキーワード取得手段7を更に具備するものであり、前記モノローグテキスト取得手段1が、前記モノローグテキスト格納部MTDから前記キーワードに対応する一以上の前記モノローグテキストを取得し、前記前処理手段2が、取得されたモノローグテキストのそれぞれについて単文テキストを生成するように構成したものである。
【0012】
このような構成であれば、ユーザが興味のあるキーワードを入力すれば、それに対応するモノローグテキストから生成した会話テキストが出力されるので、興味のある話題についてより理解を深めることができる。
【0013】
このような会話表現生成装置A1、A2において、前記モノローグテキスト格納部MTDが、ユーザの入力により電子掲示板に投稿された意見文テキストを前記モノローグテキストとして格納するものであり、前記モノローグテキスト取得手段1において、この意見文であるモノローグテキストを取得するようにしてあれば、多様な人の意見の理解が容易になる。
【0014】
本発明の第3の態様に係る会話表現生成装置A3は、図3に示すように、前記会話表現生成装置A1又はA2の構成に加えて、二以上の予め設定された話者エージェントのそれぞれに対して、出力された前記会話テキストのうち単文テキストの読み手として一の話者エージェントを対応付けるとともに、前記コメントテキストの読み手として他の話者エージェントを対応付ける処理を行う話者決定手段8を更に具備するものである。なお、この会話表現生成装置A3において、図3に破線で示したキーワード取得手段7は必須の機能ではなく、オプション的にこの機能を設けるか否かを選択できるものである。また、以下に説明する図4~図7に示される各会話表現生成装置においても、破線で示される各手段は、当該装置又はプログラムにおいてはオプション的な機能であることを示している。
【0015】
このような会話表現生成装置A3であれば、会話形式である会話テキストは、単文テキストとコメントテキストとから構成されており、それらを別々の話者エージェントが読み手として区別されるため、例えばユーザが使用するディスプレイに単文テキストとコメントテキストを文字表示する場合に、単文テキスト又はコメントテキストに対応付けられた何れかの話者エージェントの画像を同時に表示するようにすれば、現実に二人以上の話者が対話しているかの如き状態を模擬的に表現することができるため、聞き手であるユーザにとって極めて親しみやすく、理解度も向上させることができる。
【0016】
この会話表現生成装置A3の効果をより向上する本発明の第4の態様に係る会話表現生成装置A4は、図4に示すように、前記会話表現生成装置A3の構成に加えて、前記話者決定手段8で決定した各話者エージェントごとに異なる音声で対応する単文テキスト又はコメントテキストを音声出力する音声出力手段9を更に具備している。すなわち、単文テキストとコメントテキストとを異なる話者エージェントが発話しているように、それぞれ異なる音声で出力することによって、聞き手の理解のし易さがさらに向上される。
【0017】
そして、この会話表現生成装置A4による効果をさらに向上する本発明の第5の態様に係る会話表現生成装置A5は、図5に示すように、前記会話表現生成装置A4の構成に加えて、前記音声出力手段9で出力される単文テキスト又はコメントテキストの音声に対応して、各話者エージェントに当該話者エージェントの画像のうち少なくとも口を動かせるアニメーション動作を付加し出力するアニメーション処理手段10を更に備えたものである。すなわち、話者エージェントが現実に話しているかのような単文テキスト又はコメントテキストの音声データに加えて、話者エージェントの画像を動作させることによって、前述した会話表現生成装置A4の場合よりも更に現実味を帯びた態様で会話を進行させることが可能となる。
【0018】
さらに、前記会話表現生成装置A3、A4、A5の何れかに対する補助的な機能を有する本発明の第6の態様に係る会話表現生成装置A6は、前記各話者エージェントと共に、対応する単文テキスト又はコメントテキストを画面表示可能な文字データとして出力する文字データ出力手段11を更に具備するものである。このような構成とすれば、文字データとして出力された単文テキスト及びコメントテキストを話者エージェントごとに関連づけてディスプレイに表示することができるため、耳の不自由なユーザであっても内容の理解を深めることができ、また、音声データやアニメーション画像とともに出力することで、一般的なユーザも目と耳から情報を受け取ることで内容の把握が容易となる。
【0019】
また、前記モノローグテキストが画像データを伴っている場合も考えられるが、この場合における本発明の第7の態様に係る会話表現生成装置A7には、上述した前記各会話表現生成装置A1、A2、A3、A4、A5、A6の何れかの構成に加えて、前記モノローグテキスト格納部MTDから当該画像データを取得し出力する画像データ処理手段12を更に設けるとよい。すなわち、出力する画像データを会話テキストの理解のための補助として役立てることができる。
【0020】
特に、前記会話表現生成装置A3、A4、A5、A6の何れかにおいて、前記話者エージェントの一つとして、会話表現の進行役となるメインキャスタエージェントを設定しておき、前記話者決定手段8が、メインキャスタエージェントをコメントテキストの読み手として決定するものとしている場合には、会話表現の進行をスムーズに行うことができる。そして、前記モノローグテキストが、その内容の本質的部分である本文部と概要を示す表題部とから構成されるものである場合には、前記話者決定手段8において、メインキャスタエージェントを表題部の読み手として決定するように構成するとよい。また、前記コメント格納部CMTに、会話表現の開始を示すコメントテキストが格納されていれば、前記コメント選択手段4において当該単文テキストの前に他の単文テキストがない場合に前記開始を示すコメントテキストを選択し、前記話者選択手段8において、当該コメントテキストに表題部を合成したものをメインキャスタエージェントに対応付けるように構成することによっても、会話の流れをスムーズなものとすることができる。一方、前記メインキャスタエージェントとは異なる話者エージェントとして一以上のアナウンサーエージェントが設定している場合には、前記話者決定手段8が、アナウンサーエージェントを本文部の読み手として決定するようにすれば、メインキャスタエージェントとの役割分担を明確なものとすることができる。
【0021】
以上に説明した前記各会話表現生成装置A1~A7の何れかにおいて、複数のモノローグテキストに基づく複数の会話表現の流れを円滑なものとするためには、前記コメント選択手段4において、一のモノローグテキストにおける最終の単文テキストを認識し、最終の単文テキストにおける文末表現パターンに対応付けて次のモノローグテキストへ接続する表現として設定されコメント格納部に格納されたコメントテキストから当該最終の単文テキストの文末表現に対応するコメントテキストを選択するように構成することが好ましい。
【0022】
また、文末表現は、ある程度パターン化して分類しておくことができる。すなわち、前記文末表現パターンに、現象を述べ立てることを示す現象叙述形式と伝聞であることを示す伝聞形式とが少なくとも含ませるとともに、前記コメントテキストに、現象叙述形式に対応する質問文形式に該当するコメントテキストと伝聞形式に対応する予想文形式に該当するコメントテキストとが少なくとも含ませておき、前記文末処理手段3において、前記単文テキストの文末表現を現象叙述形式又は伝聞形式の何れかに対応付けるとともに、それに対応して前記コメント選択手段4において、質問文形式又は予想文形式の何れか一方のコメントテキストを選択するような態様が好ましいものとしてあげることができる。さらに加えて、質問文形式及び予想文形式の前記コメントテキストを、それぞれ複数ずつ設定しておき、前記コメント選択手段4において、それら複数のコメントテキストから何れか一のコメントテキストを選択するようにしておけば、会話が単調とならないようにバリエーションを持たせることができる。
【0023】
ところで、最近では、パブリック・オピニオン・チャンネル(以下、「POC」と称する)と呼ばれるコミュニティのためのインタラクティブ放送システムが開発されつつある。このPOCは、コミュニティメンバが他のメンバに向けて電子掲示板に投稿した意見文を処理の対象とし、この意見文に会話生成処理を加えたうえで、仮想的な話者であるメインキャスタエージェントとアナウンサーエージェントの会話による意見紹介番組の形でその意見文をコミュニティメンバに向けて放送するものである。したがって、本発明に係る前記会話表現生成装置A1~A7を、複数のユーザが入力することにより利用可能な電子掲示板に入力されたモノローグテキストを格納する前記モノローグテキスト格納部と、前記コメント格納部とを有し、且つ、入力されたモノローグテキストに基づいて生成される会話表現テキストを放送可能な、POCをはじめとするインタラクティブ放送システムにおいて適用し、入力されたモノローグテキストに基づいて会話テキストを生成し、当該会話テキストを放送可能に出力することで、POC等のコミュニティ向け意見紹介放送においても極めて重要な役割を果たすことができる。
【0024】
【発明の実施の形態】
以下、本発明の一実施形態を、図面を参照して説明する。
【0025】
この実施形態は、図8にシステム全体の概要を示すように、上述したパブリック・オピニオン・チャンネル(以下、「POC」と称する)に適用される会話表現生成装置であり、特に本発明における第7の態様の会話表現生成装置A7を利用したものである。以下、この会話表現生成装置A7は、POCキャスタA7と呼ぶものとする。POCは、コミュニティメンバである各ユーザUが使用するパーソナルコンピュータやPDAや携帯電話等のクライアントコンピュータCC、クライアントコンピュータCCに対してユーザUがクライアントコンピュータCCからアクセス可能な電子掲示板を提供するとともにクライアントコンピュータCCから投稿されたユーザUの意見文を格納するPOCサーバPS、POCキャスタA7とから基本的に構成されており、これらクライアントコンピュータCC、POCサーバPS、POCキャスタA7はインターネットINを通じて双方向通信可能に接続されている。なお、POCキャスタA7は、ユーザUから投稿された意見文を元に生成した会話形式の放送をクライアントコンピュータCCへ放送するための放送用クライアントとしての機能も有しており、ユーザUは自己のクライアントコンピュータCCの画面上で当該放送を視聴することができる。
【0026】
まず、各機器の内部機器構成について説明する。POCサーバPSは、汎用サーバコンピュータによって構成されるものであり、データベースサーバ機能やWebサーバ機能を有している。そのうち、Webサーバが、クライアントコンピュータCCから閲覧可能なホームページや電子掲示板を提供している。また、データベースサーバが、電子掲示板に入力された意見文を格納するモノローグテキスト格納部MTDとしての機能を有している。一方、POCキャスタA7は、一般的なサーバコンピュータやパーソナルコンピュータによって構築されるものであり、図9に示すように、CPU101、内部メモリ102、ハードディスク等の記憶装置103、キーボードやマウス等の入力デバイス104、ディスプレイやスピーカ等の出力デバイス105、各種通信インタフェース106等を内部機器として有している。なお、データベース装置107を更に内部機器として有していてもよいし、外部機器として有していてもよい。そして、記憶装置103に記録されたプログラムをCPU101の指示に従って内部メモリ102に読み込み、適宜データベース装置107から必要なデータ等を読み出し、また、通信インタフェース106を介してPOCサーバPSやクライアントコンピュータCCと情報通信を行うことによって、このPOCキャスタA7が動作する。なお、POCキャスタA7において情報の入力や画面表示等の出力が必要な場合には、適宜入力デバイス104や出力デバイス105が利用される。また、この実施形態では、POCサーバPSとPOCキャスタA7とをインターネットINを通じて双方向通信可能な別個のコンピュータとして示しているが、これらは専用通信回線で接続されていてもよいし、単一のコンピュータによって実現されるものであってもよい。さらにまた、クライアントコンピュータCCは、上述したように一般的なパーソナルコンピュータやPDA、携帯電話等からなるものであるが、ここでは少なくともインターネットINへの接続機能、文字や画像の入出力機能、ディスプレイ等の画像表示機能、スピーカ等の音声出力機能を有しているものとする。
【0027】
次に、POCキャスタA7の機能について説明すると、このPOCキャスタA7は、会話表現生成プログラムに基づくCPU101の指示に従って各内部機器及び外部機器が協動し、図7に示したように、モノローグテキスト取得手段1、前処理手段2、文末処理手段3、コメント選択手段4、会話表現生成手段5、会話テキスト出力手段6、キーワード取得手段7、話者決定手段8、音声出力手段9、アニメーション処理手段10、文字データ出力手段11、画像データ処理手段12としての機能を有している。これらの各手段を動作させるためのプログラムをコンピュータにインストールすることによって、コンピュータがPOCキャスタA7として機能することになる。なお、このプログラムは、例えばCD-ROM等の記録媒体に記録したものをコンピュータに読み込ませたり、インターネットIN等を通じてコンピュータにダウンロードすることによって実装される。本実施形態では特に、意見紹介の会話を行う仮想的な話者であるエージェント(メインキャスタエージェントMA及びアナウンサーエージェントAA)の音声合成にはTSSシステム(株式会社東芝製)を、それらエージェントの画像には、写真顔キャラクター作成システム(株式会社シャープ)を、POCキャスタA7に組み込んで使用しているが、これらと同等機能を有する他の製品を利用することも可能である。
【0028】
また、前記データベース107は、コメント格納部CMDとしての機能を有している。ここで、格納されるコメントの一例を図10に示す。この例では、ユーザUにより投稿された意見文の文末表現パターンを2種類に大別し、そのうち1種類を更に3種類に分類し、そのそれぞれに対応するコメントが複数ずつ用意されている。具体的に説明すると、文末表現は、同図左欄に示すように、「現象を述べ立てる」現象叙述形式と、伝聞であることを示す『伝聞形式』に大別されている。さらに現象叙述形式は、『現象を述べ立てる「がある」形式』、『現象を述べ立てるアスペクト辞「ている」形式(現在・現在進行形)』、『現象を述べ立てるアスペクト辞「ている」(過去・過去進行形)』の3種類に分類されている。これら文末表現の例としては、同図中欄に示すようなものが挙げられる。すなわち、まず、『現象を述べ立てる「がある」形式』の表現例には、「~がある。」、「~があります。」、「~があった。」、「~がありました。」等が挙げられる。『現象を述べ立てるアスペクト辞「ている」形式(現在・現在進行形)』の表現例には、「ている。」、「ています。」、「~が人気を呼んでいる。」等が挙げられる。『現象を述べ立てるアスペクト辞「ている」(過去・過去進行形)』の表現例には、「ていた。」、「ていました。」が挙げられる。『伝聞形式』の表現例には、「~だそうです。」、「~だそうだ。」、「~という。」、「~といいます。」等が挙げられる。このような表現例は、物事を紹介する際の文章の文末に関する様相を分析した結果、上述のような合計4種類の文末表現パターンに分類されることが判明したことに基づく。そして、各文末表現パターンに対応して、それらの後に挿入すべきコメントテキストは、同図右欄に示すようなものである。すなわち、現象を述べ立てる「がある」形式』及び『現象を述べ立てるアスペクト辞「ている」形式(現在・現在進行形)』には、『詳細質問文(現在の内容)』として、「どういうものなの?」、「もっと教えてよ」、「それはなに?」、「どんなものなの?」等のコメントテキストを対応付けている。また、『現象を述べ立てるアスペクト辞「ている」(過去・過去進行形)』には、『詳細質問文(過去の内容)』として、「どうだったの。」、「それで、どうだったの。」等のコメントテキストを対応付けている。さらに、『伝聞形式』には、『詳細予想文』として、「どんなのだろう。」、「どんなかんじなんだろう。」、「どんなのかな。」等のコメントテキストを対応付けている。なお、以上に示した表現例やコメントテキスト例は、一例であって、これら以外のものを含む場合もある。そして、図示していないが、各コメントテキストのパターンごと及び個々のコメントテキストには、適宜の識別子が付与されていて他のコメントテキストと区別されるようにしている。
【0029】
ただし、コメント格納部CMDとして機能するデータベース107には、上述したコメントテキストの他に、例えば、単に相づちを打つ表現である「はい。」や「そうですか。」等のコメントテキスト、エージェントが音声出力により仮想的に読み上げる元になる意見文と意見文との間に挿入され話題を接続したり他のユーザに呼びかけることを表す「みなさん、どう思われますか。」等のコメントテキスト、会話を開始することを表す「では、~の話題です。」等のコメントテキスト等も単数又は複数ずつ格納されている。
【0030】
また、ユーザUが各自のクライアントコンピュータCCで入力し送信により投稿した意見文は、POCサーバPSに格納されるが、これら意見文それぞれは、ユーザUが各自で叙述したモノローグ的な文章からなるモノローグテキストである。図11に、意見文の一例を示す。同図に示すように、意見文OPTは、「題目」欄に記述された表題部OPHと、「本文」欄に記述された本文部OPMとから構成されており、本文部には、一以上の文が記述されている。各意見文OPTは、他の意見文OPTと区別される固有の識別子により管理されている。なお、本実施形態では、意見文はPOCサーバPS内において、XML(eXtensible Markup Language)形式に変換されているが、これ以外の形式であってもよいのは勿論である。さらに各意見文には、動画又は静止画からなる関連画像OPIが添付される場合もある。
【0031】
また、話者エージェントは、メインキャスタエージェントとアナウンサーエージェントの2種類が予め設定されているものとする。すなわち、メインキャスタエージェントとアナウンサーエージェントのそれぞれに、写真顔キャラクター作成システムで作成された顔のキャラクター画像と、TSSシステムにより作成された合成音声とが関連づけて設定してあるものとする。ここで、アナウンサーエージェントは、意見文に基づいて作成される会話テキストのうち、元の意見文の本文部OPMを読み上げる話者として設定されている。一方、メインキャスタエージェントには、表題部OPH及びコメントテキストを読み上げる役割が設定されているものとする。
【0032】
以下、POCキャスタA7の動作例について、図11に示した意見文例、図12に示す会話テキスト例、図13に示すフローチャート例、及び図 に示す画面例等を利用して説明する。
【0033】
まずはじめに、前提として、例えば図11に示したようなユーザUからの意見文がモノローグテキストとしてPOCサーバPSに多数格納されているものとする。すなわち、ユーザUは、POCサーバPSにより提供された電子掲示板を利用して、各自の意見文の投稿を行っている。また、POCサーバPS又はPOCキャスタA7は、意見文の紹介を視聴したいユーザUのクライアントコンピュータCCに対して、キーワードの入力欄を表示した画面を送信して表示させており、ユーザUはその画面に何らかのキーワードを入力したうえでそれをクライアントコンピュータCCからPOCキャスタA7へ送信しているものとする。
【0034】
POCキャスタA7は、クライアントコンピュータCCから送信されたキーワードを取得すると(図13;ステップS1)、POCサーバPSを検索して取得したキーワドに関連する意見文(モノローグテキスト)OPTを検索する(ステップS2)。なお、この検索に際しては、例えば表題部OPHのみの検索、表題部OPH及び本文部OPMの全文検索等、適宜の方法を採用することができる。意見文OPTがPOCサーバPSから1以上取得できた場合(ステップS2a;Yes)は、次へ進む。ここで、取得した意見文OPTが複数あった場合は、例えば識別子の昇順又は降順、又は日付順などの適宜の順番に並べられる。一方、取得したキーワードに該当する意見文OPTがなかった場合には(ステップS2a;No)、その旨の情報をクライアントコンピュータCCへ送信する(ステップS2b)。
【0035】
次に、全ての意見文OPTを紹介したか否かを判断し、紹介し終えて以内場合(ステップS3;No)には、1件の意見文OPTを句点「。」ごとに区切った単文テキストに分割する(ステップS4)。そして、各単文テキストの文末表現を解析し(ステップS5)、各単文テキストの文末表現に該当する文末表現パターンに対応するコメントテキストをデータベース107から抽出して(ステップS6)、抽出したコメントテキストを各単文テキストの後に挿入することによって、会話テキストCVTを生成する(ステップS7)。ここで、一例として、取得した意見文OPTが図11に示したようなものであれば、生成される会話テキストCVTは、図12に示すようなものとなる。すなわち、図11に示す意見文OPTの本文部OPMは、4つの単文テキストに分割される。まず、表題部OPHは、メインキャスタエージェントMCAに割り振られる。ここで、表題部OPHの前には当該意見文OPTにおいて先行する単文テキストが存在しないので、会話の開始を示すコメントテキストと表題部OPHの記載とを合成して、「まずはじめは、ウォーキングの話題です。」というテキストが生成されている。なお、このように、「まずはじめは…」とするか否かは、意見文の紹介順により適宜変更することができ、例えば「次は、…」や「最後は…」等というようなコメントテキストを利用することができる。次に、本文部OPMの第1文はアナウンサーエージェントANAに割り振られるが、その第1分の文末表現は、「…そうです。」という『伝聞形式』に該当するので、「どんなのだろう」というコメントテキストが対応付けられており、それをメインキャスタエージェントMCAに割り振ることになる。同様に、第2文、第3文がアナウンサーエージェントANAに割り振られるとともに、それら第2文、第3文の文末表現に対応するコメントテキスト「もっと教えてよ。」や「はい。」等がメインキャスタエージェントMCAに割り振られる。さらに、第4文もアナウンサーエージェントANAに割り振られるが、この第4文は、当該意見文OPTの末尾の単文テキストであることから、他のユーザUに呼びかける表現であり、次の意見文OPTにつなげることにもなるコメントテキスト「みなさん、どうでしょう?」がメインキャスタエージェントMCAに割り振られる。
【0036】
図13に示したフローチャートに戻って説明を続けると、生成された会話テキストCVTのうち、表題部OPHについては(ステップS8;Yes)、メインキャスタエージェントMCAにコメントテキストの発話動作を与える一方、アナウンサーエージェントANAには休憩動作を与える(ステップS8a)。また、表題部OPHではない、すなわち本文部OPMである場合(ステップS8;No)、文末表現が紹介を述べ立てる表現であるか否かを判断し、そうでなければ(ステップS8b;No)、アナウンサーエージェントANAには単文テキストの読み上げ動作を与える一方、メインキャスタエージェントMCAには休憩動作を与える(ステップS8c)。一方、文末表現が紹介を述べ立てる表現である場合(ステップS8;Yes)、メインキャスタエージェントMCAにはコメントテキストの読み上げ動作を与える一方、アナウンサーエージェントANAには休憩動作を与える(ステップS8a)。そして、メインキャスタエージェントMCA及びアナウンサーエージェントANAにそれぞれ動作を与えると、それに対応するアニメーションを生成すると音声を合成する。ここで、アニメーション動作には、少なくともメインキャスタエージェントMCA及びアナウンサーエージェントANAが口を動かせる動作が含まれるが、後述するように添付画像が意見文OPTに付帯されている場合には、何れかのエージェントに指差し動作をさせたり、頷く動作をさせるなどのバリエーションがある。また、上述したように、意見文OPTに添付画像OPIがあれば(ステップS10;Yes)、その添付画像を、例えばクライアントコンピュータCCに表示させるための送信画像の中央に配置するなどして、送信画像に添付画像を合成する。その後、又は添付画像がない場合(ステップS10;No)、送信画像の例えば下欄に会話テキストCVTの文字データを合成し(ステップS11)、全てのデータをクライアントコンピュータCCで視聴可能な形式として送信する(ステップS12)。送信の結果、クライアントコンピュータCCのディスプレイに表示される画像は、例えば図14~図22に示すようなものであり、クライアントコンピュータCCのスピーカからは、メインキャスタエージェントMCA及びアナウンサーエージェントANAそれぞれの音声が出力される。
【0037】
クライアントコンピュータCCのディスプレイに表示される画面、及びスピーカから出力される音声について説明すると、図14~図22では、画面中央に添付画像が表示されており、その左側にメインキャスタエージェントMCAの画像、右側にアナウンサーエージェントANAの画像が配置された状態を示している。そして、図12に示した会話テキストCVTに従って、順次各エージェントの動作及びコメント又は意見文を読み上げる音声出力、並びにこの音声出力に伴った文字データの表示(画面下欄)が行われる。まず、図14に示すように、メインキャスタエージェントMCAが、当該意見文の表題部OPH及び会話の開始を示すコメントテキストを合成したコメント「まずはじめは…」を読み上げる動作を行うとともに、その音声を出力し、画面下欄にこのコメントの文字データを表示する。次に、図15に示すように、アナウンサーエージェントANAが、本文部OPMの第1文「伊勢志摩の…」を読み上げる動作を行うとともに、その音声を出力し、画面下欄にこのコメントの文字データを表示する。このとき、アナウンサーエージェントANAには、添付画像OPIを指し示すアニメーション動作を行わせるようにしている。次に、図16に示すように、話者がメインキャスタエージェントMCAに交代して、コメント「どんなのだろう。」を読み上げる動作を行うとともに、その音声を出力し、画面下欄にこのコメントの文字データを表示する。さらに、図17に示すように、話者がアナウンサーエージェントANAに交代して、本文部OPMの第2文「大型の施設観光を…」を読み上げる動作を行うとともに、その音声を出力し、画面下欄にこのコメントの文字データを表示する。続いて図18に示すように、メインキャスタエージェントMCAが、コメント「もっと教えてよ。」を読み上げる動作を行うとともに、その音声を出力し、画面下欄にこのコメントの文字データを表示する。次に、図19に示すように、アナウンサーエージェントANAに話者が交代し、本文部OPMの第3文「美しい景色や…」を読み上げる動作を行うとともに、その音声を出力し、画面下欄にこのコメントの文字データを表示する。これに対して、図20に示すように、メインキャスタエージェントMCAが、コメント「はい。」を読み上げる動作を行うとともに、その音声を出力し、画面下欄にこのコメントの文字データを表示する。そして、図21に示すように、アナウンサーエージェントANAが、本文部OPMの最終文「どなたかご一緒しませんか?」を読み上げる動作を行うとともに、その音声を出力し、画面下欄にこのコメントの文字データを表示する。そして最後は、図22に示すように、メインキャスタエージェントMCAが、コメント「みなさん、どうでしょう?」を読み上げる動作を行うとともに、その音声を出力し、画面下欄にこのコメントの文字データを表示して、次の意見文OPTの紹介へとつなげる。
【0038】
すなわち、以上の各ステップが終了すると、ステップS3に戻り、次の意見文OPTの処理を行う。そして、全ての意見文OPTの紹介が終了すると(ステップS3;Yes)、当初に取得した位キーワードについての処理が終了となる。なお、ステップS9~S11は、必ずしもこの順番である必要はなく、適宜順番を入れ替えてもよい。
【0039】
以上のようにして、ユーザUが投稿した意見文は、その意見文の表層的な手がかりである文末表現から対象となる意見文の意図を推測して、コメントテキストの挿入や付加合成処理を行うことによって生成された会話テキストに変換されるので、他のユーザUは、当該意見文を会話形式で視聴できることになる。したがって、元の情報提示がモノローグ的な文章である意見文であっても、それを視聴するユーザUにはより親しみやすく理解へ負担を低減した態様で情報を提供することができる。
【0040】
なお、本発明は上述した実施形態に限られるものではない。例えば分割された単文テキストの文末表現のパターンを増減することや、各パターンに該当する表現例、対応するコメントテキストの数も適宜増減することができる。また、電子掲示板に投稿される文章はフォーマルな文章ではないため、投稿された意見文において、表題部と本文部とが一つの文章として繋がっている場合があるが、この場合、本文部の文頭が「を」、「が」、「の」等の格助詞や「…」等の記号から始まっているような文章を正規化するなどの処理を行うようにすることもできる。その他、各部の具体的構成についても上記実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲で種々変形が可能である。また、生成される会話テキストは、二者に限らず三者以上の会話文とすることができる。さらに、本発明をPOC以外の分野又はシステムに適用することも可能である。
【0041】
【発明の効果】
本発明によれば、以上に詳述したように、一人が叙述した文章であるモノローグテキストを、単文に分割するという処理を経て、聞き手又は読み手が要する理解への負担を軽減し得る会話形式に変換することができるものである。すなわち、モノローグテキストの表層的な手がかりである文末表現をパターン化することで、当該モノローグテキストの意図するところを推測して単文の末尾に適切なコメントを挿入することによって、話題の内容又は分野に制限なく、会話表現を生成することが可能となる。したがって、本発明を応用することで、POC等の不特定の話題が登場するコミュニティにおける意見紹介番組の運営や、会話に関する研究にも大いに役立つことになる。
【図面の簡単な説明】
【図1】本発明の請求項1に対応する会話表現生成装置の機能構成を示すブロック図。
【図2】本発明の請求項2に対応する会話表現生成装置の機能構成を示すブロック図。
【図3】本発明の請求項4に対応する会話表現生成装置の機能構成を示すブロック図。
【図4】本発明の請求項5に対応する会話表現生成装置の機能構成を示すブロック図。
【図5】本発明の請求項6に対応する会話表現生成装置の機能構成を示すブロック図。
【図6】本発明の請求項7に対応する会話表現生成装置の機能構成を示すブロック図。
【図7】本発明の請求項8に対応する会話表現生成装置の機能構成を示すブロック図。
【図8】本発明の一実施形態を適用したPOCのシステムを示す概観図。
【図9】同実施形態のPOCキャスタの概略的な内部機器構成図。
【図10】同実施形態に適用されるコメント格納部の内部データの一例を示す図。
【図11】同実施形態に適用される意見文の一例を示す図。
【図12】同実施形態で生成された会話テキストの一例を示す図。
【図13】同実施形態の動作を概略的に示すフローチャート。
【図14】同実施形態においてクライアントコンピュータに表示される画面例を示す図。
【図15】同実施形態においてクライアントコンピュータに表示される画面例を示す図。
【図16】同実施形態においてクライアントコンピュータに表示される画面例を示す図。
【図17】同実施形態においてクライアントコンピュータに表示される画面例を示す図。
【図18】同実施形態においてクライアントコンピュータに表示される画面例を示す図。
【図19】同実施形態においてクライアントコンピュータに表示される画面例を示す図。
【図20】同実施形態においてクライアントコンピュータに表示される画面例を示す図。
【図21】同実施形態においてクライアントコンピュータに表示される画面例を示す図。
【図22】同実施形態においてクライアントコンピュータに表示される画面例を示す図。
【符号の説明】
1…モノローグテキスト取得手段
2…前処理手段
3…文末処理手段
4…コメント選択手段
5…会話表現生成手段
6…会話テキスト出力手段
7…キーワード取得手段
8…話者決定手段
9…音声出力手段
10…アニメーション処理手段
11…文字データ出力手段
12…画像データ処理手段
A1、A2、A3、A4、A5、A6、A7…会話表現生成装置
CMD…コメント格納部
MTD…モノローグテキスト格納部
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5
【図7】
6
【図8】
7
【図9】
8
【図10】
9
【図11】
10
【図12】
11
【図13】
12
【図14】
13
【図15】
14
【図16】
15
【図17】
16
【図18】
17
【図19】
18
【図20】
19
【図21】
20
【図22】
21