TOP > 国内特許検索 > 診断装置、診断方法、及び診断プログラム > 明細書

明細書 :診断装置、診断方法、及び診断プログラム

発行国 日本国特許庁(JP)
公報種別 公開特許公報(A)
公開番号 特開2017-156402 (P2017-156402A)
公開日 平成29年9月7日(2017.9.7)
発明の名称または考案の名称 診断装置、診断方法、及び診断プログラム
国際特許分類 G10L  15/10        (2006.01)
G10L  15/00        (2013.01)
FI G10L 15/10 500Z
G10L 15/00 200Z
請求項の数または発明の数 8
出願形態 OL
全頁数 15
出願番号 特願2016-036988 (P2016-036988)
出願日 平成28年2月29日(2016.2.29)
発明者または考案者 【氏名】荒牧 英治
出願人 【識別番号】504143441
【氏名又は名称】国立大学法人 奈良先端科学技術大学院大学
個別代理人の代理人 【識別番号】100067828、【弁理士】、【氏名又は名称】小谷 悦司
【識別番号】100115381、【弁理士】、【氏名又は名称】小谷 昌崇
【識別番号】100118049、【弁理士】、【氏名又は名称】西谷 浩治
審査請求 未請求
要約 【課題】言語に依存することなく簡易且つ正確に、人物が言語に症状が現れる疾患の疑いを持つか否かを判定する。
【解決手段】収音部101は、人物の発話した音声を収音する。音声認識部201は、人物が発話した音声データに対して音声認識処理を行い、テキストデータに変換する。圧縮部301は、音声認識サーバ200から送信されたテキストデータを可逆圧縮する。圧縮率算出部302は、圧縮部301により圧縮されたテキストデータの圧縮率を算出する。判定部303は、圧縮率算出部302により算出された圧縮率が所定の閾値より大きければ、診断対象の人物は認知症の疑いがあると判定する。
【選択図】図1
特許請求の範囲 【請求項1】
言語に症状が現れる疾患を診断する診断装置であって、
人物の発話内容又は前記人物が書き起こした文書を示すテキストデータを取得する取得部と、
前記取得部により取得されたテキストデータを可逆圧縮する圧縮部と、
前記圧縮部により可逆圧縮されたテキストデータの圧縮率を算出する圧縮率算出部と、
前記圧縮率算出部により算出された圧縮率に基づいて、前記人物が前記疾患の疑いを持つか否かを判定する判定部とを備える診断装置。
【請求項2】
前記人物が発話した音声を収音する収音部と、
前記収音された音声を音声認識することで、前記収音した音声を前記テキストデータに変換し、前記取得部に出力する音声認識部とを更に備える請求項1記載の診断装置。
【請求項3】
前記取得部は、前記人物の発話内容が記載された文書又は前記人物が書き起こした文書をテキスト認識することで前記テキストデータを取得する請求項1又は2記載の診断装置。
【請求項4】
前記判定部は、前記圧縮率が所定の閾値より高い場合、前記人物は前記疾患を持つと判定する請求項1~3のいずれかに記載の診断装置。
【請求項5】
前記判定部は、前記圧縮率が高くなるにつれて前記疾患の度合いが高いと判定する請求項1~4のいずれかに記載の診断装置。
【請求項6】
前記疾患は、認知症、脳疾患、及び精神障害を含む請求項1~5のいずれかに記載の診断装置。
【請求項7】
言語に症状が現れる疾患を診断する診断方法であって、
前記人物の発話内容又は前記人物が書き起こした文書を示すテキストデータを取得し、
前記取得したテキストデータを可逆圧縮し、
前記可逆圧縮されたテキストデータの圧縮率を算出し、
前記算出された圧縮率に基づいて、前記人物が前記疾患の疑いを持つか否かを判定する診断方法。
【請求項8】
言語に症状が現れる疾患を診断するための診断プログラムであって、
コンピュータを請求項1~6のいずれかに記載の診断装置が備える各部として機能させる診断プログラム。
発明の詳細な説明 【技術分野】
【0001】
本発明は、言語に症状が現れる疾患を診断する診断装置等に関するものである。
【背景技術】
【0002】
認知症患者は、症状が進行するにつれて、使用できる単語数が減少傾向へ向かうので、認知症は言語能力と相関があることが知られている。ここで、言語能力の測定は、肉体的侵襲がないため、認知症を早期に発見する手法として注目されている。
【0003】
また、早期に認知症を発見する手法として、長谷川式簡易知能評価スケール(HDS-R)や、Me-CDTが知られており、これらの手法を用いて認知症の疑いのある高齢者と健常高齢者との発話の傾向及び特徴を抽出する研究も報告されている(非特許文献1)。
【先行技術文献】
【0004】

【非特許文献1】四方朱子、宮部真衣、野田泰葉、木下彩栄、荒牧英治、「軽度認知症者の音声テキストの質的検討:認知症の無侵襲迅速スクリーニングの為に」、情報処理学会研究報告 Vol.2015-UBI-47No.4 Vol.2015-ASD-2No.4、2015年7月27日
【発明の概要】
【発明が解決しようとする課題】
【0005】
一般に言語能力は、構文能力と語彙能力との2つに大別されるが、認知症に対しては語彙能力が有用であることが知られている。語彙能力の測定手法としては、理解できる或いは使用できる語彙量を測定する手法や、認証心理学で用いられる命題数を測定する手法などが知られている。
【0006】
しかし、語彙量を測定する手法では、言語に応じて単語の単位が異なるので、単語の単位に曖昧さがあるという課題があると共に、言語に応じてアルゴリズムを変更する必要があるという課題がある。
【0007】
また、命題数を測定する手法では、専門家による人手の作業が必要となるという問題がある。なお、品詞をカウントすることで、命題数を自動解析するCPIDRと呼ばれる手法が提案されているものの、この手法は英語に対する手法であり、そのまま別の言語に適用させることは困難である。
【0008】
また、上記の非特許文献1では、公知の評価手法を利用して認知症患者と健常者との発話の特徴が抽出されているに留まり、認知症の新たな判定手法についての開示はない。
【0009】
本発明の目的は、言語に依存することなく簡易且つ正確に人物が言語に症状が現れる疾患の疑いを持つか否かを判定できる技術を提供することである。
【課題を解決するための手段】
【0010】
本発明の一態様に係る診断装置は、言語に症状が現れる疾患を診断する診断装置であって、
前記人物の発話内容又は前記人物が書き起こした文書を示すテキストデータを取得する取得部と、
前記取得部により取得されたテキストデータを可逆圧縮する圧縮部と、
前記圧縮部により可逆圧縮されたテキストデータの圧縮率を算出する圧縮率算出部と、
前記圧縮率算出部により算出された圧縮率に基づいて、前記人物が前記疾患の疑いを持つか否かを判定する判定部とを備える。
【0011】
認知症等の言語に症状が表れる疾患の疑いを持つ患者の発話内容を解析すると、同じ単語や同じフレーズを繰り返す傾向にあり、冗長性が高いことが知られている。可逆圧縮のアルゴリズムでは、冗長なフレーズを抽出し、そのフレーズに短い符号を割り付けることで元のデータが圧縮されるので、元のデータに冗長なフレーズが多く含まれるほど圧縮率が高くなる。そのため、言語に症状が現れる疾患の疑い持つ人物と疑いを持たない人物との発話内容を示すテキストデータを可逆圧縮したときの圧縮率を比較すると、言語に症状が現れる疾患の疑い持つ人物の方が疑いを持たない人物よりも高くなることを本発明者は見出した。
【0012】
本態様では、人物の発話内容を示すテキストデータを可逆圧縮したときの圧縮率に基づいて、人物が言語に症状が現れる疾患の疑いを持つか否かが判定されている。そのため、言語に依存することなく、共通のアルゴリズムで人物が言語に症状が現れる疾患の疑いを持つか否かを判定できる。その結果、簡易且つ正確に言語に症状が現れる疾患を判定できる。
【0013】
また、上記態様において、
前記人物が発話した音声を収音する収音部と、
前記収音された音声を音声認識することで、前記収音した音声を前記テキストデータに変換し、前記取得部に出力する音声認識部とを更に備えていてもよい。
【0014】
本態様によれば、人物が発話した音声を音声認識することでテキストデータが取得されているので、人物に過度な負担を強いることなくテキストデータを取得できる。
【0015】
また、上記態様において、
前記取得部は、前記人物の発話内容が記載された文書又は前記人物が書き起こした文書をテキスト認識することで前記テキストデータを取得してもよい。
【0016】
本態様によれば、人物の発話内容が記載された文書又は人物が書き起こした文書をテキスト認識することでテキストデータが取得されているので、簡易な処理でテキストデータを取得できる。
【0017】
また、上記態様において、前記判定部は、前記圧縮率が所定の閾値より高い場合、前記人物は前記疾患の疑いがあると判定してもよい。
【0018】
本態様によれば、圧縮率が所定の閾値より高ければ、人物は前記疾患の疑いを持つと判定されるので、簡便なアルゴリズムで言語に症状が現れる疾患を判定できる。
【0019】
また、上記態様において、前記判定部は、前記圧縮率が高くなるにつれて前記疾患の度合いが高いと判定してもよい。
【0020】
本態様によれば、前記疾患の有無のみならず、人物がどの程度、前記疾患の疑いを持つかを提示できる。
【0021】
また、上記態様において、前記疾患は、認知症、脳疾患、及び精神障害を含んでいてもよい。
【0022】
本態様によれば、言語能力との相関が高い、認知症、脳疾患、及び精神障害を正確に判定できる。
【発明の効果】
【0023】
本発明によれば、言語に依存することなく簡易且つ正確に人物が、言語に症状が現れる疾患の疑いを持つか否かを判定できる。
【図面の簡単な説明】
【0024】
【図1】本発明の実施の形態1に係る診断装置1の全体構成を示すブロック図である。
【図2】圧縮部による圧縮処理の一例を示す図である。
【図3】本発明の実施の形態1に係る診断装置の処理の一例を示すフローチャートである。
【図4】本実施の形態の実験で用いた言語指標を纏めた表である。
【図5】本実施の形態における実験結果を纏めた表である。
【図6】本発明の実施の形態2に係る診断装置の全体構成を示すブロック図である。
【図7】本発明の実施の形態2に係る診断装置の処理の一例を示すフローチャートである。
【図8】本発明の実施の形態3に係る診断装置の全体構成を示す図である。
【図9】本発明の実施の形態3に係る診断装置の処理の一例を示すフローチャートである。
【図10】本発明の実施の形態4に係る診断装置の全体構成を示すブロック図である。
【図11】本発明の実施の形態4に係る診断装置の処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0025】
(実施の形態1)
図1は、本発明の実施の形態1に係る診断装置1の全体構成を示すブロック図である。診断装置1は、言語に症状が現れる疾患の疑いを診断する装置である。以下の実施の形態1~4では、言語に症状が現れる疾患として認知症を例に挙げて説明するが、これに限定されない。例えば、失語症や発達障害(アスペルガー症候群、学習障害、及び多動性障害等)に対しても、本発明は適用可能である。すなわち、本実施の形態において、言語に症状が現れる疾患とは、何らかの要因によって言語に支障をきたす疾患が該当し、認知症の他、言語に症状が現れる脳疾患や精神障害(例えば、鬱病)が含まれる。

【0026】
ここでは、認知症には、アルツハイマー型認知症、脳血管型認知症、レビー小体型認知症、及び前頭側頭型認知症等が含まれる。また、本実施の形態においては、認知症には、MCI(Mild Cognitive Impairment:軽度認知障害)も含まれる。

【0027】
図1において、診断装置1は、携帯端末100、音声認識サーバ200、及び診断サーバ300を備える。携帯端末100は、例えば、スマートフォン、タブレット端末といった、タッチパネル102を備える携帯可能な情報処理装置で構成されている。但し、これは一例であり、携帯端末100としては、タッチパネル102を備えていない携帯電話が採用されてもよい。

【0028】
音声認識サーバ200及び診断サーバ300は、それぞれ、通信機能を備えるコンピュータで構成されている。携帯端末100、音声認識サーバ200、及び診断サーバ300はネットワークNTを介して相互に通信可能に接続されている。ネットワークNTとしては、携帯電話通信網及びインターネット通信網を含む公衆通信網が採用できる。携帯端末100、音声認識サーバ200、及び診断サーバ300は、TCP/IP等の通信プロトコルを用いて種々のデータを送受する。

【0029】
携帯端末100は、認知症の診断対象となる人物の音声を収音すると共に、診断結果を人物に提示する装置であり、収音部101、タッチパネル102、制御部103、及び通信部104を備える。

【0030】
収音部101は、例えば、人物の発話した音声を収音して音声信号に変換するマイクと、マイクによって変換された音声信号に対して所定の信号処理を行う信号処理回路等を含む。ここで、信号処理としては、音声信号に含まれるノイズを除去するといった前処理や、アナログの音声信号をデジタルの音声データに変換する処理等が含まれる。

【0031】
タッチパネル102は、制御部103の制御の下、診断サーバ300から送信された診断結果を表示したり、診断対象の人物に発話を促すメッセージを含む画面を表示したりする。

【0032】
制御部103は、CPU、ROM、及びRAM等を備え、携帯端末100の全体制御を司る。本実施の形態では、制御部103は、収音部101から出力された音声データを通信部104を用いて音声認識サーバ200に送信する処理や、診断サーバ300から送信された診断結果をタッチパネル102に表示する処理を行う。

【0033】
通信部104は、携帯端末100をネットワークNTに接続するための通信装置で構成されている。本実施の形態では、通信部104は、制御部103の制御の下、音声認識サーバ200に音声データを送信すると共に、診断サーバ300から送信された診断結果を受信する。

【0034】
音声認識サーバ200は、携帯端末100から送信された音声データをテキストデータに変換する処理を司り、音声認識部201及び通信部202を備える。音声認識部201は、携帯端末100から送信された音声データに対して音声認識処理を行い、テキストデータに変換する。ここで、音声認識処理としては、例えば、音の波形データを蓄積する音響モデルと、単語及びその並び方の情報を蓄積する言語モデルとを用いることで音声認識を行う公知の処理が採用されればよい。

【0035】
通信部202は、音声認識サーバ200をネットワークNTに接続する通信装置で構成され、携帯端末100から送信された音声データを受信すると共に、音声認識部201により変換されたテキストデータを診断サーバ300に送信する。

【0036】
診断サーバ300は、人物が認知症の疑いを持つか否かを診断する装置であり、圧縮部301、圧縮率算出部302、判定部303、及び通信部304を備える。

【0037】
圧縮部301は、音声認識サーバ200から送信されたテキストデータを可逆圧縮する。ここで、圧縮部301は、ZIP、LZH、TARGZ、CAB等の公知の可逆圧縮方式であればどのような圧縮方式を用いてもよい。

【0038】
図2は、圧縮部301による圧縮処理の一例を示す図である。一般に可逆圧縮では、辞書法と符号割当との2つの工程を経てデータが圧縮される。辞書法の工程では、処理対象となるテキストデータの冗長性を減らすために、テキストデータおいて繰り返し登場する語が符号化される。

【0039】
図2に示すテキストデータTXは、認知症患者の発話した内容を書き起こしたものである。図2の例では、テキストデータTXにおいて、「あのー」、「バイクの」、「とか」といった繰り返し登場する単語に対して一意的に識別可能な符号が割り付けられている。これにより、テキストデータTXは、図2の中段に示すようなテキストデータTX1に変換される。

【0040】
次に、テキストデータTX1に対して、符号割当の工程が施される。符号割当の工程では、例えば、ハフマン法が採用され、登場回数が多い単語ほど、短い符号が割り付けられる。これにより、最終的にテキストデータTX2が得られる。この例では、65文字の130バイトのテキストデータTXが最終的に43文字の86バイトのテキストデータTX2に圧縮されている。その結果、圧縮率は、86/130=66%となっている。

【0041】
図2のテキストデータTXに示すように、認知症の疑いのある人物は、同じ単語を繰り返し使用する傾向が高いので、認知症の疑いのある人物の発話内容を示すテキストデータTXの圧縮率は、認知症の疑いのない人物の圧縮率に比べて高くなる。そのため、圧縮率から診断対象の人物が認知症の疑いを持つか否かを判断できる。

【0042】
この傾向は、辞書法及び符号割当を使用する可逆圧縮方式であれば、どのような圧縮方式においても表れるので、本実施の形態は辞書法及び符号割当からなる既存の可逆圧縮方式を適用できる。また、このような既存の可逆圧縮方式は、処理対象となるデータ内容を問わず、同じ単語の繰り返し回数が多いほど、高い圧縮率が得られる。したがって、本実施の形態は、発話者が使用する言語に応じてアルゴリズムを変更する必要もない。

【0043】
なお、本実施の形態で、可逆圧縮方式を採用しているのは、既存の非可逆圧縮方式は主に画像データといったテキストデータ以外のデータを対象としてアルゴリズムが構築されており、テキストデータの圧縮にはなじまないからである。

【0044】
図1に参照を戻す。圧縮率算出部302は、圧縮部301により圧縮されたテキストデータの圧縮率を算出する。ここで、圧縮率算出部302は、圧縮前のテキストデータTXのデータ量に対する、圧縮後のテキストデータTX2のデータ量の割合を求めることで、圧縮率を算出すればよい。

【0045】
判定部303は、圧縮率算出部302により算出された圧縮率が所定の閾値より大きければ、診断対象の人物は認知症の疑いがあると判定し、当該圧縮率が所定の閾値より大きくなければ、診断対象の人物は認知症の疑いがないと判定する。ここで、判定部303は、圧縮率が大きくなるにつれて、値が増大するように認知症の度合いを算出してもよい。例えば、判定部303は、圧縮率が閾値以下であれば、認知症の疑いがないことを示す認知症度「0」を、認知症の度合いとして算出すればよい。また、判定部303は、圧縮率が閾値よりも大きい場合は、圧縮率が増大するにつれて、認知症度「1」、認知症度「2」というように、認知症の度合いを段階的に算出してもよい。そして、判定部303は、判定結果を示すデータを診断結果として生成する。ここで、閾値としては、例えば、多数の人物に対して実験を施すことにより得られた値であって、これ以上値が増大すると認知症の疑いがあること判断できる値が採用されればよい。

【0046】
通信部304は、診断サーバ300をネットワークに接続するための通信装置で構成され、音声認識サーバ200から送信されたテキストデータを受信すると共に、判定部303により生成された診断結果を携帯端末100に送信する。これを受信した携帯端末100は、タッチパネル102に診断結果を表示する。

【0047】
なお、図1において圧縮部301~判定部303は、例えば、CPUがプログラムを実行することで実現される。また、本実施の形態において、通信部304は、請求項の取得部に相当する。

【0048】
図3は、本発明の実施の形態1に係る診断装置1の処理の一例を示すフローチャートである。まず。携帯端末100は、診断対象となる人物(以下、「診断対象者」と記述する。)の音声を収音し、音声データを取得する(S101)。ここで、診断対象者は、例えば、携帯端末100のタッチパネル102に表示される、認知症の疑いを診断するための発話誘導メッセージにしたがって発話すればよい。或いは、診断対象者は、医師や看護師(以下、「医師等」と記述する。)との対話を通じて発話すればよい。

【0049】
次に、携帯端末100は、診断対象者が発話した音声データを音声認識サーバ200に送信する(S102)。

【0050】
次に、音声認識サーバ200は、音声データを受信する(S201)。次に、音声認識サーバ200は、受信した音声データを音声認識してテキストデータに変換する(S202)。次に、音声認識サーバ200は、変換したテキストデータを診断サーバ300に送信する(S203)。

【0051】
次に、診断サーバ300は、音声認識サーバ200から送信されたテキストデータを受信する(S301)。次に、診断サーバ300は、受信したテキストデータを圧縮し(S302)、圧縮率を算出する(S303)。

【0052】
次に、診断サーバ300は、圧縮率が閾値Xより大きいか否かを判定し、大きければ(S304でYES)、診断対象者は、認知症の疑いがあると判定し(S305)、圧縮率が閾値Xよりも大きくなければ(S304でNO)、診断対象者は認知症の疑いがないと判定する(S306)。次に、診断サーバ300は、診断結果を携帯端末100に送信する(S307)。

【0053】
次に、携帯端末100は、診断結果を受信し(S103)、受信した診断結果をタッチパネル102に表示する(S104)。これにより、診断対象者や医師等に認知症の診断結果が提示される。この場合、携帯端末100は、例えば、上述した認知症の度合いとその認知症の度合いの説明とを含むメッセージをタッチパネル102に表示すればよい。認知症の度合いの説明としては、例えば、認知症度が「0」であれば、「正常です。」といったメッセージが採用でき、認知症度が「1」であれば、「認知症の疑いがあります。」といったメッセージが採用でき、認知症度が「2」であれば、「認知症の疑いが高いです。」といったメッセージが採用できる。

【0054】
次に、本実施の形態の効果を確認するために行った実験について説明する。従来より、認知症患者の言語能力を測定する指標として種々の言語指標が使用されてきた。そこで、本実験では、これらの既存の言語指標に対して、本実施の形態の言語指標、すなわち、圧縮率を用いる言語指標が、どのくらい認知症を正確に診断できるかについて比較した。この実験では、認知症の疑いがあること(AD;Alzheimer’s disease)が事前に分かっている被験者8名と、認知症の疑いがないこと(nonAD)が事前に分かっている被験者9名とに対して、実験を行った。また、この実験では、被験者に対して質問を行い、13分~17分程度の発話をしてもらった。

【0055】
図4は、本実施の形態の実験で用いた言語指標を纏めた表である。図4において、「TOKEN」~「AWU」は言語指標として従来から用いられている指標であり、「TCR」は本実施の形態の言語指標である。

【0056】
詳細には、「TOKEN」は被験者が発話した単語数を示す。「TYPE」は被験者の発話に含まれる単語の種類数を示す。「TTR」は、「TOKEN」に対する「TYPE」の割合を示す。「TTR」が低いほど同じ単語を繰り返す回数が多くなり、認知症の疑いが高くなる。

【0057】
その他、詳細な説明は省くが、「TPS」(Token Per Second)は発話速度であり、「LEL」(Lexical Education Level)は語彙教育難易度であり、「ADD」(Average Dependency Distance)は平均化係り受け距離であり、「AWU」(Average Word User)は語彙平均使用者数である。

【0058】
「TCR」は、文章圧縮率(Text Compressibility Ratio)を示し、ここでは、使用する圧縮方式に応じて、ZIP、LZH等の添え字を付して表している。本実験では、圧縮方式として、ZIP、LZH、TARGZ、及びCABを採用したので、それぞれに対応するTCRをTCRZIP、TCRLZH、TCRTARGZ、及びTCRCABと表す。

【0059】
図5は、本実施の形態における実験結果を纏めた表である。図5の表51において、左から1列目は、使用した言語指標を示し、2列目のADは認知症の疑いのある被験者を示し、3列目の「nonAD」は認知症の疑いのない健康な被験者を示す。

【0060】
表51に示すように、「AD」の被験者は、「TIME」及び「TOKEN」とも「nonAD」の被験者の「13.27」及び「814」に比べ、「17.40」及び「1225」と大きい値が得られいる。また、「TTR」は「nonAD」の被験者の「0.313」に比べ、「0.249」と低く、「TOKEN」数の割りには「TYPE」数が少ないことが分かる。なお、表51において、括弧内の数値は分散を示している。

【0061】
表51において、4列目のp値(p value)は、「AD」と「nonAD」との群間差が偶然生じる可能性を示す統計的指標である。例えば、p値が0.01(p=0.01)ということは、該当する結果が偶然生じることが100回に1回しか生じないことを意味する。すなわち、p値がが小さくなるほど、それだけ群間差が有意であることを意味し、本実験では「AD」と「nonAD」との被験者を正確に判別できていることを意味する。一般的にp値が0.05を下回ると、群間差は有意である解釈されている。

【0062】
図5の表52は、被験者の内訳を纏めた表であり、1列目は「AD」の被験者を示し、2列目は「nonAD」の被験者を示している。表52において、「AD」の被験者は、男性が1名、女性が7名であり、平均年齢が「77.2歳」であり、MMSEスコアの平均値が「17.0」である。MMSEスコアとは認知症診断テストにおける被験者のスコアを示し、21を超えると「nonAD」、21以下であると「AD」と診断される。

【0063】
また、表52において、「nonAD」の被験者は、男性が4名、女性が5名であり、平均年齢が「76.6歳」であり、MMSEスコアの平均値が「25.1」であった。

【0064】
表51に示すように、TCRZIP、TCRLZH、TCRTARGZ、TCRCABは、それぞれ、p値が「0.054」、「0.015」、「0.060」、「0.029」であり、TCRTARGZ以外は全てp値が0.05を下回っており、「AD」と「nonAD」との被験者を正確に判別できていることが分かる。また、TCRTARGZはp値が0.05を超えているというものの、その超過量はわずかであり、ほぼ正確に「AD」と「nonAD」とを判別できていると言える。

【0065】
また、従来より、認知症を診断するうえで有用な言語指標として使用されていた「TTR」のp値は「0.02」であり、有意な結果を示している。しかし、TTRは、サンプルサイズに大きく依存することが知られており、サンプルサイズが小さい場合、本実験のような高いp値を得ることが困難になる。

【0066】
以上、診断装置1は、圧縮率を用いて認知症が診断されているので、言語に依存することなく正確に認知症の有無を診断することができる。また、診断装置1は、発話の言語的な意味内容に依存しない手法なので、サンプル数が少ない場合であっても、TTRのようにp値が大きくなり、診断精度が低下することもない。

【0067】
(実施の形態2)
実施の形態2の診断装置は、ネットワークを介することなくローカルのコンピュータで診断装置を構成したことを特徴とする。図6は、本発明の実施の形態2に係る診断装置1Aの全体構成を示すブロック図である。本実施の形態において、実施の形態1と同一構成のものには同一の符号を付し、説明を省く。

【0068】
診断装置1Aは、収音部410、処理部420、及び表示部412を備える。収音部410は、例えば、診断装置1Aを構成するコンピュータに外部接続されたICレコーダ、或いは、このコンピュータが内臓するマイクで構成され、人物の音声を収音する。

【0069】
処理部420及び表示部412は、診断装置1Aを構成するパーソナルコンピュータ(PC)で構成されている。このPCはデスクトップ型PC或いはノートブック型PCの何れでも良い。

【0070】
処理部420は、取得部421、音声認識部422、圧縮部423、圧縮率算出部424、及び判定部425を備える。これらのブロックは、CPUがコンピュータを診断装置1Aとして機能させるための診断プログラムを実行することによって実現される。

【0071】
取得部421は、収音部410が収音した音声データを取得する。音声認識部422、圧縮部423、圧縮率算出部424、及び判定部425は、図1の音声認識部201、圧縮部301、圧縮率算出部302、及び判定部303と同一の機能を持つので、詳細な説明は省く。

【0072】
表示部412は、液晶ディスプレイや有機ELディスプレイといった表示装置で構成され、図1に示すタッチパネル102と同一内容の画面を表示する。

【0073】
図7は、本発明の実施の形態2に係る診断装置1Aの処理の一例を示すフローチャートである。まず、収音部410は、診断対象者の音声を収音し、音声データを取得する(S801)。次に、音声認識部422は、取得された音声データを音声認識することでテキストデータに変換する(S802)。

【0074】
S803~S807の処理は、それぞれ、図3のS302~S306と同じである。S808では、判定部425は、診断結果を表示部412に表示させる。

【0075】
このように実施の形態2に係る診断装置1Aによれば、ローカルのコンピュータで構成されているので、ネットワークの通信トラフィックに依存することなく速やかに診断結果を得ることができる。

【0076】
(実施の形態3)
実施の形態3の診断装置は、実施の形態1の診断装置1において、収音部をICレコーダで構成したことを特徴とする。図8は、本発明の実施の形態3に係る診断装置1Bの全体構成を示す図である。本実施の形態において、実施の形態1,2と同一構成のものには同一の符号を付し、説明を省く。

【0077】
診断装置1Bにおいて、診断装置1との相違点は、携帯端末100に代えて、PC(パーソナルコンピュータ)920が用いられる点、収音部101に代えてICレコーダ940が用いられている点にある。

【0078】
PC920は、デスクトップ型PC、或いはノートブック型PCで構成され、表示部921、通信部922、及びUSBインターフェース923を備える。

【0079】
表示部921は、液晶ディスプレイや有機ELディスプレイといった表示装置で構成され、図1に示すタッチパネル102と同一内容の画面を表示する。

【0080】
通信部922は、PC920をネットワークNTに接続するための通信装置で構成される。USBインターフェース923は、USBメモリ930から音声データを取得する。ICレコーダ940は、図1に示す収音部101と同様、診断対象者が発話する音声を収音することで音声データを取得し、USBメモリ930に記録する。

【0081】
図9は、本発明の実施の形態3に係る診断装置1Bの処理の一例を示すフローチャートである。まず、S901では、PC920は、USBメモリ930からICレコーダ940が収音した診断対象者の音声データを読み出し、音声データを取得する。以後、図9においては図3と同様の処理が行われる。すなわち、図9のS902~S904では、図3のS102~S104と同じ処理が行われ、図9のS911~S913では、図3のS201~S203と同じ処理が行われ、図9の921~S927では、図3のS301~S307と同じ処理が行われる。

【0082】
このように実施の形態3に係る診断装置1Bによれば、外部接続されるICレコーダ940が用いられているので、診断対象者の口元にICレコーダ940を配置することが可能となり、診断対象者の発話内容を正確に収音できる。

【0083】
(実施の形態4)
実施の形態4に係る診断装置は、音声認識を行わずにテキストデータを用いて認知症を診断することを特徴とする。図10は、本発明の実施の形態4に係る診断装置1Cの全体構成を示すブロック図である。本実施の形態において、実施の形態1~3と同一構成のものには同一の符号を付し、説明を省く。

【0084】
診断装置1Cにおいて、診断装置1Bとの相違点は、スキャナ910が新たに設けられている点、USBメモリ930、ICレコーダ940、及び音声認識サーバ200が省かれている点にある。

【0085】
スキャナ910は、診断対象者の発話内容を書き起こした文書、或いは診断対象者が書いた文書を光学的に読み取り、読み取った文書に対してテキスト認識処理を行い、テキストデータを生成し、PC920に出力する。ここで、診断対象者の発話内容を書き起こした文書としては、例えば、診断対象者が医師等との対話或いは表示部921に表示されたメッセージを通じて発話した内容を医師等が紙に書き起こした文書が採用されればよい。

【0086】
また、診断対象者が書いた文書としては、例えば、表示部921に表示されたメッセージ或いは医師等との対話を通じて診断対象者が直接紙に書いた文書が採用されればよい。

【0087】
USBインターフェース923は、スキャナ910が生成したテキストデータを取得する。

【0088】
図11は、本発明の実施の形態4に係る診断装置1Cの処理の一例を示すフローチャートである。まず、S1101では、PC920は、スキャナ910からテキストデータを取得する。次に、通信部922は、取得したテキストデータをネットワークNTを介して診断サーバ300に送信する(S1102)。図11のS1111~S1117の処理は、図3のS301~S307の処理と同じであり、図11のS1103,S1104の処理は、図3のS103,S104の処理と同じである。

【0089】
以上、実施の形態4に係る診断装置1Cでは、スキャナ910を用いてテキストデータが取得されているので、音声認識をすることなくテキストデータを取得することができ、システム全体の処理の負担を低減できる。
【符号の説明】
【0090】
X 閾値
1,1A,1B,1C 診断装置
100 携帯端末
101,410 収音部
102 タッチパネル
103 制御部
104,202,304,922 通信部
200 音声認識サーバ
201,422 音声認識部
300 診断サーバ
301,423 圧縮部
302,424 圧縮率算出部
303 判定部
412 表示部
420 処理部
421 取得部
425 判定部
910 スキャナ
920 PC
921 表示部
923 USBインターフェース
930 USBメモリ
940 ICレコーダ
図面
【図1】
0
【図2】
1
【図3】
2
【図4】
3
【図5】
4
【図6】
5
【図7】
6
【図8】
7
【図9】
8
【図10】
9
【図11】
10