TOP > 国内特許検索 > リンクオーソリティ決定方法及び装置並びにプログラム

リンクオーソリティ決定方法及び装置並びにプログラム コモンズ

国内特許コード P06P004585
整理番号 T41
掲載日 2007年3月23日
出願番号 特願2005-240254
公開番号 特開2007-058335
登録番号 特許第4496370号
出願日 平成17年8月22日(2005.8.22)
公開日 平成19年3月8日(2007.3.8)
登録日 平成22年4月23日(2010.4.23)
発明者
  • 森嶋 厚行
  • 飯田 敏成
  • 杉本 重雄
  • 北川 博之
  • 中溝 昌佳
出願人
  • 学校法人筑波大学
発明の名称 リンクオーソリティ決定方法及び装置並びにプログラム コモンズ
発明の概要

【課題】 できるだけ短い時間でしかも少ない労力で、適正なリンクオーソリティを決定できるリンクオーソリティの決定装置を提供する。
【解決手段】 リンクオーソリティ候補決定手段5は、Webページ収集手段3で収集した複数のWebページの中から予め定めた条件を満たす複数のWebページをリンクオーソリティ候補として定める。リンクオーソリティ決定手段13のランキング手段17は、候補となるWebページのリンクについてのリンク切れの割合が少ない順にランキングを行う。最終決定手段19は、ランキング手段17によるランキングの結果から上位のランクにある1以上のWebページをリンクオーソリティとして決定する。
【選択図】 図5

従来技術、競合技術の概要


近年、World Wide Web(以下Web)は、社会における重要なメディアの一つである。そしてWebの特徴の一つに、分散管理が挙げられる。即ち、Webコンテンツは多くの組織・個人により独立して追加・削除・更新が行われている。この特徴はWebを便利なツールとする一方で、Webコンテンツの一貫性の維持を困難としている要因でもある。コンテンツの一貫性が損なわれる一例として、Webページのリンク切れがある。そこで従来から、リンク切れが発生したときに代わりとなるリンク候補を探す技術が種々提案されている。例えば、特開平09-081446号公報「ハイパーテキストシステム」(特許文献1)には、リンク切れが起こった場合に、代わりとなるリンク先ページ候補を探すことが記載されている。この公報に記載の技術では、代わりとなるリンク先ページの発見に、アドレス(URL)の情報とWebページの内容のみを利用している。また特開平11-039327号公報「リンク情報自動修復方法および装置」(特許文献2)には、リンク切れが起こった場合に,代わりとなるリンク先ページ候補を探すために、「同じノード(ページのこと)」を探すことが記載されている。さらに、特開2001-273185号公報「ホームページアドレス登録装置及びホームページアドレス登録処理プログラムを記憶した記憶媒体」(特許文献3)には、リンク切れが起こった場合に、代わりとなるリンク先Webページ候補を探すために、Webページの内容のみを利用する技術が開示されている。



これらの技術では、リンク先ページの探索精度が必ずしも高くない。そこで本出願の発明者等は、Webのリンク切れを発見すると、変更先と考えられるリンクの候補を自動的に発見しリンクの訂正を試みるシステムの開発を行い、実験を行ってきた(非特許文献1:中溝昌佳、森嶋厚行、杉本重雄及び北川博之著「WWWリンク一貫性維持支援システムにおけるリンク切れ自動修復」日本データベース学会Letters、Vol.3、No.2、2004年12月。非特許文献2:中溝昌佳、森嶋厚行、有山智洋、杉本重雄及び北川博之著「WWWコンテンツ一貫性維持のためのリンク更新機構の提案」日本データベース学会Letters、Vol.2、No.2、65頁-68頁、2003年10月)。このシステムでは、Webのリンク切れはページの移動に伴って生じたものであると仮定し移動先の探索を行う。



そして発明者等は、信頼できるリンクを含むページである「リンクオーソリティ(Link Authority)」を求めるための仕組みと、それを実装したLAサーバ(Link Authority Server)を提案し、LAサーバを利用することによりWebページの移動先を効率よく発見できる可能性があることを指摘した(非特許文献3:中溝昌佳、森嶋厚行、杉本重雄及び北川博之著「WWWにおける信頼度の高いリンクの発見」情報処理学会研究報告、Vol.2004、No.72(2004-DBS-134(II)、397頁-402頁。非特許文献4:中溝昌佳、森嶋厚行、杉本重雄及び北川博之著「WWWにおける信頼度の高いリンクの発見」電子情報通信学会技術研究報告、Vol.104、No.177(DE2004-63)、87頁-92頁、2004年7月)。



ここで発明者等が定義したWebページのリンクオーソリティとは、Webページが移動したときに、全Webページ中で十分に大きな確率でリンクが更新されるページを意味する。直観的には、リンクオーソリティとは、「リンク先の内容が変化したときに、全Webページ中で十分大きな確率でリンクが更新されるページ」のことである(GoogleなどにおけるAuthorityページとは異なる観念である)。なおここで全Webページとは、システムにおいて利用可能なWebページの全てという意味である。



例えば、図1に示す例で説明すると、ある大学Aの研究室のWebページu(m.l.s.ac.jp)が存在し、このページは複数のページからリンクされているものとする。このうちWebページv(l.s.ac.jp)はその研究室が所属する学科の研究室一覧ページである。このとき、一般には、WebページvはWebページuに関するリンクオーソリティである。したがって、WebページuがWebページu(m.org)に移動したとき、Webページuへリンクしているページはリンク切れを起こすが、WebページvはWebページuへのリンクをWebページuに貼り換えるはずである。そこで発明者等は、あるWebページvは次の2つの条件を満たすとき、別のWebページuのリンクオーソリティとなるものと定義した。(1)WebページvがWebページuへのリンクを持っており、且つ(2)Webページuが別のWebページunewに移動すると、Webページv中のWebページuへのリンクがWebページunewへのリンクに確実に変更されることが強く期待される。



あるWebページ中に含まれるWebページuへのリンクがリンク切れになった場合に、もしWebページuのリンクオーソリティとなるWebページvを知っていれば、Webページvを見ることにより新たなリンク先unewを知ることができ、リンク先の修正が可能になる。したがってリンク先の修正をするためには、リンクオーソリティを高い精度で決定することが必要となる。

【特許文献1】特開平09-081446号公報

【特許文献2】特開平11-039327号公報

【特許文献3】特開2001-273185号公報

【非特許文献1】中溝昌佳、森嶋厚行、杉本重雄及び北川博之著「WWWリンク一貫性維持支援システムにおけるリンク切れ自動修復」日本データベース学会Letters、Vol.3、No.2、2004年12月

【非特許文献2】中溝昌佳、森嶋厚行、有山智洋、杉本重雄及び北川博之著「WWWコンテンツ一貫性維持のためのリンク更新機構の提案」日本データベース学会Letters、Vol.2、No.2、65頁-68頁、2003年10月

【非特許文献3】中溝昌佳、森嶋厚行、杉本重雄及び北川博之著「WWWにおける信頼度の高いリンクの発見」情報処理学会研究報告、Vol.2004、No.72(2004-DBS-134(II)、397頁-402頁

【非特許文献4】中溝昌佳、森嶋厚行、杉本重雄及び北川博之著「WWWにおける信頼度の高いリンクの発見」電子情報通信学会技術研究報告、Vol.104、No.177(DE2004-63)、87頁-92頁、2004年7月

産業上の利用分野


本発明は、Webページのリンク切れを自動的に修正するために用いられるリンクオーソリティを決定するために用いられるリンクオーソリティ決定方法及び装置並びにプログラムに関するものである。

特許請求の範囲 【請求項1】
コンピュータが、
監視対象とするURLへのリンクを持つ複数のWebページを収集する収集ステップと、
前記複数のWebページの中から予め定めた条件を満たす複数のWebページをリンクオーソリティ候補として定めるリンクオーソリティ候補決定ステップと、
前記リンクオーソリティ候補に含まれる前記複数のWebページの中からリンク切れを修正するために利用可能なリンクオーソリティを決定するリンクオーソリティ決定ステップを実行し、
前記リンクオーソリティ候補決定ステップでは、予めリンクオーソリティとなり得るWebページが有する複数の属性を定めて、前記複数の属性を基準にして前記複数のWebページをリンクオーソリティとして利用可能性が高いと推測される順にランキングを行い、前記ランキングの結果から上位のランクにある複数のWebページを前記リンクオーソリティ候補として定め、
前記リンクオーソリティ決定ステップでは、前記上位のランクにある複数のWebページのそれぞれについて、各Webページについてのリンク切れのリンクの数またはリンク切れではないリンクの数を求め、この数と前記各Webページにあるリンクの数とに基づいてリンク切れの割合が少ない順にランキングを行い、前記ランキングの結果から上位のランクにある1以上のWebページを前記リンクオーソリティとして決定するリンクオーソリティの決定方法であって、
前記複数の属性には二つのWebページ間に直接的若しくは間接的な相互リンクが存在しているという相互リンクの属性が含まれており、
前記間接的な相互リンクが存在しているか否かの探索では、前記二つのWebページの一方のWebページだけの探索を行って、前記一方のWebページ中のいずれかのページに対するリンクがあれば、前記二つのWebページ間には前記間接的な相互リンクが存在するものとみなすことを特徴とするリンクオーソリティの決定方法。

【請求項2】
前記リンクオーソリティ決定ステップでは、前記リンクの数と前記リンク切れではないリンクの数の割合を反映した値をキーとして前記ランキングを行うことを特徴とする請求項1に記載のリンクオーソリティの決定方法。

【請求項3】
前記リンクの数と前記リンク切れではないリンクの数の割合の相乗平均を前記キーとすることを特徴とする請求項2に記載のリンクオーソリティの決定方法。

【請求項4】
監視対象とするURLへのリンクを持つ複数のWebページを収集する収集機能と、
前記複数のWebページの中から予め定めた条件を満たす複数のWebページをリンクオーソリティ候補として定めるリンクオーソリティ候補決定機能と、
前記リンクオーソリティ候補に含まれる前記複数のWebページの中からリンク切れを修正するために利用可能なリンクオーソリティを決定するリンクオーソリティ決定機能とをコンピュータに実現させるためのプログラムであって、
前記リンクオーソリティ候補決定機能は、予め定めたリンクオーソリティとなり得るWebページが有する複数の属性を基準にして、前記複数のWebページをリンクオーソリティとして利用可能性が高いと推測される順にランキングを行う機能と、前記ランキングの結果から上位のランクにある複数のWebページを前記リンクオーソリティ候補として定める機能を含み、
前記リンクオーソリティ決定機能は、前記上位のランクにある複数のWebページのそれぞれについて、各Webページについてのリンク切れのリンクの数またはリンク切れではないリンクの数を求める機能と、この数と前記各Webページにあるリンクの数とに基づいてリンク切れの割合が少ない順にランキングを行う機能と、前記ランキングの結果から上位のランクにある1以上のWebページを前記リンクオーソリティとして決定する機能とを含み、
前記複数の属性には二つのWebページ間に直接的若しくは間接的な相互リンクが存在しているという相互リンクの属性が含まれており、
前記間接的な相互リンクが存在しているか否かの探索では、前記二つのWebページの一方のWebページだけの探索を行って、前記一方のWebページ中のいずれかのページに対するリンクがあれば、前記二つのWebページ間には前記間接的な相互リンクが存在するものとみなすことを特徴とするプログラム。

【請求項5】
前記リンクオーソリティ決定機能に含まれる前記ランキングを行う機能は、前記リンクの数と前記リンク切れではないリンクの数の割合を反映した値をキーとして前記ランキングを行うことを特徴とする請求項4に記載のプログラム。

【請求項6】
監視対象とするURLへのリンクを持つ複数のWebページを収集する収集手段と、
前記複数のWebページの中から予め定めた条件を満たす複数のWebページをリンクオーソリティ候補として定めるリンクオーソリティ候補決定手段と、
前記リンクオーソリティ候補に含まれる前記複数のWebページの中からリンク切れを修正するために利用可能なリンクオーソリティを決定するリンクオーソリティ決定手段とを備えて、
前記リンクオーソリティ候補決定手段は、予め定めたリンクオーソリティとなり得るWebページが有する複数の属性を記憶する属性記憶手段と、前記属性記憶手段に記憶された前記複数の属性を基準にして、前記複数のWebページをリンクオーソリティとして利用可能性が高いと推測される順にランキングを行うランキング手段と、前記ランキング手段によるランキングの結果から上位のランクにある複数のWebページを前記リンクオーソリティ候補として定める候補決定手段を含み、
前記リンクオーソリティ決定手段は、前記上位のランクにある複数のWebページのそれぞれについて、リンク切れのリンクの数またはリンク切れではないリンクの数を求める検索手段と、前記検索手段により求めた数と前記各Webページにあるリンクの数とに基づいてリンク切れの割合が少ない順にランキングを行うランキング手段と、前記ランキング手段によるランキングの結果から上位のランクにある1以上のWebページを前記リンクオーソリティとして決定する最終決定手段とを含むリンクオーソリティ決定装置であって、
前記リンクオーソリティ候補決定手段の前記属性記憶手段に記憶されている前記複数の属性には、二つのWebページ間に直接的若しくは間接的な相互リンクが存在しているという相互リンクの属性が含まれており、前記リンクオーソリティ候補決定手段は、前記二つのWebページの一方のWebページだけの探索を行って、前記一方のWebページ中のいずれかのページに対するリンクがあれば、前記二つのWebページ間には前記間接的な相互リンクが存在するものとみなすことを特徴とするリンクオーソリティ決定装置。

【請求項7】
前記ランキング手段は、前記リンクの数と前記リンク切れではないリンクの数の割合を反映する値をキーとして前記ランキングを行うことを特徴とする請求項6に記載のリンクオーソリティ決定装置。
産業区分
  • 記憶装置
  • 工業用ロボット
  • 計算機応用
国際特許分類(IPC)
Fターム
画像

※ 画像をクリックすると拡大します。

JP2005240254thum.jpg
出願権利状態 権利存続中
この特許について質問等ある場合は、電子メールによりご連絡ください。


PAGE TOP

close
close
close
close
close
close
close