LINK AUTHORITY DETERMINATION METHOD, DEVICE, AND PROGRAM
Patent code | P06P004585 |
---|---|
File No. | T41 |
Posted date | Mar 23, 2007 |
Application number | P2005-240254 |
Publication number | P2007-058335A |
Patent number | P4496370 |
Date of filing | Aug 22, 2005 |
Date of publication of application | Mar 8, 2007 |
Date of registration | Apr 23, 2010 |
Inventor |
|
Applicant |
|
Title |
LINK AUTHORITY DETERMINATION METHOD, DEVICE, AND PROGRAM
|
Abstract |
PROBLEM TO BE SOLVED: To provide a link authority determination device capable of determining proper link authority in a shorter period of time and with a less labor as much as possible. SOLUTION: A link authority candidate determining means 5 decides a plurality of Web pages satisfying predetermined conditions as link authority candidates from among a plurality of Web pages collected by a Web page collecting means 3. A ranking means 17 of a link authority determining means 13 ranks candidate Web pages in the order of the Web page with the small percentage of link shortage. A final determination means 19 determines one or more Web pages positioned in the high order rank as link authority from the result of ranking by the ranking means 17. |
Outline of related art and contending technology |
(In Japanese) 近年、World Wide Web(以下Web)は、社会における重要なメディアの一つである。そしてWebの特徴の一つに、分散管理が挙げられる。即ち、Webコンテンツは多くの組織・個人により独立して追加・削除・更新が行われている。この特徴はWebを便利なツールとする一方で、Webコンテンツの一貫性の維持を困難としている要因でもある。コンテンツの一貫性が損なわれる一例として、Webページのリンク切れがある。そこで従来から、リンク切れが発生したときに代わりとなるリンク候補を探す技術が種々提案されている。例えば、特開平09-081446号公報「ハイパーテキストシステム」(特許文献1)には、リンク切れが起こった場合に、代わりとなるリンク先ページ候補を探すことが記載されている。この公報に記載の技術では、代わりとなるリンク先ページの発見に、アドレス(URL)の情報とWebページの内容のみを利用している。また特開平11-039327号公報「リンク情報自動修復方法および装置」(特許文献2)には、リンク切れが起こった場合に,代わりとなるリンク先ページ候補を探すために、「同じノード(ページのこと)」を探すことが記載されている。さらに、特開2001-273185号公報「ホームページアドレス登録装置及びホームページアドレス登録処理プログラムを記憶した記憶媒体」(特許文献3)には、リンク切れが起こった場合に、代わりとなるリンク先Webページ候補を探すために、Webページの内容のみを利用する技術が開示されている。 これらの技術では、リンク先ページの探索精度が必ずしも高くない。そこで本出願の発明者等は、Webのリンク切れを発見すると、変更先と考えられるリンクの候補を自動的に発見しリンクの訂正を試みるシステムの開発を行い、実験を行ってきた(非特許文献1:中溝昌佳、森嶋厚行、杉本重雄及び北川博之著「WWWリンク一貫性維持支援システムにおけるリンク切れ自動修復」日本データベース学会Letters、Vol.3、No.2、2004年12月。非特許文献2:中溝昌佳、森嶋厚行、有山智洋、杉本重雄及び北川博之著「WWWコンテンツ一貫性維持のためのリンク更新機構の提案」日本データベース学会Letters、Vol.2、No.2、65頁-68頁、2003年10月)。このシステムでは、Webのリンク切れはページの移動に伴って生じたものであると仮定し移動先の探索を行う。 そして発明者等は、信頼できるリンクを含むページである「リンクオーソリティ(Link Authority)」を求めるための仕組みと、それを実装したLAサーバ(Link Authority Server)を提案し、LAサーバを利用することによりWebページの移動先を効率よく発見できる可能性があることを指摘した(非特許文献3:中溝昌佳、森嶋厚行、杉本重雄及び北川博之著「WWWにおける信頼度の高いリンクの発見」情報処理学会研究報告、Vol.2004、No.72(2004-DBS-134(II)、397頁-402頁。非特許文献4:中溝昌佳、森嶋厚行、杉本重雄及び北川博之著「WWWにおける信頼度の高いリンクの発見」電子情報通信学会技術研究報告、Vol.104、No.177(DE2004-63)、87頁-92頁、2004年7月)。 ここで発明者等が定義したWebページのリンクオーソリティとは、Webページが移動したときに、全Webページ中で十分に大きな確率でリンクが更新されるページを意味する。直観的には、リンクオーソリティとは、「リンク先の内容が変化したときに、全Webページ中で十分大きな確率でリンクが更新されるページ」のことである(GoogleなどにおけるAuthorityページとは異なる観念である)。なおここで全Webページとは、システムにおいて利用可能なWebページの全てという意味である。 例えば、図1に示す例で説明すると、ある大学Aの研究室のWebページu1(m.l.s.ac.jp)が存在し、このページは複数のページからリンクされているものとする。このうちWebページv1(l.s.ac.jp)はその研究室が所属する学科の研究室一覧ページである。このとき、一般には、Webページv1はWebページu1に関するリンクオーソリティである。したがって、Webページu1がWebページu2(m.org)に移動したとき、Webページu1へリンクしているページはリンク切れを起こすが、Webページv1はWebページu1へのリンクをWebページu2に貼り換えるはずである。そこで発明者等は、あるWebページvは次の2つの条件を満たすとき、別のWebページuのリンクオーソリティとなるものと定義した。(1)WebページvがWebページuへのリンクを持っており、且つ(2)Webページuが別のWebページunewに移動すると、Webページv中のWebページuへのリンクがWebページunewへのリンクに確実に変更されることが強く期待される。 あるWebページ中に含まれるWebページuへのリンクがリンク切れになった場合に、もしWebページuのリンクオーソリティとなるWebページvを知っていれば、Webページvを見ることにより新たなリンク先unewを知ることができ、リンク先の修正が可能になる。したがってリンク先の修正をするためには、リンクオーソリティを高い精度で決定することが必要となる。 |
Field of industrial application |
(In Japanese) 本発明は、Webページのリンク切れを自動的に修正するために用いられるリンクオーソリティを決定するために用いられるリンクオーソリティ決定方法及び装置並びにプログラムに関するものである。 |
Scope of claims |
(In Japanese) 【請求項1】 コンピュータが、 監視対象とするURLへのリンクを持つ複数のWebページを収集する収集ステップと、 前記複数のWebページの中から予め定めた条件を満たす複数のWebページをリンクオーソリティ候補として定めるリンクオーソリティ候補決定ステップと、 前記リンクオーソリティ候補に含まれる前記複数のWebページの中からリンク切れを修正するために利用可能なリンクオーソリティを決定するリンクオーソリティ決定ステップを実行し、 前記リンクオーソリティ候補決定ステップでは、予めリンクオーソリティとなり得るWebページが有する複数の属性を定めて、前記複数の属性を基準にして前記複数のWebページをリンクオーソリティとして利用可能性が高いと推測される順にランキングを行い、前記ランキングの結果から上位のランクにある複数のWebページを前記リンクオーソリティ候補として定め、 前記リンクオーソリティ決定ステップでは、前記上位のランクにある複数のWebページのそれぞれについて、各Webページについてのリンク切れのリンクの数またはリンク切れではないリンクの数を求め、この数と前記各Webページにあるリンクの数とに基づいてリンク切れの割合が少ない順にランキングを行い、前記ランキングの結果から上位のランクにある1以上のWebページを前記リンクオーソリティとして決定するリンクオーソリティの決定方法であって、 前記複数の属性には二つのWebページ間に直接的若しくは間接的な相互リンクが存在しているという相互リンクの属性が含まれており、 前記間接的な相互リンクが存在しているか否かの探索では、前記二つのWebページの一方のWebページだけの探索を行って、前記一方のWebページ中のいずれかのページに対するリンクがあれば、前記二つのWebページ間には前記間接的な相互リンクが存在するものとみなすことを特徴とするリンクオーソリティの決定方法。 【請求項2】 前記リンクオーソリティ決定ステップでは、前記リンクの数と前記リンク切れではないリンクの数の割合を反映した値をキーとして前記ランキングを行うことを特徴とする請求項1に記載のリンクオーソリティの決定方法。 【請求項3】 前記リンクの数と前記リンク切れではないリンクの数の割合の相乗平均を前記キーとすることを特徴とする請求項2に記載のリンクオーソリティの決定方法。 【請求項4】 監視対象とするURLへのリンクを持つ複数のWebページを収集する収集機能と、 前記複数のWebページの中から予め定めた条件を満たす複数のWebページをリンクオーソリティ候補として定めるリンクオーソリティ候補決定機能と、 前記リンクオーソリティ候補に含まれる前記複数のWebページの中からリンク切れを修正するために利用可能なリンクオーソリティを決定するリンクオーソリティ決定機能とをコンピュータに実現させるためのプログラムであって、 前記リンクオーソリティ候補決定機能は、予め定めたリンクオーソリティとなり得るWebページが有する複数の属性を基準にして、前記複数のWebページをリンクオーソリティとして利用可能性が高いと推測される順にランキングを行う機能と、前記ランキングの結果から上位のランクにある複数のWebページを前記リンクオーソリティ候補として定める機能を含み、 前記リンクオーソリティ決定機能は、前記上位のランクにある複数のWebページのそれぞれについて、各Webページについてのリンク切れのリンクの数またはリンク切れではないリンクの数を求める機能と、この数と前記各Webページにあるリンクの数とに基づいてリンク切れの割合が少ない順にランキングを行う機能と、前記ランキングの結果から上位のランクにある1以上のWebページを前記リンクオーソリティとして決定する機能とを含み、 前記複数の属性には二つのWebページ間に直接的若しくは間接的な相互リンクが存在しているという相互リンクの属性が含まれており、 前記間接的な相互リンクが存在しているか否かの探索では、前記二つのWebページの一方のWebページだけの探索を行って、前記一方のWebページ中のいずれかのページに対するリンクがあれば、前記二つのWebページ間には前記間接的な相互リンクが存在するものとみなすことを特徴とするプログラム。 【請求項5】 前記リンクオーソリティ決定機能に含まれる前記ランキングを行う機能は、前記リンクの数と前記リンク切れではないリンクの数の割合を反映した値をキーとして前記ランキングを行うことを特徴とする請求項4に記載のプログラム。 【請求項6】 監視対象とするURLへのリンクを持つ複数のWebページを収集する収集手段と、 前記複数のWebページの中から予め定めた条件を満たす複数のWebページをリンクオーソリティ候補として定めるリンクオーソリティ候補決定手段と、 前記リンクオーソリティ候補に含まれる前記複数のWebページの中からリンク切れを修正するために利用可能なリンクオーソリティを決定するリンクオーソリティ決定手段とを備えて、 前記リンクオーソリティ候補決定手段は、予め定めたリンクオーソリティとなり得るWebページが有する複数の属性を記憶する属性記憶手段と、前記属性記憶手段に記憶された前記複数の属性を基準にして、前記複数のWebページをリンクオーソリティとして利用可能性が高いと推測される順にランキングを行うランキング手段と、前記ランキング手段によるランキングの結果から上位のランクにある複数のWebページを前記リンクオーソリティ候補として定める候補決定手段を含み、 前記リンクオーソリティ決定手段は、前記上位のランクにある複数のWebページのそれぞれについて、リンク切れのリンクの数またはリンク切れではないリンクの数を求める検索手段と、前記検索手段により求めた数と前記各Webページにあるリンクの数とに基づいてリンク切れの割合が少ない順にランキングを行うランキング手段と、前記ランキング手段によるランキングの結果から上位のランクにある1以上のWebページを前記リンクオーソリティとして決定する最終決定手段とを含むリンクオーソリティ決定装置であって、 前記リンクオーソリティ候補決定手段の前記属性記憶手段に記憶されている前記複数の属性には、二つのWebページ間に直接的若しくは間接的な相互リンクが存在しているという相互リンクの属性が含まれており、前記リンクオーソリティ候補決定手段は、前記二つのWebページの一方のWebページだけの探索を行って、前記一方のWebページ中のいずれかのページに対するリンクがあれば、前記二つのWebページ間には前記間接的な相互リンクが存在するものとみなすことを特徴とするリンクオーソリティ決定装置。 【請求項7】 前記ランキング手段は、前記リンクの数と前記リンク切れではないリンクの数の割合を反映する値をキーとして前記ランキングを行うことを特徴とする請求項6に記載のリンクオーソリティ決定装置。 |
IPC(International Patent Classification) | |
F-term |
|
Drawing
※Click image to enlarge. |
|
State of application right | Registered |
Contact Information for " LINK AUTHORITY DETERMINATION METHOD, DEVICE, AND PROGRAM"
- University of Tsukuba Department of Collaborative Research
- URL: https://www.sanrenhonbu.tsukuba.ac.jp/
-
E-mail:
- Address: 1-2,Kasuga ,City of Tsukuba ,Ibaraki ,Japan , 305-8550
- Fax: 81-29-859-1693