TOP > 研究報告検索 > Webにおけるコミュニティの発見(Webにおけるコミュニティの発見)

Webにおけるコミュニティの発見(Webにおけるコミュニティの発見)

研究報告コード R070000235
整理番号 R070000235
掲載日 2008年4月11日
研究者
  • 村田 剛志
研究者所属機関
  • 国立情報学研究所
研究機関
  • 国立情報学研究所
報告名称 Webにおけるコミュニティの発見(Webにおけるコミュニティの発見)
報告概要 世界のWebぺ一ジの総数は2004年10月現在、およそ42億ページと推定されており、日々々増加し続けている。この膨大なWeb情報を有効活用するための研究は情報化社会における急務である。Webからの知識発見(Web Mining)の研究は大きく分けて、(1)Web content mining(Webページ上の文書コンテンツの検索)(2)Web structure mining(ハイパーリンクのグラフ構造の分析)(3)Web usage mining(ユーザの閲覧で生じるログデータ等の分析)の3つに分類できる。(1)や(3)のアプローチは従来からのデータベースや情報検索技術を用いた研究が盛んに行なわれているのに対し、(2)のアプローチは比較的新しいものである。(2)のWeb structure miningの代表的な研究としては、HITSアルゴリズム[Kleinberg 99]や、trawling[Kumar 99]、PageRankアルゴリズム[Page 98]などがあり、特定のトピックに関する有用なページを見出したり、ページの重要度のランキングを行なったりするものである。Webにおけるハイパーリンクの構造については、巨視的には蝶ネクタイ構造であるとの主張がBroderらによってなされており、また微視的には関連ページ集合が2部グラフを構成することがKumarらによって指摘されている。しかし、両者の問の中間的な構造については解明されておらず、そのモデル化を行なうことは極めて新奇性のある研究テーマである。ハイパーリンクによるグラフ構造を明らかにすることの意義として、Broderらは以下の5つをあげている[Bmder 00]。(1)ロボットがWebベージを収集する際の戦略決定(2)Webコンテンツ生成における社会学の理解(3)リンク情報を用いるWebアルゴリズムの振舞いの分析(4)Web構造の発展の予測とそれを発見するアルゴリズムの開発(5)Webグラフでの重要な新現象の出現の予測。Web structure minlngの研究は、(1)や(3)のような工学的な意味においても、また(2)や(5)のような社会学的な意味においても重要なものであると考えられる。本研究提案者はハイパーリンクのグラフ構造に基づいて、興味を共有するWebページ集合であるWebコミュニティを発見および視覚化するシステムを構築しており、本研究課題ではその成果をさらに発展させる形で、以下の三つの研究項目について取り組む。Webbコミュニティのモデル化:Webコミュニティに対応するハイパーリンクのグラフ構造をモデル化し、Webコミュニティの動的変化の検川や、複数コミュニティ間の関連性の発見を行なうシステムを構築する。Web視聴率からのユーザコミュニティの発見:Web視聴率データを基に、各ユーザのアクセスパターンを明らかにする手法について考察し、そのパターンから類似した興味をもつユーザコミュニティを発見するシステムを構築する。Webコミュニティとユーザコミュニティとの相互作用の解明:ユーザコミュニティに対応するWebコミュニティに特徴的なグラフ構造の分析や、Webコミュニティにおける動的変化がユーザコミュニティに及ぼす影響の解明などに取り組む。
画像

※ 画像をクリックすると拡大します。

R070000235_01SUM.gif R070000235_02SUM.gif R070000235_03SUM.gif R070000235_04SUM.gif
研究分野
  • 情報サービス
  • グラフ理論基礎
  • 人工知能
関連発表論文 (1) Tsuyoshi Murata, “Visualizing the Structure of Web Communities Based on Data Acquired from a Search Engine”, IEEE Transactions on Industrial Electronics, Vol. 50, No.5, pp.860-866, October, 2003.
(2) 村川剛志,“ハイパーリンクのグラフ構造に基づくWebコミュニティの洗練”,人工知能学会誌,Vol.17,No.3, pp.322-329, 2002.
(3) 村田剛志,“参照の共起性に基づくWebコミュニティの発見”,村田剛志,人工知能学会誌,Vol.16, No.3, pp.316-323, 2001.
(4) Tsuyoshi Murata, “Discovery of User Communities from Web Audience Measurement Data”Proceedings of The 2004 IEEE/WIC/ACM International Conference on Web Intelligence (WI 2004), pp.673-676, 2004.
(5) Tsuyosi Murata, “A Framework for Discovering Dynamisms of the Web”Proceedings of the First European Workshop on Chance Discovery (EWCD2004), pp.214-221, 2004.
(6) Tsuyoshi Murata, “Discovery of Web User Communities from Client-level Log Data”, Proceedings of the Third International Workshop on Social Intelligence Design (SID 2004), pp.111-118, 2004.
(7) Tsuyoshi Murata, “Roles of Diagrammatic Information for the Discovery of Geometrical Theorems”Proceedings of the Third International Confereuce on the Theory and Application of Diagrams (Diagrams 2004), Lecture Notes in Artificial intelligence 2980, pp.235-238, Springer, 2004.
(8) Tsuyoshi Murata, “Graph Mining Approaches for the Discovery of Web Communities”Proceedings of the First International Workshop on Mining Graphs, Trees and Sequences (MGTS-2003), pp.79-82, 2003.
(9) Tsuyoshi Murata, “Discovery of Web Communities from Positive and Negative Examples”Proceedings of the Sixth International Conference on Discovery Science (DS2003), Lecture Notes in Artificial Intelligence 2843, pp.365-372, Springer, 2003.
(10) Tsuyoshi Murata,“A Method for Discovering Purified Web Communities”Proceedings of the Fourth International Conference on Discovery Science (DS2001), Lecture Notes in Artificial Intelligence 2226, pp.282-289, Springer, 2001.
(11) 村田剛志,“Google APIを用いたグラフ構造の生成”,人工知能学会全国大会(第18回)論文集 CD-ROM, 2004.
(12) 村田剛志,“Web視聴率データから発見されたWebユーザコミュニティの分析”人工知能学会研究会資料,SIG-KBS-A304, pp.13-18, 2004.
(13) Tsuyoshi Murata,“Discovery of Web user communities from Web audience measurement data”,電子情報通信学会技術研究報告,Vol.103, No.305, pp.47-51, 2003.
(14) 村田剛志,“正例と負例からのwebコミュニティ発見”,電子情報通信学会技術研究報告,vol.103,No.243,pp.37-42, 2003.
(15) 村田剛志,“Webコミュニティの中心性”,人工知能学会全国大会(第17回)論文集 CD-ROM, 2003.
(16) 村田剛志,“Web視聴率データからのWebユーザコミュニティ発見に向けて”,電子情報通信学会技術研究報告,Vol.102, No. 710, pp. 1-4, 2003.
(17) 村田剛志,“Webにおけるコミュニティの発見”,第5回情報論的学習理論ワークショップ (IBIS2002), pp.125-132, 2002.
(18) 村田剛志,“ハイパーリンクの結合関係に基づくWebコミュニティの構造分析”,人工知能学会全国大会(第16回)論文集 CD-ROM, 2002.
(19) 武田英明,市瀬龍太郎,村田剛志,本位田真一,“知識共生-新しい知識流通の基盤を目指して-”, 人工知能学会全国大会(第16回)論文集 CD-ROM, 2002.
(20) 村田剛志,“サーチエンジンを利用した知識発見のための視覚化”人工知能学会研究会資料,SIG-KBS-A201, pp.117-122, 2002.
(21) 村田剛志,“サーチエンジンの入力キーワードからのWebコミュニティの発見”人工知能学会研究会資料,SIG-FAI/KBS-J, pp.141-145, 2001.
(22) Tsuyoshi Murata, “Graph Mining Approaches for the Discovery of Web Communities”,in L. D. Raedt, T. Washio, J. N. Kok (Eds.) Mining Graphs, Trees aud Sequences, IOS Press, 2004. (to appear)
(23) Tsuyoshi Murata, “Toward the Discovery of Web Communities from Input Keywords to a Search Engine”in H. Motoda (Eds.), “Active Mining -- New Directions of Data Mining”, IOS Press, pp.95-101, 2002.
(24) 村田剛志、山田誠二,“特集 Webダイナミクス-膨大で動的なweb情報の知的処理に向けて-”,情報処理, Vol. 44, No.7, pp.688-725, 2003.
(25) 村田剛志,“Webコミュニティ”,情報処理, Vol.44, No.7, pp.702-706, 2003.
(26) 村田剛志,“PageRank”,日本ファジィ学会誌,Vol.14, No.2, p.38, 2002.
(27) 村田剛志,“Web構造マイニングおよびWebコミュニティ発見に関して”,The First International Workshop on Ubiquitous Knowledge Network Environment, 21 COE Program of Hokkaido University (2003)
(28) 村田剛志,“Web構造マイニングおよびWebコミュニティ発見に関して”,電子情報技術産業協会Web情報アクセス技術専門委員会(2003)
(29) 村田剛志,“Web構造マイニングおよびWebコミュニティ発見に関して”,第65回情報処理学会全国大会(2003)
(30) 村田剛志,“Web構造マイニングおよびWebコミュニティ発見に関して”,第5回情報論的学習理論ワークショップ IBIS2002(2002)
(31) 村田剛志,“Web構造マイニングおよびWebコミュニティ発見に関して”,日本ファジィ学会関東支部セミナー(2002)
(32) 村田剛志,“Web構造マイニングおよびWebコミュニティ発見に関して”,情報科学国際交流財団SSR産学戦略的研究フォーラムワークショップ(2001)
研究制度
  • 戦略的創造研究推進事業 さきがけタイプ(旧若手個人研究推進事業を含む)/相互作用と賢さ研究領域
研究報告資料
  • 村田 剛志. Webにおけるコミュニティの発見(Webにおけるコミュニティの発見). さきがけライブ2004 情報・知能分野 2004年度 研究報告会 「相互作用と賢さ」研究領域 講演要旨集(研究期間:2001-2004), 2005. p.63 - 73.

PAGE TOP