2012年2月1日水曜日

文献紹介:「ユーザの心理的距離に則したWebページ間の新しい距離の定義」

スポンサーリンク

え〜、時間が取れずブログの移転計画が延び延びになっている今日この頃。
こんな微妙なタイミングではありますが、久々に記事を一つ。WEB/SEO関連文献紹介の番外編で、気まぐれにランダムサーファーモデルで調べて見つけた古い論文についてです。

なお、パシフィカスさんの記事「クリックされる重要なリンクが評価されるリーズナブルサーファー・モデルとは」を読んだのがきっかけで、当初はリーズナブルサーファー・モデルで検索し、その流れで見つけた論文です。


「ユーザの心理的距離に則したWebページ間の新しい距離の定義(WWW)」


GeNiiで検索して見つけたのが以下の論文です。


2003年の論文ですが、全文が読めます。読む場合は上記書名でリンクしているページの「この論文を読む/探す」の「CiNii論文PDF-オープンアクセス」をクリックしてください。

なお、私がSEOを学び始めて日が浅いので上記論文の内容が知られているのかいないのか、一般的なのか一般的でないのかなどがわかりません。
もしも書くまでもない内容でしたら、読み飛ばしていただければと思います。

概要


「ユーザの心理的距離に則したWebページ間の新しい距離の定義(WWW)」を読んでみましたが...。対数を理解していないので、数値の算出がよくわかりませんでした。もちろん数値意外の部分にも分かりにくい部分はありますが。

あまり自信が無いのですが、ざっくり内容を書き出すと。

  • クリック数ではなく標準クリック数を定義
  • 標準クリック数の定義の元になっているのはランダムサーファーモデル
  • あるページ内の発リンクの数はユーザーの心理的距離に影響を与える
  • 発リンクが少ない程、リンク先のページへの心理的距離が短くなる
  • 発リンクが多い程、リンク先のページへの心理的距離が遠くなる
  • 発リンクが多い程、一般的なページと考える事が出来る
  • ユーザーの「理解のしやすさ」は標準クリックと相関関係がある

...箇条書きにすると、どれほど内容を理解しているのか怪しくなってきました。

しかし論文のまとめの部分で、

本論文では、非常に簡単な定義により、ユーザーの距離感をより的確に反映するページ間の新しい距離測度として標準クリックを提案した。さらに、ユーザーのホームページからあるホームページまでの標準クリック数が、ホームページの理解のしやすさ、得られる情報量などとの相関関係がある事を示した。

とあります。このまとめ部分を読めば、より正確に論文の概要がお分かりいただけると思います。

標準クリック

明らかにキーとなる概念なのに、数学的に理解できていません。

が、下記の文章でイメージは掴めます。

平均的なページはページ内に7つのリンクを持つと報告されているので、logの底nを7とする。このように定義された距離の単位を標準クリックと呼ぶ。

なお、

最近の調査では、平均的なページは1つの外部リンクと4つの内部リンクを持つという報告もされている。この7という数字は便宜的なものであり、実際にはeや2、10などの値をとってもかまわない。

とあります。基準を設定し、基準からの相対的評価で判断するということでしょう。
ちなみに、平均的なページのリンク云々の元情報が気になる方もいるかと思いますが、しっかりと参考文献として本文末尾に記載されています。

15)Murray, B. and Moore, A.: Sizing the INternet, white paper, Cyveillance, Inc(2000) http://www.cyveillance.com

この論文はPDFで公開されており、以下のリンクから見る事ができます。
http://www.cs.toronto.edu/~leehyun/papers/Sizing_the_Internet.pdf

発リンクの意義

SEOの情報は少しは仕入れてはいますが...。複数の発リンクによってリンクジュースやオーソリティなどの価値が流れるのは、単純にリンクが設置されているからだと考えていました。
つまりは、物理的(といっていいのかどうか)に道ができてるから流れるのが当たり前、といったイメージです。

しかし発リンクの数がユーザーの心理的距離に影響を与え、ユーザーが得らてる情報量の差をも算出できるのであれば、発リンクの意義は前述のような単純さではなくなります。

発リンクという行為はページ制作者の意図を表しますが、同時にユーザーにも影響を与えるという視点。ユーザーについて考える事と発リンクを考える事を、より結びつけて考える事ができそうです。いままでこういう理解の仕方はしていませんでしたから、わりとしっくり来る感じです。

結び


今回の記事の元になった論文は2003年の論文です。また、「仕組みを解き明かす」ではなく「仕組みを提案する」内容です。実際にgoogleやbingなどの検索エンジンがこう考えているといった内容ではありませんので、お間違いの無いように。

とはいえ、私個人としては「Webページ間の距離」という今まで考えていなかった視点を得られました。

最後に、内容的に興味を持たれる方がいるかなと思う部分を引用して締めとします。

たとえば、Web上でコニュニティを発見する際に、一般的な話題が含まれやすい事が報告されているが、標準クリック数を用いれば、一般的な話題のページは、多くのリンクを持つため遠くにあると考えることができ、除去する事ことができる。
また、リンク先のページを反復的に探索するアルゴリズムは多く用いられるが、クリック数で閥値を決めるのではなく標準クリック数で決めるべきであろう。数クリック以内という基準では、非常に多くのページを取ってきてしまうかもしれないし、内容を何段にもわたって書いてあるページに対応できない。標準クリック数を用いれば、「もしリンク数が少ないなら探索を続け、リンク数が多ければやめる」という実用的な方策の根拠となる。

追記

冒頭にも述べましたが、私の理解が間違っている可能性も大です。違うようでしたら、コメント等でご指摘いただけるとありがたいです。

スポンサーリンク

0 件のコメント :

コメントを投稿