« 2007年06月 | メイン | 2008年02月 »

2007年08月 アーカイブ

2007年08月02日

ページランクの真実

ページランクとはいったい!?ナニモノか?

ページランク(PageRank)とは、ウェブ上にあるPageの重要度を示す数値である。
GoogleはPageAがPageBへリンクすることを、AがBに票を投じている行為とみなす。つまり、表が大多く投じられていればいる程、そのPageの重要度は高い。また、投票している(リンクしている)Page自体の重要度もその票(リンク)の重要度を決定付けている。(上記の例でいえば、PageAの重要度)Googleはそうした票(リンク)から、Pageの重要度を計算する。それぞれの票の重要度が、Pageのページランク値を計算するときに用いられる。



ページランクはGoogleがPageの重要性を決定する方法であり、検索エンジンの上位表示を左右する一要因であるため、ページランクには注目するべきだ。ページランクだけがGoogleの検索エンジン結果に反映するわけではないが、重要な要因であることは確かである。



注釈:

ウェブ上に張ってある全てのリンクをGoogleは数えているわけではない。例えば、リンクファームと知られている所からのリンクは除外する。どのサイトからリンクを張られるかは、ウェブマスターの権限外であるが、どのサイトへ外部リンク
を張るかは権限内と認識している。





この理由から、被リンク を張ってもらうことは害にはならないが、禁じられている不適格なサイトへ外部リンクを張る事は危険である。あるサイトのページランク(PageRank)が0の場合、それは通常、処罰とみなされるため、そこへリンクを張ることは賢明ではない。



「外部リンク」とは、当該Pageが別のPageに向けて張っているリンクのこと。同じウェブサイト内で張っているリンクも該当する。

「被リンク」とは、別のPageが当該Pageに張っているリンクのこと。同じウェブサイト内で張っているリンクも該当する。






ページランクの計算方法

あるPageのページランク(PageRank)を計算する際に、そこへ張られている全ての被リンクが考慮される。ここで言う被リンクとは、他のサイトからのリンクだけでなく、そのウェブサイトの他のPageからの被リンクも含まれる。



PR (a) = (1-d) + d (PR (t1) /C (t1) +… + PR (TN) /C (TN))



上記がページランクの計算式である。 これはページランクが原案時の計算式であり、おそらくGoogleはここから派生したものを使用している可能性が高い。その点は不明である。だが、今回の解説はGoogleがページランクを計算する本質的概念を明らかにすることが目的であるので、派生したものであるかどうかは問題にしないこととする。



上記計算式をじっくり見てみよう。

まずは、記号の説明だが、



PR = ページランク(PageRank)

a = PageA

d = 減衰定率 (この計算式では0.85に設定)

t1….tn = PageAにリンクしているPage

C = t1….tnというPageが外部に向けて張っているリンクの数:外部リンクの数これらの記号を理解した上でページランクの計算式をもう一度見てみると、以下のように日本語で置き換えることができる。



PageAのページランク= ( 1 ? d) + 0.85 × (PageAにリンクしているPageのページランクをそこが外部に張っているリンク数で割ったもの:PageAにリンクしているPageからもらうリンクの価値)



一つ一つのPageはリンクする各Pageにページランク(PageRank)という価値あるものを分配していると考えればよい。分け与えられるページランクの価値(ページランク値)はそのPageが持っているページランク値よりもやや少ないので、減衰定率の0.85を掛けている。ページランクはリンク先のPageの質によって優遇することはせず、どのリンク先にも平等に分配される。



何度も繰り返し行われる動作によって、減り衰える効果を考慮して掛ける定率:1であったものが数多くの繰り返し作業によって、その価値が0.85になるという意味



このことから、ページランクが4で外部リンクが5つのPageからのリンクの価値のほうが、ページランクが8で外部リンクが100のPageからのリンクの価値を上回るという結論に達する。Pageのページランクは勿論重要だが、そのPageがどれだけのPageにリンクを張っているかも重要なのである。Pageが外部へリンクしていればいるほど、あなたのPageがそこからのリンクをもらって得られるリンクの価値は小さくなる。





ここで注意しておかなければならないのは、Googleツールバーに表記されている1~10のページランク指標と実際のページランクの値(ページランクの価値)の違いである。

もし、ページランク1、ページランク2、・・・・、ページランク10という指標の間隔が同じであるなら、



一つのリンクの価値は、

外部リンク5でページランク4のPage > 外部リンク100でページランク8のPageとなる。



多くの人はページランク数値の間隔は対数目盛で設定されているのだと信じている。

実は、この仮説には信憑性がある。Google社外の人たちがこのことが正しいかどうかは知る由もないが、ページランク数値間の目盛は対数であるか、対数に似たものである可能性が高い。



なぜなら、ページランク7のPageがページランク8に上がる方が、ページランク1のPageがページランク2になることの方が、はるかに難しいからである。



結果として、

一つのリンクの価値は、

外部リンク5でページランク4のPage > 外部リンク100でページランク8のPageではなく、外部リンク5でページランク4のPage < 外部リンク100でページランク8のPageとなる可能性が高い。









ページランク指標の目盛が常数であろうが対数であろうが、別のPageからのリンクは自分たちのサイトのページランク(PageRank)を向上させるということである。リンクファームからのリンクは価値がないことを覚えておく必要がある。



外部へリンクを張ると張られたPageのページランク値が大きくなるからといって、張ったPageのページランク値が減ると印象を持つ人も少なくないだろう。だが、リンクを張るという行為でページランクが減り、0になってしまうことはない。ページランク値がリンクを張る時に持つそのリンクの価値を決定付けるという意味である。



この点を理解するために、株主総会を想像して欲しい。つまり、持ち株の多い株主が投票数をたくさんもっているが、持っている株自体を総会の時に使用しないのと同様である。



しかしながら、実はリンクを張るという行為でページランク値を間接的に減らしていることがある。それは後ほど述べることにする。





これから、実際の計算を検証してみることにしよう。



Pageのページランク値を計算する時に、(既に与えられている場合は)既存のページランク(PageRank)は全く検討されず、現在の被リンクからに基づいたページランク値を用いて、あらたな計算が行われる。それは、前回の計算時から被リンクの数と質が変化している可能性があるためである。



前述した計算式は、どのようにページランク値が算出されるかを明確に示している。しかし、計算を一回するだけでいいかどうかは不明である。



例として、お互いにリンクし合っているAとBの2つのPageがあり、他のリンクが全くないと仮定し、計算してみると: -



ステップ1:Aのページランク値を被リンクの価値を用いて計算する。



現時点でPageAが持つ新しいページランク値は、PageBからの被リンクの価値に基づいている。だが、PageBの持つ被リンクはPageAから1つだけである。Bのページランク値はまだ計算されていない。従って、PageAの新しいページランク値は誤ったデータ(未算出のもの)に基づいているため正確な値であり得ない。



ステップ2:Bのページランク値を被リンクの価値を用いて計算する。



現時点でPageBは新しいページランク値を持っているものの、誤ったページランク値を持つAからのリンクに基づいて計算しているため、間違っている。



Aのページランク値がわからなければ、Bのページランク値は算出できず、Bのページランク値がわからなければ、Aのページランク値は算出できないという、俗にキャッチ22といわれる、不条理な状況を作り出すのである。



それでは話しが進まないので、誤ったページランク値でありながら、A、Bとも新しいページランク値が与えられたとする。ここでもう一度同じ計算を繰り返すことによって、より正確なページランク値を算出し、正確な値を求めることはできるのではないだろうか?



同じ計算式を繰り返すとその解答はやや正確な値に近づくが、常に誤った値を使用しているため、正確なもの合致することはない。



しかし、この問題は、計算を何度も繰り返すことによって回避される。計算するたびにより正確な値へと近づくからである。実際、不正確な値を用いた計算なので、完全に正確な値には到達できないが、40~50回の繰り返しでそれ以上繰り返しても意味のない値までに到達するには十分である。Googleはまさにこの作業を更新の都度行っているため、時間がかかるのも納得できる。



ただし、この計算式から得られる解答は比例値だということは覚えておいて欲しい。計算により得られた数値は(Googleだけが知っている)基準目盛と照らし合わされ、ツールバーに表記されるページランク指標が導き出される。 しかしながら、比例値であることを理解した上でも、サイト内のPageのリンク構造を工夫するための便利なツールとしてこの計算式を活用できる。





内部リンク

事実:

一つのウェブサイト内で、内部リンクにより分配されるページランク値には上限がある。一サイトでの上限ページランク値はPageの数に比例する。この上限は被リンクによって上げられ、外部リンクと内部リンク構造の影響によって下がる場合もある。ここでいうページランク値とは各Pageのページランク値ではなく、サイトの合計ページランク値のことである。



信じられない場合は、実際に紙と鉛筆を使って計算してみれば、同じ結論に達するはずである。









事実:

サイトのページランク値の上限は、サイトのPage数が増えるにつれて上がる。つまり、サイトのPage数が増えれば増えるほど、ページランク値は上がるということである。これもまた、紙と鉛筆を使って計算式を解けば同じ結論に達するであろう。Googleに認識されたPageしかこれには当てはまらないということを覚えておかなければならない。



事実:

リンク方法が下手なために、本来のページランク値の上限まで達することができないことはあるが、いくら上手にリンクしたとしても上限値を超えることはない。



内部リンク方法が下手なために、本来のページランク値の上限まで達さないことはあるが、内部リンク構造のおかげでページランク値の上限を超すことはない。ページランク値の上限を増やす唯一の方法は、被リンクを増やすこととサイト内のPageを増やすことである。



注意:

特定のPageのページランク値を高めるために、新しいPageを追加することを推奨するが、追加すべきでないタイプのPageもある。 これらはクッキー型(cookie-cutter)と呼ばれ、その意味するところは、全く同じ、またはほぼ同じPageのことである。Googleはこうした同一Pageが増えることをスパムとみなしており、サイト内のPageや全サイトが罰を受けることになりかねない。良い内容がたくさん集約されたPage作りが必要なのである。







合計ページランク値からわかること

例題を解いていく前に、ウェブ上の一つ以上のPageからリンクが張られてはじめて、GoogleはそのPageをインデックス(索引)することを指摘しておかなければならない。Googleのインデックスされていない場合、そのPageからのリンクは計算されない。



議論が複雑になるので、他のページランク解説書と同様に、これからの例題においては、この事実は無視することにしよう。



計算には二つの方法がある:- 質素なもの(シンプル)と現実的なもの(リアル)

シンプルな方法:他のPageがリンクしていようがいまいが、全てのPageはGoogleのインデックスに含まれていると想定して計算する。



リアルな方法:リンクされていないPageは計算する時に考慮されない。以下の例題では、シンプルな方法での計算結果を示している。



では、被リンクのないPageが(A、B、C)3Pageあるサイトを考えてみよう。1であろうが0であろうが99であろうが全く関係ないが、とりあえず初期のページランク(PageRank)設定をそれぞれ1としてみる。



このサイトは3Pageなので、上限ページランク値は3である。この時点で、どのPageも外部リンクを張っておらず、被リンクもない。



それぞれのPageについて計算すると、ページランク値はどれも0.15である。どれだけたくさんの反復計算をしたとしても、同じである。3が上限であるにもかかわらず、このサイトの合計ページランク値は0.45である。実現可能なはずのページランク値をこのサイトはひどく無駄にしていると言える。





例題1:

さて、もう一度、それぞれのPageがページランク1であると仮定する。AからBへリンクをかけ、それぞれのPageを計算してみると:-Pagerank, Page rank



A = 0.15

B = 1

C = 0.15



AはBに"投票"し、その結果、Bのページランクが高くなった。一見Bの値が良く思えるが、以前説明した"不条理な状況"を計算に入れると一回の計算では正確な値に近づかない。



100回後の数値は:-

A = 0.15

B = 0.2775

C = 0.15



AとCと比べるとBは良いが、先程の1とは比較にならない。これらの数値の方がより現実的である。サイトの合計ページランク値はこの時点で0.5775である。少しだけ良くなったが、まだ実現可能なページランク値3とは程遠い。



注釈:

厳密に言うと、Googleが”ぶら下がりリンク” (dangling link) を計算に入れないので、これらの特定の結果は不正確であるが、シンプルな計算を論証するには十分である。





例題2:

では、次のリンク方法を試してみよう。全Pageを相互リンクしてみる。各Pageはページランク1から始まるとする。:
Pagerank, Page rank



A= 1

B =1

C =1







これで合計ページランク値の上限に達したことになる。何度繰り返して計算しても、どのページランク値も1となる。ループ形式でリンクしたときにも同じ結果である。(例:AからB、BからC、CからD。)計算機でやってみるといい。以上のことでわかるように、内部リンクを上手くしていないとページランク値が無駄になり、良いリンク方法により、サイトを有効活用することができる。しかし必ずしもサイトの全てのPageに均等に力配分したいわけではない。



他のPageを犠牲にしてでも、サイト内の数Pageに大きなページランク値を与えたいことがある。例として、インデックスPageや他のPageとつながる中核Page、または特定のキーワードに最適化しているPageなどに、より高いページランク値を持たせることが考えられる。この例題ではたった3Pageしかないので、インデックスPage(PageA)にページランク値を集中させることができる。このページランク値を集中させることをチャネリングという概念と呼ぶ。



例題3:

AからBとC両方にリンクしてみる。また、BとCをそれぞれAにリンクする。ページランク1から初めて、1回目の計算結果は: -



A = 1.85

B = 0.575

C = 0.575



そして、100回後の計算結果は: -



A = 1.459459

B = 0.7702703

C = 0.7702703



1回目も100回後も、サイトの合計ページランク値は3(上限)であり、無駄が全くない。しかも、どちらの場合も、Aは他の2Pageと比較して、かなり大きなページランク値を持っている。これは、BとCがページランク(PageRank)を他には全く与えずにPageAだけに与えているためである。サイトのページランク値を望みどおりのところに多い割合で分配したことになる。





例題4:

最後に、例題3と同じリンク構造を保ちつつ、CからBに新しくリンクを加えて、ページランク1から始めてみる。



1回目:-

A = 1.425

B = 1

C = 0.575





例題3の1回目と比べると、Aのページランク値はいくらか減り、Bは増え、Cは同じであった。CはAとB両方にページランク値を分配する形となった。例題3では、AがCのページランク値を全て享受しているので今回Aのページランク値が減り、Bのページランク値が増えたのである。



100回後には: -

A = 1.298245

B = 0.9999999

C = 0.7017543



となる。



最終的に、Cはページランク値をAに全て分け与えるのではなく、A、Bに分配したため、Cからもらうページランク値は少なくなり、その結果として、AからCに還元するページランク値が少なくなってしまった。つまり、リンクを新たに増やすことで、リンク先のPageがそのPageにリンクバックしてしまうとページランク値を間接的に失ってしまうことになる。



リンク先のPageがリンクバックしなければ、ページランクを失ってしまうことはない。もっと複雑にすると、リンクバックが間接的になされていたとしても(どこか別のPageにリンクして、そのPageが元のPageにリンクバックしていると)、そのPageは少しページランクを失ってしまうことになる。内部リンクだけの話であれば、これはさほど問題にはならないが、外部リンクの場合は考慮に値する。





例題5: 新しいPage

Pageが1つ増える毎にページランク値が1増えるので、新しいPageを増やすことは、サイトの合計ページランクを高める。計算機を使ってこれを論証してみる。まず新しいPageを3つ例題3のケースに付け加えてみる。3つの新しいPageだが、まだ何の役にも立たない。新しいPageをそれぞれ重要なPage(A)にリンクすると、合計ページランク値は倍(3から6)になる。またAのページランク値もほぼ2倍になった。



このモデルには1つおかしいことがある。それは、新しいPageはオーファン(拠り所のないPage)である。よって、Googleにインデックスされていないので、サイトのページランク値に貢献することはなく、Aに分け与えるページランク値もない。それぞれの新しいPageは別のPageからリンクされていたり、リンクしていないと意味がない。Aが重要なPageであるなら、リンクをかける最善のPageは、Aである。リンクで遊ぶことはできるが、PageAのことを考えると、それ以外にいい場所はないのである。



1つのPageから多数のPageにリンクすることは良いアイデアではないので、たくさんの新しいPageを追加しているのならば、リンクをいろんなところでかけるほうがいい。サイトにとって重要なPageは1つ以上あるはずなので、新しいPageに関するリンクはまばらにするほうが適している。主要Pageにとってどのようにリンクを構成すればいいのか、計算機を使って小さなモデルサイトで実験してみるといい。



例題のまとめ

内部リンクを整理することで、サイトのページランク値を特定のPageにチャンネルする(集中させる)ことが可能であることがわかったであろう。内部リンクはサイトのページランク値の必要性に合うようにアレンジできるが、GoogleがそれらのPageを認識していることが前提なので、認識されているかどうか確認しておくことが大切である。





インバウンド(被)とアウトバウンド(外部)リンク

例題を与えることもできるが、これ以降を続けていくほうがわかりやすいであろう。



Q&A

Q:

1つのPageが別のPageにいくつもリンクを張っている場合、すべてのリンクがカウントされるのですか?

言い換えると、PageAがBに1つリンクを張り、Cに3つリンクを張っているとしたら、CはAから4分の3のページランク値を受け取ることになるのですか?



A:

リンクを張るということはあるPageが他のPageに票を投じているということである。ページランクのことが説明された元々の資料には複数のリンクを1つのPageに張ることに関しては触れていない。複数のリンクを張るということ自体、ページランクの概念と反するように思えるが、複数リンクを活用することによって、重要でないPageへかけるリンクのページランク値を少なくすることができる。



Googleから確実な回答を得られる可能性が低いため、1つのPageに張ったリンクは複数あろうとも1つとみなされ、余分なリンクは数えられていないと想定するしかない。



Q:

Pageがそれ自体にリンクを張る時に、そのリンクは数えられているのでしょうか?



A:

先ほどの質問と同様に、この質問内容に関しても元々の資料には何も触れられていない。このアイデアも”投票”というリンクの概念と反することになるので、そのようなリンクは数えられないと想定することが妥当である。





ぶら下がりリンク(Dangling Links)について



「Dangling Links(ぶら下がりリンク)とは、簡単に説明すると、外部リンクをどこにも張っていないPageへかけられるリンクのことである。こうしたリンクは価値を分け与えるところがはっきりしないので、モデル自体を崩すものとなる。 Dangling Linkはかなりの数がある。通常、こういったリンクは、まだダウンロードをしていないPageである可能性が高い。ぶら下がりリンクは他のPageのページランク値に直接影響を与えないので、ページランク値を算出する間、一旦システムから放り出すのである。全てのページランクが計算されたあとで、このようなPageは、それほど大きな影響を及ぼすことなくまた元に戻すことができる。」



- Google創設者のサージ・ブリンおよびローレンス・Pageが書いたページランクに関する元の論文からの抜粋。



例題1で、Bから外部へリンクが張られていないので、AからBに張られているリンクはぶらさがりリンクとなり、計算から取り除かれるため、計算結果は間違っていることになる。3つのページランク値はそれぞれ0.15であるべきである。



他のPageのページランク値に影響を与えることなく、リンクの全くないPageへリンクを張ることはサイトの機能上、適しているかもしれないが、ページランクを無駄にしていることがあるので注意したい。





インバウンドリンク(被リンク)

インバウンドリンク(被リンク)とはつまり別のサイトから当該サイトへのリンクであり、サイトの合計ページランクを上昇させる1つの方法である。ページランクを上昇させる別の方法としては、Page数を増やすことである。どこからリンクがくるかは関係ない。Googleはウェブマスターにどこからリンクされているかまで責任はもてないことがよくわかっているため、どこからリンクが来るかどうかで罰を受けることはない。このルールには1つ例外があるが、それはまれであり、この記事とは関係のない分野である。ウェブマスターが不意にしてしまうようなことではない。



リンクしてくれているPageのページランク値は大切であるが、そのPageから出ている外部リンクの数もまた大切である。たとえば、ページランク2のPageからのリンクがあなたのPageだけにかかっているとしたら、0.15 + 0.85(2/1) = 1.85を受け取ることになる。しかし、他に99の外部リンクを持つページランク8のサイトからは0.15 + 0.85(8/100) = 0.218上げることになる。



ページランク2からのリンクのほうがはるかにいいのは明確だ・・・ろうか?



おそらく、そうではないという理由は後半の説明を参照して欲しい。



リンクしてくれているPageのページランク値は大切であるが、そのPageから出ている外部リンクの数もまた大切である。たとえば、ページランク2のPageからのリンクがあなたのPageだけにかかっているとしたら、0.15 + 0.85(2/1) = 1.85を受け取ることになる。しかし、他に99の外部リンクを持つページランク8のサイトからは0.15 + 0.85(8/100) = 0.218上げることになる。



ページランク2からのリンクのほうがはるかにいいのは明確だ・・・ろうか?



おそらく、そうではないという理由は後半の説明を参照して欲しい。



我々のサイトは、リンクしあったPageの小さなネットワークであると考えがちである。ページランクの計算をしているときも、自分の小さなネットワークと向き合っていることになる。それから別のサイトへのリンクをかけることにより、自分の小さなネットワークのページランクの価値を奪われることになり、リンクをもらうことによって、自分のネットワークにページランクの価値が加えられる。しかし、本来の形はそうではない。ページランク値を計算するためには、たったひとつのネットワークしかない。つまりGoogleがインデックスしているすべてのPageのかたまりなのである。つまり、小さな個別のウェブサイトについてページランク値の計算がされているわけではなく、毎回大きなネットワークのページランク値を求めているのである。



全ネットワークは相互にリンクされており、全てのリンクと全てのPageが計算されるごとに役割をはたしている。したがって、我々のサイトへの被リンクの影響を正確に計算することはできない。



全ネットワークは相互にリンクされており、全てのリンクと全てのPageが計算されるごとに役割をはたしている。したがって、我々のサイトへの被リンクの影響を正確に計算することはできない。





外部リンク

外部リンクはサイトの合計ページランクのいわゆる下水管である。ページランクを漏らしているのである。下水管を克服するために、リンクがお返しされていることを確かめるべきである。外部リンクのつながり方や数の影響で、リンクバックしてくれていることがページランク値を増やしもし、減らしもする。ページランク値が別のPageへのリンクのせいで漏れ出ているとき、内部リンクでつながっているPage全てが影響される。(1回の計算ではわからないこともある。)



どのPageから外部リンクを張るかで、どのPageがページランク値を最も失うかが変化する。特定のリンク構造を計算できるプログラムがない限り、どのPageから外部リンクを張るのが1番効果的なのかを決めることは難しい。しかし、大抵の場合、ページランク値の1番低いPageから外部リンクを張ることが無難であろう。



多くのウェブサイトはページランクとは全く関係のない外部リンクをいくつか持つ必要がある。残念ながら、全てのふつうの外部リンクはページランクを漏らしてしまう。しかし、漏れが発生しないような変わったリンク方法がある。

別のサイトへのリンクをGoogleが認識するとページランクが漏れ出てしまう。それに対抗するためにできることはGoogleが認識しないリンクを使うことだ。Googleが認識しないリンクとは、Java Scriptなどを利用したものを含む。







formのaction機能

formの'action'という属性はフォームを解析するスクリプトのあるURLである必要はない。どのサイトのどのHTMLPageにも導くことができる。試してみよう。



例:

<form name="myform" action="http://www.domain.com/somePage.html>

<a href="javascript:document.myform.submit()">ここをクリック</a>



さらにずる賢くしようと思えば、action属性はformのタグではなくて、javascriptのコードの中に組み込むことができる。そして、robots.txtファイルを設置することによってGoogleのスパイダーに読まれないようにしたディレクトリ内にあるjs(java script)ファイルにこのaction属性の含まれるjava scriptコードを入れることができる。



Javascript

例:

<a href="javascript:goto('好きなところ')">ここをクリック</a>



formのactionのように、URLを含んだ別のjsファイルを呼び出すjavascriptを組み込むのはずる賢いやり方である。もっとずる賢いやり方としては、そのファイルをrobots.txtファイルによりgooglebot(グーグルボット)から隠されたディレクトリに入れてしまうことである。



"rel"属性

2005年1月18日現在で、他のサーチエンジンと同様にGoogleはアンカータグへの新しい属性を認識し始めている。この属性とは"rel"のことであり、以下のように使われる。: -



<a href="http://www.domain.com/somePage.html" rel="nofollow">テキストリンク</a>



この属性によって、Googleがこのリンクを完璧に無視することになる。このリンクはリンク先Pageのページランク値に影響を与えない上に、検索エンジンで上位表示されることへの手助けもしない。あたかもリンクが全く張られていない扱いをうけることになる。この属性をつけることによって、javascriptやformや他のGoogleからリンクを隠す手段を使う必要が全くなくなったのである。



では、Googleのページランクツールバーの目盛を1目盛だけ増やすためにどれだけのページランク値が余分に必要なのだろうか?



まず、Googleツールバーに示されている数値が実際のページランク値となぜ異なるのかということをもっと詳しく説明してみよう。これまで見てきた計算式やGoogle創設者によると、ウェブ上にある何十億ものPageのページランク値を平均するとページランク1になる。よって、ウェブ上にある合計ページランク値は、ウェブ上にある全てのPage数×1となる。つまり、たくさんのページランクがウェブ上に広がっているということである。



Googleツールバーの目盛は1から10まである。(時折0を示すが、この値は実際のページランク計算結果とは信じられていない。)グーグルが何をするかというと、ウェブ上の実ページランクを10パートに分ける。Pageがどのパートに分類されたかはツールバーに示された値でわかる。つまり、ツールバーの値はあるPageが全体の中のどこのパートに分類されているかを示すのであって、実際のページランク値ではない。ツールバーに示された数値は単なるラベルである。



全体が10の等しいパートに別れているかどうかは議論の的となるところである。- Googleはこの点には触れていない。しかし、ツールバーの値が既に高いものからもう1つ高い値にするほうが、低い場合よりもかなり難しいことから、多くの人は(私も含めて)この区分けは、常数目盛で均等に分割されたものではなく、対数目盛か、それに似たものであるのではないかと信じている。



では、この区分けがベースを10にした対数目盛であり、サイトの重要なPageのツールバーの目盛を1つ上げるのに、適切にリンクされた10の新しいPageが必要であると仮定しよう。もう1目盛あげるためには、100の新しいPageが必要で、さらにもう1目盛あげると1,000の新しいPage、そして次は10,000Pageという具合につづく。これが、低いツールバーの値から1目盛上げる方が簡単な理由である。実際には、ベースは10でない可能性が高い。



5か6、あるいは、もっと小さな数値ではないだろうかと考える人たちもいる。そうだとしても、大きな数値になればなるほど、1目盛あげることが難しくなる。ウェブ上にあるPage数が増えれば増えるほど、合計ページランクも増え、全体を区分けする位置も変わっていくことに注意すべきだ。結果として、はっきりした理由もなく、ある日突然Pageのツールバー上の数値が下がることがある。もし、Pageの実ページランク値が目盛よりほんの少しだけ上にあった場合、新しいPageがウェブ上に増えることによって、目盛の基準が上がり、結果的にPageのページランク値が目盛より下になってしまうこととなる。



Googleのインデックスは増え続け、月ごとにそれぞれのPageを再評価しているのである。これは、"Googleダンス"として知られている。ダンスが終わったときに、ツールバーのポイントが下がってしまうPageもある。次のダンスの後にツールバーのポイントを上げようと思えば、新しいPageを増やすことで事足りるかもしれない。ツールバーに表記される数値はページランク値のよい指標となるが、全体の中のどの範囲にそのPageがあるかということしか示していない。あるページランク5のPageはページランク5の区切りより少しだけ上であり、別のページランク5のPageはページランク6の区切りより少しだけ下である。-
つまりその2つのPageは1区切り分(ツールバー1ポイント分)ほどの差があるということだ。





ヒント

ドメイン・ネームおよびファイル名

スパイダーにとって、www.domain.com/、domain.com/、www.domain.com/index.html
とdomin.com/index.htmlは違うURLであり、異なるPage扱いとなる。ウェブサーファーはどのURLであろうがサイトのホームPageにやってくるが、検索ロボットはそれらを別個のURLとみなすためページランクを考慮する際には注意しておく必要がある。サイトのホームPageのURLを標準化してしまうほうがいい。



さもなければ、ページランクが1つのURLに集約されるはずだったものが、それぞれのURLは違うページランクを持つことになる。考えてみれば、www.domain.com/をリクエストした際にどのファイル名が返ってくるか検索ロボットは知りえる由がない。ファイル名は、index.html、index.htm、index.php、default.htmlなどの可能性があるが検索ロボットにはわからない。サイト内でindex.htmlにリンクを張るとスパイダーは2つのPageを比較して同じものだと判断できるかもしれないが、おそらくそんなリンクを張ることはないだろう。



したがって、それらは、2つのURLとなり、被リンクからのページランク値をそれぞれが受け取ることになる。ホームPageのURLを標準化することによって、幽霊URLにページランクを取られることがないようにできる。



例:http://www.holidays.org.ukへ行ってみよう。

ブラウザのアドレスバー内に表示されているURLにはwwwが含まれていることに気付くだろう。もし、Googleツールバーをインストールしているなら、このPageがページランク5であることがわかる。では、wwwの部分を削除し、Pageを表示してみて欲しい。ここで現れるPageは、先程と同じものであるにもかかわらず、ページランク1である。実際、このページランクは見えないフレームPageのものなのである。



この記事が最初に書かれたとき、サイト内で違うバージョンのURLリンクを使っていたため、wwwのないURLはページランク4を持っていた。つまり2つのPage(2つのサイト)のページランクを共有していたことになる。これは賢明な方法ではない。それ以来、内部リンクをきれいに整理し、wwwのついていないPageのページランクを1にまで引き下げた。そうすることによって、ほぼ全てのページランクがwww内に残るようにしたのである。しかし、サイト内のどこかにwwwのないページランク1のPageにリンクしておかないといけない。



www.domain.com/index.htmlというPageを考えてみよう。このindexPageはほかのいくつかの相対的なURLにリンクしている。例えば、products.htmlやdetails.htmlだ。検索ロボットはこれらのURLをwww.domain.com/products.htmlとwww.domain.com/details.htmlと認識する。そこで、絶対的なURLを加えてみる。今回はwwwの部分がないものとする。-



domain.com/anotherPage.html  このPageはindex.htmlPageにリンクバックしており、それによって、index.htmlPageも
domain.com/index.htmlと検索ロボットが認識する。前述のindex.htmlPageとまったく同じPageであるにもかかわらず、ロボットにとっては違うドメイン上の違うPageに見えるのである。では、何が起こるかみてみよう。indexPage上のそれぞれの相対URLも、domain.com/に所属しているので、違うものとなる。結果的に、このリンク構造は、幽霊Pageにページランクを奪われてしまっているので、ページランクを無駄にしていることになる。





新しいPageを増やす

新しいPageを追加することが悪影響を及ぼす可能性がある。完全に普通のサイトを例にとってみよう。そのサイトはいくらかのページランク値を持った他のサイトやサイト自体Pageからの被リンクがある。そこで、新しいPageを追加して、既存のPageから1つや2つのリンクを張ることにする。



新しいPageは、勿論、サイトの既存Pageからページランク値をもらう格好になる。その結果、そのサイトの合計ページランク値は上がったけれども、既存Pageの1つや2つはページランク値を分け与えてしまったことが原因でページランク値が少なくなってしまう。新しいPageが増えれば増えるほど既存Pageのページランクは少なくなっていく。大きなサイトでは、こういった影響は気付かない程度だが、小さなサイトでは、すぐに気付いてしまうだろう。



よって、新しいPageを加えることは、サイト内の合計ページランク値を増やすことになるが、結果としてサイトのいくつかのPageはページランクを失うことになる。打開策として、サイト内で新しいPageへのリンク方法を工夫することによって、重要なPageのページランクが下がらないようにするか、十分な量の新しいPageを加えることでページランクを保つようにする。(もの凄い量の新しいPageが必要な場合もあるだろう。)もっといいのは、被リンクをもっと増やすことである。



雑学

Google ツールバー

ブラウザにGoogleツールバーをインストールしているのなら、インターネットを利用しているときに訪問するPageのページランク指標をいつも見ているだろう。だが、全てが見たままであるとは限らない。Googleがページランクを見せる多くのPageが実のところはGoogleによってインデックスされておらず、本来ならばページランクを持っていないことがある。つまりそのPageと同じサイト上の他のPageがインデックスされ、ページランクが計算されているということである。インデックスされていないそのサイトのPageはツールバーの便宜上ページランク値を与えられている。しかし、ページランクは実際存在しない。



実際にページランクのないPageと相互リンクをすることを避けるためにも、この事実を知っておくべきである。相互リンクを交わす前に、GoogleでそのPageを検索し、インデックスされていることを確かめる必要がある。





サブディレクトリ

ルートディレクトリから一段低いサブディレクトリに進むに従ってGoogleがページランク指標を1つ下げると信じている人がいる。例、ルートディレクトリ内にあるPageの価値がだいたい4くらいであれば、次の下層ディレクトリにあるPageの価値はだいたい3くらいとなる。また、(私を含んで)これを全く信じていない人たちもいる。いずれにせよ、深いサブディレクトリを避ける傾向にある検索ロボットがいるので、ディレクトリ構造を浅めに作っておくのがいいだろう。(ルートから1~2階層)。



ODPとヤフー

ヤフーとODP(Dmoz)ディレクトリに登録されているサイトにGoogleはページランクをたくさん与えていると信じられていたが、最近は違う。当然、これらのディレクトリに登録されているサイトはページランクの見地からもいいことだが、その理由は以下のことからである: -



他のサイトと同様にGoogleの検索ロボットはディレクトリも読みに行き、それらのPageはページランクもいいので、もらえる被リンクもいいものである。ODPの場合、Googleのディレクトリはそのコピーなので、サイトがODPに加えられたり、抹消されると、Googleがディレクトリを次にアップデートする際に反映される。Googleのディレクトリに登録されるということは、ページランク的にみても良い被リンクとなる。また、ODPのデータは他のさまざまなウェブサイトの検索に利用されるので、被リンクの数がもっと増えるということだ。
ODPへの登録は無料であるが、手作業でサイトを審査しているため登録されるにはかなり長い時間がかかる。よって、早く申請することが望ましい。

2007年08月03日

ページランク別詳細

2007年08月04日

無料会員登録

MASH無料会員登録

会員登録すると以下の特典があります。


  • 毎月3名さまにページランク7へのテキスト広告を無料プレゼント!
  • 会員さま限定で厳選された質の高いページランク7・8のサイトの
    ご紹介
  • 本場アメリカからの最新情報を毎週無料配信
    • 例えば、nofollowタグを使ったページランクのアップ法とは?
    • グーグルで1位・2位を独占するちょっとしたテクニック
    • アメリカのSEO無料ツールの紹介

上記の特典を手に入れたい方は、MASHにご登録を!


はい!今すぐ下記フォームに入力して、
MASHに会員登録をします!

MASH登録WEB会員

お名前(名字のみ)<必須>
メールアドレス<必須>
下記はページランク7当選者発表の際、必要となりますので御入力ください。
URL<必須>

※当選者は毎月月末にメールにて発表します。
※MASHテキスト広告が発行するメルマガ「MASH通信」にも登録されます。
※MASH通信のメルマガの解除は簡単に行えますので、ご安心ください。
 ただし、メルマガを解除した場合、プレゼントの対象者からも除外されます。

変更・解除はこちら


About 2007年08月

2007年08月にブログ「被リンクならMASHテキスト広告」に投稿されたすべてのエントリーです。過去のものから新しいものへ順番に並んでいます。

前のアーカイブは2007年06月です。

次のアーカイブは2008年02月です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。