2017/08/20

sponsored link
Contents
Googleの検索順位決定アルゴリズム
Googleの検索結果でいかに上位表示してもらえるかは、めちゃ大事です。
ブログのPVも、アフィリエイターの命もそれにかかっています。
Googleは無数にあるwebページから如何にして検索結果として表示するページを決定しているのか?そのアルゴリズムを勝手に推察してみたいと思います。
埋もれたページを探すのだ
検索エンジンユーザーに、如何に価値あるページをに提供できるかがGoogleにとっての至上命題です。
Googleにとって、誰かさんが書いたwebページ、及び、webサイトは資産です。勝手に見つけて勝手に検索結果として使っています。勝手に使っといて「どうだ、Googleの検索エンジンは凄いだろぉ」と、どや顔です。
「俺が必死で作ったサイトを勝手に使うんじゃないよ!」と文句を言う人はまず居ません。むしろ上位に表示してもらう為に皆しのぎを削っています。
新たな資産を探す為に、クローラーは24時間365日、休むことなく世界中のwebページの中を探し回っています。
資産たり得るページがどこかに埋もれていないかな?と。
クローラーは普通にリンクを辿って巡回しています。言うなればネットサーフィンです。
そしてまだインデックスしていないページを見つけると、そのページには何らかのキーワードの検索結果として表示するべきことが書いてあるか?その内容をスキャンします。
コンテンツをスキャンせよ
人工知能研究に大金をはたいているとは言え、まだまだGoogleは人間が読むようにそのページの価値を計ることはできません。
しかしながらGoogleは、他企業が決して真似できない高度な技術を駆使して、titleタグやhタグ、コンテンツ内に出現する様々なキーワードなどから、そのページに書かれている内容を読み取ります。
そして、そのページが、何らかの検索ワードの検索結果として使えるか、使えねぇかを判断します。
インデックスせよ
このページは使える!と判断した場合、Googleはそのページをインデックスします。作者に許可を取るでもなく勝手に資産にします。どうぞどうぞ。
インデックスするかしないかももちろんですが、検索結果の何位に表示するかが何より大問題です。Googleにとっても作者にとっても。
検索者が検索結果上位のページへ移動して「こんな情報見たいんじゃないよ。」と思ってしまったらGoogleの負けです。逆に、検索者に「これこれ!この情報が欲しかったんだ!」と思ってもらえたらGoogleの価値です。・・おっと洒落が効いてしまいました。
さて、ここからが本題です。前置きが長くて申し訳ないです。
新しく発見したwebページをインデックスする際、そのページを何位に表示するか?そのアルゴリズムに迫りましょう。
まず順位を決める大まかな要素を挙げてみます。
検索ワードとコンテンツのマッチング度合
当たり前と言えば当たり前ですが、検索ワードに対して、これ!っていうドンピシャの内容が書かれているページが優先されます。
すごい簡単に言うてますが、これすごいことです。
検索ワードは無数にあります。よく似たキーワードでも微妙にニュアンスが違う場合もあります。
webページに書かれている内容を正確に読み取ることも至難の業ですが、入力された検索ワードから、検索者がどんな情報を欲しがっているのか?を見極めるのも相当難しいと思います。
しかしながら、情報を探している検索者と、情報が載っているwebページとをマッチングするその精度の高さこそが、GoogleのGoogleたる所以です。
どんなニッチワードでもマッチングしてみせましょう。by Google
ドメインパワー
各ドメインが持つ基礎点みたいなのをGoogleは考慮しています。ドメインパワーはドメインの古さ、サイトへの被リンクの多さ、サイト内ページの多さ等から導き出しています。
しかし、このドメインパワーを参考にしすぎると、ブラックSEOと呼ばれるような検索エンジンを騙す手法が通用してしまうので、最近はあまり重要視していないと思われます。被リンクなどは場合によってはむしろ減点対象です。
今後、純粋にコンテンツ自体を評価するアルゴリズムが向上すればするほど、ドメインパワーによる順位補正は無視される傾向にあると言えます。
コンテンツの文字数
文字が多い方がとりあえずは評価されます。
しかし多ければいいというものでもなく、その検索結果の答えとして相応しい内容の文章が書かれている必要があります。余計なことを書いて文字数を稼いでもすぐに見抜かれます。
例えば「セミの捕り方」というタイトルの記事で、セミの捕り方とバッタの捕り方とカブトムシの捕り方を2000文字かけて書いているよりも、同タイトルでセミの捕り方について1500文字かけて書いているコンテンツの方が、「セミの捕り方」という検索ワードにおいては、より高く評価されるはずです。
それぐらいのスキャン能力はあります。たぶん。
ぶら下がりページの評価
単発の記事としてではなく、そのページにどんなページがぶら下がっているか?これはかなり重要です。「ぶら下がっている」と表現しているのはそのページからリンクしているという意味です。
内部リンク
ブログで言うカテゴリーページを想像してもらえると分かりやすいと思います。
例えば「ブログの書き方」というカテゴリーで「タイトルの付け方」「読まれる文章の書き方」「SNSでバズらせるコツ」「ネタを見つける方法」という4つの記事があったとしましょう。
そうすると、この「ブログの書き方 一覧」というカテゴリーページには「タイトルの付け方」「読まれる文章の書き方」「SNSでバズらせるコツ」「ネタを見つける方法」という4つの記事がぶら下がることになります。
こういうリンク構造になっていると、ぶら下がっているページそれぞれの評価(価値)が「ブログの書き方 一覧」のカテゴリーページへと集まることになります。
もちろん、ぶら下がっているページそれぞれの評価が高ければ高いほどそのカテゴリーページは強くなります。
結果的に、「ブログの書き方 一覧」というタイトルのカテゴリーページ自体が、「ブログの書き方」等の検索結果に表示されることになります。
このことから分かるようにブログのSEOを考えた場合、カテゴリー分けは非常に重要です。記事が如何に適切にカテゴライズされているかによって、ブログ内の各カテゴリーページの強さが変わってきます。
出来るだけノイズが入らないような厳密なカテゴライズが出来れば、そのカテゴリーページは強くなります。もちろん各記事自体が強いのが前提ですが。
このぶら下がりページをも評価するアルゴリズムのおかげで、単発の記事よりも、そのキーワードに対して深く掘り下げたサイト(そのジャンルのポータルサイト的なやつ)が比較的強くなります。
もちろん、サイトの場合、リンク構造が非常に重要になってくるのは言うまでもありません。
外部リンク
内部リンクだけではなく、外部リンクもぶら下がりページとして評価の対象となります。
(当然、外部リンクよりも内部リンクの方がより効率よく評価されるはずですが。)
例えば「笑えるブログを集めてみました」という記事内で、笑えるブログ(外部サイト)をいくつか紹介し、詳細な紹介文とともにそれぞれのブログへとリンクを貼れば、それらもぶら下がった状態と見なされます。
そのような記事は「笑えるブログ」などの検索ワードで表示されることになります。各ぶら下がりページ(それぞれのブログ)の価値が「笑えるブログを集めてみました」の記事に集まるからです。
ただしこのアルゴリズムを強くし過ぎると問題があります。
まとめサイトの乱立です。
まとめサイトは便利な場合もありますが、Googleにとっては非常に邪魔な存在です。
なぜなら、役割がGoogleと被ってしまうからです。
例えば「面白いブログ」という検索結果に、面白いブログをひたすら列挙しているページが表示されてしまうと、ユーザーにとっては二度手間になります。
目的のページを列挙するのは検索エンジンの役目です。その先にまた列挙しているだけのページが来ることをGoogleは嫌っています。
ただリンクを列挙する(ぶら下げる)だけじゃなく、それぞれのサイトについて説明なり意見なりを書いているのなら、Googleはそこに価値を見いだすはずです。
以上のようなアルゴリズムで、Googleは新しく見つけたwebページ、及び、サイトをスキャンすることで、そのページをどんな検索ワードの何番目ぐらいに表示するべきかを決定します。
いきなり検索結果の一位に表示されることもあれば、100位に登録されることもあります。
もちろん検索ワードによります。ライバルが強ければいきなり上位表示されることはまずないでしょう。
検索順位を入れ替えよ
ここまでは、Googleが新しく見つけたページを「まあこのページなら、○○って検索ワードの30位ぐらいかな?」と登録するまでの話です。
そのページの価値を暫定的に判定した上で、適当な順位に放り込んだだけです。本当の価値を計るのはこれからです。
インデックスされてからも、ご存知のように検索順位は大きく変動します。
その変動の根拠となるのが、ユーザー満足度です。
ユーザー満足度を計るアルゴリズム
Googleは検索者の行動をおそらくchromeブラウザを通して可能な限り監視・追跡しています。
例えば「セミの捕り方」で検索した人が、その検索結果5位に表示されている「セミを捕った話」というタイトルのページに移動したとします。
そして移動してから1分ほどでブラウザのバックボタンを押して検索結果に戻ったとします。
その「セミを捕った話」というページに書かれているコンテンツが600文字程度のものなら、Googleはユーザーがそのコンテンツを読んだと判断すると思います。
日本人(日本語)の読文スピードは分速500~600文字程度と言われていますので、Googleはそれに照らし合わせてユーザーがコンテンツを読んだのか途中で読むのをやめたのか推察しているはずです。
そうやって、検索結果に表示されているうちの、どのページが読まれていて、どのページが読まれていないか?をGoogleは常に監視しています。5位のページより6位のページの方がユーザーの役に立ってそうだなっていう風に。
では、「セミを捕った話」が5000文字のコンテンツだったら、どうでしょう?
もし5000文字のコンテンツを1分で離脱したなら、ユーザーは最後までコンテンツを読んでいないとGoogleは判断するはずです。
単純に滞在時間の長さを見ているわけではなく、コンテンツの量と照らし合わせることで、満足度を測っているということです。
コンテンツが長ければ長いほど、長く滞在してもらわなければ評価されません。
つまり、長文コンテンツはSEOに強いと言われますが、評価されるハードルもそれだけ高くなってしまうということです。
いくらキーワードや想起語を忍ばせた長文であっても誰も読んでいないと判断されれば検索順位は下がる一方です。
もちろん滞在時間だけでそのページの満足度を完全に測れるものではありません。ページを開いたままトイレに立つ人もいますから。
しかし1日数百回、数千回と検索される検索ワードなどではその評価の精度は高まるはずです。
それと、ぶら下げページ(上記のカテゴリーページみたいなやつ)の場合は、ユーザーが実際にそのリンクを踏んでいるか?も評価の対象になります。
さらに、そのリンク先での滞在時間も評価の対象です。
ユーザーの行動から、そのぶら下がっているページは本当にユーザーにとって価値あるページなのか?を推測しています。
そのようにして、ストーカーまがいの手法で、Googleは各検索結果ページにおけるユーザー満足度をチェックしています。
そのページの絶対的な満足度としてではなく、それぞれの検索ワードに対する相対的な満足度として測っています。
そりゃそうです。「セミを捕った話」というタイトルのページは「セミの捕り方」の検索結果に出て来てこそ値打ちがありますが、「カワセミの捕り方」の検索結果に出てきても邪魔なだけですね。
検索ワードに対する相対的な満足度を見極めることで、検索結果はより最適化されていきます。
ユーザー満足度検証テスト
Googleは検索結果の順位を微妙に上下させることがあります。
ユーザー満足度を測定した結果によって、順位を入れ替える。のはもちろんですが、それとは別にGoogleは検索者を相手にテストを行う為に順位をいじっているはずです。
検索結果7位と8位を入れ替えてみたり、急に20位のページを1ページ目に表示してみたり、100位のページを30位に表示してみたり、という様に、決して検索順位を固定することなく、あえていろんなページへ検索者を送り込みながら、ユーザー満足度テストを行っているんだと思います。
ある程度ランダムな要素がある方が結果的に順位は最適化されるはずです。
もちろんその中で、ユーザーの満足度が高そうなページは更にジャンプアップのチャンスに恵まれることになります。
逆にユーザーが明らかに最後まで読んでいないページだと判断されれば、順位は落ちていきます。
そうやって、常時、テストを繰り返すことによって、自然とユーザーにとって価値あるページが上位に集まるようになっているわけです。
まとめ
長々と書いてしまいましたが、要はSEOに強くする為には、サジェストキーワードを拾って目次を考えて長文書きゃいいんじゃないよ。ってことです。
長文はSEOに強いなんて言うけど、それは本質じゃないよってことです。
読まれてなんぼです。
読まれない長文はむしろ評価が下がります。もちろん、かなりの長文であるにも関わらずほとんどの人が最後まで読んでいると判断されるページは強いです。
ってことで、SEOを意識するなら、読まれるコンテンツを書きましょう。
あと、サイトの場合はリンク構造に注意、ブログの場合はカテゴリーの分け方に注意しましょう。っていう割と当たり前のお話でした。
P.S. どんどん検索順位が落ちていくページは、最後まで読まれていない証拠です。残念っ!