WEB歴 7年の専門家がホームページやブログ運営に役立つ情報を発信しています。

公開:2020年3月9日・更新:2020年4月10日

クローラーとは?仕組み・SEOで重要な理由・具体的な対策をやさしく説明

検索エンジンのクローラーのイメージイラスト

当記事を読むと「クローラーって何?」という人が「クローラーがSEOで重要な理由は〇〇だからだよ!」と自信を持って言えるようになります。

具体的にはクローラーの基礎知識からSEOで重要な理由、さらにはクローラー対策の具体的な内容まで幅広く説明しています。

当記事を読めば、SEOで必要なクローラー知識を一通り理解することができます。

クローラーとは

クローラーがインターネットを巡回して文書や画像などのデータを収集するイラスト

クローラーは検索エンジンを構成するプログラムの 1つです。その役割はインターネットを巡回して文書や画像などのデータを収集することです。

クローラーは次のように呼ばれることもあります。

  • ボット(Bot)
  • ロボット
  • スパイダー

そして、クローラーがインターネットを巡回して文書や画像などのデータを収集することを「クローリング」と呼ぶ人もいます。


以上が、クローラーの大まかな意味です。

ここからは、クローラーの仕組みについて分かりやすく説明していきます。

クローラーが収集するデータ(クローリング対象)

クローラーは「私たち人間がウェブブラウザを利用して閲覧できる情報(データ)と同じもの」を収集しています。具体的には次のようなものです。

  • HTMLファイル
  • CSSファイル
  • JavaScriptファイル
  • 画像
  • Flash
  • PDF・Word・Excelファイル

クローラーとウェブブラウザの通信プロトコルは同じ

クローラーが使用する通信プロトコル(通信規格)は、私たち人間が利用しているウェブブラウザの通信プロトコルと同じものです。

具体的には、どちらも「HTTP/HTTPS」という通信プロトコルを使用しています。

そのため、クローラーは「私たち人間がウェブブラウザを使用して閲覧できる情報」と同じデータを収集することが出来ます。

クローラーがインターネットを巡回(クロール)する仕組み

クローラーは、ウェブページに貼ってあるリンクをたどって別のページへ移動する仕組みになっています。イメージとしては下の画像のような感じです。

Googleのクローラーがリンクをたどってウェブページを移動する様子。

このように、クローラーはウェブページにあるリンクを「たどり」ながら世界中のウェブページを巡回してインターネット上のデータを収集しています。

これが、クローラーがインターネットを巡回する仕組みです。

クロールとクローラビリティ

ちなみに、クローラーがウェブページにあるリンクをたどってウェブサイトを巡回することを SEO用語で「クロール」と言います。

そして、クローラーが移動しやすいウェブサイトかどうかを SEO用語で「クローラビリティ」と言います。使用例は次のとおりです。

サイトをクロールする...【意味】クローラーがウェブサイトを巡回する

クローラビリティが高いサイト…【意味】クローラーが巡回しやすいウェブサイト

クローラーが収集したデータは検索エンジンのデータベースに登録(インデックス)される

クローラーがインターネットを巡回して収集したデータは、検索エンジンのデータベースに登録(インデックス)されます。

検索エンジンのデータベースから検索結果は作られる

クローラーのことを理解するために、検索エンジンの仕組みを少しだけ説明します。

検索結果はインターネットではなく検索エンジンのデータベースに登録(インデックス)されているウェブページから選ばれている

検索エンジンは、ユーザーが検索した際に「インターネット」から該当するウェブページを探しているわけではありません。検索エンジンは「自身のデータベース」から該当するページを探して検索結果を作成しています。

したがって、検索エンジンが検索結果を表示するためには「まず」インターネット上にあるデータを自身のデータベースに登録(インデックス)する必要があります。

このデータベースに登録するデータを収集しているのが、クローラーという訳です。

クローラはインターネットを常に巡回している

クローラーはインターネットを常に巡回しています。

その理由は正しい検索結果を表示するためです。そして、そのためには検索エンジンのデータベースを常にインターネッと同じにしておく必要があるからです。

検索結果はインターネットではなく検索エンジンのデータベースに登録(インデックス)されているウェブページから選ばれている

そうしないと次のような不具合が起きます。

①検索結果をクリックするとウェブページが削除されていた。

②検索結果に表示されている内容と違う内容のウェブページが表示される。
たとえば、検索結果に表示されているページタイトルは「SEOとは?」なのに実際に表示されたページは「会社概要」だったというような感じです。

これは、次の2つが違うのが原因です。

  • 検索結果 … 検索エンジンのデータベースから作成
  • 検索ユーザーがクリックした後に見るページ … インターネット上のページ

したがって、検索ユーザーを満足させる「正しい検索結果」を表示させるためには検索エンジンのデータベースを常にインターネッと同じにしておく必要があります。

そして、そのためにクローラーはインターネットを常に巡回しています。

SEOでクローラー対策が重要と言われる理由

SEOでは「クローラー対策が重要」とよく言われています。

その理由は、先述したように検索結果は「検索エンジンのデータベース」をもとに作られていて、そこに登録するデータを収集しているのがクローラーだからです。

検索結果はインターネットではなく検索エンジンのデータベースに登録(インデックス)されているウェブページから選ばれている

ウェブページを新しく作ったりページ内容を変更したりした場合は「まず」クローラーにデータを収集してもらう必要があります。そうしないと、いつまで経っても検索結果は変りません。

つまり、SEOを効率的に進めるためには「ウェブサイトの変更情報をクローラーに素早く収集してもらう」ことが重要という訳です。これがSEOで「クローラー対策が重要」と言われる理由です。

SEO のクローラー対策【具体的な内容を紹介】

SEOではクローラー対策として次のようなことを行います。

  • ウェブサイトにクローラーが来るように依頼する
  • ウェブサイトをクローラーが巡回しやすい構造にする
  • クロールの無駄を無くす

それぞれの作業について順番に説明します。

ウェブサイトにクローラーが来るように依頼する

一つ目は、クローラーがウェブサイトに来るよう「こちらから依頼する」ことです。

具体的には次の作業を行います。

  • XMLサイトマップの送信
  • URL検査ツールを使用した巡回依頼

上記作業について詳しく説明した記事があります。下記リンクよりご覧ください。

ウェブサイトをクローラーが巡回しやすい構造にする

二つ目は、ウェブサイトをクローラーが巡回しやすい構造にすることです。

具体的にはウェブサイトに貼る内部リンクを最適化します。作業の詳しい内容については、次の記事をご覧ください。

クロールの無駄を無くす

三つ目は、クロールする必要のないページを「こちらから」検索エンジンに伝えてクロールの無駄を無くすことです。

具体的には次の作業を行います。

  • URLの正規化
  • noindexメタタグの設定

上記作業について詳しく説明した記事があります。下記リンクよりご覧ください。

クローラーの種類:検索エンジンの数だけある

最後にクローラーの種類を紹介します。

検索エンジンごとに使用しているクローラーは異なります。そのため、検索エンジンの数だけクローラーの種類はあります。

代表的な検索エンジンと、その検索エンジンが使用しているクローラーをあげると次のとおり。左が検索エンジン、右がクローラーです。

  • Google … Googlebot
  • Bing … Bingbot
  • 日本以外のYahoo! … Yahoo Slurp
  • 百度 … Baiduspider
  • Naver … Yetibot

Yahoo! JAPAN は Google の検索エンジンを使用

本来は 検索エンジンの数だけ SEO が必要

「検索エンジンごとにクローラーが違う」ということは、各検索エンジンのクローラーに対して別々にSEOをする必要があるということです。

そうしないと、次のようなことが起こります。

ウェブサイトが Google の検索エンジンには表示されるけれど、その他の検索エンジンには表示されない…
原因は、Google のクローラーしかウェブサイトの情報を収集してないためです。

このような状況を防ぐためには、各検索エンジンのクローラーに対して別々にSEOをする必要があります。

実際は Googleのクローラー対策だけでOK

しかし、実際は Google のクローラーに対してだけSEOをする場合がほとんどです。

理由は、日本における検索エンジンのシェアの9割以上が Googleだからです。これは、Googleにウェブサイトが表示されれば検索ユーザーの9割以上にウェブサイトが見てもらえることを意味します。

そのため、日本のユーザーを対象にしたウェブサイトの場合は Google に対してだけSEOをすれば充分という訳です。

まとめ

クローラーは検索エンジンを構成するプログラムの 1つで、その役割はインターネットを巡回して文書や画像などのデータを収集することです。

もう少し言うと、検索結果は「検索エンジンのデータベース」をもとに作られていて、そこに登録するデータを収集しているのがクローラーです。

そのため、SEOを効率的に進めるためには「ウェブサイトの変更情報をクローラーに素早く収集してもらう」ことが重要になります。これが、SEOでクローラー対策が重要と言われる理由です。

そして、SEOで行うクローラー対策は次の2つです。

  • ウェブサイトにクローラーが来るように依頼する
  • ウェブサイトをクローラーが巡回しやすい構造にする
  • クロールの無駄を無くす

上記2点の具体的な作業については本文に書いたとおりです。

また、クローラーの種類は検索エンジンの数だけ存在します。そのため、本来は各検索エンジンのクローラーに対して別々にSEOをする必要があります。

しかし、実際は Google のクローラーに対してだけSEOをする場合がほとんどです。理由は、日本における検索エンジンのシェアの9割以上が Googleだからです。


以上で、当記事の内容は終了です。

当ウェブサイトにはクローラーに関する次のような記事もあります。

興味のある方は、ぜひご覧ください。

おわり

当記事の内容が役にたったという方は、他の方に紹介していただけると嬉しいです。

— スポンサーリンク— 

タグ:

これからブログを始めたい人にオススメの記事

トップへ戻るボタン