WEB歴 7年の専門家がホームページやブログ運営に役立つ情報を発信しています。

公開:2020年3月25日 / 更新:2020年3月28日

【SEO初心者むけ】URLの正規化とは?重要な理由と方法も説明

「URLの正規化」と聞くとなんだか難しい感じがしますが、そんなことはありません。

ただ「一言でわかりやすく説明して」と言われると難しいのは事実です。

当記事は、具体例をたくさん使用しながらURLの正規化について分かりやすく説明したものです。そのため文字数は多めです。

文字数が多くても良いからURL正規化について理解したい!

という方は当記事をぜひご覧ください。

URLの正規化とは

まず、URLの正規化について大まかに説明します。

ウェブサイトに同じような内容のページが複数ある場合に「検索結果に表示したいページは〇〇というURLのページ」と検索エンジンに伝えることをURL正規化といいます。

具体的に説明します。

たとえば、EC(通販)サイトに「同じ商品の色違いページ」が複数あるとします。ページ内容は商品の色以外は全て同じです。

つまり、同じような内容のページがウェブサイトに複数ある状態です。

同じ商品の色違いページ

  • カバン(茶色)https://sample.com/bag/brown/
  • カバン(白色)https://sample.com/bag/white/
  • カバン(黒色)https://sample.com/bag/black/

URLの末尾が異なる

このような場合に行うのがURLの正規化です。こちらから検索エンジンに対して「検索結果に表示したいページは〇〇というURLのページ」と伝えます。

たとえば、次のような感じです。

検索結果に表示したいページは「https://sample.com/bag/brown/」というURLのページ(カバン茶色)です! と検索エンジンに伝える。


同じ商品の色違いページ

  • カバン(茶色)https://sample.com/bag/brown/
  • カバン(白色)https://sample.com/bag/white/
  • カバン(黒色)https://sample.com/bag/black/

そうすると、検索結果に自分が意図したページが表示されるようになります。上記の場合ならば「カバン(茶色)」が検索結果に表示されます。

これが URLの正規化です。以上で大まかな説明は終わりです。

Googleが説明するURL正規化の意味「正規ページを設定する」

ここまでに説明したように、URLの正規化はウェブサイトに同じような内容のページが複数ある場合に「検索結果に表示したいページは〇〇というURLのページ」と検索エンジンに伝えることです。

この「検索結果に表示したいページは〇〇というURLのページ」を「正規ページ(正規URL)」とGoogleは表現しています。それが次の文章です。

類似ページや重複ページについて正規ページを設定する

正規 URL とは、サイトの重複するページの中で Google が最も代表的と考えるページの URLです。たとえば、同じページに対して複数の URL がある場合(例: example.com?dress=1234とexample.com/dresses/1234)、Googleはそのうちの 1 つを正規 URL として選択します。

URL正規化とは【Google】

そして、Googleは「正規ページ」という言葉を使ってURL正規化の意味を次のように説明しています。

ほとんど同じコンテンツの複数のページがサイトに含まれる場合、優先する URL を Google に指定する方法(「正規化」と呼びます)

したがって、上記文章がURL正規化の正しい意味になります。

同じような内容のページ = 重複コンテンツ

また、ウェブサイトに同じような内容のページが複数あることを「重複コンテンツ」と Google は表現します。

その証拠に、ここまでに紹介したGoogleのウェブページのタイトルは次のとおり。

  • 重複した URL を統合する
  • 重複コンテンツの作成を避ける

したがって「重複コンテンツ」という言葉もこの機会に覚えておくと良いと思います。

URL正規化がSEOで重要と言われる理由【3つ】

URLの正規化がSEOで重要と言われる理由は次の 3つです。

  • 被リンクが分散して検索順位が上がりづらくなる
  • 重複コンテンツとしてペナルティを受ける可能性がある
  • クローラーの巡回効率が悪くなる

それぞれについて順番に説明していきます。

被リンクが分散して検索順位が上がりづらくなる

一つ目の理由は、URLの正規化をしていないと被リンク(外部リンク)が分散するためウェブページの検索順位が上がりにくくなることです。

根拠は Google 公式サイトの次の記述です。

正規 URL の指定が重要な理由

類似ページや重複ページについてリンクのシグナルを統合するため。これにより、検索エンジンで、個々の URL について得られた情報(その URL へのリンクなど)を、選んだ 1 つの URL に統合できるようになります。つまり、他のサイトからの
http://example.com/dresses/cocktail?gclid=ABCD へのリンクが、https://www.example.com/dresses/green/greendress.htmlへのリンクに統合されます。

上記の文章を分かりやすく言い換えると次のとおり。

「内容が似ているページ」や「同じ内容のページ」に付いている被リンクを一つのURLに統合するために URLの正規化は重要。

どうして被リンクを統合する必要があるかというと、検索エンジンがウェブページの評価に被リンクの数を使用しているからです。

そのため、被リンクが分散した状態だと被リンクを統合した状態に比べウェブページの検索順位は上がりにくくなります。

したがって、SEOを効果的に進めるためにはURLの正規化が欠かせません。これが、URL正規化が SEO で重要と言われる一つ目の理由です。

被リンク(外部リンク)が分散するとは

「URLの正規化をしていないと被リンクが分散する」と聞いても、その意味が分からない人も多いかと思います。

そのような人のために「URLの正規化をしていないと被リンクが分散する」の意味について具体例を使用しながら分かりやすく説明します。

たとえば「SEOとは?」というブログ記事が次の 3つの URL で表示されるとします。

ブログ記事:SEOとは?

  • http://tk-create.com/what-is-seo/
  • http://tk-create.com/what-is-seo/index.html
  • http://www.tk-create.com/what-is-seo/

違い … 「index.html」と「www」の有無

301リダイレクト設定をしていないと上記3つのURLは同じページを表示します

そして、各ウェブページ(URL)に被リンクが5本ずつ付いているとします。

ブログ記事:SEOとは?

  • 【被リンク 5】http://tk-create.com/what-is-seo/
  • 【被リンク 5】http://tk-create.com/what-is-seo/index.html
  • 【被リンク 5】http://www.tk-create.com/what-is-seo/

この場合、検索エンジンはブログ記事「SEOとは?」の被リンクは5本と評価します。3つのURLに付いている被リンクを合計した15本とは評価されません。

これが「被リンク(外部リンク)が分散する」の意味です。

被リンク(外部リンク)が分散する理由は、検索エンジンが「それぞれのURLを別々のページと判断してしまう」からです。

重複コンテンツとしてペナルティを受ける可能性がある

二つ目の理由は、重複コンテンツとしてペナルティを受ける可能性があることです。

根拠は Google 公式サイトの次の記述です。

ごくまれなケースとして、Google でのランキングの操作やユーザーへの偽装を意図した重複コンテンツが表示される可能性が認識された場合も、Googleでは関係するサイトのインデックス登録とランキングに対して適切な調整を行います。

その場合、該当するサイトはランキングが低下するか、Google インデックスから完全に削除されて検索結果に表示されなくなる可能性があります。

上記をみるとわかるように、ウェブサイトに同じような内容のページが複数ある場合「ごくまれ」にペナルティを受けることがあります。

そして、ペナルティを受けた場合はウェブページの検索順位が低下するか検索結果に全く表示されなくなります。

このような事態を未然に防ぐためにもURLの正規化は重要です。これが、URL正規化が SEO で重要と言われる二つ目の理由です。

クローラーの巡回効率が悪くなる

三つ目の理由は、URLの正規化をしていないとクローラーの巡回効率が悪くなることです。根拠は Google 公式サイトの次の記述です。

正規 URL の指定が重要な理由

重複したページのクロールに時間がかかるのを防ぐため。Googlebot でサイトが最大限に活用されるようにするには、サイト内の同一ページの PC版とモバイル版のクロールよりも、新しい(または更新された)ページのクロールに多くの時間をかけられるようにするのが効果的です。

上記文章については説明は不要と思いますので省略します。

これが、URL正規化が SEO で重要と言われる三つ目の理由です。

URLの正規化が必要なケース【4つ】

URLの正規化が必要なのは、ウェブサイトが次のような状態のときです。

  • 同じような内容のページが複数ある
  • 複数の異なる URL で同じページが表示される
  • PCとスマホ(モバイル端末)で表示するページが違う
  • ウェブページの印刷用バージョンやPDFバージョンがある

それぞれについて順番に説明します。

同じような内容のページが複数ある

一つ目のケースは、ウェブサイトに同じような内容のページが複数ある場合です。

具体的には、先述した EC(通販)サイトで「同じ商品の色違いページ」がある場合などが、このケースに該当します。

もう一度、先述の具体例を見てみましょう。

同じ商品の色違いページ

  • カバン(茶色)https://sample.com/bag/brown/
  • カバン(白色)https://sample.com/bag/white/
  • カバン(黒色)https://sample.com/bag/black/

URLの末尾が異なる

これらのページは完全に同じではありませんが「商品の色」以外の部分はすべて同じです。つまり、同じような内容のページがウェブサイトに複数ある状態になります。

このような場合は URLの正規化が必要です。

複数の URL で同じページが表示される

後ほど説明しますが「301リダイレクト(URL転送処理)」という設定をしていないと、同じウェブページが複数のURLで表示されます。これが二つ目のケースです。

たとえば、次のURLはすべて同じウェブページを表示します。

先頭が http

  • http://tk-create.com/what-is-seo/
  • http://tk-create.com/what-is-seo/index.html
  • http://www.tk-create.com/what-is-seo/

先頭が https

  • https://tk-create.com/what-is-seo/
  • https://tk-create.com/what-is-seo/index.html
  • https://www.tk-create.com/what-is-seo/

その他の違い … 「index.html」と「www」の有無

上記のURLには様々な違いがありますが、表示されるウェブページは同じです。

このような場合にもURLの正規化が必要です。

具体例のURL以外

具体例で紹介したURL以外にも URL末尾のファイル名が「index.php」だったり、ディレクトリ名の最後に「/(スラッシュ)」が無かったりする場合もあります。

気になる方は調べてみてください。

PCとスマホ(モバイル端末)で表示するページが違う

三つ目のケースは、PCとスマホ(モバイル端末)で表示するページが違う場合です。

たとえば、次のような場合です。

  • PC用 https://sample.com/
  • スマホ用 https://sample.com/sp/

PC とスマホで表示するウェブページの違いはデザイン(文字や画像の大きさ)だけです。つまり、同じような内容のページがウェブサイトに 2つあるということです。

このような場合にも URLの正規化が必要です。

ウェブページの印刷用バージョンやPDFバージョンがある

四つ目のケースは、ウェブページの印刷用バージョンやPDFバージョンがある場合です。

たとえば、次のような場合です。

  • 通常用 https://sample.com/
  • 印刷用 https://sample.com/print/
  • PDF版 https://sample.com/pdf/

上記ウェブページの違いはCSS(スタイルシート)やファイル形式です。書かれている内容については全く同じはずです。

つまり、同じような内容のページがウェブサイトに複数あるということです。このような場合にも URLの正規化が必要です。

URLを正規化する方法【4つ】

URLを正規化する方法は次の4つです。以下、Google公式サイトの引用です。

具体的な方法

  • rel="canonical" リンクタグを使用する
  • rel="canonical" HTTP ヘッダーを使用する
  • サイトマップを使用する
  • 廃止する URL に 301 リダイレクトを使用する

4つの方法を全て行う必要はありません。ウェブページの内容やウェブサーバーの状況に応じて、どれか一つを選んでURLを正規化をします。

一般的には、次のような感じになるかと思います。

301リダイレクト

  • 複数の異なる URL で同じページが表示される

cannoical(カノニカル)タグの設定

  • 同じような内容のページが複数ある
  • PCとスマホ(モバイル端末)で表示するページが違う
  • ウェブページの印刷用バージョンやPDFバージョンがある

ここからは URLを正規化する方法について使用頻度の高い順に説明していきます。

rel="canonical" リンクタグを使用する(カノニカル)

rel="canonical" リンクタグはHTMLタグの一つです。役割は「検索エンジンに正規ページ(一番重要なページ)がどれか」を伝えるためのものです。

たとえば、次のようなウェブページがあったとします。

同じ商品の色違いページ

  • カバン(茶色)https://sample.com/bag/brown/
  • カバン(白色)https://sample.com/bag/white/
  • カバン(黒色)https://sample.com/bag/black/

そして、上記ウェブページのなかにある「カバン(茶色)」を正規ページ(一番重要なページ)と検索エンジンに伝えたいとします。

この場合ならば「カバン(白色)」と「カバン(黒色)」のウェブページに次のような cannoical(カノニカル)タグを記述します。


                                        <link rel="canonical" href="https://sample.com/bag/brown/" />
                                    

そうすると、検索エンジンに「カバン(茶色)」が正規ページ(一番重要なページ)ということが伝わります。

どのような場合に使用するべきか

rel="canonical" リンクタグは、URL正規化が必要な全てのケースに対応することが出来ます。具体的には次のケースです。

  • 同じような内容のページが複数ある
  • 複数の異なる URL で同じページが表示される
  • PCとスマホ(モバイル端末)で表示するページが違う
  • ウェブページの印刷用バージョンやPDFバージョンがある

ただ、上記のなかにある「複数の異なる URL で同じページが表示される」に関しては後述する「301リダイレクト」を使用した方が良いと思います。理由については、後述する「301リダイレクト」で説明します。

書き方

rel="canonical" リンクタグの詳しい書き方については次の記事で説明していますので、そちらをご覧ください。

301リダイレクト

301リダイレクトは、特定のURLへのアクセスを別のURLへ転送する処理のことです。

具体的に言うと、〇〇というURLのウェブページにアクセスがあったら××というURLのウェブページに転送するという処理のことです。

たとえば、次のように 3つの URL で同じウェブページが表示されるとします。

ブログ記事:SEOとは?

  • http://tk-create.com/what-is-seo/ ← ①
  • http://tk-create.com/what-is-seo/index.html← ②
  • http://www.tk-create.com/what-is-seo/← ③

違い … 「index.html」と「www」の有無

そして、正規ページ(一番重要なページ)は①と検索エンジンに伝えたいとします。

この場合は②③のURLへのアクセスを①に転送するように設定します。具体的には次のとおり。

  • http://tk-create.com/what-is-seo/ ← ①
  • http://tk-create.com/what-is-seo/index.html← ①に転送
  • http://www.tk-create.com/what-is-seo/← ①に転送

そうすると、どのURLにアクセスしても①のURLが表示されるようになります。

このようにすると、検索エンジンに①が正規ページ(一番重要なページ)ということが伝わります。これが、301リダイレクトによるURL正規化です。

どのような場合に使用するべきか

301リダイレクトを使用するのは「複数の異なる URL で同じページが表示される」場合のみです。

rel="canonical" リンクタグより優先する理由

複数の異なる URL で同じページが表示される場合に、rel="canonical" より301リダイレクトを優先する理由は次の 2つです。

  • ユーザーに正規ページ以外を表示しないため
  • 検索エンジンに正規ページを伝える効果が高いから

同様のことがGoogle公式サイトにも記述されています。

(前略)サーバー側での 301リダイレクトは、ユーザーや検索エンジンを正しいページに確実に誘導するのに最適な方法です。ステータス コード 301は、ページが別の場所に完全に移転したことを意味します。

設定方法「.htaccess」を使用

301リダイレクトの設定方法は次のとおりです。

  1. 「.htaccess」というファイルに URL の転送処理を記述
  2. ウェブサーバーに「.htaccess」ファイルを設置

「.htaccess」ファイルに記述するURLの転送処理についての説明は省略します。詳しく知りたいという方は「301リダイレクト htaccess」というキーワードで Google
検索してみてください。

サイトマップを使用する(XMLサイトマップ)

XMLサイトマップでも正規ページ(一番重要なページ)を検索エンジンに伝えることが出来ます。ただし、その効果はあまり高くありません。

根拠は Google 公式サイトの次の記述です。

サイトマップ内の URL が正規と見なされることは保証されませんが、サイトマップを使うと、大規模なサイトでも正規 URLを簡単に設定でき、また、サイト上のどのページを最も重要と見なすかを Google に伝えるのに役立ちます。

したがって、XMLサイトマップを使用したURL正規化はおすすめ出来ません。

どのような場合に使用するべきか

rel="canonical" リンクタグ や 301リダイレクトの補助として使用。

XMLサイトマップの作成方法

XMLサイトマップを作成する際は、正規ページ以外のURLを含めないように注意してください。詳しい作成方法については、次の記事をご覧ください。

rel="canonical" HTTP ヘッダーを使用する

rel="canonical" HTTP ヘッダーは、サーバーを構成する権限がないと使用できません。

したがって、詳しい説明は省略します。

パラメータ付き URL(検索・並び替え機能)は noindex

検索や並び替え機能を使用するとウェブページの URLに余計なパラメータが付く場合があります。こういった場合は noindex(メタタグ)を使用してURL正規化をします。

具体的に説明します。たとえば、次のようなウェブページがあったとします。

ページ内容:女性用ドレス「緑色」の一覧ページ

① 通常(静的なURL):https://example.com/women/dress/green/


②「女性 ドレス 緑色」で検索

https://example.com/?search=women+dresss+green


③ 検索後に「価格」で並べ替え

https://example.com/?search=women+dresss+green&search_sort=price

①と②のURLで表示されるウェブページは全く同じです。そして ③は商品(ドレス)を表示する順番が①と②と違うだけです。

つまり、同じような内容のページがウェブサイトに複数あるということです。したがって URLの正規化が必要です。

noindex を使用した URL正規化

ページ内容:女性用ドレス「緑色」の一覧ページ

① 通常(静的なURL):https://example.com/women/dress/green/


②「女性 ドレス 緑色」で検索

https://example.com/?search=women+dresss+green


③ 検索後に「価格」で並べ替え

https://example.com/?search=women+dresss+green&search_sort=price

まず、①のURLに「自己参照」のrel="canonical"リンクタグを設定して①が正規ページということを検索エンジンに伝えます。

次に、上記②と③のURLにnoindexメタタグを記述して②と③は「正規ページではない」ということを検索エンジンに伝えます。noindexを設定したページにはクローラーが来なくなるためクロールの無駄をなくす事ができます。

noindexの書き方は次のとおりです。


                    <meta name="robots" content="noindex" />
                                

WordPressはプラグインでnoindex 設定

WordPressの場合は「All in One SEO Pack」というプラグインを使用すると簡単に②③の noindexが設定できます。

WordPressのプラグイン「All in One SEO Pack」の画像

設定方法については長くなるため省略します。

その他のパラメター付きURLについて

具体例で紹介したURL以外にも不要なパラメータが付くケースはいくつもあります。詳しく知りたい方は次のページをご覧ください。


おわり

以上で、当記事の内容は終了です。

  • カテゴリ:
  • SEO
タグ:,

【初心者向け】まとめ記事

SEOまとめ記事

トップへ戻るボタン