SEOApril 5, 20256 min read
    MW
    Marcus Weber

    ウェブサイトの重複ページを見つけて修正する:テクニカルSEOガイド

    ウェブサイトの重複ページを見つけて修正する:テクニカルSEOガイド

    SEOを向上させるための重複ページの検出と除去方法:完全な技術的サイト監査ガイド

    導入:重複ページがSEOを損なう理由

    重複ページは、ウェブサイトのパフォーマンスに対する一般的な脅威であり、しばしば見えない問題です。CMSの設定、不適切なリダイレクト、または動的URL生成によって引き起こされるこれらのページは、ランキング力を分散させ、検索エンジンを混乱させ、クロールの非効率を引き起こします。一見無害に見えても、重複ページはインデックス化の問題、低い検索 visibility、およびユーザーエクスペリエンスの問題を引き起こすことがあります。

    このガイドでは、サイト全体で重複ページを検出、分析、除去する方法を探ります。SEOの専門家、開発者、サイト所有者が、GoogleとYandexで最適なパフォーマンスをサポートする技術的に堅牢なウェブサイトアーキテクチャを作成するためのツール、テクニック、実践的な例を組み合わせます。


    第1章:ドメインのバリエーションとリダイレクトから始める

    重複の最初の層:ドメインのバリエーション

    サイトをクロールする前に、すべてのドメインのバージョンが主要なバージョンに適切にリダイレクトされることを確認してください。これには以下が含まれます:

    • http://example.com
    • https://example.com
    • http://www.example.com
    • https://www.example.com

    これらの各々が、単一の正規バージョン(通常はHTTPSで「www」の有無に関わらず)に301リダイレクトを行うべきです。不適切または欠落したリダイレクトは、ホームページや内部ページの重複バージョンを生み出します。

    ドメインのリダイレクトを確認するためのツール

    • SEOクローラー(Netpeak SpiderやScreaming Frogなど)
    • ブラウザのアドレスバーとリダイレクトチェッカー
    • Google Search ConsoleまたはYandex Webmaster

    リダイレクトがクリーンでない場合や、誤ったステータスコード(例:301の代わりに302)を使用している場合、検索エンジンはこれらのページを別個のものとして扱い、インデックス化された重複を引き起こす可能性があります。


    第2章:HTTPSをデフォルトプロトコルとして確保する

    混合プロトコルの確認

    サイトがHTTPSを使用していても、内部でHTTPバージョンへのリンクやリダイレクトが存在しないことを確保することが重要です。HTTPを使用した内部リンクはHTTPSの代わりに:

    • 不要なリダイレクトを引き起こします
    • クローラーを混乱させます
    • ユーザーの信頼とセキュリティに影響します

    解決策

    • 内部リンクリストでhttp://リンクを検索します
    • それらをhttps://相当のものに置き換えます
    • 優先バージョンを強制するためのcanonicalタグを使用します

    サイトにHTTPとHTTPSの両方へのリンクがある場合、2つのコンテンツセットとして解釈される可能性があります。


    第3章:ホームページのバリエーションの重複を検出する

    重複の一般的な原因はホームページです。

    ホームページの典型的な重複URL:

    • example.com
    • example.com/index.html
    • example.com/index.php
    • example.com/home

    対処方法

    すべてのバリエーションを単一のバージョン(理想的にはルートURL example.com/)に301リダイレクトを使用します。追加のセキュリティのためにcanonicalタグを使用します。これにより、ホームページの複数のバージョンがインデックス化されるのを防ぎます。

    確認方法:

    • 手動のブラウザテスト
    • Netpeak Spiderの「Duplicate URLs」レポート
    • Google Search ConsoleのURL検査ツール

    第4章:末尾スラッシュの問題とGETパラメータ

    末尾スラッシュの不整合(/page/ vs /page)と不要なGETパラメータ(?source=nav)は、同じコンテンツに対する複数のURLを作成します。

    例:

    • example.com/products
    • example.com/products/
    • example.com/products?page=1

    検索エンジンは、以下がない限り、これらを異なるページとして扱う可能性があります:

    • Canonicalタグが正しく設定されている
    • GETパラメータが検索エンジンツールで除外されている

    推奨事項:

    • サイト全体で末尾スラッシュを標準化する
    • 正しいバージョンを定義するためのcanonicalタグを使用する
    • robots.txtまたはGoogle/Yandex Webmaster Toolsのパラメータ設定で関連のないGETパラメータを禁止する

    第5章:大文字小文字の区別問題

    URLの大文字小文字の区別は、もう一つの隠れた重複問題です。以下のようなURL:

    • example.com/Page
    • example.com/page

    検索エンジンによって別個のものとして扱われます。

    予防方法:

    • ウェブサーバーを小文字のURLを強制するように設定する
    • 大文字バージョンを小文字にリダイレクト(301)
    • すべての小文字URLにcanonicalタグを使用する

    CMSやルーティングシステムが競合するケースを自動生成しないようにしてください。


    第6章:CMS生成の重複ページ

    コンテンツ管理システム、特にBitrixやWordPressのような高度なカタログ機能を持つプラットフォームは、自動的に生成する可能性があります:

    • 同じ製品に対する複数のURL
    • 重複カテゴリーページ
    • ソート/フィルタリングページでユニークなURL

    例:

    複数のカテゴリの下にリストされた1つの製品は、以下に表示される可能性があります:

    • /tools/drills/product123
    • /power-tools/product123

    解決策:

    • メインのバージョンにcanonicalタグを使用して指す
    • ソート、フィルタリング、検索のためのURLパラメータを制限する
    • 必要に応じて301リダイレクトを実装する

    第7章:ページネーションと正規化の扱い

    ページネーションの落とし穴

    ページネーションが正しく扱われていない場合、重複コンテンツを引き起こす可能性があります。例えば:

    • /blog?page=1
    • /blog?page=2

    適切なシグナルがない場合、検索エンジンはこれらを別個のコンテンツセットとして見なす可能性があります。

    ベストプラクティス:

    • ルートページネーションページ(/blog)にrel="canonical"を使用して指す
    • 代替として、関係性を示すrel="prev"とrel="next"を使用(Googleでは非推奨ですが、構造には依然として有用)
    • ページネーションシリーズの各ページでタイトルとメタ記述タグをカスタマイズして、重複メタデータを避ける

    ページネーションシリーズのすべてのページで同じH1とメタ記述を使用しないでください。


    第8章:言語バージョンの重複

    複数の言語バージョンを提供するサイトは、hreflangタグやcanonicalリンクの実装を忘れることがあります。

    1つの言語のみの場合:

    以下を確保してください:

    • 代替言語URLが誤って生成されない
    • CMSが不要な場合に/en//ru/のようなフォルダを作成しない

    1つの言語のみを提供する場合、重複を避けるために未使用のバージョンをブロックまたはリダイレクトしてください。


    第9章:検索インデックスの重複ページ

    site:演算子またはYandexの検索インデックスエクスポートツールを使用して検出してください:

    • インデックス化されたままの古いまたはテストサブドメイン
    • インデックスに残った削除されたコンテンツ
    • 重複メタタイトルと記述

    アクションステップ:

    • 孤立したページをクリーンアップする
    • 必要な場所で「noindex」メタタグを使用する
    • Google Search ConsoleまたはYandex Webmasterで削除を送信する

    第10章:壊れたURLとリダイレクトURL

    デッドページ(404)

    404ページへの内部リンクは深刻なSEO問題です。これらは:

    • クロール予算を浪費します
    • ユーザーを混乱させます
    • リンクエクイティの流れを損ないます

    定期的に監査し、非存在ページへのリンクを削除または修正してください。

    リダイレクトチェーンとループ

    以下のようなチェーン:

    • Page A → Page B → Page C

    遅延とクロールの非効率を引き起こします。リダイレクトループはさらに悪いです。

    修正:

    • 最終目的地に直接リンクする
    • リダイレクトチェーンを検出するためのツールを使用(Netpeak、Screaming Frog)
    • 可能な限りリダイレクトを1ホップに制限する

    第11章:薄いコンテンツ重複の検出と除去

    一部の重複ページは技術的に重複ではありませんが、最小限または冗長なコンテンツを提供します。これらには以下が含まれます:

    • 自動生成されたタグページ
    • 空のカテゴリーページ
    • 類似の見出しだが同一のコンテンツを持つページ

    修正:

    • 適切な場所で統合する
    • canonicalまたはnoindexタグを使用する
    • 薄いコンテンツを改善または削除する

    第12章:Canonicalタグのベストプラクティス

    重複する可能性のあるすべてのページに、正しいバージョンに指す明確なcanonicalタグがあることを確保してください。

    Canonicalを使用する場所:

    • ページネーションシリーズ
    • フィルタリングまたはソートされた製品リスト
    • 製品バリエーション
    • 複数のカテゴリに再掲されたコンテンツ

    一般的なミス:

    • 404に指すcanonicalタグ
    • 誤った大文字小文字やパラメータに指す自己参照タグ
    • ページネーションまたはフィルタリングページから欠落したタグ

    重複ページ制御のための最終SEO監査チェックリスト

    ✅ すべてのドメインのバリエーションに301リダイレクトを設定
    ✅ HTTPSを強制し、HTTPページをリダイレクト
    ✅ ホームページに1つのインデックス可能なURLのみ
    ✅ 末尾スラッシュポリシーが一貫
    ✅ GETパラメータを管理および/または除外
    ✅ 大文字小文字の区別を正規化
    ✅ CMSの重複パターンを監査および解決
    ✅ ページネーションに適切な正規化を使用
    ✅ 言語バリエーションにhreflangを実装
    ✅ 壊れた内部リンクを修正
    ✅ リダイレクトチェーンを排除
    ✅ Canonicalタグをサイト全体で使用および検証
    ✅ 重複メタタグとH1を排除
    ✅ 薄い重複コンテンツを特定およびクリーンアップ


    結論:クリーンなアーキテクチャがクローラビリティとランキングを向上させる

    重複ページはSEOの力を消耗します。キーワードの関連性を分散させ、クロールの効率を低下させ、アルゴリズムフィルターを引き起こす可能性があります。詳細な技術監査を実施し、これらの問題に対処することで、サイトの品質、信頼性、検索パフォーマンスを向上させます。

    小規模ビジネスサイトから大規模eコマースプラットフォームまで、重複監査を継続的に行うことが不可欠です。技術的な専門知識を構造化されたプロセスと組み合わせ、コンテンツが意図した通りにインデックス化されランキングされることを確保してください。

    📚 SEOとデジタルマーケティングに関する詳細

    関連記事

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation