SEO監査の習得 - Screaming Frog SEO Spiderで洞察を解き放つ


推奨: クロールデータダンプから始め、最大の問題をすぐにタグ付けしてください。サイトでScreaming Frogを実行し、各URLパスをステータス、リダイレクト、canonicalシグナルとペアにしたCSVをエクスポートします。これを修正の公開と、エディタや開発者と共有するもののソースとして保持します。各キーページがクロール結果に存在することを確認してください。クロールデータ自体がタイムスタンプ付きの証拠を運びます。
regex フィルターを使用して問題をタイプ(リダイレクト、欠落タグ、または壊れたアセット)ごとに分離し、修復のための選択肢を比較します。URLパスとステータスコードでフィルタリングしてパターンを迅速に特定します。チームは高優先と見なされる問題をマークして解決を加速できます。
プロトコルシグナルとcanonicalパスマッピングを確認: httpがhttpsにリダイレクトされることを確認し、ネストされたパスがソースコードと一致し、公開ワークフローが一貫したリンクを使用することを確認します。これによりクロールがクリーンになり、偽陽性を減らします。
オーガニックアセットを監査: タイトル、メタ記述、ヘッダータグ、画像のaltテキスト。変更を追跡するために生きているチェックリストとコンテンツ所有者向けのヒントを使用します。修正のログを保持し、オーガニックランキングへの影響を週次で測定します。
自動化により監査をスケールアップ: 保存されたチェックをスケジュールし、ヒント駆動のレポートを生成し、Open、Fixed、New 問題を表示するメインダッシュボードを提示します。ユーザーが優先順位を選択し、オーナーを割り当て、進捗を監視できるワークフローを構築し、変更を確認するためのセルフチェックを含めます。
大規模サイトの場合、パスでクロールを分割し、リクエストをずらしてクラッシュを避けます。クロールに問題が発生した場合、深度を減らして再起動し、結果をマージします。regexを使用してスコープを制限し、チームとの共有のためにダンプをコンパクトに保ちます。
公開パイプラインに注意を払い: リンク検証、canonicalの規律、リダイレクトルール。Screaming Frogをベースラインツールとして扱い、データ共有のための軽量プロトコルと組み合わせることで、監査の精度を向上させ、コンテンツチームの意思決定を加速できます。
User-Agentの選択がクロール結果とデータシグナルを形成する方法を分析するための対象ステップ

まず、2つの主要なUser-Agent文字列(Googlebot DesktopとGooglebot Smartphone)を選び、パラレルクロールを実行し、各UAに明示的なラベルを付けてスタジオに結果を保存します。
同じスコープを設定: 深度、サブドメインカバレッジ、クロールモード; フォースダイレクテッドビジュアライゼーションを使用して、UA間の内部パスがどのように異なるかを特定し、各UAからより多くのリクエストを受けるページを特定します。
必須シグナルを含め: ステータス、レスポンスタイム、ページタイトル、ヘッダー、内部リンク、PageSpeedスコア; データを整列して2つのUser-Agent間で迅速に比較可能にし、インサイトを非常に実用的で実行可能にします。
UA間のステータスコードとリソースリクエストの違いを調べ; スマートフォンUAがrobots.txtでブロックされたり異なる方法で提供されたりするページを特定し、そのUAで表示されるコンテンツバリアントをメモします。
リアルタイムの観察を保存されたスナップショットと更新に変え; 時間経過での変更を追跡し、それを簡潔なリソースセットにまとめ、聴衆向けに明確な文法とデータ形式ガイドラインでステークホルダーが行動できるようにします。
結果をプラットフォームクラスターで構造化し、ヘッダーとコンテンツブロックを比較し、選択設定を使用して追加モードやUA文字列をテスト; これにはPageSpeed、フォームフィールド、その他のシグナルが含まれ、プラットフォーム間の整合性を検証します。
発見を実行可能なステップに変え: 機能豊富なコンテンツを持つページを優先し、聴衆のニーズに合わせ、レポートの注目セクションにエグゼクティブサマリーと次のイテレーションのための実用的チェックリストを公開します。
クロールに適したUser-Agentを選択し、そのアクセス影響を評価
Screaming Frog SEO SpiderのデフォルトUser-Agentを使用して制御された監査を実行します。速度と精度のバランスを取るために軽いクロールフットプリントを設定します。サイトを一気にクロールするのではなく、リクエストをスロットルし、必須ページをシードし、徐々に拡張します。このアプローチにより、アクセスシグナルを定期的にチェックでき、明確な戦略を実装し、ウェブサイトの高価値セクションを優先できます。
複数のUser-Agentバリアントをテストしてアクセス影響を評価: デフォルトのScreaming Frog Spider、Googlebot、モバイルUser-Agent。これによりアクセシビリティとインデクシングの表面がどのように異なるかを明らかにし、デスクトップとモバイルセクションのサイズとレイテンシを測定できます。非常に正確なシグナルを集めることで、ステータスコード、ヘッダーハンドリング、canonicalを迅速に比較でき、結果を監査にフィードし、最終決定を更新できます。更新されたサーバーレスポンスを使用して、クリティカルページを優先した戦略を実装し、クロール影響に関するウェブサイトの考えをガイドします。
具体的なテストプランを実装: デフォルトUser-Agentでベースラインクロールを実行し、速度、精度、エラー率のメトリクスを記録; 次に同じスコープでモバイルUser-Agentに切り替え比較します。オーバーロードを防ぎ、アクセシビリティチェックを新鮮に保つためにクロールスコープを定期的に更新します。このプロセスは意思決定の文脈を提供します。サイトを更新した場合、結果を使用して戦略を洗練し、明確な根拠で最終決定をドキュメントします。このプロセスは、ブロックされたアセット、誤設定されたcanonical、sitemapのギャップなどの問題を発見するのに役立ち、継続的な監査をサポートします。
| User-Agent | アクセス影響 | 最適な用途 | 利点 | 欠点 |
|---|---|---|---|---|
| Screaming Frog SEO Spider (default) | robots.txtに従う; スロットルコントロール; 内部構造に適する | ページ、canonical、内部リンクの定期監査 | オンページシグナルが正確; 小規模サイトで高速 | レートでブロックされた場合に外部参照を逃す可能性 |
| Googlebot (simulated) | 検索エンジンの視点を提示; robotsやスロットルでブロックされる可能性 | インデクサビリティとヘッダーハンドリングの評価 | 現実的なアクセスシグナル | ポリシーリミット; ブロックされたコンテンツを取得できない |
| Mobile User-Agent | モバイルレンダリングとレスポンスタイムをテスト | レスポンシブとAMPページのアクセシビリティ | モバイル特有の問題を迅速に明らかに | 追加設定と別スコープが必要 |
スコープ、速度、礼儀のためのクロール設定を構成
スコープから始め: ターゲットを定義し、クロールスキームを設定し、スキャンしたいフォルダを制限します。関連URLを追加し、異なるユーザーによって使用されるパスを反映したIncludeパターンを利用します。スコープを狭めることでクロールを集中させ、結果を実行可能に保ちます。
ドリフトを避けるためのスコープコントロールを設定: スキーム(httpsのみ)でフィルタリングし、選択フォルダに制限し、最初の通過でクロール深度を3–5レベルに制限します。これにより構造を迅速に理解でき、無関係な領域への不必要なヒットを防ぎます。
礼儀と速度: サーバーを圧倒しないよう最大スレッドとクロール遅延を設定します。安全な開始点は最大4スレッドで1–2リクエスト/秒; アナリティクスを監視してサーバーがレスポンシブを維持することを確認し、ホストが耐えられる量を超えないでください。ステージングで動作する場合、一時的に高く設定可能ですが、制御を保ちます。
Canonicalと属性: Crawl Canonicalを有効にしてcanonicalシグナルをキャプチャし、ページのrel=canonical属性をレビューします。これにより重複シグナルを減らし、フォルダとスキーム間のページ比較時のピボットの品質を向上させます。
スコープ、パフォーマンス、データ品質: クロール深度を3–5レベルに制限し、最も価値のあるフォルダを対象としたInclude/Excludeルールを使用します。この設定で、サイト全体のパターンを失わずに集中監査を実行できます。ほとんどのチームは、簡潔なスコープがより高速で信頼性の高い結果をもたらすことを発見します。
アナリティクスと成果: レスポンスタイム、ステータスコード、発見ページの分布をアナリティクスで追跡します。徹底的な評価のためにデータをエクスポートし、後続の実行のためのクロール設定最適化の機会をメモします。アナリティクスは、注意を必要とするページと最も信頼性の高いデータを生んだ戦略を示します。
変更とイテレーション: クロール後、フォルダごとの変更と発見問題をレビューします。変更フォルダのみを再実行してプロセスを加速し、労力を管理可能に保ちます。必要に応じてピボットし、新しい戦略をテストし、ベースラインに対して改善を検証します。
チュートリアルとドキュメント: canonicalハンドリング、スキーマ使用、クロールパターンのベストプラクティスに沿ったチュートリアルを参照します。これによりプロジェクト間で再利用可能なスキームを構築でき、推測なしに最も効果的なアプローチを明らかにします。証明されたワークフローから学ぶ機会は明確で、これらのレッスンをサイト構造に適用する方法を理解できます。
組織と再利用: 構成をクロールスキームとして保存し、将来の監査で再利用可能にします。結果を明確に命名されたフォルダに保存し、一貫したワークフローを維持し、ステークホルダーが一貫したデータセットを受け取ることを確保します。クロール完了後、共有とイテレーション可能な準備された参照があります。
最も重要に、スコープ、速度、礼儀の適切なバランスが信頼性の高い結果を生みます。サイトに最適なアプローチはターゲット、サーバー耐性、収集アナリティクスに依存します – したがって、前のクロールとの比較を使用して進捗を定量化するために調整を躊躇しないでください。クロール完了後、変更を特定し、SEO戦略を洗練する継続的な機会、canonicalと属性の整合性を確認し、簡単にアクセス可能なフォルダに保存できるインサイトを発見します。これらのステップをライブページの妨げなくナビゲートでき、発見インサイトを同僚と監査のために整理できます。
クロール全体のHTTPステータスコード、リダイレクト、URL構造を分析
クロールステータスレポートをエクスポートし、非200ステータス、リダイレクト、URL異常に対応してから進めます。必要な構成を適用: デフォルトリダイレクトルール、正確なステータスコードマッピング、クリーンな404ハンドリング設定。このアプローチは高速な修正を生み、チームにここで知らせ、行動をターゲットとランキング目標に合わせ、問題は誤設定から来て迅速に対処されます。
重複URLとそのターゲットの数をレビューします。ユーザーエクスペリエンスを害する4xxと5xxレスポンスをフラグ付けし、廃止パスを剪定します。canonicalタグがランク付けしたいデフォルトバージョンにポイントすることを確認し、サービングURLを一貫させます。変更が適用されたら、ステークホルダーに知らせ影響を認識させ、結果を追跡してクロールメトリクスがどのようにシフトするかを理解します。
リダイレクトを評価: ページネーションシリーズでrelnextがチェックされていることを確認し、リダイレクトがクロールグラフのフォールド上部にリードすることを確認します。各3xxについて、なぜ発生するかを検証し、ループを作成する代わりに価値を保持するかを確認します。301対302のデフォルト動作に注意を払い、チェーンリンクされたリダイレクトの数をカウントし、これはクロール効率を害します。このプロセスは長期安定性に非常に役立ちます。
クロール全体のURL構造をスクリーニング: containをチェックし、URLが推奨長を超えないことを確認し、曖昧な文字を避け、コンテンツをフィルタリングするための必須パラメータがページを重複させる代わりに使用されていることを検証します。URLにクリーンで記述的なパスを含め、重複コンテンツを生む廃止クエリ文字列を避けます。カウントと構成を使用して変更をドキュメント化し、URL構造が正しいコンテンツのサービングをサポートし、ランキング混乱を防ぐ方法を理解するのに役立ちます。
オンページ要素を検証: タイトル、メタタグ、H1使用、Canonicalタグ
Screaming Frogを使用してタイトル、メタタグ、H1使用、canonicalタグの集中監査から始めます。HTMLのみをクロールし、URL、Title、Meta Description、H1、Canonical、Status、Typeの列で問題をエクスポートします。ユーザーエージェントをGoogleのプロトコルを模倣するように設定して、検索結果でのページ表示を反映します。重複外観を作成する内部リンクのループを特定し、欠落または競合するcanonicalタグを持つページをフラグ付けします。小規模バッチで問題を修正し、更新を実行して変更が効果を発揮したことを確認します。
タイトルとメタタグ: すべてのURLにユニークで記述的なタイトルと関連メタ記述があることを確認します。コンテキストで最短の安全長を目指します – タイトルで約50-60文字、記述で120-155文字。重複を避け; トピックに複数のページがある場合、ライターは一貫したパターン(例: Brand | Topic)を従いつつ異なるタイトルを作成できます。必要に応じて提供パラメータを使用してタイトルバリアントを調整し、公開前に異なるオプションをテストします。ライターはCTRと検索結果での外観を改善するためのワード選択の小さな選択肢があります。例はページとテンプレート全体でどのバリアントが最適に機能するかを検証するのに役立ちます。
H1使用: ページごとに単一のH1を強制し、そこにメインキーワードを配置します。H2-H6を使用してコンテンツを構造化し、リーダーとクローラーにとって自然な流れを保ちます。コンテンツモジュールを実行する場合、シングルページアプローチまたはモジュールベースページを使用し、視覚階層を明確に保ちます。
Canonicalタグ: すべてのページに優先URLをポイントするcanonicalリンクがあるべきです。重複インデクサビリティを避けるためにGoogleのcanonicalizationプロトコルに従います。canonical URLはサイト全体の好み(例: httpよりhttps、wwwよりnon-www)を反映し、パラメータをクリーンURLにリダイレクトします。セルフ参照canonicalが存在することをチェックし、ループを作成する異なるcanonicalにページがポイントしないことを確認します。
検証とワークフロー: 修正適用後、再クロールして改善を検証します。チェックのループを使用: 前後比較、更新メモ、必要に応じて調整。変更の例と理由付きの簡潔な監査ログを維持します。ライターと開発者に推奨を提供し、可能であればCMSまたはサイトコードで直接変更を実装します。次に新しいページでプロセスを繰り返し、定期更新でサイトを監視します。
カスタム抽出とJavaScriptレンダリングを活用して隠れた問題を発見

静的HTMLに頼る代わりにJavaScriptでレンダリングし、カスタム抽出を使用してインデクサビリティとユーザーエクスペリエンスに影響する動的値を引き出します。このアプローチは、レンダリングされたDOMにデータがはるかに多く含まれていることを示し、ページがユーザーと検索エンジンに提供するものをビジュアライズし、基本クロールが見逃すものを発見しやすくします。
ワークフローを過負荷にせず必須シグナルをカバーするための3つの集中抽出を設定します:
- レンダリングされたH1テキストとページタイトル
- レンダリングされたDOM内のRobotsディレクティブとnoindexの存在
- 代替言語リンクとcanonical URL
Screaming Frogで効率的に設定する方法:
- Configuration > Spider > Renderingの下でJavaScript Renderingを有効にし、Chromeベースのレンダリングを選択; これにより下流データが抽出可能になります。
- CSS PathまたはXPathを使用して3つのCustom Extractionルールを追加:
- レンダリングH1とタイトル: レンダリングHTMLのh1とtitle要素からテキストを抽出。
- Noindexとrobots: meta name="robots"のcontent属性とレンダリングDOMからのX-Robots-Tagシグナルを読み取り。
- Alternateとcanonical: link[rel="alternate"]とlink[rel="canonical"]からhrefを抽出。
- クロールを実行し、Custom Extractionタブをレビューして各ルールが期待値を含むことを検証; 欠落がある場合、セレクタを調整して再実行。
- Exportボタンで結果をエクスポートし、チームメイトと共有したりスタジオダッシュボードに貼り付けたりできるエクスポートファイルを作成。
出力の解釈が情報に基づく決定をガイド:
- 静的HTMLとレンダリングコンテンツを比較して隠れたシグナルを特定; 初期HTMLに存在しないデータがレンダリングDOMに含まれる場合、なぜレンダリングがそれを明らかにするかを調査する必要があります。
- Noindexがレンダリングビューでのみ表示される場合、ページがインデックスされるべきか、レンダリングが下流のインデクシングをブロックする誤設定を明らかにするかを検討します。
- ページ間のalternateリンクとcanonicalタグをチェック; ギャップはウェブサイトと言語バリアント間の競合シグナルを引き起こします。
- 発見を下流アクションにマップ: オンページマークアップを修正、サーバーサイドレンダリングを調整、またはレスポンスの早い段階でクリティカルコンテンツを提供してpagespeed影響を改善。
カバレッジを最大化するための実用的ワークフローと設定:
- いくつかのデバイスエミュレーションを使用して違いを特定; モバイルでのレンダリングはデスクトップクロールが見逃す代替コンテンツを露出します。
- レンダリングコンテンツのpagespeed影響を監視; JavaScriptヘビーページはクロールが遅くなる可能性があるので、深度とクロール速度のバランスを取ります。
- ベースラインをシンプルに: 基本抽出から始め、精度を検証しながら徐々にフィールドを追加。
- 結果が準備されたら、エクスポートデータからビジュアライゼーションダッシュボードを作成し、ステークホルダー向けの情報概要を提供。
- 発見を短いノートでドキュメント化し、正確なページにリンク; これによりチームを一般的な推奨ではなく具体的な修正に向かわせます。
クライアントサイドレンダリングに依存するウェブサイトの利点は具体的です:
- 初期ヒット後にロードされるクリティカルなインデクサビリティに影響する隠れたコンテンツを発見。
- レンダリング出力でのみ表示されるnoindexブロックを明らかにし、本番配信前に必要な変更をガイド。
- すべてのデバイス上のユーザーが一貫した情報を受けることを確保するための代替経路の完全シグナルを提供。
- エクスポートデータとスタジオグレードダッシュボードでクロスファンクショナルレビューをサポートし、より高速で情報に基づく決定を支援。
📚 SEO & デジタルマーケティングに関する詳細
- Meet SEO's New Era - Mastering Search Everywhere Optimization
- What 912 Million Blog Posts Reveal About Content Marketing - Data-Driven Insights
- Which Brands Have the Most Followers on Social Media - Global Ranking & Insights
- The 100 Most Popular Google Keywords in 2026 - Rankings, Trends & SEO Insights
- Mastering SERP Feature Targeting and Optimization - A Guide for SEO Pros
Ready to leverage AI for your business?
Book a free strategy call — no strings attached.


