La Guida Definitiva a Screaming Frog 2026 – Scansione, Audit e Ottimizzazione SEO


Raccomandazione: Configura Screaming Frog per eseguire scansioni specifiche dalla tua homepage con una profondità di scansione di 3-4 pagine e abilita l'analisi dei link interni. Esporta i primi risultati della scansione come CSV, quindi convalida i codici di stato http e i tag canonical per le pagine più importanti. Questo primo passaggio produrrà dati utilizzabili e risultati rapidi per il tuo flusso di lavoro SEO.
Imposta l'allineamento con l'accesso reale dell'utente: usa googlebot come user-agent, abilita il rendering JavaScript solo quando devi indicizzare contenuti renderizzati dal client e decidi se eseguire la scansione dei sottodomini. In questo passaggio, raccogli campi come URL, codice http, titolo, meta descrizione, H1 e canonical. analizza come le pagine saranno viste dall'utente e dai motori di ricerca e assicurati che il contenuto che stai ottenendo corrisponda a ciò che ti aspetti. Se non riesci a eseguire il rendering di JavaScript, confronta i risultati non renderizzati con quelli renderizzati per individuare le pagine nascoste e pianificare le correzioni.
Esegui un confronto tra questa scansione e quella precedente per far emergere le modifiche allo stato, inclusi nuovi 404 trovati, reindirizzamenti o metadati mancanti. Per ogni elemento, esporta un report che includa URL, codice, titolo e stato e annota dove le pagine sono state spostate o rinominate. Questo ti aiuta a decidere le correzioni senza indovinare e mantiene il tuo team allineato con dati concreti.
Collega Screaming Frog con integrazioni come Google Analytics, Search Console e il tuo CMS per arricchire i dati. Il file di esportazione può alimentare le dashboard, mentre gli snippet di codice automatizzano i controlli per le anomalie dello stato http e i link interni interrotti. Ottenere questi dati continuamente aiuterà il tuo team ad agire rapidamente e a misurare l'impatto attraverso le modifiche.
Per il controllo degli accessi, limita la condivisione dell'esportazione a un singolo nome utente con i diritti appropriati e archivia i report in un repository condiviso. Quindi esegui scansioni settimanali, concentrandoti sui nuovi contenuti e sulle pagine contrassegnate durante l'esecuzione precedente. Tieni una rapida revisione con le parti interessate dopo ogni esecuzione. Il punteggio di integrità e gli elementi utilizzabili da ogni guida di esportazione correggono, ri-scansionano e verificano, mentre un confronto nel tempo mostra quanto bene le ottimizzazioni funzionano su metriche come la profondità di scansione, l'incidenza di 4xx e le dipendenze di caricamento della pagina.
Scansiona, verifica e identifica i contenuti duplicati: flussi di lavoro pratici

Esegui una scansione completa con i tuoi strumenti per stabilire una base di riferimento e contrassegnare i duplicati in anticipo, quindi procedi con audit mirati.
-
Configurazione della scansione: imposta le impostazioni di scansione per coprire l'intero sito, comprese le visualizzazioni mobile e desktop. Abilita i codici di stato, gli errori e i controlli delle immagini. Esegui una breve scansione per verificare l'ambito, quindi esegui la scansione completa; esporta i risultati per la console e conserva una copia di backup per la revisione.
-
Verifica dei duplicati: confronta titoli, meta descrizioni, H1 e testo alt dell'immagine tra le loro pagine. Usa l'hashing o i controlli di similarità per raggruppare i quasi duplicati, quindi tagga ogni cluster con un'etichetta chiara nel report. Prendi nota delle differenze nei modelli e del loro impatto sul flusso utente.
-
Identifica e metti in attesa: assembla un breve elenco di trasgressori e assegna uno stato di attesa per le pagine che necessitano di revisione prima delle modifiche. Crea una vista trasversale tra le loro sezioni per dare la priorità alle correzioni in base a traffico, conversioni ed errori aperti.
-
Flusso di lavoro di correzione: applica i tag canonical dove appropriato e implementa i reindirizzamenti 301 dagli URL precedenti alla pagina master scelta. Aggiorna i collegamenti interni in tutta l'architettura in modo che puntino alla master e adatta i modelli di applicazione per prevenire la ricorrenza. Tieni un changelog per il cliente per tenere traccia delle modifiche.
-
Ciclo di convalida: esegui nuovamente la scansione per confermare le rimozioni; verifica che i codici di stato si stabilizzino a 200 per le pagine master e che le pagine reindirizzate non attivino più segnali duplicati. Convalida che le conversioni sulle pagine spostate o consolidate mostrino risultati stabili o migliorati.
-
Report e consegna della guida: produci una guida concisa per il cliente con lo stato, le sue pagine modificate e l'impatto sulle prestazioni del sito. Includi una vista a finestra aperta dei risultati dell'audit e una breve checklist fruibile per la manutenzione continua.
-
Automazione e controlli continui: stabilisci un flusso di lavoro in studio per scansioni ricorrenti e imposta avvisi della console per collegamenti interrotti e nuovi errori. Pianifica una cadenza adatta alle dimensioni del sito e mantieni un repository compatto tra i progetti. Se necessario, acquista strumenti per estendere la copertura senza rallentare le ore di esecuzione.
-
Vittorie rapide e best practice: elimina prima i duplicati evidenti, correggi i contenuti scarsi o ripetitivi e assicurati che ogni pagina abbia una proposta di valore unica. Usa una breve finestra per la rapida convalida delle correzioni, quindi scala con controlli automatizzati e un approccio di gestione delle immagini consolidato per prevenire duplicati di immagini aperte.
Configura l'ambito di scansione per siti di grandi dimensioni: limiti di profondità, parametri URL ed esclusioni
Raccomandazione: Imposta un limite di profondità di scansione di 3 livelli per i siti di grandi dimensioni; rivedi i risultati prima di aumentare la profondità per evitare migliaia di pagine e per risparmiare tempo di scansione.
Usa le schede in Screaming Frog per mantenere l'ambito flessibile. Inizia dalla parte inferiore dell'architettura e mappa i modelli di collegamento, quindi estendi ai livelli superiori man mano che verifichi i risultati su una sezione rappresentativa del sito.
Gestisci i parametri URL deliberatamente. In Configuration > Spider, abilita URL Parameter Handling ed escludi i parametri non di contenuto (ID sessione, termini di tracciamento, ecc.). Esegui una rapida analisi per confrontare la mappa con e senza parametri e mantieni il feed pulito per evitare percorsi duplicati.
Imposta le esclusioni per saltare le sezioni non di contenuto. Escludi login, checkout, aree di amministrazione e percorsi di catalogo duplicati utilizzando corrispondenze esatte e modelli jolly. Usa un filtro mirato per sopprimere i loop che si ripetono attraverso la paginazione o le pagine di tag e mantieni la scansione focalizzata sui contenuti reali.
Affidati alle sitemap per guidare la scansione. Apri e rivedi le voci della sitemap, collegale al crawler e leggi i metadati della data e i valori lastmod per allineare la tua scansione prima con le pagine più pertinenti. Questo ti aiuta a raggiungere il fondo delle sezioni critiche senza inseguire ogni sbuffo di parametro.
Esegui prima controlli leggeri e salva i risultati. Dopo aver avviato una scansione di prova, esegui controlli rapidi su profondità di scansione, gestione dei parametri ed esclusioni; salva un set di dati mirato per guidare le esecuzioni successive e datalo per la tracciabilità.
Flusso di lavoro pratico: inizia con un piccolo sottoinsieme rappresentativo di migliaia di URL, analizza come la struttura si ripete tra le categorie e regola di conseguenza il livello di profondità e i filtri dei parametri. Questo approccio costante riduce al minimo il lavoro sprecato e supporta una scansione coerente e scalabile per siti di grandi dimensioni.
Usa l'estrazione personalizzata per far emergere i segnali duplicati
Abilita l'estrazione personalizzata per far emergere i segnali duplicati tra pagine e sitemap. Prendi di mira campi specifici come titolo, meta descrizione, H1, canonical, testo alt dell'immagine e blocchi di schema JSON-LD per rivelare dove si verificano le ripetizioni.
Scegli regole di estrazione con XPath o regex per estrarre i valori direttamente dall'HTML o dai dati strutturati e collega i risultati alle API per fornire feedback al tuo flusso di lavoro QA e per raccomandare modifiche.
Esegui una scansione completa con l'estrazione personalizzata attiva, quindi conta i duplicati per pagina e per segmento di sito. Tieni traccia di quali pagine sono cambiate dall'ultima esecuzione per guidare le correzioni.
Converti i segnali in correzioni: consolida i tag del titolo dove necessario, accorcia o riscrivi le meta descrizioni lunghe, elimina le pagine sottili e semplifica i blocchi di schema duplicati, in modo che le modifiche si trasformino in miglioramenti misurabili.
Usa la seguente checklist per accelerare la correzione: rivedi le pagine con elevati conteggi di duplicati, acquisisci i segnali di accessibilità e verifica che l'utilizzo della memoria rimanga entro i limiti per il tuo ambiente di esecuzione. Il tuo team può dare la priorità alle correzioni con questa vista e puntare a vittorie rapide.
Esporta le metriche nella tua guida o dashboard; genera un report gratuito o un feed API per monitorare i dati più recenti e l'impatto delle modifiche nel tempo, quindi esegui iterazioni su sitemap e gruppi di pagine.
| Tipo di segnale | Fonte | Regola di estrazione (esempio) | Azione raccomandata |
|---|---|---|---|
| Tag del titolo duplicati | Titoli delle pagine | Valore del tag del titolo (ad esempio, //title o equivalente) | Consolida in un modello coerente per sezione |
| Meta descrizioni duplicate | Meta descrizione | meta[@name='description']/@content | Crea descrizioni uniche; mantieni entro ~160 caratteri |
| H1 duplicati | Titoli | Primo H1 sulla pagina | Assicurati che ogni pagina abbia un argomento principale distinto |
| Canonical duplicati | Tag canonical | link[@rel='canonical']/@href | Allinea il canonical tra pagine simili |
| Blocchi JSON-LD duplicati | Dati strutturati | identifica blocchi @type identici | Consolida o delimita i dati a gruppi di pagine |
Rileva i duplicati esatti con l'hash del contenuto e l'analisi degli URL
Abilita l'hashing del contenuto durante la scansione per rilevare i duplicati esatti tra gli URL. L'hash viene creato durante l'estrazione e riflette un'istantanea completa del payload della pagina, inclusi blocchi di testo, titoli e contenuti visibili. Questo produce un segnale reale in tutto il mondo.
- Configura la scansione hash: in Screaming Frog, Configuration > Spider > Advanced, abilita Content Hashing. Esegui una scansione completa per generare la colonna Hash insieme ai dati URL, Stato, Canonical e Titolo.
- Esporta e preparati per il confronto: esporta come CSV con Hash, URL, Canonical, Stato e Lunghezza contenuto. Questo set di dati completo ti consente di eseguire un confronto semplice tra gruppi che condividono lo stesso hash.
- Identifica gruppi duplicati: nella vista Hash, i gruppi con due o più URL indicano duplicati esatti. Prendi nota dei loro percorsi (ad esempio, pagine di prodotto rispetto alle loro pagine di conferma dell'acquisto o alle pagine di tag).
- Verifica nel browser per confermare i duplicati reali: per ogni gruppo, apri URL rappresentativi in un browser per confrontare il contenuto, comprese immagini e metadati. Se due pagine mostrano lo stesso contenuto con URL diversi, sono candidate per la canonizzazione.
- Decidi una risoluzione: se il contenuto è veramente identico, scegli un URL canonical e applica un tag rel="canonical". Se la duplicazione è dovuta a variazioni che non aggiungono valore, implementa i reindirizzamenti 301 o consolida il contenuto in una singola pagina. Screaming Frog ti consente di mappare i duplicati al canonical e di generare elenchi di reindirizzamento per l'implementazione.
- Gestisci la duplicazione di immagini e media: se più pagine solo immagine contengono le stesse immagini, consolida la loro esposizione puntando alla stessa destinazione dell'immagine o includi le immagini nella pagina principale con testo alt descrittivo. Puoi anche aggiungere metadati specifici dell'immagine per differenziare.
- Gestisci parametri e tag: per le stringhe di query che non alterano il contenuto, usa le regole dei parametri URL per comprimere i duplicati. Per le pagine di tag e di archivio, applica il canonical alla pagina di tag principale o unisci il contenuto scarso in una panoramica più ampia secondo le linee guida ufficiali e le best practice seocom.
Scenari e azioni pratiche
- Pagine di prodotto con descrizioni identiche: imposta l'URL canonical sulla pagina di prodotto principale e assicurati che i link interni puntino a quell'URL.
- Post del blog distribuiti su più categorie: applica il canonical all'URL del post originale e rimuovi i duplicati dall'indice.
- Pagine di tag e di archivio: indirizza attraverso la pagina di tag principale; usa un canonical per evitare più voci nell'indice.
- Pagine di destinazione delle immagini: scegli una singola pagina di destinazione come principale o collega dai duplicati alla pagina principale; regola gli attributi alt dell'immagine per un valore univoco.
- Contenuto guidato da parametri: mappa i parametri che non cambiano in modo che i duplicati non vengano visualizzati nell'indice.
Panoramica: l'approccio basato sull'hash offre un modo rapido per individuare i duplicati esatti nell'intera scansione. Le linee guida più recenti di seocom e la documentazione ufficiale di Screaming Frog supportano la canonizzazione e i reindirizzamenti per migliorare l'esperienza utente e l'efficienza della scansione. Dopo aver identificato i duplicati, ottieni un set pulito di pagine da ottimizzare per il coinvolgimento degli utenti e le immagini. L'uso di questo metodo in tutto il mondo aiuta a ridurre il budget di scansione sprecato e migliora l'indicizzazione per i loro contenuti e le loro immagini.
Controlli assistiti da OpenAI: per un piccolo campione, esegui un controllo di integrità basato su openai per confermare che il percorso canonical scelto preservi l'intento dell'utente e garantisca che le pagine collegate mantengano il loro valore così come appaiono nelle interazioni del browser.
Suggerimenti per i team: tieni traccia di un registro di controllo guidato dai tag, mappa i link interni all'URL canonical ed esporta hash periodici per monitorare le modifiche tra marchi o marketplace. Questo approccio è ottimo per mantenere una struttura ufficiale e coerente supportando al contempo le reali esigenze degli utenti e i flussi di acquisto.
Valuta i duplicati tramite confronti di titolo, meta descrizione e H1

Esegui subito un audit dei duplicati ed elimina le pagine con titoli, meta descrizioni o H1 identici. Raccogli titoli, meta descrizioni e H1 per ogni pagina, quindi raggruppa i risultati in base alla loro fonte canonical per rivelare la cannibalizzazione tra le sezioni.
Controlla le lunghezze target: mantieni i titoli tra 50 e 60 caratteri, le meta descrizioni tra 150 e 160 e gli H1 sotto i 70 caratteri. Contrassegna prima i duplicati esatti, quindi i quasi duplicati che condividono una o due parole chiave principali. Questi controlli riducono il sovraccarico di scansione, migliorano la chiarezza della SERP e supportano i segnali di accessibilità e di intento dell'utente.
Assegna lo stato: i duplicati esatti sulle pagine ad alto traffico ottengono lo stato Alto; i quasi duplicati nello stesso argomento ottengono Medio; i duplicati non correlati ottengono Basso. Questo dà la priorità alle correzioni e mantiene i progressi visibili nella tua panoramica per le parti interessate e i team.
Utilizzo del canonical: se una coppia di pagine serve lo stesso contenuto, punta le pagine non master alla master tramite un tag canonical. Se devi mantenere entrambe le pagine, assicurati che abbiano H1 e meta descrizioni distinte in modo che le pagine non si cannibalizzino a vicenda e l'indice possa distinguere i loro ruoli.
Sicurezza e accesso: per le pagine dietro l'autenticazione, abilita la scansione sicura con un account di test; assicurati che queste pagine contribuiscano all'audit e non rimangano non sicure. L'autenticazione aiuta a raccogliere dati completi senza introdurre punti ciechi o segnali di stato fuorvianti.
Piano di correzione: implementa i reindirizzamenti 301 alla pagina canonical, riscrivi i titoli e le descrizioni per riflettere scopi univoci, adatta gli H1 per corrispondere al contenuto on-page e rimuovi i blocchi di contenuto duplicati. Aggiorna i link interni all'URL canonical e rivedi il testo alt dell'immagine per evitare la diluizione del segnale.
Controlli di qualità: riesegui la scansione con le stesse impostazioni e conferma che i duplicati diminuiscano; verifica che immagini, link interni e widget sociali puntino alle pagine canonical; ispeziona i percorsi di codice per i reindirizzamenti per mantenere lo stato pulito e coerente.
Framework e linee guida: allineati con le istruzioni seocom e le linee guida sull'accessibilità; usa modelli flessibili che si adattano man mano che il tuo sito cresce; documenta le modifiche in un framework centralizzato in modo che i team possano riutilizzare i modelli tra le pagine.
Panoramica e metriche: tieni traccia dei miglioramenti della page speed dopo le correzioni e monitora il coinvolgimento sulle pagine aggiornate; crea una panoramica concisa per le parti interessate che mostri i progressi e le lacune rimanenti. Usa i dati da источниk, i log del server e i segnali social per convalidare l'impatto.
Implementa le correzioni: reindirizzamenti, tag canonical e revisioni dei meta on-page
Applica reindirizzamenti permanenti 301 per le pagine spostate e imposta un tag canonical sul markup di ogni pagina per puntare alla versione univoca che desideri indicizzare. Questo switch consolida i segnali, riduce al minimo gli errori e mantiene le schede utente sullo stesso contenuto tra i dispositivi.
Diagnostica i reindirizzamenti in Screaming Frog: identifica 4xx/5xx, mappa le catene e aggiorna il database con il target finale. Assicurati che le catene di reindirizzamento siano state accorciate a tre hop o meno; una volta corrette, rimuovi gli URL intermedi in modo che googlebot atterri sulla pagina canonical. Per le pagine dinamiche, implementa i 301 lato server anziché i reindirizzamenti JavaScript lato client; questo garantisce che i segnali più recenti raggiungano il dominio root.
Canonical nel markup: posiziona nell'head di ogni pagina. Il canonical deve essere la versione univoca e indicizzabile e deve essere assoluto. Usa i selettori per verificare la presenza del tag canonical nel DOM e assicurarti che corrisponda all'URL nel tuo database. In SPA o pagine guidate da JavaScript, assicurati che il canonical sia presente nell'HTML renderizzato dal server o tramite un'iniezione di markup appropriata. Questo sblocca l'indicizzazione coerente, evita confusione e migliora l'efficienza della scansione per googlebot.
Revisioni dei meta on-page: rivedi titoli, meta descrizioni e titoli per riflettere il contenuto attuale, correggi la grammatica e gli errori e assicurati che il markup sia univoco e descrittivo. Allinea le modifiche con le ultime linee guida SEO ed evita il keyword stuffing. Aggiorna il database con i metadati rivisti e assicurati che le modifiche si propaghino agli eventi di analisi e al reporting. Questo aiuta i ricercatori a comprendere il contenuto a colpo d'occhio e riduce il rischio di bounce.
Suggerimenti, pratica e governance: tieni sotto controllo le modifiche con un set di strumenti approvato dalla licenza; implementa le integrazioni con il tuo CMS e l'analisi per mantenere la coerenza. Usa un registro delle modifiche e un flusso di lavoro per acquisire chi ha cambiato cosa e quando, in modo che i team possano diagnosticare rapidamente i problemi. Il trucco è passare dalla strategia di alto livello ai selettori precisi per individuare le anomalie e assicurarsi che l'audit del frog rispecchi il comportamento reale dell'utente.
Convalida finale: una volta implementate le modifiche, esegui un'altra scansione per verificare che i reindirizzamenti permanenti siano validi, che i link canonical si risolvano su pagine univoche e che le revisioni dei meta on-page si riflettano negli ultimi dati di scansione. Controlla le risposte di googlebot, i tempi della finestra e le dashboard di analisi per confermare i miglioramenti nell'indicizzazione e nel traffico; questo approccio migliora la salute del sito e riduce i contenuti duplicati nel database.
Ready to leverage AI for your business?
Book a free strategy call — no strings attached.


