SEODecember 10, 202513 min read
    MW
    Marcus Weber

    Mistrzostwo w Audytach SEO - Odkrywanie Wiedzy z Screaming Frog SEO Spider

    Mistrzostwo w Audytach SEO - Odkrywanie Wiedzy z Screaming Frog SEO Spider

    Mastering SEO Audits: Unlocking Insights with the Screaming Frog SEO Spider

    Rekomendacja: zacznij od zrzutu danych z przeszukiwania i od razu oznacz największe problemy. Uruchom Screaming Frog na swojej stronie, a następnie wyeksportuj plik CSV, który łączy każdą ścieżkę URL ze statusem, przekierowaniami i sygnałami kanonicznymi. Zachowaj to jako źródło publikowania poprawek oraz udostępniania redaktorom i programistom. Upewnij się, że każda kluczowa strona istnieje w wynikach przeszukiwania. Same dane z przeszukiwania zawierają dowody z sygnaturą czasową.

    Użyj filtrów regex, aby oddzielić problemy według typu (przekierowania, brakujące tagi lub uszkodzone zasoby) i porównaj wybory dotyczące naprawy. Filtruj według ścieżki URL i kodu stanu, aby szybko dostrzec wzorce. Zespół może oznaczyć problemy uznane za priorytetowe, aby przyspieszyć rozwiązanie.

    Sprawdź sygnały protokołu i mapowanie kanonicznej ścieżki: upewnij się, że http przekierowuje do https, zagnieżdżone ścieżki są zgodne z kodem źródłowym, a przepływ pracy publikowania wykorzystuje spójne linkowanie. Dzięki temu przeszukiwania są czyste i zmniejsza się liczba fałszywych alarmów.

    Przeprowadź audyt zasobów organicznych: tytuły, metaopisy, tagi nagłówków i tekst alternatywny obrazów. Śledź zmiany za pomocą aktualizowanej listy kontrolnej i wskazówek dla właścicieli treści. Prowadź dziennik poprawek i mierz wpływ na rankingi organiczne co tydzień.

    Automatyzacja pomaga w skalowaniu audytów: zaplanuj zapisane kontrole, generuj raporty oparte na wskazówkach i wyświetlaj główny panel, który pokazuje otwarte, naprawione i nowe problemy. Zbuduj przepływ pracy, który pozwala użytkownikowi wybrać priorytet, przypisać właścicieli i monitorować postępy, z samodzielnym sprawdzaniem, aby zweryfikować zmiany.

    W przypadku dużych witryn podziel przeszukiwania według ścieżki i rozłóż żądania w czasie, aby uniknąć awarii. Jeśli przeszukiwanie się zawiesi, uruchom je ponownie ze zmniejszoną głębokością, a następnie połącz wyniki. Użyj regex, aby ograniczyć zakres i zachować zwartość zrzutu w celu udostępnienia go zespołowi.

    Miej oko na proces publikowania: sprawdzanie poprawności linków, dyscyplina kanoniczna i reguły przekierowań. Traktując Screaming Frog jako narzędzie podstawowe i łącząc go z lekkim protokołem udostępniania danych, możesz poprawić dokładność swoich audytów i przyspieszyć podejmowanie decyzji dla zespołów ds. treści.

    Ukierunkowane kroki w celu analizy, jak wybory User-Agent kształtują wyniki przeszukiwania i sygnały danych

    Targeted steps to analyze how User-Agent choices shape crawl results and data signals

    Zacznij od wybrania dwóch głównych ciągów User-Agent (Googlebot Desktop i Googlebot Smartphone) i uruchom równoległe przeszukiwanie, upewniając się, że wyniki są zapisywane w studio z wyraźnymi etykietami dla każdego UA.

    Ustaw ten sam zakres: głębokość, pokrycie subdomen i tryb przeszukiwania; użyj wizualizacji opartej na sile, aby zidentyfikować, w jaki sposób wewnętrzne ścieżki różnią się między UA i które strony otrzymują więcej żądań od każdego UA.

    Uwzględnij podstawowe sygnały: status, czas odpowiedzi, tytuły stron, nagłówki, linki wewnętrzne i wyniki PageSpeed; dopasuj dane, aby można było szybko porównywać między dwoma User-Agentami, dzięki czemu wnioski będą bardzo praktyczne.

    Przeanalizuj różnice w kodach stanu i żądaniach zasobów między UA; zidentyfikuj strony, które Smartphone UA blokuje lub obsługuje inaczej przez robots.txt, i zanotuj wszelkie warianty treści, które pojawiają się w ramach tego UA.

    Przekształć obserwacje w czasie rzeczywistym w zapisane migawki i aktualizacje; śledź zmiany w czasie i przekształć je w zwięzły zestaw zasobów dla nich, odbiorców, z jasną gramatyką i wytycznymi dotyczącymi formy danych, na podstawie których interesariusze mogą działać.

    Ustrukturyzuj wyniki według klastrów platform, porównaj nagłówki i bloki treści oraz użyj wybranych ustawień, aby przetestować dodatkowe tryby lub ciągi UA; obejmuje to PageSpeed, pola formularzy i inne sygnały, aby zweryfikować spójność między platformami.

    Przekształć wyniki w praktyczne kroki: ustal priorytety dla stron z bogatą zawartością, dopasuj do potrzeb odbiorców i opublikuj wyróżnioną sekcję w raporcie, która zawiera podsumowanie dla kierownictwa i praktyczną listę kontrolną dla kolejnych iteracji.

    Wybierz odpowiedni User-Agent do przeszukiwań i oceń jego konsekwencje dotyczące dostępu

    Użyj domyślnego User-Agent Screaming Frog SEO Spider do kontrolowanego audytu. Ustaw lekki ślad przeszukiwania, aby zrównoważyć szybkość i dokładność. Zamiast atakować witrynę, ogranicz żądania, dodaj kluczowe strony i stopniowo rozszerzaj zakres. Takie podejście pomaga regularnie sprawdzać sygnały dostępu, wdrażać jasne strategie i ustalać priorytety dla wartościowych sekcji witryny.

    Oceń konsekwencje dotyczące dostępu, testując wiele wariantów User-Agent: domyślny Screaming Frog Spider, Googlebot i mobilny User-Agent. Ujawnia to, w jaki sposób różnią się dostępność i powierzchnie indeksowania, i pomaga mierzyć rozmiar i opóźnienia w sekcjach desktopowych i mobilnych. Zbierać niezwykle dokładne sygnały, mogłoby szybko porównać kody stanu, obsługę nagłówków i tagi kanoniczne, przekazując wyniki do audytów i aktualizując swoje ostateczne decyzje. Użyj zaktualizowanych odpowiedzi serwera, aby wdrożyć strategie z priorytetem dla krytycznych stron, kierując swoje przemyślenia na temat wpływu przeszukiwania na witrynę.

    Wdróż konkretny plan testów: uruchom podstawowe przeszukiwanie z domyślnym User-Agent, zapisz metryki dla szybkości, dokładności i współczynników błędów; następnie przełącz się na mobilny User-Agent dla tego samego zakresu i porównaj. Regularnie aktualizuj zakres przeszukiwania, aby zapobiec przeciążeniu i zachować świeżość kontroli dostępności. Ten proces zapewnia kontekst dla podejmowania decyzji. Jeśli zaktualizowałeś witrynę, użyj wyników, aby doprecyzować strategie i udokumentować ostateczne decyzje z jasnym uzasadnieniem. Ten proces pomaga w odkrywaniu problemów, takich jak zablokowane zasoby, nieprawidłowo skonfigurowane tagi kanoniczne i luki w mapie witryny, wspierając bieżące audyty.

    User-AgentKonsekwencje dotyczące dostępuNajlepsze zastosowanieZaletyWady
    Screaming Frog SEO Spider (domyślny)Przestrzega robots.txt; kontrola ograniczania przepustowości; dobry do struktury wewnętrznejRegularne audyty stron, tagów kanonicznych i linków wewnętrznychDokładne sygnały na stronie; szybki dla małych witrynMoże pomijać odniesienia zewnętrzne, jeśli są blokowane przez limit
    Googlebot (symulowany)Daje perspektywę wyszukiwarki; może być blokowany przez roboty lub ograniczony przepustowościąOcena indeksowalności i obsługi nagłówkówRealistyczne sygnały dostępuLimity zasad; nie może pobierać zablokowanej zawartości
    Mobilny User-AgentTestuje renderowanie mobilne i czasy odpowiedziDostępność dla responsywnych stron i AMPSzybko ujawnia problemy specyficzne dla urządzeń mobilnychWymaga dodatkowej konfiguracji i oddzielnych zakresów

    Skonfiguruj ustawienia przeszukiwania pod kątem zakresu, szybkości i uprzejmości

    Zacznij od zakresu: zdefiniuj cele, ustaw schemat przeszukiwania i ogranicz foldery, które chcesz przeskanować. Dodaj odpowiednie adresy URL i użyj wzorców Include, które odzwierciedlają ścieżki używane przez różnych użytkowników. Ograniczając zakres, utrzymujesz skupienie przeszukiwania i zapewniasz, że wyniki są praktyczne.

    Ustaw kontrolę zakresu, aby uniknąć dryfu: filtruj według schematu (tylko https), ogranicz do wybranych folderów i ogranicz głębokość przeszukiwania do 3–5 poziomów za pierwszym razem. Pomaga to szybko zrozumieć strukturę i zapobiega niepotrzebnym żądaniom w niepowiązanych obszarach.

    Uprzejmość i szybkość: skonfiguruj maksymalną liczbę wątków i opóźnienie przeszukiwania, aby uniknąć przeciążenia serwera. Bezpiecznym punktem wyjścia są 4 maksymalne wątki z 1–2 żądaniami na sekundę; monitoruj analitykę, aby upewnić się, że serwer pozostaje responsywny, i nigdy nie przekraczaj tego, co host może tolerować. Jeśli działasz w środowisku przejściowym, możesz tymczasowo zwiększyć te wartości, ale zachowaj kontrolę.

    Tagi kanoniczne i atrybuty: włącz Crawl Canonicals, aby przechwytywać sygnały kanoniczne i przeglądaj atrybuty rel=canonical na stronach. Zmniejsza to zduplikowane sygnały i poprawia jakość osi, gdy porównujesz strony w różnych folderach i schematach.

    Zakres, wydajność i jakość danych: ogranicz głębokość przeszukiwania do 3–5 poziomów i użyj reguł Include/Exclude, aby kierować na najcenniejsze foldery. Dzięki tej konfiguracji możesz przeprowadzić ukierunkowany audyt, nie tracąc z oczu wzorców obejmujących całą witrynę. Większość zespołów uważa, że ​​zwięzły zakres prowadzi do szybszych i bardziej wiarygodnych wyników.

    Analityka i wyniki: użyj analityki, aby śledzić czasy odpowiedzi, kody stanu i dystrybucję odkrytych stron. Wyeksportuj dane w celu dokładnej oceny i zanotuj możliwość optymalizacji ustawień przeszukiwania dla kolejnych uruchomień. Analityka pokaże ci, które strony wymagają uwagi i jakie strategie dały najbardziej wiarygodne dane.

    Zmiany i iteracje: po przeszukaniu przejrzyj zmiany i odkryte problemy według folderu. Możesz ponownie uruchomić tylko zmienione foldery, aby przyspieszyć proces i utrzymać wysiłek w ryzach. W razie potrzeby zmieniaj oś, aby testować nowe strategie i weryfikować ulepszenia względem linii bazowej.

    Samouczki i dokumentacja: zapoznaj się z samouczkami, aby dostosować się do najlepszych praktyk w zakresie obsługi tagów kanonicznych, użycia schematu i wzorców przeszukiwania. Pomaga to zbudować schemat, który można ponownie wykorzystać w różnych projektach, i ujawnia najbardziej skuteczne podejścia bez zgadywania. Możliwość uczenia się na sprawdzonych przepływach pracy jest jasna i możesz zrozumieć, jak zastosować te lekcje do struktury swojej witryny.

    Organizacja i ponowne użycie: zapisz swoją konfigurację jako schemat przeszukiwania, aby móc go ponownie wykorzystać w przyszłych audytach. Przechowuj wyniki w wyraźnie nazwanych folderach i utrzymuj spójny przepływ pracy, zapewniając, że interesariusze otrzymają spójny zbiór danych. Po zakończeniu przeszukiwania masz gotowe odniesienie, którym możesz się dzielić i iterować.

    Co najważniejsze, właściwa równowaga między zakresem, szybkością i uprzejmością daje wiarygodne wyniki. Podejście, które sprawdziło się najlepiej w przypadku Twojej witryny, będzie zależeć od celów, tolerancji serwera i zebranej analityki – więc nigdy nie wahaj się dostosować i użyć porównania z poprzednimi przeszukiwaniami, aby zmierzyć postępy. Po zakończeniu przeszukiwania zidentyfikujesz zmiany i stałą możliwość udoskonalania swoich strategii SEO, potwierdzisz zgodność tagów kanonicznych i atrybutów oraz odkryjesz spostrzeżenia, które możesz przechowywać w folderach, aby uzyskać do nich łatwy dostęp. Możesz poruszać się po tych krokach bez zakłócania działania stron na żywo i możesz uporządkować odkryte spostrzeżenia dla współpracowników i audytów.

    Analizuj kody stanu HTTP, przekierowania i strukturę adresów URL podczas przeszukiwania

    Wyeksportuj raport o stanie przeszukiwania i podejmij działania w zakresie statusów innych niż 200, przekierowań i anomalii adresów URL przed kontynuowaniem. Zastosuj wymagane konfiguracje: domyślne reguły przekierowań, dokładne mapowania kodów stanu i czyste ustawienie obsługi 404. Takie podejście zapewnia szybsze poprawki i informuje Twój zespół, umożliwiając dostosowanie działań do celów i celów rankingowych, problemy wynikają z błędnych konfiguracji i są szybko rozwiązywane.

    Przejrzyj liczbę zduplikowanych adresów URL i ich cele. Oznacz odpowiedzi 4xx i 5xx, które szkodzą doświadczeniu użytkownika, i usuń przestarzałe ścieżki. Upewnij się, że tagi kanoniczne wskazują domyślną wersję, którą chcesz rankować, aby adres URL serwowania pozostał spójny. Gdy zmiany zostaną wprowadzone, poinformuj interesariuszy, aby zdawano sobie sprawę z wpływu, i śledź wyniki, aby zrozumieć, jak zmieniają się metryki przeszukiwania.

    Oceń przekierowania: potwierdź, że relnext jest zaznaczone w serii stronicowanej i że przekierowania prowadzą do stron powyżej linii składania na wykresie przeszukiwania. Dla każdego 3xx sprawdź, dlaczego występuje i czy zachowuje wartość zamiast tworzyć pętle. Miej oko na domyślne zachowanie dla 301 w porównaniu z 302 i policz, ile przekierowań jest połączonych łańcuchowo, co może zaszkodzić wydajności przeszukiwania. Ten proces jest niezwykle pomocny dla długoterminowej stabilności.

    Przeskanuj strukturę adresów URL podczas przeszukiwania: sprawdź zawartość i upewnij się, że adresy URL nie przekraczają zalecanej długości, unikaj niejednoznacznych znaków i sprawdź, czy wymagane parametry są używane do filtrowania zawartości zamiast duplikowania stron. Upewnij się, że adresy URL zawierają czyste, opisowe ścieżki i unikaj przestarzałych ciągów zapytań, które powodują zduplikowaną zawartość. Użyj liczby i konfiguracji do udokumentowania zmian, co pomaga zrozumieć, jak struktura adresów URL wspiera serwowanie właściwej zawartości i zapobiega rankingowemu zamieszaniu.

    Sprawdź poprawność elementów na stronie: tytuły, metatagi, użycie H1 i tagi kanoniczne

    Rozpocznij od ukierunkowanego audytu tytułów, metatagów, użycia H1 i tagów kanonicznych za pomocą Screaming Frog. Przeszukaj tylko HTML, wyeksportuj problemy z kolumnami URL, Tytuł, Metaopis, H1, Kanoniczny, Status i Typ. Ustaw agenta użytkownika, aby naśladował protokół google, aby odzwierciedlał sposób wyświetlania stron w wynikach wyszukiwania. Zidentyfikuj pętle w linkowaniu wewnętrznym, które tworzą zduplikowany wygląd, i oznacz strony z brakującymi lub sprzecznymi tagami kanonicznymi. Naprawiaj problemy w małych partiach, a następnie uruchom aktualizacje, aby potwierdzić, że zmiany zostały wprowadzone.

    Tytuły i metatagi: upewnij się, że każdy adres URL ma unikalny, opisowy tytuł i trafny metaopis. Dąż do najkrótszej długości bezpiecznej w Twoim kontekście – około 50–60 znaków dla tytułów i 120–155 dla opisów. Unikaj duplikatów; jeśli masz wiele stron na dany temat, pisarze mogą tworzyć odrębne tytuły, które nadal są zgodne ze spójnym wzorem (na przykład Marka | Temat). Używaj dostarczonych parametrów w razie potrzeby, aby dostosować warianty tytułów i testuj różne opcje przed publikacją. Pisarze mają niewielkie możliwości wyboru słów, aby poprawić CTR i wygląd w wynikach wyszukiwania. Przykłady pomagają sprawdzić, które warianty działają najlepiej na różnych stronach i szablonach.

    Użycie H1: wymuś pojedyncze H1 na stronę i umieść tam główne słowo kluczowe. Użyj H2-H6 do struktury zawartości i utrzymuj naturalny przepływ dla czytelników i robotów indeksujących. Jeśli uruchamiasz moduł zawartości, użyj podejścia jednoelementowego lub stron opartych na modułach, upewniając się, że hierarchia wizualna pozostaje jasna.

    Tagi kanoniczne: na każdej stronie powinien znajdować się link kanoniczny, który wskazuje preferowany adres URL. Postępuj zgodnie z protokołem google dotyczącym kanonizacji, aby uniknąć zduplikowanego indeksowania. Kanoniczny adres URL powinien odzwierciedlać preferencje w całej witrynie (na przykład https zamiast http, www zamiast non-www) i obsługiwać parametry, kierując do czystego adresu URL. Sprawdź, czy istnieje link kanoniczny wskazujący na siebie i upewnij się, że żadna strona nie wskazuje na inny tag kanoniczny, który tworzy pętlę.

    Walidacja i przepływ pracy: po zastosowaniu poprawek ponownie przeszukaj, aby zweryfikować ulepszenia. Użyj pętli kontroli: porównaj przed/po, zanotuj aktualizacje i dostosuj w razie potrzeby. Prowadź zwięzły dziennik audytu z przykładami zmian i uzasadnieniem. Przekazuj zalecenia pisarzom i programistom i, jeśli to możliwe, wdrażaj zmiany bezpośrednio w CMS lub kodzie witryny. Następnie powtórz proces na nowych stronach i monitoruj witrynę w czasie za pomocą okresowych aktualizacji.

    Wykorzystaj niestandardowe wyodrębnianie i renderowanie JavaScript, aby odkryć ukryte problemy

    use Custom Extraction and JavaScript Rendering to uncover hidden issues

    Renderuj w JavaScript, zamiast polegać na statycznym HTML, i użyj niestandardowego wyodrębniania, aby pobrać dynamiczne wartości, które wpływają na indeksowanie i doświadczenie użytkownika. Takie podejście pokazuje, że renderowany DOM zawiera znacznie więcej danych, umożliwiając wizualizację, co strony serwują użytkownikom i wyszukiwarkom, co ułatwia znalezienie czegoś, czego brakuje podstawowym przeszukiwaniom.

    Skonfiguruj trzy ukierunkowane wyodrębnianie, aby pokryć podstawowe sygnały bez przeciążania przepływu pracy:

    • Renderowany tekst H1 i tytuł strony
    • Dyrektywy robotów i obecność noindex w renderowanym DOM
    • Alternatywne linki językowe i kanoniczny adres URL

    Jak skutecznie to skonfigurować w Screaming Frog:

    1. Włącz renderowanie JavaScript w Konfiguracja > Spider > Renderowanie i wybierz renderowanie oparte na Chrome; dzięki temu dane downstream są dostępne do wyodrębniania.
    2. Dodaj trzy niestandardowe reguły wyodrębniania za pomocą ścieżki CSS lub XPath:
      1. Renderowane H1 i tytuł: wyodrębnij tekst z elementów h1 i title w renderowanym HTML.
      2. Noindex i robots: odczytaj atrybut content meta name="robots" i wszelkie sygnały X-Robots-Tag z renderowanego DOM.
      3. Alternatywny i kanoniczny: pobierz href z link[rel="alternate"] i link[rel="canonical"].
    3. Uruchom przeszukiwanie i przejrzyj kartę Niestandardowe wyodrębnianie, aby sprawdzić, czy każda reguła zawiera oczekiwane wartości; jeśli czegoś brakuje, dostosuj selektory i uruchom ponownie.
    4. Wyeksportuj wyniki za pomocą przycisku Export, aby utworzyć wyeksportowany plik, który możesz udostępnić członkom zespołu lub wkleić do panelu studia.

    Interpretacja wyników kieruje świadomymi decyzjami:

    1. Porównaj renderowaną zawartość ze statycznym HTML, aby zidentyfikować ukryte sygnały; jeśli renderowany DOM zawiera dane, których nie ma w początkowym HTML, musisz zbadać, dlaczego renderowanie je ujawnia.
    2. Jeśli noindex pojawia się tylko w renderowanym widoku, zastanów się, czy strona powinna być indeksowana, czy też renderowanie ujawnia błędną konfigurację, która blokuje indeksowanie downstream.
    3. Sprawdź alternatywne linki i tagi kanoniczne na stronach; luki mogą prowadzić do sprzecznych sygnałów w witrynach i wariantach językowych.
    4. Zmapuj wyniki na działania downstream: napraw znacznik na stronie, dostosuj renderowanie po stronie serwera lub serwuj krytyczne treści wcześniej w odpowiedzi, aby poprawić implikacje pagespeed.

    Praktyczny przepływ pracy i ustawienia, aby zmaksymalizować pokrycie:

    • Użyj kilku urządzeń emulatorów, aby wykryć różnice; renderowanie na urządzeniach mobilnych może ujawnić alternatywną zawartość, której brakuje przeszukiwaniom desktopowym.
    • Monitoruj implikacje pagespeed renderowanej zawartości; Strony z dużą ilością JavaScript mogą być przeszukiwane wolniej, więc zrównoważ głębokość z szybkością przeszukiwania.
    • Utrzymuj podstawową konfigurację prostą: zacznij od podstawowych wyodrębnień i stopniowo dodawaj więcej pól w miarę sprawdzania poprawności.
    • Gdy wyniki będą gotowe, utwórz panele wizualizacji z wyeksportowanych danych, aby zapewnić świadomy przegląd interesariuszom.
    • Dokumentuj wyniki za pomocą krótkich notatek i linków do dokładnych stron; pomaga to kierować zespoły w stronę konkretnych poprawek, a nie ogólnych zaleceń.

    Korzyści dla witryn, które polegają na renderowaniu po stronie klienta, są namacalne:

    • Odkryj ukrytą zawartość, która wpływa na indeksowanie, na przykład krytyczne elementy załadowane po początkowym trafieniu.
    • Ujawnij bloki noindex widoczne tylko w renderowanym wyjściu, kierując niezbędnymi zmianami przed dostarczeniem do produkcji.
    • Zapewnij kompletne sygnały dla alternatywnych ścieżek, zapewniając użytkownikom na wszystkich urządzeniach spójne informacje.
    • Wspieraj szybsze, świadome decyzje dzięki wyeksportowanym danym i panelom klasy studio do międzyfunkcyjnych recenzji.

    Powiązane artykuły

    Ready to leverage AI for your business?

    Book a free strategy call — no strings attached.

    Get a Free Consultation