Index bloat — nadmiarowa indeksacja stron
Czym jest index bloat?
Index bloat to sytuacja, w której Google indeksuje zbyt wiele stron niskiej jakości z Twojej witryny — strony paginacji, filtrów, tagów, parametrów URL czy thin content. Zamiast wzmacniać widoczność, te strony rozmywają autorytet domeny i marnują crawl budget.
Dlaczego to problem?
- Rozmycie autorytetu — link equity rozkłada się na setki bezwartościowych stron
- Marnowanie crawl budgetu — Googlebot crawluje śmieci zamiast ważnych stron
- Kanibalizacja — podobne strony konkurują o te same frazy
- Niższe pozycje — Google ocenia jakość całej domeny, nie tylko najlepszych stron
Typowe źródła index bloat
| Źródło | Przykład |
|---|---|
| Filtry i parametry | /produkty?kolor=czerwony&rozmiar=L |
| Tagi i archiwa | /tag/seo, /author/jan-kowalski |
| Paginacja | /blog/page/47 |
| Wersje sortowania | /produkty?sort=price-asc |
| Strony wyszukiwania | /search?q=buty |
| Stare treści | Artykuły z 2018 z zerowym ruchem |
Jak diagnozować?
site:twojadomena.plw Google — porównaj liczbę wyników z liczbą stron, które chcesz mieć- Search Console → Pages → sprawdź, ile stron jest „Indexed, not submitted"
- Screaming Frog — crawl całej witryny i porównanie z indeksem Google
Jak naprawić?
- Noindex na stronach bez wartości — tagi, filtry, archiwa autorów
- Canonical — wskaż wersję kanoniczną dla wariantów
- Robots.txt — zablokuj crawlowanie parametrów URL
- Content pruning — usuń lub połącz treści niskiej jakości
- Monitoruj systematycznie — sprawdzaj indeks co miesiąc
Powiązane pojęcia
- Crawl budget — budżet crawlowania
- Content pruning — usuwanie słabych treści
- Canonical URL — adres kanoniczny
- Technical SEO — SEO techniczne