Canonical URL — co to jest i jak uniknąć duplikatów?
Czym jest canonical URL?
Canonical URL (adres kanoniczny) to znacznik HTML wskazujący wyszukiwarkom, która wersja strony jest „oryginalna" i powinna być indeksowana. Używa się go, gdy ta sama lub bardzo podobna treść jest dostępna pod wieloma adresami URL — sytuacja znacznie częstsza, niż mogłoby się wydawać.
Jak wygląda znacznik kanoniczny?
<link rel="canonical" href="https://example.com/artykul" />
Ten znacznik umieszcza się w sekcji <head> strony HTML. Mówi Google: „to jest preferowany URL tej treści — indeksuj ten, a nie inne warianty".
Canonical URL można również wskazać w nagłówku HTTP odpowiedzi (Link: <URL>; rel="canonical") — przydatne dla plików PDF i innych zasobów bez sekcji <head>.
Kiedy stosować canonical?
Canonical URL jest niezbędny wszędzie tam, gdzie ta sama treść jest dostępna pod wieloma adresami. Najczęstsze scenariusze:
- Parametry URL —
/produkty?sort=cenai/produkty?sort=nazwamają tę samą treść, różnią się jedynie sortowaniem - Wersje www/non-www —
www.example.comvsexample.com - HTTP/HTTPS —
http://vshttps://(choć to powinno być rozwiązane przekierowaniem 301) - Trailing slash —
/artykulvs/artykul/ - Syndykacja treści — gdy ten sam artykuł pojawia się na wielu stronach (np. przedruk w serwisie branżowym)
- Wersje mobile —
m.example.comvsexample.com(rzadziej stosowane przy responsive design) - Paginacja —
/blog?page=1,/blog?page=2mogą mieć canonical na stronę główną kategorii - Warianty produktu — ten sam produkt w różnych kolorach pod różnymi URL-ami
Dlaczego canonical jest ważny?
Bez canonical URL Google musi sam zdecydować, który wariant strony indeksować — i często wybiera nieprawidłowy. Konsekwencje braku kanonizacji mogą być poważne — dlatego jest to jeden z kluczowych punktów każdego audytu SEO:
Problemy z duplikacją treści
- Rozproszenie autorytetu — backlinki prowadzące do różnych wariantów URL nie sumują się; zamiast jednej silnej strony masz kilka słabych
- Kanibalizacja w SERP — wiele wersji tej samej treści konkuruje ze sobą w wynikach wyszukiwania
- Marnowanie crawl budget — Google traci czas na crawlowanie duplikatów zamiast odkrywać nowe treści
- Nieprawidłowe dane analityczne — ruch rozdzielony między wiele URL-i utrudnia analizę
Korzyści z prawidłowej kanonizacji
- Konsolidacja autorytetu — wszystkie sygnały rankingowe trafiają do jednego, preferowanego URL-a
- Czyste dane w Google Search Console — jeden URL per treść, łatwa analiza
- Kontrola nad indeksem — Ty decydujesz, co Google indeksuje
- Lepsza crawlability — crawler efektywniej wykorzystuje budżet
Jak prawidłowo wdrożyć canonical?
Zasady implementacji
- Każda strona powinna mieć canonical — nawet jeśli wskazuje na siebie samą (self-referencing canonical). Pełną listę elementów do weryfikacji znajdziesz w checkliście SEO technicznego
- Canonical musi wskazywać na wersję z HTTPS — zawsze pełny, absolutny URL
- Canonical powinien wskazywać na stronę 200 — nie na redirect ani stronę 404
- Jeden canonical per stronę — wiele znaczników canonical na jednej stronie jest ignorowanych
- Spójność z innymi sygnałami — canonical powinien zgadzać się z sitemap, hreflangy i linkowaniem wewnętrznym
Częste błędy
- Canonical na stronę z noindex — sprzeczne sygnały, Google może zignorować oba
- Łańcuchy canonical — A → B → C; Google może nie podążać za łańcuchem
- Canonical na stronę z inną treścią — Google ignoruje canonical, jeśli treści znacząco się różnią
- Brak canonical na stronach paginacji — prowadzi do indeksowania setek stron
/page/2,/page/3
Canonical a redirect 301
Canonical to „sugestia" dla Google — wyszukiwarka może ją zignorować. Redirect 301 to „nakaz" — przeglądarka i crawler są fizycznie przekierowywane. Gdy to możliwe, preferuj redirect 301 nad canonical — jest silniejszym sygnałem.
| Sytuacja | Rozwiązanie |
|---|---|
| Jedna treść, jeden prawidłowy URL, reszta do usunięcia | Redirect 301 |
| Jedna treść, wiele URL-i muszą istnieć (parametry, sortowanie) | Canonical |
| Syndykacja treści na zewnętrznej stronie | Canonical |
| Migracja domeny | Redirect 301 + canonical |
Powiązane pojęcia
- Duplicate content — problem, który canonical rozwiązuje
- Redirect 301 — stałe przekierowanie, alternatywa dla canonical
- Crawlability — zdolność crawlerów do przechodzenia przez witrynę
- Indeksowanie — proces zapisywania strony w indeksie Google
- Crawl budget — budżet crawlowania, marnowany przez duplikaty