Niejednokrotnie w naszych artykułach wspominamy o niepożądanej praktyce, której bardzo nie lubią algorytmy Google. Na czym dokładnie polega "duplicate content"?
W języku polskim to duplikacja treści, która należy do ścisłego grona Black Hat SEO, czyli ciemnej strony pozycjonowania.
Duplikacja - jak sama nazwa wskazuje - jest kopią/plagiatem tekstu, który pojawił się już wcześniej co najmniej raz na innych stronach internetowych, albo na tej samej witrynie. Duplicate content dzieli się na wewnętrzny oraz zewnętrzny.
Duplicate content
W części wewnętrznej bierzemy pod uwagę powtarzające się teksty w tym samym serwisie, zdarza się to zwłaszcza w sklepach internetowych, gdzie ich właściciele zapominają o unikalnych opisach produktów. Błędne jest chociażby dodanie takiego samego tekstu w jednym produkcie, w kilku jego wariantach (np. w kilku kolorach). Nawet jeśli ta duplikacja treści została wywołana nieświadomie, czy przez przypadek, to algorytmy Google i tak mogą w wyszukiwarce ograniczyć widoczność strony i blokować pozycjonowanie. Na zewnątrz zwykle dochodzi do publikacji takiego samego tekstu w różnych miejscach, które linkują do jednego adresu.
Od kilku lat celem wszystkich mechanizmów wyszukiwarki jest premiowanie materiałów unikalnych, jedynych w swoim rodzaju. Jeżeli te nie będą wartościowe dla użytkowników, a przede wszystkim - będą zawierały skopiowane części artykułów z innych źródeł, może to zostać ocenione jako oszustwo i próba wyłudzenia wyższych pozycji w wynikach wyszukiwania na poszczególnych frazach. W najlepszym wypadku dana strona spadnie w rankingu, w najgorszym może zostać całkowicie usunięta z Google.
Powody zewnętrznej duplikacji
Podstawowym punktem w tzw. klonach są treści, które zostają skopiowane z jednej strony i opublikowane na drugiej. Tutaj dobrym przykładem, który sami możecie łatwo zauważyć, są informacje prasowe z domów i biur medialnych, umieszczane następnie na największych portalach informacyjnych.
Duplicate content występuje też w przypadku opisów produktów, umieszczanych na portalach sprzedażowych z Twojego serwisu. Podobnymi przypadkami są informacje, które znajdą się na naszym "podwórku", a potem także m.in. katalogach, czy wiadomościach sponsorowanych na innych portalach. Zewnętrzną duplikacją można też uznać wklejone opisy na profile społecznościowe, chociaż w tym przypadku ryzyko jest nieco mniejsze.
Wspomnieliśmy już wcześniej o sklepach, gdzie występuje nie tylko problem kopii bezpośrednio przy swoich produktach, ale też kopiowanie charakterystyki towaru pomiędzy obcymi sobie sklepami online.
Sporym błędem - i to bardzo częstym - jest kopiowane informacji z Wikipedii, która ma bardzo wysoką reputację i każdy tekst stamtąd wzięty, będzie traktowany w innych miejscach sieci jako bezwartościowy. Jeżeli nasz materiał nie będzie unikatowy, to zbyt wiele w promocji zdziałać się nie da, ponieważ Google takie jednostki eliminuje i zawsze ostrzegamy o tym zagrożeniu naszych klientów.
Wewnętrzny duplicate content
- W sklepach internetowych to bardzo częsty problem, który ciężko jest wyeliminować, jeśli nie zdiagnozuje się go na starcie, jeśli produktów w sprzedaży jest bardzo wiele,
- Jeżeli strona główna ma kilka różnych adresów, bez poprawnego przekierowania, to taka praktyka też może zostać uznana jako kopiowanie, np.:
http://www.strona.pl/index.html
http://strona.pl/index.html
http://www.strona.pl
http://strona.pl
- Po dodaniu certyfikatu bezpieczeństwa SSL i nieprawidłowemu przekierowaniu z http na https, Google również może ocenić, jakby to były dwie strony z tym samym materiałem,
- Zdarza się, że podczas tworzenia różnych wersji językowych serwisu internetowego, niektóre części nie zostaną przetłumaczone na dany język i pozostaną tam np. polskie wstawki. Będzie to oznaczało na co najmniej dwóch podstronach duplikację,
- Problem może pojawić się również, jeśli powielone zostaną znaczniki title oraz meta description, a zdarza się to w momencie, kiedy na podstronach nie zastosujemy w tych sekcjach różnorodnych opisów. Nie jest to ogromny błąd, natomiast prawdopodobne, że zostaną osłabione pozycje strony w Google. Podobna sytuacja związana jest z błędną paginacją serwisu.
Jak kontrolować publikowane treści na stronie internetowej?
Duplicate content to ważna kwestia przy budowaniu i utrzymywaniu wartości swojej strony internetowej. Istnieją specjalne narzędzia, aby móc regularnie to kontrolować.
Wewnętrzna duplikacja
Google Search Console, Siteliner, Screaming Frog, Ahrefs, Sitebulb
Zewnętrzna duplikacja
Copyscape, SeoReviewTools (Duplicate Content Checker), Wyszukiwarka Google (poprzez wklejanie poszczególnych zdań tekstu)
Jak eliminować kopiowanie tekstu?
Nie zawsze tworzenie unikatowych treści wystarczy, bowiem też nie na wszystko sami mamy wpływ, czyli na np. kopiowanie pomiędzy różnymi stronami. Starajmy się jednak wszystkie powyższe zagrożenia analizować i możliwie szybko reagować na to, co jest w naszych rękach, ponieważ filtry i kary nałożone przez Google mogą być niekiedy bardzo dotkliwe. Publikowanie tekstów swojego autorstwa z pewnością docenią również użytkownicy.