Baza wiedzy » Blog » Pozycjonowanie / SEO

Mapa strony i jej wpływ SEO. Jak stworzyć sitemapę?

Zaktualizowano: 2020-06-18  
(12 min czytania)
Mapa strony - sitemap
Nawet najlepsza treść nie poprawi widoczności naszej witryny, jeśli nie zostanie zaideksowana przez roboty wyszukiwarki. Rozwiązaniem, które może nam pomóc w uniknięciu takiej sytuacji, jest stworzenie mapy strony, o ile zostanie ona przygotowana w sposób właściwy. Sprawdź, czym dokładnie jest mapa witryny oraz jak możesz stworzyć dla swojej strony plik sitemap, który pomoże w indeksacji zawartej na niej treści.

Spis treści:

Internet rośnie z każdą sekundą – nieustannie przybywa nowych stron i treści publikowanych w sieci. Wobec takiego ogromu danych coraz większym wyzwaniem staje się indeksacja contentu przez wyszukiwarki. Pomóc nam w tym może mapa strony. Tak jak mapa topograficzna pomaga ludziom w orientacji w terenie i dotarciu do obranego celu, tak mapa strony stanowi swoisty przewodnik poruszania się po stronie zarówno dla robotów indeksujących, jak i użytkowników.

Czym jest mapa strony?

Mapa strony (ang. sitemap) to zbiór adresów URL prowadzących do podstron naszej witryny. Stworzenie pliku sitemap ma na celu ułatwienie robotom wyszukiwarki crawlowanie i indeksowanie treści, a jednocześnie umożliwia zasugerowanie, które z podstron odgrywają ważniejszą rolę w obrębie strony. Za pośrednictwem mapy strony pomagamy crawlerom zrozumieć strukturę naszej witryny oraz dostarczamy dodatkowych informacji, takich jak data aktualizacji podstrony.

Dlaczego strona powinna mieć mapę strony?

Źródło: cdn.searchenginejournal.com/wp-content/uploads/2018/08/sitemap-crawl.webp

Jak widzimy na powyższej grafice schemat strony internetowej przypomina strukturę drzewa, a część podstron (szczególnie tych najbardziej rozbudowanych) może wymagać od crawlera przejścia przez kilka kolejnych stron. Tymczasem dzięki mapie strony robot otrzymuje informacje o wszystkich adresach URL od razu.

Czasem zdarza się również, że struktura strony jest daleka od ideału i wówczas może dojść do sytuacji, w której dana podstrona nie została podlinkowana wewnętrznie. Dodanie adresu URL takiej podstrony do pliku sitemap zwiększa prawdopodobieństwo dotarcia robotów wyszukiwarek i w następstwie zaideksowania podstrony. Posiadanie mapy strony może być szczególnie przydatne dla stron:

  • z dużą liczbą podstron (np. sklepy internetowe),
  • często dodających nowe treści,
  • aktualizujących istniejący już content,
  • posiadających słaby profil linków.

Indeksacja a sitemap. Jak mapa witryny wpływa na indeksację strony?

Mapa strony ułatwia robotom wyszukiwarki dotarcie do zasobów naszej strony, jednakże należy pamiętać, że umieszczenie adresu URL w pliku sitemap nie jest jednoznaczne z zaindeksowaniem podstrony. Jest to wyłącznie sugestia, natomiast z różnych przyczyn wskazany przez nas adres może zostać pomięty podczas indeksacji (np. jeśli do sitemapy przypadkowo trafił URL z tagiem „noindex”, „nofollow”).

Rodzaje sitemap

Istnieje kilka rodzajów map strony. Do najpopularniejszych należą:

  • Mapa strony HTML

Mapa strony w HTML tworzona jest z myślą zarówno o użytkownikach, jak i robotach indeksujących. Przyjmuje ona najczęściej formę podobną do spisu treści celem określenia hierarchii i ułatwienia orientacji w strukturze strony.

Przykład:

Źródło: allegro.pl/mapa-strony/kategorie

  • Mapa strony XML

Mapa strony w XML w odróżnieniu od mapy witryny w HTML skierowana jest dla crawlerów wyszukiwarek. Z tego powodu jej wygląd jest mniej przyjazny dla przeciętnego użytkownika, ale jednocześnie można w niej zawrzeć większą liczbę informacji przydatnych dla robotów indeksujących: priorytet, datę aktualizacji czy częstotliwość zmian.

Źródło: www.sitemaps.org/sitemap.xml

Z uwagi na popularność w dalszej części artykułu skupimy się na mapie strony o formacie XML.

Jak wygląda plik sitemap.xml?

XML (ang. Extensible Markup Language, czyli rozszerzalny język znaczników) to język stworzony z myślą o prezentowaniu różnych danych w strukturalizowany sposób1. Przykładowy plik mapy strony w XML może wyglądać następująco:

Źródło: www.whitepress.pl/sitemap.xml

W pliku mapy witryny możemy następujące tagi:

<urlset> - tag otwarcia i zamknięcia.

<url> - tag nadrzędny, rozpoczynający i zamykający poszczególne adresy URL w mapie witryny.

<loc> - tag lokalizacyjny, zawierający adres URL (podany w pełnej formie (z http lub https).

<lastmod> - tag zawierający informacje o dacie ostatniej modyfikacji (w formacie YYYY-MM-DD).

<changefreq> - informacja o częstotliwości zmian pliku (np. daily, weekly, monthly).

<priority> - priorytet ważności pliku w hierarchii strony ujęty wartością od 0.0 do 1.0.

<xhtml:link> - tag używany do wskazania alternatywnych adresów URL w innych wersjach językowych

Wśród powyższych tagów część jest niezbędna (urlset, url, loc), a pozostale mają charakter opcjonalny.

Mapa strony XML – wymagania

  • rozmiar pliku sitemap.xml nie może przekraczać 50 MB,
  • pojedynczy plik mapy strony może zawierać do 50 000 adresów URL,
  • mapa strony może zostać skompresowana (np. do formatu gzip),
  • nazwa pliku mapy witryny może być dowolna (zaleca się unikanie polskich znaków), lecz najczęściej stosuje się warianty: sitemap.xml, sitemap-index.xml, mapa-strony.xml,
  • plik mapy strony powinien zostać umieszczony na serwerze strony, z myślą o której został przygotowany. Lokalizacja pliku jest dowolna, ale sam Google zaleca zamieszczanie go w katalogu głównym. Najczęściej mapę strony znajdziemy pod adresem przykładowyadres.pl/sitemap.xml (zależnie od nazwy pliku z mapą witryny).

Jakie adresy URL nie powinny znaleźć się w mapie witryny?

  • Strony z błędami (np. 4xx lub 5xx),
  • Adresy z przekierowaniami,
  • URL stron z parametrami,
  • Adresy zablokowane w robots.txt lub tagiem noindex,
  • Strony będące wynikami wyszukiwania.

Jedna mapa strony czy wiele?

W wielu sytuacjach konieczne może okazać się przygotowanie kilku plików mapy strony. Dotyczy to przede wszystkim dużych stron, posiadających więcej niż wspomniany już limit 50 000 URL, ale nie tylko. W przypadku stron opierających się o grafikę lub wideo, jak również stron udostępniających treści za pośrednictwem Google News, warto przygotować specjalne pliki sitemap. Zastosowanie kilku mniejszych map witryny pozwala również na lepsze kontrolowanie stanu indeksacji strony.

Sitemapindex

Plik sitemapindex to, najprościej ujmując, indeks map witryn, w którym zamieszczamy adresy URL wszystkich map strony, jakie zostały przygotowane dla naszej witryny.

Plik może wyglądać w następujący sposób:

Źródło: support.google.com/webmasters/answer/75712?hl=pl

Wymagane tagi w pliku sitemapindex:

<sitemapindex> – tag nadrzędny pliku.

<sitemap> – tag nadrzędny otwierający i kończący każdą kolejną mapę witryny w pliku.

<loc> – lokalizacja adresu URL poszczególnej mapy strony.

Mapa strony grafik

Mapa grafik przygotowywana jest w celu poprawy indeksacji treści graficznych. Jest to szczególnie istotne w przypadku stron koncentrujących się na tego typu contencie (np. banki zdjęć, sklepy internetowe). Stworzenie mapy grafik oraz odpowiednie opisanie treści na stronie przy użyciu stosownych znaczników Schema może ułatwić dotarcie do większej grupy odbiorców, np. za pośrednictwem Google Grafika.

Źródło: support.google.com/webmasters/answer/178636?hl=pl&ref_topic=4581190

Tagi w mapie grafiki

Wymagane tagi w mapie grafiki:

<image:image> - tag zawierający komplet informacji na temat obrazu. Liczba tagów <image:image> dla pojedynczego tagu <url> nie może przekraczać 1000.

<image:loc> - tag lokalizacyjny adresu URL obrazu.

Opcjonalne tagi w mapie strony grafik:

<image:caption> - tag podpisu obrazu .

<image:geo_location> - tag określający geograficzną lokaliazację obrazu.

<image:title> - tag wskazujący tytuł obrazu.

<image:license> - tag zawierający URL licencji

Mapa strony wideo

Jeśli nasza strona posiada wiele materiałów wideo, wówczas możemy się pokusić o stworzenie osobnej mapy wideo, zawierającej dodatkowe informacje dotyczące materiałów filmowych.

Źródło: support.google.com/webmasters/answer/80471?hl=pl&ref_topic=4581190

Tagi w mapie strony wideo

Wymagane tagi w mapie wideo:

<url> – tag nadrzędny, rozpoczynający i zamykający poszczególne adresy URL.

<loc> - tag lokalizujący, wskazujący konkretny adres URL

<video:video> - tag będący elementem nadrzędnym w stosunku do wszystkich informacji o filmie.

<video:thumbnail_loc> - tag wskazujący lokalizację miniatury filmu

<video:title> - tag zawierający tytuł filmu.

<video:description> - tag opisujący film (do 2048 znaków).

<video:content_loc> - URL wskazujący plik z filmem – stosowany wymiennie z <video:player_loc>

<video:player_loc> - URL odtwarzacza filmu – stosowany wymiennie z <video:content_loc>

 

Tagi w mapie strony wideo

Wymagane tagi w mapie wideo:

<url> – tag nadrzędny, rozpoczynający i zamykający poszczególne adresy URL.

<loc> - tag lokalizujący, wskazujący konkretny adres URL

<video:video> - tag będący elementem nadrzędnym w stosunku do wszystkich informacji o filmie.

<video:thumbnail_loc> - tag wskazujący lokalizację miniatury filmu

<video:title> - tag zawierający tytuł filmu.

<video:description> - tag opisujący film (do 2048 znaków).

<video:content_loc> - URL wskazujący plik z filmem – stosowany wymiennie z <video:player_loc>

<video:player_loc> - URL odtwarzacza filmu – stosowany wymiennie z <video:content_loc>

 

Mapa newsów

Mapa newsów jest rozwiązaniem zoptymalizowanym pod kątem usługi Google News. Zawiera ona adresy URL artykułów z 2 ostatnich dni, a jej utworzenie jest jednym z wymogów publikacji treści w Wiadomościach Google.

Źródło: support.google.com/news/publisher-center/answer/9606710?hl=en

Mapa newsów wymaga wykorzystania tagów takich jak:

<publication> - tag wskazujący wydawcę publikującego newsa.

<name> - tag nazwy wydawnictwa. Musi być spójny z nazwą wyświetlaną w Google News.

<language> - tag określający język.

<publication_date> - data publikacji podana w formacie W3C, czylu YYYY-MM-DD.

<title> - tag wskazujący tytuł artykułu. W swoich wytycznych Google sugeruje zastosowanie tytuły artykułu identycznego z tym na stronie, pozbawionego informacji o autorze oraz wydawnictwie.

Statyczna czy dynamiczna mapa strony?

Mapa strony może mieć charakter statyczny, jak i dynamiczny. W tym pierwszym przypadku sami tworzymy plik sitemap i zamieszczamy go na serwerze. Jest to jednak rozwiązanie niewskazane, gdyż po każdej zmianie w obrębie witryny konieczne będzie ręczne odświeżenie pliku. Stosowanie dynamicznej mapy strony pozwala uniknąć takich kłopotów, gdyż każda zapisana zmiana zostaje automatycznie wdrożona również w samej mapie strony.

Jak przygotować mapę strony?

Mapa strony może zostać przygotowana na kilka sposobów. Większość systemów CMS daje możliwość generowania dynamicznych plików sitemap w oparciu o dedykowane tym celu pluginy, ale można przygotować również stosowny plik za pośrednictwem innych narzędzi.

Jak stworzyć plik sitemap.xml za pomocą Screaming Frog SEO Spider?

W darmowej wersji Screaming Frog SEO Spider umożliwia crawlowanie do 500 adresów URL.

W celu automatycznego generowania mapy witryny w narzędziu Screaming Frog musimy:

  1. Wpisać w pasek adres WWW strony, dla której chcemy przygotować plik sitemap.xml i kliknąć przycisk „start”.

  1. Gdy nasza strona zostanie przecrawlowana w 100%, wybieramy z górnego paska „Sitemaps” a następnie „XML sitemap”.
  2. Kolejnym krokiem jest konfiguracja – musimy określić parametry, jakie będą uwzględniane przy generowaniu mapy.

  1. Po kliknięciu przycisku next, program zapyta nas, gdzie zapisać wygenerowany plik mapy strony.

Należy pamiętać, że mapa strony generowana za pomocą Screaming Frog jest mapą statyczną, czyli po każdej zmianie treści na naszej stronie konieczne jest wygenerowanie nowego pliku sitemap.

Jak stworzyć mapę strony w Wordpress?

Wordpress pozostaje najpopularniejszym CMS-em na świecie, więc na jego przykładzie zaprezentujemy sposób na wygenerowanie mapy strony. Domyślnie WP nie generuje pliku sitemap.xml, ale możemy bardzo łatwo to zmienić za pomocą wtyczek.

Na potrzeby artykułu wykorzystamy w tym celu Yoast SEO.

Pobieramy i instalujemy wtyczkę.

  1. Po instalacji wybieramy w bocznym pasku menu pozycję „SEO”, a następnie w zakładce „funkcje” oznaczamy pozycję Mapa strony XML jako „włączone” i zapisujemy zmiany.

  1. Jeśli chcemy, aby niektóre strony nie pojawiały się w mapie strony, możemy wyłączyć je wybierając „SEO” -> „wyszukiwarki” - > „Rodzaje treści”, a następnie wybierając stosowne ustawienie w polu „Wyświetlać stronę w wynikach wyszukiwania”

Źródło: beskidzka24.pl/sitemap_index.xml

Listę generatorów map witryny proponowanych przez Google znaleźć można pod linkiem:

code.google.com/archive/p/sitemap-generators/wikis/SitemapGenerators.wiki 

Jak zweryfikować poprawność mapy strony?

Po wygenerowaniu mapy strony możemy zweryfikować jej poprawność np. przy pomocy www.xml-sitemaps.com. Po wpisaniu adresu, pod którym dostępna jest mapa witryny i kliknięciu przycisku „VALIDATE SITEMAP” otrzymamy informację o ewentualnych błędach i ostrzeżeniach.

Źródło: www.xml-sitemaps.com/validate-xml-sitemap.html 

Jak dodać mapę strony w Google Search Console?

Po stworzeniu mapy strony warto zgłosić ją również w narzędziu Google Search Console, co powinno przyspieszyć zauważenie jej przez crawlery Google.

Możemy tego dokonać w kilku prostych krokach:

  1. Zaloguj się do Google Search Console i wybierz domenę, dla której chcesz dodać mapę strony.
  2. W menu nawigacyjnym wybierz mapę witryn.

  1. Jeśli w polu „Przesłane mapy witryn” nie widzisz żadnego wpisu, wpisz adres URL, pod którym zamieszczona jest mapa Twojej strony i kliknij „Prześlij”.

  1. Po chwili powinien pojawić się nowy wpis – jeśli wszystko przebiegło poprawnie, w polu „stan” zobaczysz komunikat „Sukces”.

Warto przy okazji wspomnieć, iż dobrą praktyką jest dodanie informacji o mapie strony w pliku robots.txt. W tym celu powinniśmy dopisać w nim następującą treść:

Sitemap: przykładowyadres.pl/sitemap.xml

Jeśli mamy więcej plików, wówczas dodajemy je kolejno:

Sitemap: przykładowyadres.pl/sitemap1.xml

Sitemap: przykładowyadres.pl/sitemap2.xml

Ważne jest, by podany w robots.txt URL pliku sitemap był adresem bezwzględnym, czyli z http lub https.

Podsumowanie

Mapa strony nie jest magicznym narzędziem, które zagwarantuje nam topowe pozycje dla konkurencyjnych fraz. Jest to natomiast łatwe w przygotowaniu rozwiązanie, dzięki któremu możemy poprawić widoczność naszej strony. Biorąc pod uwagę fakt, iż ostatnimi czasy Google często miewa problem z indeksacją treści, warto zadbać o ten aspekt i w jak największym stopniu ułatwić przyswajanie treści na naszych stronach robotom crawlującym wyszukiwarek.

Zapoznaj się także z naszym artykułem: https://www.whitepress.com/pl/baza-wiedzy/42/podstawy-optymalizacji-stron-internetowych-pod-seo

 


1 Źródło: pl.wikipedia.org/wiki/XML

Autor: Wojciech Kuczera

SEO Specialist w WhitePress®

W świecie SEO porusza się już od 2010 roku. W WhitePress® prowadzi projekty dla klientów w zakresie link buildingu oraz inbound marketingu. Zwolennik metodologii datadriven w procesie pozycjonowania. Prywatnie wielki fan Marvela i piłki nożnej, od lat wiernie kibicuje drużynie Everton F.C.
Wasze komentarze (1)
Redakcja WhitePress® zastrzega sobie prawo usuwania komentarzy niezgodnych z Regulaminem publikowania komentarzy oraz niezgodnych z prawem i dobrymi obyczajami.

Administratorem danych osobowych osób korzystających ze strony internetowej whitepress.com i wszystkich jej podstron (dalej: Serwis) w rozumieniu Rozporządzenia Parlamentu Europejskiego i Rady (UE) 2016/679 z dnia 27 kwietnia 2016 r. w sprawie ochrony osób fizycznych w związku z przetwarzaniem danych osobowych i w sprawie swobodnego przepływu takich danych oraz uchylenia dyrektywy 95/46/WE (dalej: RODO) jest wspólnie „WhitePress” Spółka z ograniczoną odpowiedzialnością z siedzibą w Bielsku – Białej przy ul. Legionów 26/28, wpisana do rejestru przedsiębiorców KRS prowadzonego przez Sąd Rejonowy w Bielsku – Białej, VIII Wydział Gospodarczy Krajowego Rejestru Sądowego pod numerem KRS: 0000651339, NIP: 9372667797, REGON: 243400145 oraz pozostałe spółki z Grupy WhitePress (dalej łącznie: Administrator).

Dokonując zapisu na newsletter wyrażacie Państwo zgodę na przesyłanie informacji handlowych za pomocą środków komunikacji elektronicznej, w tym w szczególności poczty elektronicznej, dotyczących marketingu bezpośredniego usług i towarów oferowanych przez WhitePress sp. z o.o. oraz jej zaufanych partnerów handlowych, zainteresowanych marketingiem własnych towarów lub usług. Podstawą prawną przetwarzania Państwa danych osobowych uzasadniony interes Administratora oraz jego partnerów (art. 6 ust. 1 lit. f RODO).

W każdym momencie przysługuje Państwu możliwość wycofania zgody na przetwarzanie Państwa danych osobowych w celach marketingowych. Więcej informacji na temat przetwarzania oraz podstaw przetwarzania Państwa danych osobowych, w tym przysługujących Państwu uprawnień, znajdziecie Państwo w naszej Polityce prywatności.

Czytaj całość
Marek
2020-06-23, 16:03

Fajny wpis, mapa strony często jest lekceważona przez właścicieli serwisów

bootcampy.pl

Zgłoś komentarz

Polecane artykuły