XML sitemap

xml sitemap

Een XML sitemap, is het overzicht van alle pagina’s op je website. Met een XML sitemap, kan een zoekmachine in een oogopslag alle content van je website zien. Google bevestigd zelfs dat je (nieuwe) content hierdoor sneller ontdekt wordt.

In deze blog leggen ik je uit wat een sitemap is, welke soorten sitemaps er bestaan en hoe je je sitemap kan controleren

Wat is een xml sitemap?

Een sitemap is een eenvoudig te creëren document. In dit document staan alle URLs of afbeeldingen of video’s van je website. Dit document wordt vaak in een XML document opgeslagen (er bestaan ook alternatieven). Voor Google is het is belangrijk dat je je aan bepaalde richtlijnen houdt. Op die manier geef je de juiste signalen af naar Google of evt. andere zoekmachines.

Urls toevoegen sitemap werkt sneller aldus Google.
Medewerker Google via Twitter: Urls toevoegen in een sitemap versnelt het proces

Voorbeeld XML sitemap

Een sitemap, is geschreven is vaak geschreven in het xml formaat. Wellicht heb je al een sitemap op je website? Je kan dit controleren door te surfen naar: jouwwebsite.nl/sitemap.xml. Mocht dit nog niet het geval zijn, bekijk dan het voorbeeld hieronder eens:

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>https://www.jouwwebsite.nl</loc>
</url>
<url>
<loc>https://www.jouwwebsite.nl/shop</loc>
</url>

Elementen in de sitemap:

XML header: Geeft aan dat de sitemap in versie 1.0 is geschreven volgens de standaard richtlijnen. Het stukje encoding geeft aan volgens welke tekencodering is gebruikt. In dit geval is dat UTF-8 (een standaard die door Google begrepen wordt). Door dit aan te geven, begrijpt een zoekmachine hoe hij de tekst moet interpreteren.
URL set: Geeft aan dat de urls zijn geschreven volgens de xml standaard.
Individuele urls (loc): Geeft de locatie van de urls aan.

Optionele elementen:

lastmod: Geeft aan wanneer een document voor het laatst is aangepast ( <lastmod>2018-08-24T10:23:20+02:00</lastmod>)
Priority: Geeft de prioriteit aan van 0 t/m 1
Changefreq: geeft aan hoe vaak het stukje content gemiddeld veranderd (per uur, dag week etc)

De optionele elementen zijn niet verplicht. Sterker nog, Google hecht hier helemaal geen waarde aan (zie tweet hieronder).

Optionele elementen in sitemap heeft geen toegevoegde waarde
Medewerker Google reageert op de vraag of optionele elementen belangrijk zijn

Alternatieve sitemap formaten

Naast het .XML bestandsformaat, is het ook mogelijk om je sitemap anders aan te leveren bij Google. Tot de mogelijkheden behoren:
HTML sitemap: Zie toelichting hieronder.
Sitemap index: Een sitemap van meerdere sitemaps
(Hier maak ik gebruik van)
RSS sitemap
ATOM feedindeling

HTML sitemap

Zoals je hierboven leest, is een XML sitemap niet verplicht. Een HTML sitemap, is een mooi alternatief of toevoeging naast je XML sitemap. Waarom? Het is fijn voor de gebruiker om eenvoudig door de website te kunnen navigeren en uit ervaring zie ik dat de Bots van Google graag gebruik maken van je HTML sitemap. In mijn optiek een echte aanrader voor grotere websites!

Vaak vind je vaak in de footer van een website terug. Mijn advies bij een HTML sitemap: Plaats alleen je belangrijkste pagina’s hierin. Een goed voorbeeld is de html sitemap van de belastingdienst. In de afbeelding hieronder, zie je dat alleen de belangrijkste URLs getoond worden. Dat zijn er veel minder dan hun XML sitemap.

HTML sitemap voorbeeld

Sitemap controleren op SEO fouten

Als je een sitemap maakt om je prestaties in de zoekmachine te optimaliseren, dan is het handig om je sitemap (periodiek) te controleren. Hiermee voorkom je verkeerde signalen aan Google.

Sitemap controleren in Screamingfrog

Alhoewel er andere webcrawlers bestaan, controleer ik een sitemap altijd met Screamingfrog. Zet Screamingfrog op “list mode” en kies vervolgens voor upload, download XML sitemap. Voeg hier de URL naar je XML sitemap in en klik op ok!

Controleer je Sitemap op de volgende punten:

• Plaats je sitemap direct na je root domein, dus: www.jouwwebsite.nl/sitemap.xml. Indien je een sitemap index hebt, plaats deze dan als volgt: www.jouwwebsite.nl/sitemap_index.xml;
• Je sitemap mag niet groter zijn dan 50 mb op 50k urls. Indien je sitemap groter is, splits deze dan op in verschillende sitemaps en maak een sitemap index;
• Plaats je sitemap in je robots.txt;
• Je hoeft alleen maar een sitemap aan te maken voor je voorkeursdomein. Dus alleen www of non www;
• Voorkom tegengestelde signalen. Voeg de volgende urls niet aan je sitemap toe:
1. Url die een canonical verwijzing naar een andere url geven;
2. Pagina’s met een robotos meta tag
3. Pagina’s geblokkeerd in de robots.txt
4. Pagina’s met een 3xx/4xx/5xx statuscode
5. Gepagineerde content
6. Gearchiveerde pagina’s 

• Je kunt eventueel je alternate lang tags in je sitemap plaatsen;
• Zorg ervoor dat je sitemap dynamisch is. Daarmee bedoelen we: als er nieuwe content is, voeg deze dan toe en als content verwijderd is van je website, haal deze dan ook uit je sitemap. Het is belangrijk dat je sitemap alleen maar 2xx http status codes bevat (urls die direct te bereiken zijn).
• Maak eventueel een sitemap aan voor je video’s en afbeeldingen (zeker voor ondernemers waarbij afbeeldingen belangrijk zijn zoals grafisch ontwerpers, raden we aan dit te doen). Het maakt hierbij niet uit of de afbeeldingen van dezelfde website komen. Een CDN is ook prima. Zolang hij maar geverifieerd is in de Google search console.
• Heb je een nieuwswebsite? Voeg geen artikelen toe die ouder zijn dan 2 dagen.

TIP: Tevreden over je sitemap? Voeg je sitemap toe aan Search console.
Indien je dit al gedaan hebt, hoef je niks te doen.

Nu jij weer! Loop je nog ergens tegen aan? Worden de pagina’s uit je sitemap geïndexeerd? Laat het mij weten in de comments hieronder.

Laat een reactie achter