Tra le misure più importanti per ottimizzare il proprio sito lato SEO c'è dubbio la costruzione e il mantenimento di una sitemap.xml. Come suggerisce il nome stesso si tratta sostanzialmente di una mappa del proprio sito, che contiene una lista in formato xml di tutte le pagine interne. Questa mappa server a guidare i motori di ricerca verso tutti i contenuti del sito rendendo il processo di crawling più rapido e chiaro. Rappresenta dunque uno step fondamentale per ottimizzare il proprio sito lato SEO.

Senza di essa i motori di ricerca navigano comunque all'interno del sito e i crawler sono in grado di passare da una pagina all'altra tramite i link di navigazione interni. Tuttavia spesso non tutti i link sono presenti all'interno delle pagine e può esservi il caso in cui determinati contenuti siano raggiungibili solo esternamente. In questo caso il motore di ricerca ignorerebbe la pagina e quindi il sito ne risentirebbe in visibilità.

Come è formata la sitemap.xml

La sitemap.xml è un file xml che viene pubblicato all'interno del sito ad un determinato indirizzo e le cui regole aderiscono ad uno schema preciso. Ciascun nodo si presenta nella forma:

<url>
  <loc>https://www.yourpage.com/</loc>
  <changefreq>daily</changefreq>
  <priority>1.0</priority>
  <lastmod>2017-05-16T10:03Z</lastmod>
</url>
  • Il nodo loc corrisponde all'indirizzo assoluto della pagina
  • changefreq indica la frequenza con cui la pagina subisce modifiche
  • priority è un valore da 0 a 1 che indica la priorità della pagina rispetto alle altre
  • lastmod corrisponde alla data di ultima modifica della pagina

I benefici di una sitemap.xml

Come detto la sitemap.xml fornisce maggiori informazioni sulla struttura delle pagine del sito, per cui:

  • Include le pagine che non sono collegate direttamente da altre pagine
  • Informa i motori di ricerca sulla priorità delle pagine
  • Include informazioni temporali, permette dunque ai motori di ricerca di capire quando le pagine sono state aggiornate e con quale frequenza

Come creare una sitemap.xml

Creare una sitemap è piuttosto semplice se si utilizzano CMS come Wordpress o Drupal. Esistono infatti moduli e plugin che si occupano della creazione e aggiornamento automatico della sitemap. In ogni caso è sempre buona prassi assicurarsi che il documento in output sia corretto:

  • Inizia con un tag di apertura e un tag di chiusura
  • Specifica il namespace corretto all'interno del tag
  • Per ogni pagina includi un nodo <url> come visto sopra
  • Utilizza la codifica utf-8

È poi necessario verificare il corretto formato della sitemap.xml e che sia caricata ed accessibile sul server. Uno strumento di test molto efficace lo fornisce la Search Console di Google.

Per siti web piccoli e che non sono costruiti sopra un CMS è possibile avvalersi di uno strumento online per la generazione automatica: https://www.xml-sitemaps.com/. Una volta generato il documento dev'essere caricato sulla root del server e dev'essere accessibile con un url del tipo: www.your-website.com/sitemap.xml.

Questo approccio è tuttavia molto limitato e richiede una manutenzione manuale nel corso del tempo. È assolutamente consigliato utilizzare un CMS per lo sviluppo di un sito web, anche se di poche pagine.

Modulo Drupalhttps://www.drupal.org/project/xmlsitemap

Plugin Wordpresshttps://it.wordpress.org/plugins/google-sitemap-generator/

Inserire la sitemap.xml nel robots.txt

Come già detto in questo articolo è buona prassi specificare ai crawler il percorso della sitemap.xml, soprattutto qualora essa si trovasse su un percorso differente rispetto alla root o il file avesse un nome diverso. È necessario modificare il file robots.txt presente nella root del server e aggiungere la riga seguente:

Sitemap: http://www.miosito.it/percorso_della_sitemap.xml