Screaming Frog SEO Spider è uno degli strumenti più utili a disposizione di chi si occupa di Search Engine Optimization a livello professionale.

Tra le diverse funzioni di questo tool ve ne è anche una che consente di creare una Sitemap XML del proprio sito da inviare successivamente a Google per velocizzare ed ottimizzare la scansione delle URL del nostro sito.

A questo proposito puoi leggere anche “Come creare, testare ed inviare una Sitemap XML a Google“. In questo post vediamo invece nel dettaglio come generare una Sitemap XML con Screaming Frog.

Creare una Sitemap XML con Screaming Frog: procedura preliminare

Per creare una Sitemap XML con Screaming Frog, in fase preliminare sarà necessario disporre di un elenco delle URL che desideriamo includere nella Sitemap, siano esse relative a pagine web o immagini.

Se non disponete di un elenco di tutte le URL del vostro sito che volete far indicizzare a Google è possibile ricavarne uno attraverso la scansione sempre tramite Screaming Frog SEO Spider.

  • Avviate Screaming Frog ed assicuratevi che la modalità selezionata sia “Spider”

    sf-spidermode

  • Configurate lo Spider cliccando sulla voce di menu “Configuration”: se nella vostra Sitemap XML volete includere le immagini assicuratevi che – nella scheda “Basic” – sia spuntata la casella “Check images”. Potete invece togliere la spunta a tutta le altre caselle.
  • Sempre in fase di configurazione, nella scheda “Limits” deselezionate la casella “Limit Search Total”: stiamo cercando di produrre un elenco di URL del nostro sito il più completo possibile, lasceremo quindi lo spider di Screaming Frog navigare il nostro sito “in profondità”. N.B. Per siti con un numero molto elevato di URL la scansione può richiedere un tempo significativo.

Questo metodo ha il grosso limite di identificare le URL attraverso la “navigazione” del sito. Per fare un “censimento” delle URL del vostro sito Screaming Frog ne esegue la scansione seguendone i link interni: non è quindi scontato che al termine del processo vengano riportate tutte le URL che desideriamo includere nella Sitemap XML.

Sarebbe meglio disporre a priori di un elenco di tutte le URL ma, in mancanza di alternative, eseguire una scansione del sito con Screaming Frog o un altro tool simile rappresenta senz’altro una valida soluzione.

Una volta ottenuto un elenco delle URL rilevate dallo spider esportatelo in formato XLS e procedete ad una deduplicazione delle URL (attraverso la rimozione di valori duplicati o la formattazione condizionale) in modo da ottenere un elenco di valori univoci all’interno del vostro file. Eliminate poi tutte le URL che non volete vengano incluse in Sitemap (ad esempio URL che non hanno http status 200 o URL con parametri generati dal web server).

L’elenco finale che otterrete sarà il punto di partenza per generare la Sitemap XML con Screaming Frog.

Creazione di una Sitemap XML con Screaming Frog

Una volta che abbiamo un elenco completo delle URL che vogliamo includere in Sitemap (ad esempio in formato XLS o csv) apriamo Screaming Frog SEO Spider e scegliamo la modalità “Elenco” (List).

sf-listmode

Eseguiamo l’upload del file in cui sono riportate le URL.
Una volta caricate le URL, selezioniamo “Sitemaps” e “Create XML Sitemap”.

sf-sitemapxml

Prima di esportare la Sitemap XML è possibile configurare:

  • Pagine: potete scegliere quali tipologie di pagine includere. Come impostazione di default Screaming Frog non include nè le pagine “noindex”, nè le URL derivanti da paginazione o i file PDF. La configurazione ottimale di una Sitemap XML lato SEO di solito rispecchia questa configurazione (specialmente per le pagine “noindex”): potete quindi lasciare deselezionate tutte le caselle di questo tab a meno che obiettivi e configurazione del vostro sito non richiedano un approccio differente
  • Last Modified: il parametro associato a ciascuna URL che ne indica la data di ultima modifica. In questo caso lasciate l’impostazione di default che utilizza la risposta del web server per definire il valore
  • Priority: il parametro associato a ciascuna URL che ne indica la priorità, e che comunicherà a Google la “gerarchia” interna delle vostre pagine. In questo caso potete “personalizzare” la priorità a vostro piacimento, ricordandovi sempre che 1 è il valore massimo e che il “Livello 0” è la homepage del sito
  • Change frequency: è il parametro che indica la frequenza con cui ciascuna URL viene modificata, potete lasciare l’impostazione di default che deriva il valore dalla risposta del web server oppure decidere di inserire una configurazione personalizzata
  • Images: qualora nella vostra Sitemap XML vogliate includere immagini oltre che pagine web lasciate selezionata questa opzione. E’ possibile anche includere soltanto le immagini a cui punta un determinato numero di link

Ecco fatto. Una volta finito esportiamo la Sitemap XML salvandola sul nostro PC e carichiamola sul web server via FTP.