Se utilizzate Google Analytics, negli ultimi mesi vi sarà probabilmente capitato di vedere strane visite “referral” effettuate da siti dal nome improbabile come nell’esempio qui sotto.

Trattasi di referral spam.
Questo fenomeno, che ha un’origine relativamente recente, negli ultimi mesi ha continuato ad evolversi fino a raggiungere una dimensione preoccupante per chi lavora tutti i giorni con il web.

Purtroppo non esiste ancora una soluzione definitiva al problema: mentre Google continua a lavorarci su, è possibile limitare quasi del tutto l’efficacia delle diverse tecniche utilizzate dagli spammer per “sporcare” i nostri dati attraverso alcuni piccoli accorgimenti.

In questa mini guida spiego come eliminare il referral spam dai rapporti Google Analytics.

Eliminare Spam Referral

Cos’è e come funziona il referral spam su Google Analytics

Eliminare lo spam referral dai rapporti Google Analytics è più semplice di quanto si possa pensare.

Ma che cos’è e come funziona lo spam referral in Google Analytics?
Innanzitutto con “referral spam” intendiamo un metodo utilizzato da malintenzionati per creare delle finte sessioni sul nostro sito che vengono registrate da Google Analytics con origine referral.

I referral sono siti che hanno un link diretto al nostro contenuto: l’obiettivo degli spammer è – nella maggior parte dei casi – quello di incuriosirci ed indurci a visitare il dominio che ci invia il (finto) traffico referral come appare nei rapporti.

Attenzione: alcuni di questi siti possono infettare il vostro computer virus o malware non appena li visitate. Personalmente consiglio di non visitarli assolutamente: nel caso voleste comunque farlo assicuratevi assolutamente di avere installato un antivirus attivo ed aggiornato.

Come si riconosce il referral spam?
Premesso che esistono diverse tipologie di referral spam su Google Analytics, identificare i domini è relativamente semplice.
Il metodo più semplice ed efficace è il seguente:

  1. Selezionate gli ultimi 30 giorni come periodo temporale dai vostri rapporti GA
  2. Accedete al vostro report “Acquisizione” > “Tutto il Traffico” > “Referral”
  3. Ordinate per “Bounce Rate” ed identificate quei referral che hanno un tasso di rimbalzo del 100% e che hanno fatto registrare un numero di sessioni maggiore di 10

Due tipologie di Referral Spam

Esistono almeno due tipologie di spam bot responsabili dello spam referral su Google Analytics:

  • Spam Bot di Tipo A: visitano il vostro sito. Richiedono una pagina al vostro server che gli viene restituita e Google Analytics registra la sessione. In questo caso “ingannano” il codice di tracciamento GA identificandosi come referral (e non come traffico diretto).
  • Spam Bot di Tipo B (Ghost): non visitano il vostro sito. Sono in grado letteralmente di “comparire” come referral nei rapporti senza nemmeno richiedere la pagina al webserver. Inviano “falso” traffico riproducendo richieste HTTP che vengono registrate dal codice di tracciamento Google Analytics utilizzando l’ID della vostra proprietà.

Eliminare il Referral Spam dai rapporti Google Analytics

Per eliminare il ghost referral spam dai rapporti Google Analytics è sufficiente utilizzare questa procedura:

  • Create una nuova vista Google Analytics per i rapporti
  • Create un nuovo filtro Personalizzato di inclusione del traffico per nome di host
  • Nel campo Hostname indicate il vostro dominio (senza www.) e il dominio googleusercontent.com (utilizzato dalla cache di Google). Aggiungete qualsiasi dominio su cui è eventualmente installato il vostro codice di tracciamento Google Analytics e per cui registrate i dati nella forma utilizzata nell’immagine qui sotto. Poi date un nome al filtro e salvate

Da questo momento in poi non vedrete più i ghost referral nei vostri rapporti ed avrete eliminato la maggior parte dello spam referral dai rapporti Google Analytics.

Per eliminare anche il referral spam del primo tipo, quello generato dai bot che richiedono a tutti gli effetti pagine del vostro sito al webserver (consumando in questo modo banda e risorse), sarà necessario invece un intervento più risolutivo.

Questi bot non sono infatti certamente i tipi da rispettare le direttive del file robots.txt.

L’unico modo veramente efficace di fermarli è bloccare il referrer, l’indirizzo IP o il range di indirizzi IP che utilizzano per connettersi al vostro server modificando direttamente il file .htaccess del sito.

Importante Prima di mettere le mani sul file .htaccess assicuratevi però di sapere molto bene quello che state facendo: se sbagliate qualcosa – in questo caso – il rischio concreto è di non riuscire più ad accedere al vostro stesso sito.

Affidatevi piuttosto ad un esperto.