Webstatistiken wie Google Analytics haben es zunehmend schwerer „echte“ Zugriffszahlen zu liefern da Fake-Bots und Spider automatische Zugriffe generieren mit dem Ziel, dass Webmaster daraufhin ihre Seite besuchen. Dies ist nicht unbedingt gefährlich für die Webseite, aber lästig, da man dann kaum noch mit den Analytics-Daten arbeiten kann.
Seit kurzem gibt es eine neue, sehr aggressive Referral-Spam Methode (Von Computern simulierte Zugriffe auf die Webseite), bei der vermeintlich bekannte Seiten auf einen zugreiffen, wie z.B. reddit.com oder lifehacker.com – hier die Anleitung wie ihr diesen Referral Spam und auch andere Verweise von Bots & Spidern wie buttons-for-website.com oder „semalt“ ausschließen könnt:
Allgemeinen Referrral Spam von Bots und Spidern in Analytics ausschließen
- Unter https://analytics.google.com einloggen und oben auf „Verwaltung“ klicken.
- Wählen Sie Ihre Property und die dazugehörige Datenansicht aus (Wenn keine Domain drinnen steht ist die Datenansicht „Alle Websitedaten“)
- Klicken Sie auf „Einstellungen der Datenansicht
- Scrollen Sie runter und aktivieren Sie das Häckchen bei „Bots herausfiltern“ – „Alle Treffer von bekannten Bots und Spidern ausschließen „
- Klicken Sie auf „Speichern“ am Ende der Seite
Language Referral Spam von lifehacĸer.com und reddit.com herausfiltern
Die echte Seite lifehacker.com ist eine bekannte Heimwerkerseite aus den USA – Die Seite „lifehacĸer.com“ die man in den Statistiken als Zugriffsquelle sieht, hat jedoch statt dem „c“ ein „c“ – sieht fast gleich aus, stammt aber aus dem Zeichensatz einer anderen Sprache und leitet somit zu einer komplett anderen Domain eines russischen Hackers weiter, der dort zum Download von Schadsoftware auffordert (Domains deshalb nicht öffnen!).
Diesen Trick macht der Hacker mittlerweile auch mit anderen bekannten Domains wie z.B. abc.xyz, thenextweb.com, addons.mozilla.org, uvm. – hier werden in Zukunft vermutlich noch weitere hinzukommen.
Klickt man unter Verweise in Analytics auf den Verweispfad öffnen sich folgende Seiten (nicht anklicken!)
- http://lifehacĸer.com/new-revolutionary-shell-from-lifehacĸer.com/
- http://o-o-8-o-o.com/
So kann man Language-Spam längerfristig herausfiltern
Normalerweise kann man einzelne Domains filtern indem man unter Verwaltung > Datenansicht > Filter einen neuen ausschließenden Filter für hostname-traffic ider ISP Domain hinzufügt, hier muss man jedoch anders vorgehen:
Spracheinstellungen-Filter in Analytics einrichte
- In Analytics auf Verwaltung > Datenansicht > Filter gehen
- Benennen Sie den Filter „Language Spam“ und wählen sie den „Benutzerdefiniert“ Filtertyp aus
- Als Filterfeld wählen Sie „Spracheinstellungen“ (Language Settings)
- Als Filtermuster genau den Text zwischen den Anführungszeichen eintragen: „\s[^s]*\s|.{15,}|\.|,“
- Unter Filterüberprüfung können Sie „Filter überprüfen“ klicken – hier sollte nun ein Wert angezeigt werden, wenn Sie von Language-Spam betroffen waren.
- Spreichern klicken.
Ist dieser Language- und Referral Spam schädlich für meine Webseite)
Die gefakten Zugriffe sind ansich nicht schädlich für die Webseite und es bedeutet auch nicht, dass Sie gehackt wurden. Zu viele dieser Zugriffe können jedoch Ihren Server stark beanspruchen und die Seite langsamer machen.
Am gefährlichsten ist es jedoch solche Domains aufzurufen, da dort oft versucht wird Malware oder Trojaner zu verbreiten. Auf keinen Fall jedoch sollte man sich von dort aus irgendwas herunterladen oder Zugangsdaten eingeben.
Wenn man sich nicht sicher ist, ob man z.B. auf der echten reddit.com Seite ist, sollte man die URL mit der eigenen Tastatur eingeben, dann sieht man es.
Viel Erfolg beim Entfernen dieser lästigen Verweise aus Google Analytics!