Erfahrungsbericht matomo Tracking Rauschen

Hallo, ich nehme in meinem Matomo Tracking seit einiger Zeit sowas wie ein Tracking-Rauschen wahr. Soll heißen, es wird getrackt, aber das scheinen keine natürlichen Personen zu sein. Jetzt ist zwar bekannt, dass nicht alle Bots gefiltert werden können, weil einiger diese sich wie natürlichen Person zu erkennen geben und verhalten, aber es gibt da auch sehr eigenartige Vorfälle.

Eigentlich könnte ich zig Themen öffnen, um jede einzelne Beobachtung zu diskutieren. Ich will hier nur eines zum Thema machen, aber die anderen nebenbei erwähnen.

Ich habe nagelneue Webpages mit nagelneuen Domains veröffentlicht und sofort matomo Tracking darin scharf gemacht. Dabei ist aufgefallen das ausschließlich “Direkte Zufgriffe” getrackt wurden, mit ein paar Ausnahmen, und zwar jeden Monat in etwa gleich viele, jedoch nicht bei jeder Domain gleich viele. Es sind demnach keine natürlichen Personen. Erstens sind die Domains nicht im Umlauf und zweitens auch nicht in Suchmaschinen gerankt. Ich habe mich schon gewundert, woher die Besucher kommen. Ich kann es mir nur so erklären, dass Suchmaschinen auf Gut Glück auf Schlagwort-Domains angesetzt sind, egal ob es diese gibt oder nicht.

Die IPs sind verschieden. Die meisten dieser “Besucher” sind: USA, Chrome, Win 10, Desktop. Die zweitmeisten: Baidu, MIUI, Android, Phablet.

Dieses Rauschen vermute ich auch auf meinen älteren Websites und insbesondere verstärkt auf einer ganz besonderen. Diese besteht aus 10.000ten Webpages. Ich vermute hier, dass das Rauschen auf jede einzelne Webpage zutrifft, allerdings nicht pro Webpage so stark wie bei den oben erwähnten neuen Domains (Onepager). Jedoch in der Masse wirkt das Rauschen dadurch stärker.

Meine Frage: Hat hier jemand ähnliche Erfahrungen und Beobachtungen? Eine Lösung wird nicht gesucht, weil dagegen wohl nichts getan werden kann. Es geht nur um eine Bestätigung.

Hi @melbao,
Hast du mal geschaut, ob deine “nagelneuen Domains” irgendwelche Vorgeschichte haben? Mal in Majestic oder so geschaut, ob es Backlinks auf die Domain gibt?
Daniel

Hallo Daniel, die Domains sind wirklich frisch. Ich habe es in web.archive.org gechekt. Das Rauschen beträgt bis zu 50 Besucher im Monat, wobei ich bei wenn zwei TDLs mit gleichem Domainnamen die gleiche Tracking-ID verwende (plus cannonical). Das Tracking ist nicht defekt. Mittlerweile sind auch ein paar scheinbar echte Viewer darunter und die Domains sind auf einer meiner anderen Websites verlinkt. Von da können Bots auf sie gelangen. Aber die Rauschen-Viewer scheinen gleich zu bleiben. Bei der 10.000+ Website kann ich das leider nicht genauer analysieren, weil nur 500 “Seitentitel” angezeigt werden, und das sind dem Anschein nach echte Viewer. In der letzten Zeile “Andere” steht dann “~25.000” Seitenansichten und “~10.000” eindeutige Seitenansichten mit Ø Zeit 10 Sekunden. Die Zeit ist da auch ein Indikator für Bots. Es gibt einen weiteren Hinweis: Ich habe tote Webpages, die nicht mehr existieren (404), und diese werden jeden Monat mindestens einmal mit “Dirketer Zugriff” aufgerufen. Diese Webpages habe ich schon vor vielen Jahren auf eine neue Domain verlegt und neu verlinkt. Selbiges beobachte ich auch mit anderen uralten Webpages.

Bei Majestic stehen nur meine Backlinks.

@melbao
Hm, sobald eine Domain registriert ist, muss das ja irgendwo eingetragen sein… vielleicht greifen Bots das von diesen Einträgen ab? Aber was für einen Nutzen hätte das?

Majestic: Auch für den “Historic” Index?

@DanielHug , bei Verweisende Domains steht bei Aktuellen = 3 und bei Historischen = 3. Historische hat eine Paywall. Der Begriff ist ziemlich neu. Ich denke nicht, dass der schon einmal in Gebrauch war. Aber ganz ausschließen kann ich es nicht.

Die Sache mit Domains ist eh ein furchtbares Thema, bezüglich Domaingrabbing, Domainparking und Domainauktionen. zB die Denic ist eine Genossenschaft mit sehr vielen Mitgliedern. Diese haben Zugriff auf die Daten der denic, und sie betreiben Drittfirmen, die diese Daten kommerziell verwerten. In meinem Fall sind es aber keine .de Domains. Jedoch wird das bei anderen nicht viel anders sein.

Hallo melbao,
ja, das Rauschen gibts. Und nach einiger Beobachtung, welche Bedingungen es erfüllt, fange ich die Bots nun über folgendes Segment ein:

Aktionen beim Besuch maximal 1
und
Dauer des Besuchs (in Sekunden) entspricht 1
und
URL der Ausstiegsseite entspricht diejeweiligedomain.de

Das ergibt schon mal eine recht exakte Größenordnung fürs Rauschen.

Und nun könnte man diese Bedingungen natürlich negieren um damit Bot-freie oder wenigstens Bot-reduziertere Segmente für die Echt-Besuche zu erstellen.

hbbear

This post was flagged by the community and is temporarily hidden.

Trackst du mit dem Img im Noscript Bereich ?

Ich tracke nur mit JavaScript.

Im aktuellen Monat sind es ungefähr die Hälfte weniger. Was häufig und auffällig ist:

  • Direkte Zugriffe + USA + Desktop + 800x600 Bildschirmauflösung.

Das ist eher unwahrscheinlich bei realen Viewern.
Alle weiteren Angaben wechseln jeweils.

Seit heute ist bei diesen Viewern die Zeit mehr als 0 oder 1 Sekunde, sondern 3 oder 4 Sekunden.

Zudem ist ab und an Baidu dabei mit Direkte Zugriffe. Da passt zB in einem Fall die Bildschirmauflösung nicht zum angezeigten Gerät.

  • Xiaomi Mi Note 2 + 800x600 Bildschirmauflösung.