Deutliche Unterschiede zwischen Matomo und Server Logs

Hallo,

wir messen diverse Seiten mit Matomo. Seit November haben wir die Option “disable Cookies” in Matomo aktiviert und seitdem unterscheiden sich die Zahlen in Matomo und Logfiles deutlich. Bisher war der Trend immer ähnlich, nun weichen die Werte Monat zu Monat immer weiter voneinander ab.

Insbesondere bei den Seitenaufrufen haben wir mittlerweile Faktor 26x (50k Matomo vs 1318k Logs), Besuche 2x (16k Matomo vs 34k Logs), zudem sind die Zahlen laut Matomo Rückläufig wärend sie bei Serverzugriffen stark zunimmt.

Wem kann ich nun glauben schenken oder ist der Trackingcode falsch eingebunden?

var _paq = window._paq || ;
/* tracker methods like “setCustomDimension” should be called before “trackPageView” */
_paq.push([“disableCookies”]);
_paq.push([‘trackPageView’]);
_paq.push([‘enableLinkTracking’]);
(function() {
var u=“https://www.website.com/”;
_paq.push([‘setTrackerUrl’, u+‘matomo.php’]);
_paq.push([‘setSiteId’, ‘1’]);
var d=document, g=d.createElement(‘script’), s=d.getElementsByTagName(‘script’)[0];
g.type=‘text/javascript’; g.async=true; g.defer=true; g.src=u+‘matomo.js’; s.parentNode.insertBefore(g,s);
})();

Mir fallen da in erstrer Linie die Anführungszeichen beim disableCookies auf, laut unserer IT wäre das kein Unterschied…

Danke & Gruß

Arne

Hallo,

Also, wenn die Anführungszeichen in Source-Code wirklich so aussehen wie in deinem Post, dann kann das nicht funktionieren.

var someArray = [];
someArray.push([“disableCookies”]);
> SyntaxError: illegal character
➜  ~ echo “disableCookies” | uniname
No LINES variable in environment so unable to determine lines per page.
Using default of 24.
character  byte       UTF-32   encoded as     glyph   name
        0          0  00201C   E2 80 9C       “      LEFT DOUBLE QUOTATION MARK
        1          3  000064   64             d      LATIN SMALL LETTER D
        2          4  000069   69             i      LATIN SMALL LETTER I
        3          5  000073   73             s      LATIN SMALL LETTER S
        4          6  000061   61             a      LATIN SMALL LETTER A
        5          7  000062   62             b      LATIN SMALL LETTER B
        6          8  00006C   6C             l      LATIN SMALL LETTER L
        7          9  000065   65             e      LATIN SMALL LETTER E
        8         10  000043   43             C      LATIN CAPITAL LETTER C
        9         11  00006F   6F             o      LATIN SMALL LETTER O
       10         12  00006F   6F             o      LATIN SMALL LETTER O
       11         13  00006B   6B             k      LATIN SMALL LETTER K
       12         14  000069   69             i      LATIN SMALL LETTER I
       13         15  000065   65             e      LATIN SMALL LETTER E
       14         16  000073   73             s      LATIN SMALL LETTER S
       15         17  00201D   E2 80 9D       ”      RIGHT DOUBLE QUOTATION MARK
       16         20  00000A   0A                     LINE FEED (LF)

LEFT DOUBLE QUOTATION MARK und RIGHT DOUBLE QUOTATION MARK sind nur für literarische Texte gedacht und in Programmcode ungültig. Da kannst du nur ' und " verwenden.

Danke für die Antwort. Ich lasse es abändern und bin gespannt wie die Zahlen morgen aussehen und werde hier berichten. :slight_smile:
Spannend ist, dass trotzdem noch Daten erfasst werden, aber eben nicht alle.

Das kann aber auch mit den “Cookie Disable” im Allgemeinen zusammen hängen. Zum Einen erstellt Matomo dann einen Fingerprint. Der ist aber deutlich ungenauer als Cookies. Es kann also passieren, dass Matomo hier Besucher zusammenfasst, die eigentlich getrennt gehören. Das hängt auch mit IP-Verschlüsselung und der Marktdominanz von z.B. Android, IOs oder WIndows zusammen.

Ich bin kein Fan von Cookie Disable - weil der Fingerprint auch nicht 100% sauber ist. Meines Wissens kann das auch nicht deaktiviert werden. Ich denke, dass du dies so eingestellt hast, wegen dem EUGH Urteil oder dem Cookie Banner?

Dazu kommt, dass man Server-Logs Zahlen nicht direkt vergleichen kann. Matomo zeichnet mittels JavaScript auf. Wenn sich Personen aus dem Tracking herausnehmen wollen, gibt es zig Möglichkeiten. Adblocker, Browser-Prevention Funktionen usw. Das Problem haben gerade alle Webanalyse-Systeme - also auch Google Analytics. Es gibt also eine Dunkelziffer die leider immer größer wird.

Im Serverlog sind natürlich alle Zugriffe - auch von Abblocker, Bots usw. enthalten. Das könnte also z.B. auch eine Erklärung sein, warum die Schere zwischen Server-Logs und Webanalyse größer wird.
Das mal unabhängig von dem oben genannten eventuellen Implementierungsfehler :wink:

Danke erstmal für das ganze Feedback und die ausführliche Darstellung.

Die o.G. Punkte sind alle völlig richtig und für mich nachvollziehbar. Unsere Statistiken in Matomo sind von heute auf Morgen (ab dem 10. März) schlagartig eingebrochen und das um 50% (dort verweilen wir seitdem). Jetzt bin ich auf Ursachenforschung, neben einem technischen Fehler habe ich auch Corona in Verdacht, seit Mitte Mai gehen die Zaheln ein klein wenig (ca. 5%) wieder nach oben.
Zudem filtern wir interne IPs unseres Netzwerk in Matomo aus.

Der Hinweis mit der IP Verschlüsselung ist gut, das könnte eine Ursache im Webstats (Serverlogs) sein.

Ich bleibe weiter am Ball und verbleibe mit besten Grüßen

Analysierst Du denn mit Matomo die Logfiles oder mit einem anderen Tool?
Wenn du Matomo zur Logfile-Analyse nutzt: Matomo filtert auch dort die Zugriffe von Bots aus, sofern im Logfile der UserAgent enthalten ist.

Meinen Erfahrungen nach hat man bei Verwendung der Logfile-Analyse durch Matomo ca. 10-20% mehr eindeutige Besucher im Vergleich zu dem Cookie-basiertem Tracking.
Allerdings werden bei der Logfile-Analyse und auch beim Cookie-losem Tracking (mittels Fingerprinting) die wiederkehrenden Besucher nicht mehr erkannt und werden stattdessen als eindeutige Besucher ausgewiesen.

Na schön. Und gibt es schon eine Lösung dafür? Es kann doch nicht sein, dass z.B. AWSTats das hinbekommt Matomo aber nicht. Uns ist ein erheblicher Unterschied zwischen den Zahlen von Matomo und AWStats im Besuchersttistik aufgefallen.
Für August z.B. zeigt AWStats 77.490 Matomo 291.317.
Der Logfile-Importer läuft mit default Optionen und beide Tools greifen auf die gleiche Logfiles zu.
Hat jemand eine Idee woran es liegt?

Hallo Lekis,
Im Logfile stehen alle Zugriffe auf deine Webseite. Also auch Bots oder Besucher mit Adblockern usw.
Awstats zeigt diese Daten ungefiltert an. Was du darin aber nicht siehst sind Informationen zur Browsersprache, Bildschirmauflösung und andere Browserwerte.

Matomo erfasst Nutzer mit JavaScript, weil man hier ja echte Nutzer ohne Bots erfassen möchte. Dazu kommt noch, dass man Warenkörbe, Ereignisse wie Klicks und Scrolling messen möchte.
Durch Adblocker und andere Tracking Prevention ist die Anzahl natürlich geringer

Wenn du Matomo in Verbindung mit Logfiles nutzt, kannst du einstellen, was man ausschließen will.
Siehe hier

Hallo Thomas,

vielen Dank für deine Antwort.
Ja, genau so wird Matomo genutzt.
Ich sehe das aber eben umgekehrt.
“By default, the log analytics importer script does not track static files (JS, CSS, images, etc.) and excludes all bot traffic.”
Default sollten diese NICHT mitberechnet werden man hat jedoch die Möglichkeit sie zu includieren.

AWStas zeigt diese schon gefiltert an nicht aber Matomo, obwohl nach der Beschreibung das so sein sollte.
AWStats macht unterschied zwischen “gesehener-” und “nichtgesehener” Traffic. Und als Erläuterung steht noch da:
“* Nicht gesehener Traffic ist Traffic, welcher von Robots, Würmern oder Antworten mit speziellem HTTP-Statuscode”

Nach deiner Vermutung sollte AWStats eine größere Zahl liefern als Matomo. Es ist aber der Gegenteil. Deshalb verstehe ich nicht warum und wieso. Einfach unfassbar und ich komme nicht drauf woran es liegt. Ich habe bei Import nichts includiert , es läuft default. Deshalb dürften die Zahlen nicht oder zumindest nicht wesentlich voneinander abweichen.