Deutliche Unterschiede zwischen Logs und Piwik

Hallo zusammen,

ich bin neu in der Piwik Welt, habe vorher vor allem mit GA gearbeitet.

Meine Firma betreut eine große Webseite, ich bin für das Zusammenstellen und Analysieren/Plausibilisieren der Zugriffszahlen verantwortlich.

Nun habe ich zum einen die Server Logs, die ich mit WebLog Expert anschaue und zum anderen die Daten aus Piwik.

Laut Logs haben wir auf der Seite pro Wochentag ca. 30.000 Besucher mit 150.000 Pageviews. Piwik zeigt für den gleichen Tag ca. 7.500 Besucher und 30.000 Pageviews an. Das sind ein Viertel der Besucher und ein Fünftel der Pageviews.

Nun stellt sich mir die Frage, wie genau solche Differenzen zustande kommen. Ein paar Dinge fallen mir ein:

  • Piwik trackt nichts, was kein Javascript ausführt (Suchmaschinenbots)
  • Cookies müssen erlaubt sein
  • Piwik trackt keine direkten Zugriffe auf PDFs/Bilder auf der Seite
  • Piwik trackt nur vollständige Seitenaufrufe

Ist das soweit korrekt? Die eigentliche Fragen lauten nun: Gibt es weitere Gründe, die die Differenzen erklären könnten? Habt Ihr bei euren Seiten ähnliche Erfahrungen gemacht (Differenzen in dieser Größenordnung)? Welchen Anteil an Traffic lösen Bots ca. aus?

Ich frage mich einfach, ob sich mit den genannten Gründen die Unterschiede erklären lassen.

Ich freue mich über Tipps, Hinweise, Ergänzungen, Antworten und Erklärungen :wink:

Viele Grüße

Könnte es so in etwa sein. Cookies sind aber nicht zwingend erforderlich. Bots sind oft durch die Javascript Anforderung schon ausgefiltert aber in den Logs mit drin. Benutzer mit DNT aktiv werden nicht getrackt. Vielleicht ist auch der Tracking Code nicht auf allen Seiten eingebunden.
Siehe auch
http://piwik.org/faq/troubleshooting/#faq_50
http://piwik.org/faq/new-to-piwik/#faq_63

Hallo zusammen,

auch ich bin neu in der Piwik Welt mit mehreren unabhängigen WP-Webseiten. Auch bei mir weichen die statistischen Zahlen extrem von den PIWIK Ergebnissen ab.

Ich nutze aktuell das WP-Plugin WP-Piwik für jede WP-Installation und habe die notwendigen Parameter auch in dem Piwik Dashboard eingetragn. Folgende Angaben habe ich bei den Einstellungen des WP-Plugin WP-Piwik gemacht:

Piwik Einstellungen: User agent: “PHP default ()” oder ist der Radio Button bei “WP-Piwik” richtig?
Tracking: “Tracking Code einfügen” Häkchen in Kästchen!

Ist es vielleicht doch sinnvoller den unter Tracking Code Vorschau" aufgeführten Tracking Code in jeden Content einzubauen?

Alle oft besuchten Seiten landen auch in einem Cache.

Vielleicht kann mir jemand helfen?

Beste Grüße
Mustermann

Schau doch einfach mal ob der Piwik Code auf allen Seiten automatisch eingebunden wird. Einfach die jeweilige Unterseite aufrufen und dann den Quelltext im Browser anschauen und dort nach Piwik suchen.
Ansonsten einfach mal den Autor des Plugins ansprechen.

Hallo Thomas,

besten Dank für den Tipp. Noch eine Frage zum Verständnis: Der “Piwik-Code” muss prinzipiell doch in jedem Beitrag (Post) und Seite (Page) einer Webseite eingebunden sein, um richtige Zugriffszahlen als Ergebnis zu bekommen?

Schon mal Danke für die Aufklärung

Beste Grüße
Mustermann

Eigentlich ja - außer wenn die PHP Api intern verwendet wird, dazu müsste ich aber das Plugin kennen :wink:

Bei Wordpress, wie bei anderen Content Management System (CMS) Lösungen auch, genügt es den korrekten Piwik-Code in das Footer-Template einzubinden. Bei Wordpress ist das in der Regel die footer.php, in der am besten direkt vor der Tracking-Code eingebunden wird.

Du musst also nicht in jedem Artikel/ jeder Seite den Code unterbringen.

Wie von Thomas Seifert schon geschrieben. Schau dir den Quellcode deiner Seiten/ Unterseiten an, dort sollte überall vor im unteren Bereich der Piwik-Code zu finden sein. Ist das nicht der Fall, stimmt bei dir im Template etwas nicht. Eventuell fehlt <?php wp_footer(); ?>, WP-Piwik nutzt meines Wissens diese Funktion.

In den Serverlogs wird eben alles mögliche geloggt und später durch Tools wie WebLog Expert oder Webalizer aufbereitet. Hat man diese Tools nicht entsprechend konfiguriert, dann tauchen halt auch “Besucher” wie: Suchmaschinen-Crawler, Spam-Robots, Scraper, Hacker-Bots und der ganze Müll in der Auswertung auf, die ja nun wirklich nichts mit den realen Besucherzahlen zu tun haben.

Bis auf einen gewissen Teil der Suchmaschinen-Crawler sollte man diese besser zuvor versuchen auszufiltern und direkt an der Firewall des Servers, aber spätestens per .htaccess-Datei von Zugriffen auf die Websites aussperren.

Eigentlich müssten die vergleichsweise vielen Aufrufe aus irgendwelchen Inselstaaten wie Montserrat, Aruba oder Neukaledonien auffallen. Das sind gern genutzte Server-Standorte für Abfragen aller Art.

Mich beschäftigt auch die Frage wie hoch der Anteil meiner “realen” User ist.

Wir haben den “Piwik Simple Image Tracker” aktiviert, das haben wir gemacht weil wir auch mobile Zugriffe tracken wollen.

“There are other frequent cases however where Javascript can not be used: Ebay pages, MySpace pages, but also Software Apps, iPhone or Android apps, mobile websites, etc. Quelle: Tracking API - Analytics Platform - Matomo

Leider steht in der Piwik-FAQ, dass man mit dem Image-Tracker auch Bots zählen würde:
“If you want to track visitors (or bots) without Javascript, you can add an Image Tracker on your pages. Quelle: New to Piwik - Analytics Platform - Matomo

Kann ich in Piwik irgendwie erkennen, ob ich eine größere Zahl Suchmaschinen-Crawler, Spam-Robots, Scraper, Hacker-Bots in meinen Daten habe? Zugriffe aus Inselstaaten wie Montserrat, Aruba oder Neukaledonien hatten wir 2012 keinen einzigen.

Aber: Zählt Piwik beim Simple Image Tracker überhaupt die Visitor-Herkunft?

“Note: the code doesn’t use Javascript so Piwik will not be able to track some user information such as search keywords, referrer websites, screen resolutions, plugin support and page titles. Quelle: Tracking API - Analytics Platform - Matomo

Wie ist Eure Meinung zum Image-Tracker?

Für die Zählung von Mobile Webseiten muss man nicht den Image Tracker nehmen. der normale JS-Code wird heute von jedem mobile Browser ausgeführt und auch in Piwik richtig als Mobil-Gerät erkannt und aufgezeichnet.

Den Image Tracker benötigt man höchstens in Teilnativen Apps, obwohl es da auch bessere Möglichkeiten gibt. Der Image Tracker kann den Referrer nicht abrufen. Als Referrer gibt der Image tracker die aktuell aufgerufene Seite aus. Bots kann man bei Verwendung des Image Trackers mit diesem 3rd Party Plugin identifizieren: Plugin: BotTracker to track bot-actions · Issue #2391 · matomo-org/matomo · GitHub

Aber generell empfiehlt sich auch hier die Verwendung des normalen JS-Snippets.

Hallo Peter,

Vielen Dank für Deine Einschätzung!

Wer lesen kann ist klar im Vorteil! :slight_smile:

Ich wollte gerade den “Image Tracker code” aus meinen Seiten rausnehmen und habe festgestellt, dass ich nur den normalen “Standard JavaScript Tracking code” online habe:


</script><noscript><p><img src="http://MY_DOMAIN/piwik.php?idsite=1" style="border:0" alt="" /></p></noscript>
<!-- End Piwik Tracking Code -->

Ich hatte mich nicht weiter mit dem Thema beschäftigt und gedacht, dass der noscript-Teil der Image-Tracker sei. Jetzt habe ich gesehen, dass ich zum Imagetracker noch den Parameter rec=1 brauche:


<!-- Piwik Image Tracker -->
<img src="http://MY_DOMAIN/piwik.php?idsite=1&rec=1" style="border:0" alt="" />
<!-- End Piwik -->

Hat jemand eine Idee, was der -Teil aus dem “Standard JavaScript Tracking code” für einen Nutzen hat? Wenn nicht gezählt wird, wäre es nicht besser, wenn ich den einfach weglasse? Ich könnte mir den einen Request einsparen?

Im Standard-Tracker hat der -Teil gar keine Funktion und kann weggelassen werden.