ich bin neu in der Piwik Welt, habe vorher vor allem mit GA gearbeitet.
Meine Firma betreut eine große Webseite, ich bin für das Zusammenstellen und Analysieren/Plausibilisieren der Zugriffszahlen verantwortlich.
Nun habe ich zum einen die Server Logs, die ich mit WebLog Expert anschaue und zum anderen die Daten aus Piwik.
Laut Logs haben wir auf der Seite pro Wochentag ca. 30.000 Besucher mit 150.000 Pageviews. Piwik zeigt für den gleichen Tag ca. 7.500 Besucher und 30.000 Pageviews an. Das sind ein Viertel der Besucher und ein Fünftel der Pageviews.
Nun stellt sich mir die Frage, wie genau solche Differenzen zustande kommen. Ein paar Dinge fallen mir ein:
Piwik trackt nichts, was kein Javascript ausführt (Suchmaschinenbots)
Cookies müssen erlaubt sein
Piwik trackt keine direkten Zugriffe auf PDFs/Bilder auf der Seite
Piwik trackt nur vollständige Seitenaufrufe
Ist das soweit korrekt? Die eigentliche Fragen lauten nun: Gibt es weitere Gründe, die die Differenzen erklären könnten? Habt Ihr bei euren Seiten ähnliche Erfahrungen gemacht (Differenzen in dieser Größenordnung)? Welchen Anteil an Traffic lösen Bots ca. aus?
Ich frage mich einfach, ob sich mit den genannten Gründen die Unterschiede erklären lassen.
Ich freue mich über Tipps, Hinweise, Ergänzungen, Antworten und Erklärungen
Könnte es so in etwa sein. Cookies sind aber nicht zwingend erforderlich. Bots sind oft durch die Javascript Anforderung schon ausgefiltert aber in den Logs mit drin. Benutzer mit DNT aktiv werden nicht getrackt. Vielleicht ist auch der Tracking Code nicht auf allen Seiten eingebunden.
Siehe auch http://piwik.org/faq/troubleshooting/#faq_50 http://piwik.org/faq/new-to-piwik/#faq_63
auch ich bin neu in der Piwik Welt mit mehreren unabhängigen WP-Webseiten. Auch bei mir weichen die statistischen Zahlen extrem von den PIWIK Ergebnissen ab.
Ich nutze aktuell das WP-Plugin WP-Piwik für jede WP-Installation und habe die notwendigen Parameter auch in dem Piwik Dashboard eingetragn. Folgende Angaben habe ich bei den Einstellungen des WP-Plugin WP-Piwik gemacht:
Piwik Einstellungen: User agent: “PHP default ()” oder ist der Radio Button bei “WP-Piwik” richtig?
Tracking: “Tracking Code einfügen” Häkchen in Kästchen!
Ist es vielleicht doch sinnvoller den unter Tracking Code Vorschau" aufgeführten Tracking Code in jeden Content einzubauen?
Alle oft besuchten Seiten landen auch in einem Cache.
Schau doch einfach mal ob der Piwik Code auf allen Seiten automatisch eingebunden wird. Einfach die jeweilige Unterseite aufrufen und dann den Quelltext im Browser anschauen und dort nach Piwik suchen.
Ansonsten einfach mal den Autor des Plugins ansprechen.
besten Dank für den Tipp. Noch eine Frage zum Verständnis: Der “Piwik-Code” muss prinzipiell doch in jedem Beitrag (Post) und Seite (Page) einer Webseite eingebunden sein, um richtige Zugriffszahlen als Ergebnis zu bekommen?
Bei Wordpress, wie bei anderen Content Management System (CMS) Lösungen auch, genügt es den korrekten Piwik-Code in das Footer-Template einzubinden. Bei Wordpress ist das in der Regel die footer.php, in der am besten direkt vor der Tracking-Code eingebunden wird.
Du musst also nicht in jedem Artikel/ jeder Seite den Code unterbringen.
Wie von Thomas Seifert schon geschrieben. Schau dir den Quellcode deiner Seiten/ Unterseiten an, dort sollte überall vor im unteren Bereich der Piwik-Code zu finden sein. Ist das nicht der Fall, stimmt bei dir im Template etwas nicht. Eventuell fehlt <?php wp_footer(); ?>, WP-Piwik nutzt meines Wissens diese Funktion.
In den Serverlogs wird eben alles mögliche geloggt und später durch Tools wie WebLog Expert oder Webalizer aufbereitet. Hat man diese Tools nicht entsprechend konfiguriert, dann tauchen halt auch “Besucher” wie: Suchmaschinen-Crawler, Spam-Robots, Scraper, Hacker-Bots und der ganze Müll in der Auswertung auf, die ja nun wirklich nichts mit den realen Besucherzahlen zu tun haben.
Bis auf einen gewissen Teil der Suchmaschinen-Crawler sollte man diese besser zuvor versuchen auszufiltern und direkt an der Firewall des Servers, aber spätestens per .htaccess-Datei von Zugriffen auf die Websites aussperren.
Eigentlich müssten die vergleichsweise vielen Aufrufe aus irgendwelchen Inselstaaten wie Montserrat, Aruba oder Neukaledonien auffallen. Das sind gern genutzte Server-Standorte für Abfragen aller Art.
Mich beschäftigt auch die Frage wie hoch der Anteil meiner “realen” User ist.
Wir haben den “Piwik Simple Image Tracker” aktiviert, das haben wir gemacht weil wir auch mobile Zugriffe tracken wollen.
“There are other frequent cases however where Javascript can not be used: Ebay pages, MySpace pages, but also Software Apps, iPhone or Android apps, mobile websites, etc. Quelle: Tracking API - Analytics Platform - Matomo”
Leider steht in der Piwik-FAQ, dass man mit dem Image-Tracker auch Bots zählen würde:
“If you want to track visitors (or bots) without Javascript, you can add an Image Tracker on your pages. Quelle: New to Piwik - Analytics Platform - Matomo”
Kann ich in Piwik irgendwie erkennen, ob ich eine größere Zahl Suchmaschinen-Crawler, Spam-Robots, Scraper, Hacker-Bots in meinen Daten habe? Zugriffe aus Inselstaaten wie Montserrat, Aruba oder Neukaledonien hatten wir 2012 keinen einzigen.
Aber: Zählt Piwik beim Simple Image Tracker überhaupt die Visitor-Herkunft?
“Note: the code doesn’t use Javascript so Piwik will not be able to track some user information such as search keywords, referrer websites, screen resolutions, plugin support and page titles. Quelle: Tracking API - Analytics Platform - Matomo”
Für die Zählung von Mobile Webseiten muss man nicht den Image Tracker nehmen. der normale JS-Code wird heute von jedem mobile Browser ausgeführt und auch in Piwik richtig als Mobil-Gerät erkannt und aufgezeichnet.
Den Image Tracker benötigt man höchstens in Teilnativen Apps, obwohl es da auch bessere Möglichkeiten gibt. Der Image Tracker kann den Referrer nicht abrufen. Als Referrer gibt der Image tracker die aktuell aufgerufene Seite aus. Bots kann man bei Verwendung des Image Trackers mit diesem 3rd Party Plugin identifizieren: Plugin: BotTracker to track bot-actions · Issue #2391 · matomo-org/matomo · GitHub
Aber generell empfiehlt sich auch hier die Verwendung des normalen JS-Snippets.
Ich wollte gerade den “Image Tracker code” aus meinen Seiten rausnehmen und habe festgestellt, dass ich nur den normalen “Standard JavaScript Tracking code” online habe:
Ich hatte mich nicht weiter mit dem Thema beschäftigt und gedacht, dass der noscript-Teil der Image-Tracker sei. Jetzt habe ich gesehen, dass ich zum Imagetracker noch den Parameter rec=1 brauche:
Hat jemand eine Idee, was der -Teil aus dem “Standard JavaScript Tracking code” für einen Nutzen hat? Wenn nicht gezählt wird, wäre es nicht besser, wenn ich den einfach weglasse? Ich könnte mir den einen Request einsparen?