Ich habe meinen Server bei Host Europe. Die Zahlen, die ich dort über die täglichen Besuche erhalte, liegen bis zum Dreifachen über denen von Piwik, obwohl beide jeden Besuch zählen, der länger als 30 Minuten nicht auf der Seite war. Gestern sagt mir Webalyzer 2, es waren 300 Besucher auf dem Server. Piwik sagt 98.
Weiß jemand, was ich bei Piwik vielleicht falsch mache?
Ich habe heute von einem Freund den Hinweis bekommen, dass Piwik im Unterschied zu den reinen Server-Zählern alles herausfiltert, was Google oder andere Suchmaschinen mit irgendwelchen automatischen Zugriffen auslösen können. Es gebe sogar Statistik-Applikationen, die noch mehr herausfiltern, was nicht wirklich ernsthafte Zugriffe sind.
Es scheint also so zu sein, dass Piwik die “besseren” Zahlen liefert. Auch wenn sie “schlechter” aussehen.
Was ich dabei nicht verstehe: wenn ich mir die ke_stats-Auswertung für den Monat Januar anschaue, habe ich einzelne Seiten mit über 500 Zugriffen und einige, mit z.B. 4 Zugriffen. Die Reihenfolge der Seiten nach Zugriffen entspricht in etwa auch der Piwik-Liste.
Falls die meisten meiner “Besucher” Bots waren, müssten dann nicht alle Seiten, die nicht in der Piwik-Liste stehen, ungefähr die gleiche Klickrate zeigen? Da ich mir denke, dass Bots regelmäßig den “Gesamtbestand” indexieren und dabei nicht die Inhalte unterscheiden?
Dann dürften aber bei diesen großen Unterschieden zwischen den Zahlen der beiden Statistik-Programme doch die tatsächlichen Preferenzen der Besucher gar nicht mehr bemerkbar sein.
Ihr könnt keine völlig unterschiedlich arbeitende Statistik-Tools miteinander vergleichen.
Webalizer & Co. sind klasse wenn es darum geht (Spam-)Bots, Crawler usw. zu verfolgen. Sie lesen die Server-Logfiles aus und je nach Konfiguration dieser Anwendungen, kommen um ein vielfaches höhere Werte dabei zu Stande. Man müsste, um hier brauchbare Werte zu erhalten, in der Konfiguration (z.B. bei Webalizer) alle möglichen Useragents von nicht menschlichen Besuchern ausschließen bzw. zusammenfassen. Der Rest könnten dann die wirklichen Webseitenbesucher sein; zumindest in etwa.
Wenn es aber darum geht wie viele menschliche Wesen meine Inhalte besucht haben, dann ist Piwik oder GoogleAnalytics etc. die bessere Wahl.
Ja, ich habe auch Kunden, die mit den höheren Zahlen aus Webalizer zufriedener waren bzw. sich um die “Besuchereinbrüche” sorgen gemacht haben…Aber in diesem Fall sollte man wohl lieber dazu raten mehr Besucher auf die Webseite zu bekommen (Werbung, gute Inhalte, Aktualität, SEO) und nicht einer mangelhaft arbeitenden Webanalyse hinterher weinen. Gut möglich, dass sich in Piwik ein Korrekturfaktor einbauen ließe, aber dann kann ich Zahlen auch gleich per Hand generieren …
Google-Crawler liest mehr als die Besucher
Ich hatte vor kurzem mit dem Google-Crawler auf einer meiner betreuten Seiten intensiver zu tun. Hierbei kam bspw. heraus, dass der Crawler im Schnitt auf 18.000 Seitenaufrufe am Tag kommt (kam). Menschliche Besucher waren es im Gegenzug nur etwa 8.000. Gut, hier lag ein Fehler in der Konfiguration des CMS vor, sodass die Google-Crawler durch unterschiedliche URL-Parameter auf sehr viele Inhalte kamen … Nicht betrachtet hatte ich hierbei die ganzen Spam-Bots (z.B. E-Mail-Adresssucher), die unzähligen Suchmaschinen und Projekt-Crawler.
Bei einer Auswertung mit einem Logfile-Analyse-Tool wäre ich somit sicherlich nicht auf 8.000 sondern vielleicht auf 30.000 Besucher am Tag gekommen. Toller Wert, aber eben nicht annähernd korrekt - oder!?