Für welche Webseiten eignet sich Piwik?


#1

Hallo alle zusammen,

für welche Zugriffsmenge ist Piwik eigentlich nutzbar? Eignet es sich nur für kleine und mittlere Websites oder auch für solche, wo die Seitenzugriffe im Millionen-Bereich liegen?

Danke für Eure Antworten und liebe Grüße
Claudia


(Thomas Seifert) #2

Millionen Zugriffe am Tag wären sicherlich aktuell ein Problem, da jeder Zugriff mehrere Datenbankabfragen nach sich zieht. Es gibt aber Arbeiten, die die Skalierbarkeit deutlich steigern sollen und Interesse besteht daran wohl auch deutlich, wie auch dort -> 301 Moved Permanently zu sehen.


(picxl) #3

Ich habe eine Piwik-Installation im Einsatz für über 100 Webseiten mit jeweils 10 - 10.000 Besuchern am Tag. Völlig unproblematisch auf einem vernünftigen Server (siehe http://www.hetzner.de/hosting/produkte_rootserver/eq6).
Eine zweite Installation bedient etwa 10 Webseiten mit jeweils um die 100 Besuchern am Tag. Diese läuft “nebenbei” auf einem kleinen 10 € VServer.

Ich finde gerade diese kleinen bis mittleren Webseiten haben mit Piwik eine erstklassige Webanalyse-Software.


(Peterbo) #4

Eine weitere Möglichkeit ist, nginx oder lighttpd statt apache einzusetzen. So sollte zumindest das Tracking eines solchen Volumens überhaupt kein Problem darstellen.

Grüße


(Thomas Seifert) #5

Ich würd schätzen, dass der limitierende Faktor hier die Datenbank ist. Die kann man mit Nginx / Lighttpd leider nicht beschleunigen, wenn ich auch gern auf solche Webserver setze ;).


(Peterbo) #6

Klar, vor allem das Table-locking im MyISAM-Betrieb kann bei dem Volumen problematisch sein. Dann muss man eben die Archivierung in die Nacht verlegen, wenn die Serverlast geringer ist und die gesperrte Tabelle nicht mehr so ins Gewicht fällt. Eine weiterentwicklung der Idee wäre, die Replikation der DB auf einen zweiten Server, der die Archivierung übernimmt, aber keine Last / table-locks durch den tracker hat.

Dann hätte man piwikTracker.domain.tld (Server 1, nur Tracker-Instanz mit eigener DB (Master))
piwikDashboard.domain.tld (Server 2, der die Datenbank-Replikation zieht (Slave) und die Archivierung / Dashboard übernimmt.)

So sollte das Volumen locker verarbeitet werden können.

Grüße
Peter


#7

Uns ist das ganze grade bei nur 160.000 Besuchern in 7 Stunden um die Ohren geflogen. Der Peak war zu viel für den Server, selbst mit einem Mem-Limit von 1G und entsprechender Ausstattung. Und das war nur ein Test auf einem eng eingegrenzten Testgebiet.

Hochlastseiten sind mit Piwik offenbar definitiv nicht zu stemmen. Jedenfalls nicht mit der Voraussetzung, auch bezahlbar zu sein. Wir tracken derzeit etwa 25 Mio Uniques am Tag mit GA ohne Probleme. Wenn ich das auf den Hardware-Hunger von Piwik hochrechne, kann ich mir überlegen, entweder zu tracken oder die Gehälter zu zahlen. Da hilft uns auch ein Master / Slave-Setup einer Datenbank nicht weiter.

Wir werden Piwik sicherlich beobachten, aber an Google führt derzeit für uns kein Weg vorbei. Schade eigentlich.


(Peterbo) #8

Ist dann die Archivierung das Problem, oder das Tracking an sich?


#9

Das kann ich dir noch nicht sagen, wir werden heute mal die Logfiles durchgehen und evtl. noch etwas mehr Hardware dazu stellen. Bereits beim Tracking selbst gab es derartige Aussetzer, dass nichtmal alle Besucher gezählt wurden, wie GA gezeigt hat. Evtl. lässt sich die DB auch auf Inno umstellen, wenn noch auf Isam steht. Evtl. holt das auch noch ein bisschen raus. Eine komplexe Infrastruktur will ich jedenfalls nicht hinstellen, das muss auch mit weniger Hardware als einem Standard-Projekt-Setup laufen.


(Matthieu Aubry) #10

MarcusS, I don’t understand everything but for such massive traffic will require new algorithm in Piwik. Please see my post in: 301 Moved Permanently