import_logs

Hallo Forum,

Ich importiere Apache LogFiles mit dem Python Script import_logs.py von Piwik. Die Files enthalten ausschließlich Protokolle von PDF downloads (aus dem eigentlichen Apache LogFile gefiltert). Irgendwie wollen mir die Exportergebnisse nicht einleuchten.

Wenn ich z.B. ein LogFile mit 12018 Zeilen/downloads für einen Tag importiere, dann sagt der Report anschließend:

12018 requests imported successfully
23984 requests were downloads

Wie kann es mehr downloads als Zeilen geben? Piwik sagt mir im Graph der letzten Besuche:

3276 Besuche
9929 Downloads

Warum sind es nicht 0 Besuche und 12018 downloads? Das JavaScript Tracking war dabei deaktiviert.

In den JavaScript Code habe ich piwikTracker.setDownloadExtensions() eingefügt, um ein Tracken von downloads zu unterbinden - die sollen eben durch den Import integriert werden. Das müßte doch funktionieren, oder?

Vielen Dank für jeden Hinweis,

mucctecc

Hallo Forum,

Ich rätsele immer noch an dem Import Script import_logs.py herum. Wenn ich

python /srv/www/htdocs/piwik/misc/log-analytics/import_logs.py --url=https://meinePiwikSeite.de test.log --idsite=17 --recorders=4 --enable-http-errors --enable-http-redirects --enable-static --enable-bots

ausführe, wobei test.log nur folgende Zeile enthält (IP Adresse anonymisiert):

00.000.00.000 - - [21/Nov/2012:00:07:09 +0100] “GET /1579/1/paper_189.pdf HTTP/1.1” 304 - “-” “Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)”

dann erhalte ich als Ergebnis:

===============================================================================
Logs import summary

1 requests imported successfully
2 requests were downloads
0 requests ignored:
    0 invalid log lines
    0 requests done by bots, search engines, ...
    0 HTTP errors
    0 HTTP redirects
    0 requests to static resources (css, js, ...)
    0 requests did not match any known site
    0 requests did not match any requested hostname

Website import summary

1 requests imported to 1 sites
    1 sites already existed
    0 sites were created:

0 distinct hostnames did not match any existing site:

Performance summary

Total time: 1 seconds
Requests imported per second: 0.99 requests per second

===============================================================================

Unter Piwik sehe ich aber das PDF File nicht, es wird in der Statistik nicht erfasst (es gibt null downloads für den 21/Nov). Die Seite mit --idsite=17 ist eine rein interne typo3 Webseite für Testzwecke, deren Zugriffe ich kenne. Auch wenn ich noch

/usr/local/bin/php /srv/www/htdocs/piwik/misc/cron/archive.php --url=https://meinePiwikSeite.de > /srv/www/logs/piwik-archive.log

ausführe, wird der download nicht erfasst.

Bin für jeden Hinweis wirklich dankbar!

mucctecc