Differenzen im Dashboard und bei der API

Hallo Community!

Ich habe durch Zufall ein paar Unstimmigkeiten an einer jahrelangen Installation festgestellt.

Eventuell habt Ihr ein paar Ansätze, wie ich den beiden Übeln auf den Grund gehen kann ?

Unter Blondie denkt. Zuviel?: Unregelmäßigkeiten in Piwik-Dashboard und API habe ich es konkret aufgeschrieben.


Differenzen im Dashboard

Eine erste Unstimmigkeit habe ich im Dashboard bei der Suche festgestellt. Beim Filtern nach einem Wort aus der Url wurde bei der Tagesanzeige eine Seitenurl mehr ausgegeben als bei der Suche innerhalb einer Woche.

[ul]
[li] Suche beim Tag: 3 Urls, die das Wort in der Url enthalten
[/li][li] Suche in der Woche: 2 Urls, die das Wort in der Url enthalten
[/li][/ul]

Differenzen zwischen Dashboard und API

Dieser Fehler kann natürlich aufgrund fehlerhafter Umsetzung der API-Dokumentation entstehen, deshalb hier auch die Url-Abfrage.

/piwik/index.php?module=API
&method=VisitsSummary.getVisits
&idSite=1&period=range&date=previous7&format=xml
&segment=pageUrl=@[Suchwort]&token_auth=[token]

In der API-Ausgabe und der Dashboard-Abfrage entstehen nun andere Werte. Die Werte im Dashboard sind zwischen 3 und 10mal höher als über die API.


Entgegen 301 Moved Permanently handelt es sich bei mir nicht um weiter zurückliegende Daten sondern um heutige bzw. heute-7 Tage.

Hi,
erstmal danke für den ausführlichen Report. Ein konkretes Beispiel mit demo.piwik.org würde helfen das Problem (wenn vorhanden) genauer zu analysieren. Die UI/Dashboard nutzt die API, von daher sollten da keine Unterschiede bestehen.

Kleiner Tipp für deinen Artikel: Das Bild vom Dashboard hast du von Wikipedia hotlinked (Hotlinking – Wikipedia), das ist zum einen i.d.R. nicht erwünscht und in Deutschland sogar untersagt.

Zu Differenz 1:

In der Matomo Forums - week March 18 – 24, 2013 - Web Analytics Reports - Matomo habe ich nach ‘75’ gesucht und 14 Zeilen (Seiten) erhalten.

Bei Matomo Forums - Tuesday, March 19, 2013 - Web Analytics Reports - Matomo werden 15 Zeilen ausgegeben. Da es die tägliche Abfrage ist, müsste aber diese ‘Menge’ in der wöchentlichen Abfrage enthalten sein.

BTW: Für das Bild nutze ich zemanta.com. Es schlägt mir content/keywordrelevante Bilder aus dem I-Net vor. Es beachtet hierbei die Rechteangaben. Werde das aber nochmal konkret nachprüfen.

Zu 2

mit Suchphrase ‘75’

Mit http://demo.piwik.org/index.php?module=API&method=VisitsSummary.getVisits&idSite=7&period=range&date=previous7&format=xml&segment=pageUrl=@75&token_auth=anonymous werden 462 ausgegeben.

Im Dashboard werden mit Matomo Forums - January 5 – 11, 2018 - Web Analytics Reports - Matomo bei Seitenansichten 252 und bei einmalige Seitenansichten 227 ausgegeben.

Hier würde ich nun (leider) schlussfolgern, dass der Fehler wohl in der Abfrage liegt und dadurch der Unterschied zu Stande kommt.

mit Suchphase ‘97’

API : http://demo.piwik.org/index.php?module=API&method=VisitsSummary.getVisits&idSite=7&period=range&date=previous7&format=xml&segment=pageUrl=@97&token_auth=anonymous -> 476

Dashboard: Seitenansicht 172 & einmalige Seitenansicht 164

Falsche Voraussetzungen würde ich sagen.
Piwik “merkt” sich nur die 500 meistbesuchten Seiten. Die angegebenen 500 sind nicht nur eine Darstellungssache, sondern auch wirklich nur separat in der Datenbank enthalten. Das heisst in der wöchentlichen Zusammenfassung wurde dann offenbar zumindest einer Deiner “75”-Einträge von einem anderen aus der Liste der 500 verdrängt.

[quote=familienfreund]
Zu 2

mit Suchphrase ‘75’

Mit http://demo.piwik.org/index.php?module=API&method=VisitsSummary.getVisits&idSite=7&period=range&date=previous7&format=xml&segment=pageUrl=@75&token_auth=anonymous werden 462 ausgegeben.

Im Dashboard werden mit Matomo Forums - January 5 – 11, 2018 - Web Analytics Reports - Matomo bei Seitenansichten 252 und bei einmalige Seitenansichten 227 ausgegeben.

Hier würde ich nun (leider) schlussfolgern, dass der Fehler wohl in der Abfrage liegt und dadurch der Unterschied zu Stande kommt.

mit Suchphase ‘97’

API : http://demo.piwik.org/index.php?module=API&method=VisitsSummary.getVisits&idSite=7&period=range&date=previous7&format=xml&segment=pageUrl=@97&token_auth=anonymous -> 476

Dashboard: Seitenansicht 172 & einmalige Seitenansicht 164[/quote]

Auch hier würde ich von falschen Voraussetzungen ausgehen.
Die Segmentierung, welche Du bei der API-Abfrage verwendest, arbeitet auf den Rohdaten, den Logging-Tabellen und damit auf den nicht verarbeiteten Daten. Es kann also (solange die Logging-Tabellen nicht geleert werden) auf die vollständigen Daten zurückgreifen.
Das Dashboard hingegen arbeitet auf den archivierten Daten und kann damit nicht mehr nach allen URLs, sondern nur nach den 500 häufigsten des Zeitraumes suchen.

Danke für die Erläuterungen !