Die geschätzte Speicherplatzeinsparung kommt mir sehr groß vor


#1

Hi,

vielleicht kann mir hier jemand weiterhelfen.

Ich habe eine Matomo ehemals Piwik Installation die schon ein Paar Jährchen auf dem Buckel hat, aber immer fleißig aktualisiert wurde.

Nun wollte ich um DSGVO konform zu sein ältere Besucher Logs löschen und wollte zum Testen erst mal alle Logs löschen die älter als 2700 Tage sind.

Das entspricht in etwa den ersten 2 Jahren der Aufzeichnungen.

Matomo hat errechnet dass die aktuelle Größe der Datenbank 30.3 GB beträgt,
jedoch wird mir auch angezeigt dass die geschätzte Speicherplatzeinsparung beim Löschen 21,3 GB sein wird! Die erwartete Größe nach dem Löschen wird mit 8.9GB angegeben.

Ich frage mich nun ob es ein Berechnungsfehler ist oder wie kann es sein dass wenn ich ca. 2 Jahre von 9 Jahren lösche über 60% der gesamten Datenbankgröße eingespart werden können.


(Fabian Dellwing) #2

Ich frage mich ja gerade wieviele Seiten du trackst um auf 30 GB zu kommen, aber das ist vermutlich ein anderes Thema.

Ob die Berechnung jetzt stimmt ist schwer zu sagen, aber mal als Vergleichswerte unsere Instanz:

19 Seiten
Besucherlogs löschen die älter als 365 Tage sind
Berichte (älter als 12 Monate) löschen außer Basis, Wochen, Monats, Jahr
Wöchentlich ausführen

Nächste Ausführung einem Tag verringert die Größe von 1,1G um 219M auf 883M.


(Peterbo) #3

Es gab zwischendurch ein paar Versionen, welche die Reporting-Tabellen durch Mehrfachanlegen der Archive enorm aufgebläht haben. Es kann also schon sein, dass dies dann so viel Platz einspart, wenn dort einige dieser “aufgeblähten” Archivtabellen enthalten sind.

Am Besten einmal mit einem Datenbank-Tool (z.B. phpMyAdmin) in die DB schauen und abschätzen, ob das hinkommen könnte.


#4

Vorab schon mal vielen Dank für die schnellen Antworten.

In PHP Myadmin hatte ich mir die Tabellen mal angeschaut.

Die Tabelle piwik_log_visit hat ca. 14 GB.
Da wären ja dann anteilig bei o.g. Verhältnis höchstens 2-3GB wenn man davon ausgeht dass vor 9-10 Jahren viel weniger Besucher auf der Seite waren eher sogar noch weniger.

Ich habe auch lediglich Besucherlogs löschen ausgewählt.

Inklusive der Archive wäre es vielleicht verständlicher für mich gewesen wenn soviel Platz eingespart werden könnte.

Könnte es sein, dass die Datenbank größer ist als die reine Datenmenge die darin enthalten ist, sodass Piwik bei der Optimierung evtl. ein Shrink, welcher durch Datenbankoptimierung gemacht würde, mit einberechnet?