Dieser Post adressiert besonders @Ronan Chardonneau, weil Du Dich im Teil I des besagten Themas augenscheinlich für meine Kritik interessiert hast. Von daher wäre es wünschenswert, wenn Du Dich im Teil II erneut damit auseinandersetzen würdest.
Meine Kritik an Matomo und wie Matomo versucht durch die KI Assistenten Funktion daraus ein wertvolles Feature zu machen, ist unverändert gleich. Matomo spricht damit zwar etwas an, ist damit aber Lichtjahre davon entfernt, dass man daraus einen Nutzen ziehen könnte. Zumal diese KI Funktion über den JS Tracker erst gleich gar nicht möglich ist. Man bräuchte mindestens die PHP API dazu, aber selbst damit ist man weit davon entfernt etwas brauchbares zu ermöglichen.
Das bezeichnete Problem (“Die Kritik“) fängt schon damit an, dass man sich seitens Matomo noch nicht mal ansatzweise damit auseinandersetzt, welche Logik es braucht, um zumindest KI Crawler erfassen zu können. Die bekannten KI Crawler sind dabei das kleinste Problem, wenngleich Matomo sich dabei bei CloudFlare bedienen will. CloudFlare ist in dieser Hinsicht aber maximal insufizient! Man muss schon selbst wissen, wie man einen KI Crawler identifizieren kann, was Matomo nur sehr bedingt kann. Zumal es mindestens die bereits erwähnte PHP API bräuchte.
Ich beschäftige mich nun schon seit ca. 10 Jahren mit der Thematik, wie ich das, was der JS Tracker systembedingt nicht erfassen kann, trotzdem sichtbar machen kann, ohne dass ich dafür die access_log brauche, aber zweifelsohne und trozdem nur mit der PHP API möglich ist. Ich nutze also die Php API UND den JS Tracker, aber nicht gleichzeitig, was andernfalls zu doppelten Traffic Daten führen würde. Um genau das zu verhindern, definere ich zunächst, was “ not human like“ sein kann. Alles andere ist dann automatisch human like und nur dieser Traffic wird vom JS Tracker erfasst. Den not human like Traffic ignoriere ich aber nicht, sondern erfasse ich per Definiton über eine andere “Website“ in Matomo, eben weil ich gerne wissen will, was und wer sich sonst noch so auf einem Webserver herumtreibt, ohne dass ich die access_log dazu heranziehen muss.
Das Thema “KI“ und KI Crawler hat mich in meinen Bemühungen den not human like traffic zu erfassen eher noch bestärkt und bestätigt. Das Thema KI Crawler ist aber hochbrisant!! Wenngleich der not human like Traffic in der Summe betrachtet um das x-fache größer ist als der Traffic, der durch bekannte KI Crawler verursacht wird, werden Nutzer durch KI Crawler zumindest sensibilisiert, aber nicht durch den Traffic. KI Crawler haben es sich zu eigenen gemacht Webseiten kostenlos zu crawlen, um damit KI zu trainieren, ohne dass man als Webseiten Betreiber etwas zurückbekommt. Der frühere und klassische Deal, dass ein Bot, allen voran der Googlebot, eine Webseite crawlt und man im Gegenzug in den Suchergebnissen erscheint, gilt nicht mehr. Allen voran Google mutiert gerade von einer Suchmaschine hin zu einer Antwortmaschine und verschiebt dadurch ein Weltbild, obgleich andere Chatbots bereits jetzt schon massiv dazu beitragen, dass Suchaschinen in erheblichem Maße nicht mehr genutzt werden, zumindest nicht oder sehr stark bei der organischen Suche eingeschränkt.
Auf Reddit gibt es einen von mir initiierten Thread, der auf große Resonanz gestoßen ist:
https://www.reddit.com/r/Wordpress/comments/1sxvtqz/wordpress_sites_why_allow_ai_crawlers_if_they/
Ungeachtet dieser KI Crawler Brisanz geht es darum, wie man mit Matomo nicht nur KI Crawler erfassen kann, sondern jeglichen anderen Not Human Like Traffc. Warum lege ich so viel wert darauf? Ganz einfach. Zumindest bei meinen Webseiten Angeboten kommt auf 1 human like Nutzer täglich mindestens 500 not human like Requests. Kann einem das egal sein? Mit Einschränkung ja, aber mann muss sich bewusst sein, dass ein sehr hohes Maß an Traffic, den Matomo selbst über den JS Tracker erfasst, keinen natürlichen Ursprung hat. Wenn man so will, gaugelt einem Matomo ungewollt etwas vor, was nicht der Realität entspricht.
Was ist nun die Konsequenz daraus?
Obgleich ich mich schon seit vielen Jahren mit der not human like Traffic Thematik beschäftige, haben mich die KI Crawler getriggert.Deswegen habe ich für WordPress ein Plugin mit dem Namen “LiteCache Suspicous Traffic Viewer“ programmiert, das sich der Thematik annimmt. Dieses Plugin ist kein Realtime Traffic Viewer, sondern trackt ausnahmlos das, was suspicous erscheint, aber 10 Jahre praktische Erfahrung darin einfließt. Herkömmliche von natürlichen Nutzern ausgelöste Requests werden deswegen ignoriert. Dieses Plugin ersetzt keine WAF oder ein Security Plugin, sondern macht ledigleich sichtbar, was größtenteils unsichtbar ist und selbst die access_log nicht ausweisen kann. Es schließt außerdem die physische Lücke bei GA4 und Matomo, die PHP API inklusive.
Das sog. STV Plugin stellt ein gesäubertes Logile zur Verfügung, das 1x täglich in die DB importiert wird und dann zur Anzeige gebracht wird. Man muss also nicht selbst herausfinden, was einem “spanisch“ vorkommt, sondern wird einem auf dem Silbertablet serviert, aber maximal für den Vortag. Man bekommt aber auch eine Möglichkeit zur Lanzeitbeobachtung, wenngleich sich lang auf 30 Tage reduziert. Wichtig ist in diesem Zusammenhang, dass durch das STV keine zusätzliche Server Last entsteht.
Was würde das STV Plugin für Matomo interessant machen?
Das besagte Plugin ist OpenSource. Man könnte das Design und die Logik des Plugins entweder für Matomo übertragen oder man greift einfach das aufbereitete Logfile ab. Wenn Matomo seinen Nutzer tatsächlich einen Mehrwert bieten will, dann sollte man sich mit diesem Plugin auseinandersetzen.
Das STV Plugin steht in Kürze über das WP Plugin Repository zum Download zur Verfügung. Studieren kann man aber jetzt schon die readme.txt
www.litecache.dev/readme.txt
