Dato "Visitatori Unici" non tracciato correttamente utilizzando il lettore logs di Apache import_logs.py

Buongiorno a tutti provo a scrivere anche qui nel lato italiano sperando di ricevere risposta.

Al fine di evitare qualsiasi problema di “red Flag” di Google su una specifica installazione di Matomo (molto delicata) abbiamo optato per il tracciamento diretto tramite lettura dei log APACHE.

Tralasciando tutti i problemi e le difficoltà nell’utilizzare lo strumento e personalizzarlo per fargli digerire i nostri LOGS riscontriamo discrepanze “consistenti” nel tracciamento dei visitatori unici del portale.

Questa è una topica riga del log di accessi del nostro server APACHE

192.***.32.*** - - [29/Oct/2023:04:12:50 +0100] "GET /profilo-professionale HTTP/1.1" 200 62443 Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.0.0 Safari/537.36

Considerando che il primo IP è sempre lo stesso ed è il bastione che seleziona una delle macchine di produzione da servire e che a disposizione di “personale” c’è esclusivamente l’USER AGENT. Come fa Matomo nelle sue metriche ad indicare i VISITATORI UNICI ?

Specifico che l’IP del navigante non può essere tracciato per specifica volontà della DPO al fine di essere compliance con le regolamentazioni GDPR.

Con la nostra attuale configurazione però ci ritroviamo con dati poco credibili:

in 14gg ad esempio abbiamo tracciato: 12.597 visite di cui 12.536 visitatori unici a fronte però di 488.477 pagine viste.

Per quanto ci possa far piacere reputare i nostri visitatori dei lettori assidui è improbabile che gli stessi permangano nel portale 30min.

Avete idee sul come migliorare il tracciamento ? Conoscete una documentazione specifica per il tracciamento tramite logs che aiuti a migliorarne l’affidabilità che non siano:

che ho già letto con zelo attivando anche le best practices indicate ma che non sortiscono beneficio alcuno alla situazione ?

1 Like

Ciao, dubito che la lettura log del webserver aggiunga precisione, anzi se è l’unico modo per ottenerne, ipotizzo che la qualità dei dati collezionati sia meno precisa di quanto sarebbe innescando il tracker javascript.

Non ho capito la questione di Red Flag Google… Considera anche che confrontare numeri ottenuti con due software diversi, è sempre sconsigliato perché difficilmente segnaleranno esattamente gli stessi risultati.

Ciao.Prima di tutto grazie per la risposta.

Per quanto riguarda la redFlag di Google il problema è presto detto. Utilizzando il tracciamento tramite Javascript di matomo su un campione di nostri clienti abbiamo notato che Google “bollava” Matomo e il relativo tracciamento come Malevolo bloccando di fatto l’accesso ai portali con il tracciamento Javascript.

Parlo ovviamente di portali grandi dal traffico considerevole.

Il problema è stato ampiamente discusso anche su GitHub: https://github.com/matomo-org/matomo/issues/20246

Nel nostro caso invece l’utilizzo della lettura dei LOG è stata quindi una scelta cautelativa in quanto non potevamo premetterci un blocco di erogazione dovuta a Google nemmeno di pochi minuti.

Abbiamo descritto la scelta in un articolo dedicato: https://diagnosidigitale.com/2023/11/08/matomo-diverse-versioni-di-integrazione/

Quello che volevamo sapere e se esiste una documentazione del come tramite la lettura dei LOG Matomo calcoli i visitatori unici che a nostro avviso al momento non traccia correttamente.

Noi ipotiziamo per via dell’assenza degli IP dei visitatori nel file di LOG scelta imposta per essere compliance con il GDPR.

Secondo me questo è uno dei motivi per evitare di usare Google, in qualsiasi sua forma.

Relativamente alle questioni tecniche, Matomo mette a disposizione la configurazione per anonimizzare gli indirizzi IP dei visitatori. Quindi non mi preoccuperei di oscurare l’indirizzo IP dal log del webserver, se il log è mantenuto lo stretto tempo necessario per svolgere l’archiviazione dati di Matomo e poi cancellato.

Per quanto riguarda le informazioni dettagliate, probabilmente fai prima a studiare il codice sorgente e dedurne il funzionamento. Se non sbaglio, questa capacità, essendo facoltativa, è gestita per mezzo di un plugin. In realtà Matomo è tutto gestito tramite plugin.