In Google Analytics sono presenti dimensioni alle quali possono essere assegnati molti valori, anche dette dimensioni ad alta cardinalità.
Per fare un esempio, la dimensione Categoria dispositivo può avere come valori desktop, tablet e mobile, per questo motivo la sua cardinalità è 3. Alla dimensione Pagina, invece, è assegnato un valore diverso per ogni URL visualizzato nel sito, pertanto la sua cardinalità può essere elevata.
A causa dei limiti del sistema Analytics, e quindi in base a come vengono interrogati i dati nei rapporti, l’utilizzo di dimensioni ad alta cardinalità può tradursi nell’inserimento di una voce di tipo (other) nel risultato dell’interrogazione, ovvero vengono raggruppati i dati eccedenti tali limiti, Fig. 1.
Perché succede
Google Analytics memorizza giornalmente, nelle tabelle elaborate, fino a un massimo di 50.000 righe (in Google Analytics 360 il limite aumenta fino a 1.000.000 di righe, rendendo meno frequente il problema dell’aggregazione dei dati). Di conseguenza, per ogni tabella elaborata, vengono memorizzate ogni giorno molte combinazioni di valori di dimensioni uniche. Se una determinata tabella include un numero di combinazioni di valori di dimensioni maggiore, Analytics archivia i primi N valori e crea una riga di tipo (other) per le combinazioni di valori rimanenti.
Soluzione
Sia in Google Analytics standard che in Google Analytics 360, nel caso dell’esempio di utilizzo della dimensione Pagina (quello più frequente così come con la Pagina di destinazione), la soluzione proposta è quella di ridurre il numero di possibili valori di tale dimensione applicando un filtro a monte per escludere parametri in querystring che possono generare la separazione di uno stesso URL in più righe. Mi riferisco a quei parametri che indicano la sessione dell’utente, il token di registrazione o di login ed altre informazioni tecniche che non portano alcun valore aggiunto all’informazione della pagina ma il cui scopo è solo quello tecnico legato al funzionamento del sito. È possibile escludere questi parametri di ricerca dai rapporti, rimuovendoli dagli URL, definendoli nelle impostazioni della vista (in Escludi parametri di ricerca URL).
Stessa cosa può essere fatta per i parametri delle ricerche effettuate sul sito nel caso di attivazione del Monitoraggio ricerca su sito. Personalmente preferisco evitare questa pratica perché la loro informazione all’interno delle URL può essere utile ai fini di analisi di navigazione.
In Google Analytics 360, è inoltre possibile esportare i dati in un rapporto non campionato. Questo tipo di rapporti è generato utilizzando i dati non elaborati delle tabelle sulle visite anziché i dati provenienti dalle tabelle elaborate, per questo motivo permettono di recuperare fino a 3.000.000 di righe di dati uniche.
Per approfondimenti sulle dimensioni ad alta cardinalità in Google Analytics rimando alla documentazione ufficiale.
Commenti recenti