Quando implementi Google Analytics 4, ricordati di fare in modo di evitare la cardinalità. Ti spiego subito che cos’è la cardinalità e perché dovrebbe interessarti!
In Universal Analytics/GA3, la cardinalità si verificava solitamente eseguendo rapporti in cui le dimensioni utilizzate avevano più di 50.000 voci univoche. Ne ho parlato nel dettaglio in un mio precedente articolo dal titolo “Valori raggruppati in (other) nei report” .
In GA4, il suo funzionamento è assai diverso e bastano meno combinazioni per attivare questa visualizzazione aggregata. Lo screenshot seguente, preso da un post di Charles Farina, evidenzia che nonostante esistano solo circa 60 possibili combinazioni di sistema operativo e raggruppamento di canali predefinito, il rapporto viene fortemente aggregato, Fig. 1:
Questo accade perché ci sono dimensioni come page_location
e parametri dell’evento quali ad esempio l’acquisizione di user_id
, velocità del sito, ecc… che hanno molti valori univoci e l’interfaccia di GA4 sembra funzionare in modo che qualsiasi dimensione abbia una serie di valori diversificati avviene l’aggregazione di tutte le altre dimensioni.
In GA4, le dimensioni ad alta cardinalità sono dimensioni con più di 500 valori unici al giorno, come indicato nelle best practice Google.
Per evitare che questo accada pertanto, è importante assicurarsi di rendere il più possibile i valori univoci. Eliminando ad esempio, con Google Tag Manager, i parametri in querystring dalle URL, evitare di impostare lo user_id
in una dimensione personalizzata (bensì utilizzare la dedicata funzionalità User-ID) e assicurarsi di scrivere tutto in lowercase.
In BigQuery i dati saranno invece consultabili nella loro forma disaggregata. Molto probabilmente è lì che Google vuole portare gli utilizzatori del servizio.
semplice e chiaro, grazie 🙂
Grazie a te per il feedback!