Rozdíly v datech mezi Universal Analytics a GA4

Adam Šilhan   21. 7. 2023


Universal Analytics nám postupně přestávají měřit (nakonec to nebyl tak ostrý konec 30. 6., jak se očekávalo). Pokud jste migraci na GA4 brali vážně, pak jste nejspíš nějakou dobu měřili paralelně jak do GA4, tak do Universal Analytics. Je ale rozdíl mezi „měříme do GA4“ a „pracujeme s GA4“. Aby byl přechod méně bolestný, projdeme si hlavní důvody, proč a jak se data mezi nástroji liší.

Předně – drobné nepřesnosti neřešte vůbec. S největší pravděpodobností je způsobuje celkově odlišný model UA vs GA4. Pojďte se s námi podívat, na co se zaměřit, pokud to překračuje přípustnou mez.

V GA4 mi chybí některé zdroje návštěvnosti

Co dělat, když v Universal Analytics pro dané období vidíte některé zdroje návštěvnosti a v GA4 nejsou? Nejčastěji se jedná o dva důvody:

  1. V Universal Analytics máte nastavené nějaké filtry zdrojů, které v GA4 (snad zatím) použít nemůžeme. Jako dobrý výchozí bod jakékoliv investigace rozdílů mezi UA a GA4 doporučujeme právě kontrolu filtrů. Může to být mimochodem problém na obě strany. Buď máte zdroje z UA odfiltrované, nebo tam jsou některé jinak či navíc.
  2. Nenaskočil vám v GA thresholding (limity minimálního objemu dat). Poznáte to podle informační panel u reportu. Pokud je to opravdu thresholding, zkuste změnit reporting identity (Identitu pro přehledy) na device based (založené na zařízení). Sice to má pár dalších dopadů, ale s thresholdingem to většinou pomůže.
Informační box o aplikaci tresholdingu

Informační box o aplikaci tresholdingu

V reportu návštěvnosti mám prázdný řádek

Prázdný řádek v reportu návštěvnosti je naštěstí jednoduchý problém. Jedná se o unassigned traffic (nezařazenou návštěvnost). Občas se bohužel může jednat čistě o bug GA4, případně o Ad blockery.

Častými viníky jsou ale i problémy s channel grouping (seskupení kanálů) kvůli špatnému tagování kampaní, posílání neúplných dat přes measurement protocol nebo chybné nastavení crossdomain tracking (měření ve více doménách). Více do hloubky to najdete popsané na measureschool.

Většinu návštěvnosti mám pod direct / none

Neděste se, když máte většinu návštěvnosti pod direct / none. To je problém, který vidíme nejčastěji u chybně nasazené cookie lišty. Ta je většinou ale stejně špatně nastavená jak na UA, tak GA4, takže při porovnávání rozdílů bývá zakopaný zdroj jinde.

Jak v UA, tak v GA4 se další návštěvy, které jdou napřímo (chybí nám k nim informace, odkud člověk přišel) připisují pod předchozí zdroj. V Universal Analytics je pod campaign timeout nastavené ze základu na půl roku, u GA4 dokonce o žádné časové limitaci nevíme.

Pokud tedy máte oproti UA nasazené GA4 chvíli (třeba jen pár měsíců), je naprosto očekávatelné, že zatímco UA si pamatují, odkud daná návštěva přišla posledně, tak pro GA4 to bude nová návštěva. Nemá ji tak kam zařadit a hodí ji do direct / none.

Návštěvnost mi nesedí jinak

Pokud vám návštěvnost nesedí ještě jinak, jedním z důvodů je, že GA4 používá behavior modeling (modelování chování). Na základě naměřeného chování lidí (těch, od kterých máme souhlasy) se GA4 snaží modelovat chování těch ostatních, co nám souhlas nedali nebo jejichž zařízení (operační systém, prohlížeč) měření překazilo. Pokud máme reporting identity nastavenou jinak než na blended (smíšené), můžeme tento důvod vyloučit.

Druhou příčinou jsou pak změny v terminologii a celkově definicí pojmů mezi UA a GA4.
Aneb nejsou uživatelé jako uživatelé. UA a GA4 pod pojmem users uvádí něco výrazně odlišného.

Pro UA users = total users, tedy všechny cookies, u kterých byl alespoň jeden hit (většinou zobrazení stránky). V GA4 ale users = active users, tedy všichni (což na základě reporting identity může být jiná definice než jen unikátní cookies) s alespoň jednou engaged session (relace se zapojením). Jedná se tedy o uživatele, co alespoň jednou na stránkách nějakou chvíli pobyli (v rámci jedné návštěvy zobrazili dvě a více stránek, byli na stránkách aktivní 10+ sekund nebo spustili konverzní událost).

Sessions se v GA4 a UA počítají také jinak a je dobré to vědět. Tyto rozdíly už ale nejsou tak zásadní.

Nesedí mi konverze

A co dělat, kdyý vám nesedí konverze? První z důvodů – v GA4 mám ze základu nastavený data driven atribuční model, v UA last non-direct click.

Pokud jde o report (přehled), nebo exploration (průzkum), které jste si vytvořili sami, zkontrolujte, jestli máte vybranou opravdu tu správnou dimenzi (source vs. session source vs. first user source), případně jestli náhodou nepárujete k dimenzi source sekundární dimenzi session medium. To nejen že jde, ale dokonce nás k tomu GA4 navádí. Tento přehled pak určitě neukazuje to, na co si myslíte, že se díváte.

Session source je dimenze na úrovni návštěvy, zatímco medium je na úrovni jednotlivého eventu. Když si rozkliknete odkaz o rozdílech v definování návštěv v GA4 a UA výše, tak v GA4 se při změně zdroje / média v průběhu návštěvy daná návštěva nerestartuje, jak bylo zvykem v UA. V session source si stále nese informaci o prvotním zdroji návštěvy, ale v medium má uloženou aktuální hodnotu zdroje (který se v průběhu té návštěvy mohl změnit).

Při kombinaci těchto dimenzí tak dostanete krásné výsledky, jako je například email.seznam.cz / cpc, accounts.google.com / cpc právě proto, že se v průběhu návštěvy změnil zdroj. Ty vznikly třeba tak, že jsme si v rámci návštěvy odskočili na Facebook a proklikli jsme tam remarketing. Úrovně nejsou úplně intuitivní. Pokud si po přečtení nejste jistí, jestli to správně chápete, zkuste si dát ještě tento příspěvek.

Pokud máte výrazně větší část konverzí u direct / none, bude to s největší pravděpodobností ten samý důvod, jako u zkřivení návštěvnosti z direct / none.

Rozdíl na opačnou stranu, tedy přehazování nezařazených konverzí z direct / none pod ostatní kanály, dělají GA4 automaticky v rámci conversion modeling. To znamená, že Google sleduje v datech trendy a pokud mu přijde, že ten stejný vzorec existuje jak v naměřených datech, tak v těch neúplných, konverze podle něj domodeluje.

Abyste nemuseli porovnávat rozdíly mezi GA4 a UA ve dvou otevřených GA rozhraních vedle sebe, můžete použít Looker Studio report Tomáše Hanáčka.

Pokud chcete o GA4 a celkově analytice dostávat pravidelné pikošky, přihlaste se k odběru Adamova newsletteru na LinkedInu.