Datově-vizualizační minimalismus a jak ho aplikovat
Datové vizualizace tvoří nedílnou součást celého analytického procesu. Bohužel jsou zároveň částí velice opomíjenou. Ve vědeckých kruzích se mnohdy vychází i z několik desítek let starých výzkumů, které se jen pomalu aktualizují. Z hlediska uživatele je vizualizační proces velmi ovlivněný trendy a vlastním experimentováním. Jedním z těchto trendů je i datově‑vizualizační minimalismus, který protlačují některé z osobností vizualizační scény. Při nesprávné aplikaci však mohou být výsledky katastrofální. Pokud se chcete této pohromy vyvarovat, tak čtěte dál a najděte svůj vizualizační balanc!
Vizualizace a jejich místo v analytickém procesu
Řekněme si to upřímně – správné a kvalitní nastavení analytiky je dlouhý a náročný proces, který stojí peníze. Pokud jste analytici, tak to jistě znáte. Interní marketéři či CMO mají zase s nastavením analytiky zkušenost z druhé strany.
Typické jsou především dlouhé schůzky. Při nich se doptáváme na nejmenší maličkosti, protože se snažíme co nejlépe poznat klientův business. Vymýšlímé nová řešení a nakonec vybíráme to nejlepší. A to je teprve začátek. Poté přichází na řadu tvorba implementačního plánu, další konzultace s klientem a případně s vývojem, která přechází v samotnou implementaci. Následuje testování, aplikace a integrace dalších nástrojů či modelování a spojování dat např. v BigQuery.
Když všechno máme hotové, přichází na řadu ten „zlatý hřeb”, ke kterému předchozí kroky směřovaly – prezentace výsledků analytiky klientovi.
Prezentace výsledků probíhá různě, nicméně nejoblíbenějším řešením jsou reporty či přímo interaktivní dashboardy, které obsahují i datové vizualizace. Jedná se o populární formu výstupů, protože datové vizualizace jsou skvělé na jednoduché zobrazení velkého množství dat a spojování informací do kontextu. Představte si, že byste výsledky z několika reklamních nástrojů a z různých kampaní za určité časové období prezentovali v tabulkovém formátu. Klient by z takové formy nebyl zrovna nadšený, protože by z toho zkrátka nic nevyčetl. Málokdo si ale uvědomuje, že špatně zvolený vizualizační design může report znepřehlednit a klienta zmást či mystifikovat.
Částečnou odpovědí na nepřehlednost datových vizualizací, zbavení se přebytečného balastu a striktní prezentování pouze datově‑vizualizačních prvků je právě minimalismus.
Původ datově‑vizualizačního minimalismu a co to vlastně znamená
Pokud se v oblastí datových vizualizací trochu pohybujete, tak jste se určitě setkali se jménem Edward Tufte. Tento, dnes již osmdesátidvouletý, profesor statistiky se výrazně podílel na formování dnešní podoby datových vizualizací a způsobů prezentace dat. Mimo to je právě on hlavní postavou v příběhu datově-vizualizačního minimalismu, do kterého přispěl především dvěma pojmy – data-ink-ratio a chartjunk.
Data-ink-ratio
Data‑ink‑ratio je spojením několika slov, která na první pohled nemusí dávat smysl. Zároveň je tím hlavním, co definuje, zda je datová vizualizace minimalistická, nebo není. Ve zkratce se jedná o jednoduchý výpočet, ve kterém vydělíme „datový inkoust“ (v dnešní digitální době si za inkoust dosadíme pixely), který byl použitý pro reálné zobrazení dat, s veškerým inkoustem, jež obsahuje daná vizualizace. Pro lepší pochopení si můžeme vzoreček i graficky znázornit:
Výsledkem bude číslo, které ve zkratce určuje, jak moc je daná vizualizace minimalistická. Čím blíže k číslu 1, tím více je aplikovaný minimalismus, přičemž rovná 1 je znakem absolutního minimalismu a vizualizace, která neobsahuje žádný přebytečný balast. Právě s tímto balastem je spojený další termín, a to chartjunk.
Chartjunk
Chartjunkem se rozumí jakýkoliv vizuální prvek v datové vizualizaci, který nemá své opodstatnění z datově‑vizualizačního pohledu. Může se jednat o vodící čáry, grid, barevné pozadí, použití stínování nebo dokonce 3D efektu. Nemají žádnou informační hodnotu a pouze „překáží“ informačně nosným a nezbytným prvkům. Pro lepší ilustraci si můžeme chartjunk ukázat na následujícím obrázku:
Zdroj obrázku: Infovis Wiki
Pokud bychom se zbavili všech prvků, na které ukazuje červená šipka, tak získáme daleko přehlednější a lépe použitelnou vizualizaci. Uživatel uvidí data a nebudou jej rozptylovat žádné další prvky, které ve vizualizaci nemusí být a naopak jsou spíše rušivé.
Datově‑vizualizační minimalismus tedy spočívá v co největší maximalizaci poměru prvků datových a minimalizaci těch nedatových, tedy chartjunku.
Příklady minimalistických vizualizací a jejich problematičnost
Na první pohled se tento minimalismus může zdát super. Při správné aplikaci jsou výsledkem vizualiazce, které maximálně reprezentují data a jsou informačně nabité bez rozptylujících prvků okolo. Takovou vizualizaci si můžeme představit následovně:
Zdroj obrázku: Tufte’s Principles of Data-Ink
Jak je vidět na obrázku, tak vizualizace neobsahuje žádný chartjunk. Nepoužívá vodící čáry, grid, žádné pozadí či dokonce 3D efekt. Velký důraz se klade na samou podstatu vizualizace, a to předat informace jasně a srozumitelně.
Někteří ale tento minimalistický přístup vyhnali do úplného extrému, což můžeme vidět na dalším obrázku Ten je rovněž datově minimalistický a neobsahuje chartjunk. Na druhou stranu ale chybí i prvky, které pro mnohé tvoří samotnou podstatu dané vizualizace. V tomto případě je na obrázku znázorněný box plot, ve kterém však chybí boxy.
Zdroj obrázku: Tufte’s Principles of Data-Ink
Zde narážíme na hranici toho, kdy minimalismus začíná škodit. Ano, pokud máte informaci, že je daná vizualizace vlastně box plotem, tak si sami v hlavě dokážete boxy vizualizovat. Je to ale další proces, který je nutné udělat. Absence grafického znázornění boxů tak běžnému uživateli přenos informací nezjednoduší.
Nemusíme ale zůstat pouze u box plotu bez boxů. Pro některé je chartjunkem i bar v bar chartu, respektive 2D podstata samotného sloupce. Ta je v minimalistických variantách nahrazovaná jednoduchou čarou, která se snaží o fungování v jedné dimenzi.
Small multiples a sparklines
Pokud existují formy, kde se datově‑vizualizační minimalismus projevuje nejvíce, jsou to small multiples a sparklines. Oba vizualizační objekty jsou minimalistické již ze své podstaty a pro chartjunk tak není téměř žádný prostor.
Small multiples
Small multiples představují sadu minimalistických grafů, které spojuje stejný vizualizační styl, měřítko a osy. Jelikož se tyto vizualizace nachází v řadě nebo jednom bloku, je velmi jednoduché mezi sebou jednotlivé hodnoty porovnávat, což zaručuje použití stejného měřítka a osy. V těchto datově‑vizualizačních blocích se můžeme setkat i s desítkami vizualizací, které se musí vejít na jednu stránku tak, aby bylo možné srovnání hodnot. Vizualizace jsou velmi malé, a tudíž se „šetří místem“, kde se dá. Logicky se odstraní vše, co nemá informačně vypovídající hodnotu – chartjunk.
Zdroj obrázku: Juice Analyts
Sparklines
Dalším projevem samé podstaty datově-vizualizačního minimalismu jsou sparklines. Tyto drobné vizualizace nemají často vyznačené osy ani znázorněné měřítko či jednotky. Jejich cílem je prosté znázornění trendu. Jsou tak malé, že se s nimi můžeme často setkat v samotném textu, který doplňují o grafické znázornění. V případě užití sparklines je hlavním nositelem informační hodnoty text, který sekundárně doplňuje tato vizualizace.
Zdroj obrázku: Juice Analytics
Pokud obchodujete na finančních trzích, velmi pravděpodobně se s nimi často setkáváte ve formě widgetů či seznamů. Jejich cíl je i v tomto případě jasný, a to ukázat trend obchodovaného aktiva za vámi zvolené období.
Hlavně nic nepřehánět
U datových vizualizací platí více než kde jinde, že by se nic nemělo přehánět. Extrémem byla devadesátá a nultá léta, kdy byly velmi oblíbené 3D vizualizace a velká barevnost. Naproti tomu ale stojí druhý extrém, který aplikuje datově‑vizualizační minimalismus v podobě, kdy odporuje jeho samotné podstatě, a to ulehčit uživateli příjem informací.
Důležité je najít rovnováhu. Mějte minimalismus na paměti. Pokud uděláte pro klienta nějaký report nebo celý dashboard, tak se zaměřte na každý jeden graf a zapřemýšlejte, zda by nebylo možné některou z jeho částí odebrat tak, aby bylo zobrazení čistší a čitelnější. Není potřeba to přehánět či se striktně držet v nějakém vypočítaném data-ink-ratio rozmezí.
Čeho se rozhodně vyvarujte, je použití stínování nebo 3D efektu. Tyto prvky byly, jsou a budou vždy nadbytečné. Nemají jinou než estetickou funkci (což z nich ale nedělá něco esteticky hodnotného), která však silně narušuje funkci informační, jež by měla být v datových vizualizacích primární.
K celému tématu se mrkněte i na prezentaci, se kterou jsme byli na MeasureCampu.