Datově-vizualizační minimalismus a jak ho aplikovat

Dominik Jirotka   4. 9. 2024


Datové vizualizace tvoří nedílnou součást celého analytického procesu. Bohužel jsou zároveň částí velice opomíjenou. Ve vědeckých kruzích se mnohdy vychází i z několik desítek let starých výzkumů, které se jen pomalu aktualizují. Z hlediska uživatele je vizualizační proces velmi ovlivněný trendy a vlastním experimentováním. Jedním z těchto trendů je i datově‑vizualizační minimalismus, který protlačují některé z osobností vizualizační scény. Při nesprávné aplikaci však mohou být výsledky katastrofální. Pokud se chcete této pohromy vyvarovat, tak čtěte dál a najděte svůj vizualizační balanc!

Vizualizace a jejich místo v analytickém procesu

Řekněme si to upřímně – správné a kvalitní nastavení analytiky je dlouhý a náročný proces, který stojí peníze. Pokud jste analytici, tak to jistě znáte. Interní marketéři či CMO mají zase s nastavením analytiky zkušenost z druhé strany.

Typické jsou především dlouhé schůzky. Při nich se doptáváme na nejmenší maličkosti, protože se snažíme co nejlépe poznat klientův business. Vymýšlímé nová řešení a nakonec vybíráme to nejlepší. A to je teprve začátek. Poté přichází na řadu tvorba implementačního plánu, další konzultace s klientem a případně s vývojem, která přechází v samotnou implementaci. Následuje testování, aplikace a integrace dalších nástrojů či modelování a spojování dat např. v BigQuery.

Když všechno máme hotové, přichází na řadu ten „zlatý hřeb”, ke kterému předchozí kroky směřovaly – prezentace výsledků analytiky klientovi.

Prezentace výsledků probíhá různě, nicméně nejoblíbenějším řešením jsou reporty či přímo interaktivní dashboardy, které obsahují i datové vizualizace. Jedná se o populární formu výstupů, protože datové vizualizace jsou skvělé na jednoduché zobrazení velkého množství dat a spojování informací do kontextu. Představte si, že byste výsledky z několika reklamních nástrojů a z různých kampaní za určité časové období prezentovali v tabulkovém formátu. Klient by z takové formy nebyl zrovna nadšený, protože by z toho zkrátka nic nevyčetl. Málokdo si ale uvědomuje, že špatně zvolený vizualizační design může report znepřehlednit a klienta zmást či mystifikovat.

Částečnou odpovědí na nepřehlednost datových vizualizací, zbavení se přebytečného balastu a striktní prezentování pouze datově‑vizualizačních prvků je právě minimalismus.

Původ datově‑vizualizačního minimalismu a co to vlastně znamená

Pokud se v oblastí datových vizualizací trochu pohybujete, tak jste se určitě setkali se jménem Edward Tufte. Tento, dnes již osmdesátidvouletý, profesor statistiky se výrazně podílel na formování dnešní podoby datových vizualizací a způsobů prezentace dat. Mimo to je právě on hlavní postavou v příběhu datově-vizualizačního minimalismu, do kterého přispěl především dvěma pojmy – data-ink-ratiochartjunk.

Data-ink-ratio

Data‑ink‑ratio je spojením několika slov, která na první pohled nemusí dávat smysl. Zároveň je tím hlavním, co definuje, zda je datová vizualizace minimalistická, nebo není. Ve zkratce se jedná o jednoduchý výpočet, ve kterém vydělíme „datový inkoust“ (v dnešní digitální době si za inkoust dosadíme pixely), který byl použitý pro reálné zobrazení dat, s veškerým inkoustem, jež obsahuje daná vizualizace. Pro lepší pochopení si můžeme vzoreček i graficky znázornit:

Výsledkem bude číslo, které ve zkratce určuje, jak moc je daná vizualizace minimalistická. Čím blíže k číslu 1, tím více je aplikovaný minimalismus, přičemž rovná 1 je znakem absolutního minimalismu a vizualizace, která neobsahuje žádný přebytečný balast. Právě s tímto balastem je spojený další termín, a to chartjunk.

Chartjunk

Chartjunkem se rozumí jakýkoliv vizuální prvek v datové vizualizaci, který nemá své opodstatnění z datově‑vizualizačního pohledu. Může se jednat o vodící čáry, grid, barevné pozadí, použití stínování nebo dokonce 3D efektu. Nemají žádnou informační hodnotu a pouze „překáží“ informačně nosným a nezbytným prvkům. Pro lepší ilustraci si můžeme chartjunk ukázat na následujícím obrázku:

Zdroj obrázku: Infovis Wiki

Pokud bychom se zbavili všech prvků, na které ukazuje červená šipka, tak získáme daleko přehlednější a lépe použitelnou vizualizaci. Uživatel uvidí data a nebudou jej rozptylovat žádné další prvky, které ve vizualizaci nemusí být a naopak jsou spíše rušivé.

Datově‑vizualizační minimalismus tedy spočívá v co největší maximalizaci poměru prvků datových a minimalizaci těch nedatových, tedy chartjunku.

Příklady minimalistických vizualizací a jejich problematičnost

Na první pohled se tento minimalismus může zdát super. Při správné aplikaci jsou výsledkem vizualiazce, které maximálně reprezentují data a jsou informačně nabité bez rozptylujících prvků okolo. Takovou vizualizaci si můžeme představit následovně:

Jak je vidět na obrázku, tak vizualizace neobsahuje žádný chartjunk. Nepoužívá vodící čáry, grid, žádné pozadí či dokonce 3D efekt. Velký důraz se klade na samou podstatu vizualizace, a to předat informace jasně a srozumitelně.

Někteří ale tento minimalistický přístup vyhnali do úplného extrému, což můžeme vidět na dalším obrázku Ten je rovněž datově minimalistický a neobsahuje chartjunk. Na druhou stranu ale chybí i prvky, které pro mnohé tvoří samotnou podstatu dané vizualizace. V tomto případě je na obrázku znázorněný box plot, ve kterém však chybí boxy.

Zde narážíme na hranici toho, kdy minimalismus začíná škodit. Ano, pokud máte informaci, že je daná vizualizace vlastně box plotem, tak si sami v hlavě dokážete boxy vizualizovat. Je to ale další proces, který je nutné udělat. Absence grafického znázornění boxů tak běžnému uživateli přenos informací nezjednoduší.

Nemusíme ale zůstat pouze u box plotu bez boxů. Pro některé je chartjunkem i bar v bar chartu, respektive 2D podstata samotného sloupce. Ta je v minimalistických variantách nahrazovaná jednoduchou čarou, která se snaží o fungování v jedné dimenzi.

Small multiples a sparklines

Pokud existují formy, kde se datově‑vizualizační minimalismus projevuje nejvíce, jsou to small multiplessparklines. Oba vizualizační objekty jsou minimalistické již ze své podstaty a pro chartjunk tak není téměř žádný prostor.

Small multiples

Small multiples představují sadu minimalistických grafů, které spojuje stejný vizualizační styl, měřítko a osy. Jelikož se tyto vizualizace nachází v řadě nebo jednom bloku, je velmi jednoduché mezi sebou jednotlivé hodnoty porovnávat, což zaručuje použití stejného měřítka a osy. V těchto datově‑vizualizačních blocích se můžeme setkat i s desítkami vizualizací, které se musí vejít na jednu stránku tak, aby bylo možné srovnání hodnot. Vizualizace jsou velmi malé, a tudíž se „šetří místem“, kde se dá. Logicky se odstraní vše, co nemá informačně vypovídající hodnotu – chartjunk.

Zdroj obrázku: Juice Analyts

Sparklines

Dalším projevem samé podstaty datově-vizualizačního minimalismu jsou sparklines. Tyto drobné vizualizace nemají často vyznačené osy ani znázorněné měřítko či jednotky. Jejich cílem je prosté znázornění trendu. Jsou tak malé, že se s nimi můžeme často setkat v samotném textu, který doplňují o grafické znázornění. V případě užití sparklines je hlavním nositelem informační hodnoty text, který sekundárně doplňuje tato vizualizace.

Zdroj obrázku: Juice Analytics

Pokud obchodujete na finančních trzích, velmi pravděpodobně se s nimi často setkáváte ve formě widgetů či seznamů. Jejich cíl je i v tomto případě jasný, a to ukázat trend obchodovaného aktiva za vámi zvolené období.

Hlavně nic nepřehánět

U datových vizualizací platí více než kde jinde, že by se nic nemělo přehánět. Extrémem byla devadesátá a nultá léta, kdy byly velmi oblíbené 3D vizualizace a velká barevnost. Naproti tomu ale stojí druhý extrém, který aplikuje datově‑vizualizační minimalismus v podobě, kdy odporuje jeho samotné podstatě, a to ulehčit uživateli příjem informací.

Důležité je najít rovnováhu. Mějte minimalismus na paměti. Pokud uděláte pro klienta nějaký report nebo celý dashboard, tak se zaměřte na každý jeden graf a zapřemýšlejte, zda by nebylo možné některou z jeho částí odebrat tak, aby bylo zobrazení čistší a čitelnější. Není potřeba to přehánět či se striktně držet v nějakém vypočítaném data-ink-ratio rozmezí.

Čeho se rozhodně vyvarujte, je použití stínování nebo 3D efektu. Tyto prvky byly, jsou a budou vždy nadbytečné. Nemají jinou než estetickou funkci (což z nich ale nedělá něco esteticky hodnotného), která však silně narušuje funkci informační, jež by měla být v datových vizualizacích primární.

K celému tématu se mrkněte i na prezentaci, se kterou jsme byli na MeasureCampu.