Rejstřík balíčků Pythonu obsahuje knihovny prakticky pro každou potřebu vizualizace dat – od Pastalogu pro vizualizaci tréninku neuronových sítí v reálném čase po Gaze Parser pro výzkum pohybu očí. Některé z těchto knihoven lze použít bez ohledu na oblast použití, mnohé z nich jsou však intenzivně zaměřeny na splnění konkrétní úlohy.
Přehled 11 mezioborových knihoven pro vizualizaci dat v jazyce Python, od nejoblíbenějších po nejméně oblíbené, následuje.

Matplotlib

Knihovna pro Python Matplotlib slouží k vytváření jednoduchých, ale výkonných vizualizací. Je stará více než deset let a je nejpoužívanější knihovnou pro vykreslování v komunitě Pythonu. Matplotlib se používá k vykreslování široké škály grafů – od histogramů po tepelné grafy.

Matplotlob je první knihovnou pro vizualizaci dat v jazyce Python, proto je nad Matplotlibem postaveno mnoho dalších knihoven, které jsou určeny pro spolupráci s analýzou. Knihovny jako pandas a matplotlib jsou „obaly“ nad Matplotlib, které umožňují přístup k řadě metod Matplotlib s menším množstvím kódu.

Všestrannost Matplotlib lze využít k tomu, aby vizualizace typu např:

  • Rozptylové grafy
  • Sloupcové grafy a histogramy
  • Čárové grafy
  • Koláčové grafy
  • Koláčové grafy
  • Koláčové grafy
  • Spektrogramy

Můžete vytvářet mřížky, popisky, legendy atd. snadno, protože vše lze snadno přizpůsobit.

Seaborn

Seaborn je populární knihovna pro vizualizaci dat, která je postavena nad Matplotlib. Výchozí styly a palety barev Seabornu jsou mnohem propracovanější než u Matplotlibu. Seaborn staví vizualizaci do centra porozumění jakýmkoli datům. Seaborn je knihovna vyšší úrovně – je snazší generovat určité druhy grafů, včetně tepelných map, časových řad a houslových grafů.

ggplot

Ggplot je vizualizační knihovna pro Python založená na ggplot2 a grafické gramatice R. Vizualizační knihovna pro Python je založena na grafické gramatice. Můžete konstruovat grafy pomocí vysokoúrovňové gramatiky, aniž byste se museli starat o implementační detaily. Ggplot pracuje jinak než Matplotlib: umožňuje uživatelům vrstvit komponenty a vytvořit tak plnohodnotný graf. Uživatel může například začít s osami a pak přidat body, pak přímku, čáru trendu atd. Gramatika grafiky byla označena za „intuitivní“ metodu vykreslování, nicméně zkušení uživatelé Matplotlibu budou možná potřebovat čas, aby si na toto nové myšlení zvykli.

Bokeh

Bokeh, nativní verze jazyka Python, je také založen na Gramatice grafiky stejně jako ggplot. Podporuje také streamování a data v reálném čase. Jeho jedinečnou předností je schopnost vytvářet interaktivní grafy připravené pro web, které lze snadno vyvést jako objekty JSON, dokumenty HTML nebo interaktivní webové aplikace.
Bokeh má tři rozhraní s různým stupněm ovládání, aby vyhovoval různým typům uživatelů. Nejvyšší úroveň slouží k rychlému vytváření grafů. Obsahuje metody pro vytváření běžných grafů, jako jsou sloupcové grafy, krabicové grafy a histogramy. Střední úroveň umožňuje uživateli ovládat základní stavební prvky každého grafu (například body v grafu rozptylu) a má stejná specifika jako Matplotlib. Spodní úroveň je zaměřena na vývojáře a softwarové inženýry. Nemá žádné přednastavené výchozí hodnoty a vyžaduje, aby uživatel definoval každý prvek grafu.

Plotly

Ačkoli je Plotly široce známé jako online platforma pro vizualizaci dat, jen velmi málo lidí ví, že k němu lze přistupovat ze sešitu Pythonu. Stejně jako Bokeh spočívá síla Plotly v tvorbě interaktivních grafů a nabízí obrysové grafy, které ve většině knihoven nenajdete.

Pygal

Pygal stejně jako Plotly a Bokeh nabízí interaktivní grafy, které lze vložit do webového prohlížeče. Jeho hlavním rozlišovacím znakem je možnost výstupu grafů ve formátu SVG. Pro práci zahrnující menší datové soubory postačí soubory SVG. Pro grafy se stovkami tisíc datových bodů se však stávají pomalými a mají problémy s vykreslováním.
Je snadné vytvořit pěkně vypadající graf pomocí několika řádků kódu, protože každý typ grafu je zabalen do metody a vestavěné styly jsou skvělé.

Altair

Altair je deklarativní statistická vizualizační knihovna pro Python založená na Vega-Lite. Stačí pouze zmínit vazby mezi sloupci dat na kódovací kanály, jako je osa x, osa y, barva atd. a o ostatní detaily vykreslování se postará automaticky. Díky tomu je Altair jednoduchý, přívětivý a konzistentní. Pomocí aplikace Altair lze snadno navrhovat efektivní a krásné vizualizace s minimálním množstvím kódu.

Geoplotlib

Geoplotlib je sada nástrojů používaná pro vykreslování geografických dat a tvorbu map. Lze jej použít k vytváření různých typů map, jako jsou choroplety, heatmapy a mapy hustoty bodů. Pro použití Geoplotlib je nutné nainstalovat Pyglet (objektově orientované programovací rozhraní).

Geoplotlib snižuje složitost návrhu vizualizací tím, že poskytuje sadu vestavěných nástrojů pro nejběžnější úlohy, jako je vizualizace hustoty, prostorové grafy a soubory tvarů.

Protože většina knihoven pro vizualizaci dat v jazyce Python nenabízí mapy, je dobré mít knihovnu, která se jim věnuje.

Gleam

Gleam je inspirován balíčkem Shiny v jazyce R. Vizualizace dat v jazyce Python je založena na mapách. Umožňuje uživateli proměnit libovolnou analýzu v interaktivní webovou aplikaci pouze pomocí skriptů v jazyce Python. Uživatelé Gleamu k tomu nepotřebují znát HTML, CSS ani JavaScript. Gleam pracuje s libovolnou knihovnou pro vizualizaci dat v jazyce Python. Jakmile uživatelé vytvoří graf, mohou nad ním vytvořit pole pro filtrování a třídění dat.

Missingno

Práce s chybějícími daty je těžkopádná. Úplnost souboru dat lze rychle posoudit pomocí funkce Missingno, namísto zdlouhavého prohledávání tabulky. Uživatel může filtrovat a třídit data na základě úplnosti nebo zjišťovat korelace pomocí tepelné mapy nebo dendrogramu.

Leather

Leather je navržen pro práci se všemi typy dat a vytváří grafy, například SVG, takže je lze škálovat bez ztráty kvality obrazu. Nejlépe to vystihuje tvůrce Leather, Christopher Groskopf: „Leather je knihovna pro tvorbu grafů v jazyce Python pro ty, kteří potřebují grafy hned a nezáleží jim na tom, zda jsou dokonalé.“ Protože je tato knihovna relativně nová, na některých částech dokumentace se stále pracuje. Grafy, které lze vytvářet, jsou docela základní – ale to je záměr.“

Pro Python je k dispozici široká škála vizualizačních nástrojů s obrovskou rozmanitostí v závislosti na zaměření dané úlohy. To se odráží v obrovském množství dostupných knihoven. Je nezbytné, aby uživatelé měli na paměti rozdíly mezi jednotlivými přístupy a jejich důsledky, než se rozhodnou pro konkrétní přístup.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.