De Python Package Index heeft bibliotheken voor praktisch elke datavisualisatie-behoefte – van Pastalog voor real-time visualisaties van neurale netwerktraining tot Gaze Parser voor oogbewegingsonderzoek. Sommige van deze bibliotheken kunnen worden gebruikt ongeacht het toepassingsgebied, maar veel van hen zijn intensief gericht op het uitvoeren van een specifieke taak.
Een overzicht van 11 interdisciplinaire Python-bibliotheken voor datavisualisatie, van de meest populaire tot de minst populaire volgt.

Matplotlib

Matplotlib Python Library wordt gebruikt om eenvoudige maar krachtige visualisaties te genereren. De bibliotheek is meer dan tien jaar oud en is de meest gebruikte bibliotheek voor plotten in de Python-gemeenschap. Matplotlib wordt gebruikt om een breed scala aan grafieken te plotten – van histogrammen tot warmte plots.

Matplotlob is de eerste Python data visualisatie bibliotheek, daarom zijn veel andere bibliotheken gebouwd op de top van Matplotlib en zijn ontworpen om te werken in combinatie met de analyse. Bibliotheken zoals pandas en matplotlib zijn “wrappers” over Matplotlib die toegang geven tot een aantal van Matplotlib’s methoden met minder code.

De veelzijdigheid van Matplotlib kan worden gebruikt om visualisatietypes te maken zoals:

  • Scatter plots
  • Bar charts en Histograms
  • Line plots
  • Pie charts
  • Stem plots
  • Contour plots
  • Quiver plots
  • Spectrograms

Je kunt rasters, labels, legenda’s enz. met gemak, omdat alles gemakkelijk aan te passen is.

Seaborn

Seaborn is een populaire bibliotheek voor datavisualisatie die is gebouwd bovenop Matplotlib. De standaardstijlen en kleurenpaletten van Seaborn zijn veel geavanceerder dan Matplotlib. Seaborn plaatst visualisatie in de kern van het begrijpen van gegevens. Seaborn is een bibliotheek op een hoger niveau – het is eenvoudiger om bepaalde soorten plots te genereren, waaronder heat maps, tijdreeksen en vioolplots.

ggplot

Ggplot is een Python-visualisatiebibliotheek die is gebaseerd op R’s ggplot2 en de Grammar of Graphics. U kunt plots maken met behulp van een grammatica op hoog niveau zonder u zorgen te maken over de implementatiedetails. Ggplot werkt anders in vergelijking met Matplotlib: het laat gebruikers toe componenten te lagen om een volledige plot te maken. De gebruiker kan bijvoorbeeld beginnen met assen, en dan punten toevoegen, dan een lijn, een trendlijn, enz. The Grammar of Graphics is geprezen als een “intuïtieve” methode voor plotten, maar doorgewinterde Matplotlib-gebruikers hebben misschien tijd nodig om aan deze nieuwe denkwijze te wennen.

Bokeh

Bokeh, native in Python, is ook gebaseerd op The Grammar of Graphics zoals ggplot. Het ondersteunt ook streaming en real-time data. Het unieke verkoopargument is de mogelijkheid om interactieve, web-ready plots te maken, die gemakkelijk kunnen worden uitgevoerd als JSON-objecten, HTML-documenten of interactieve webapplicaties.
Bokeh heeft drie interfaces met verschillende mate van controle om tegemoet te komen aan verschillende soorten gebruikers. Het hoogste niveau is bedoeld om snel grafieken te maken. Het bevat methoden voor het maken van algemene grafieken zoals staafplots, boxplots, en histogrammen. Het middelste niveau stelt de gebruiker in staat om de basis bouwstenen van elke grafiek te controleren (bijvoorbeeld de punten in een scatter plot) en heeft dezelfde specificiteit als Matplotlib. Het onderste niveau is gericht op ontwikkelaars en software ingenieurs. Het heeft geen vooraf ingestelde standaardwaarden en vereist dat de gebruiker elk element van de grafiek definieert.

Plotly

W hoewel Plotly wijd en zijd bekend is als een online platform voor datavisualisatie, weten maar weinig mensen dat het ook vanuit een Python-notebook kan worden benaderd. Net als Bokeh ligt de kracht van Plotly in het maken van interactieve plots, en het biedt contourplots, die in de meeste bibliotheken niet te vinden zijn.

Pygal

Pygal biedt, net als Plotly en Bokeh, interactieve plots die in een webbrowser kunnen worden ingebed. De mogelijkheid om grafieken als SVG’s uit te voeren is de belangrijkste onderscheidende factor. Voor werk met kleinere datasets voldoen SVGs prima. Voor grafieken met honderdduizenden datapunten worden ze echter traag en hebben moeite met renderen.
Het is eenvoudig om een mooi ogende grafiek te maken met slechts een paar regels code, omdat elk grafiektype is verpakt in een methode en de ingebouwde stijlen geweldig zijn.

Altair

Altair is een declaratieve python-bibliotheek voor statistische visualisatie, gebaseerd op Vega-Lite. Je hoeft alleen de links tussen datakolommen en de coderingskanalen te vermelden, zoals x-as, y-as, kleur, enzovoort, en de rest van de plottingdetails worden automatisch afgehandeld. Dit maakt Altair eenvoudig, vriendelijk en consistent. Het is eenvoudig om met een minimale hoeveelheid code effectieve en mooie visualisaties te ontwerpen met Altair.

Geoplotlib

Geoplotlib is een toolbox die wordt gebruikt voor het plotten van geografische gegevens en het maken van kaarten. Het kan worden gebruikt om een verscheidenheid aan kaarttypen te maken, zoals choropleths, heatmaps en dot density maps. Pyglet (een object-georiënteerde programmeer interface) moet worden geïnstalleerd om Geoplotlib te kunnen gebruiken.

Geoplotlib vermindert de complexiteit van het ontwerpen van visualisaties door een set ingebouwde gereedschappen te bieden voor de meest voorkomende taken, zoals dichtheidsvisualisatie, ruimtelijke grafieken, en vormbestanden.

Doordat de meeste Python-bibliotheken voor datavisualisatie geen kaarten bieden, is het goed om een bibliotheek te hebben die daaraan is gewijd.

Gleam

Gleam is geïnspireerd op het Shiny-pakket van R. Het stelt de gebruiker in staat om elke analyse om te zetten in interactieve webapps met alleen Python-scripts. Gebruikers van Gleam hoeven geen kennis te hebben van HTML, CSS of JavaScript om dit te kunnen doen. Gleam werkt met elke Python-bibliotheek voor datavisualisatie. Zodra gebruikers een plot hebben gemaakt, kunnen ze er velden bovenop bouwen om gegevens te filteren en te sorteren.

Missingno

Het omgaan met ontbrekende gegevens is omslachtig. De volledigheid van een gegevensverzameling kan snel worden beoordeeld met Missingno, in plaats van moeizaam door een tabel te zoeken. De gebruiker kan gegevens filteren en sorteren op basis van volledigheid of correlaties ontdekken met een heatmap of een dendrogram.

Leather

Leather is ontworpen om met alle gegevenstypen te werken en produceert grafieken zoals SVG’s, zodat ze kunnen worden geschaald zonder verlies van beeldkwaliteit. De maker van Leather, Christopher Groskopf, verwoordt het als volgt: “Leather is de Python charting library voor degenen die nu grafieken nodig hebben en het niet uitmaakt of ze perfect zijn.” Omdat deze bibliotheek relatief nieuw is, is een deel van de documentatie nog in ontwikkeling. De grafieken die gemaakt kunnen worden zijn vrij basic-maar dat is ook de bedoeling.

Er is een breed scala aan visualisatie tools, met een enorme diversiteit, afhankelijk van de focus van de taak bij de hand beschikbaar voor Python. Dit wordt weerspiegeld in het grote aantal beschikbare bibliotheken. Het is noodzakelijk voor de gebruikers om de verschillen tussen de benaderingen en hun implicaties in gedachten te houden alvorens zich te richten op een bepaalde benadering.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.