Python Package Index har biblioteker til praktisk talt alle behov for datavisualisering – fra Pastalog til realtidsvisualiseringer af neurale netværkstræning til Gaze Parser til forskning i øjenbevægelser. Nogle af disse biblioteker kan bruges uanset anvendelsesområde, men mange af dem er intenst fokuseret på at udføre en specifik opgave.
En oversigt over 11 tværfaglige Python-biblioteker til datavisualisering, fra de mest populære til de mindst populære, følger.

Matplotlib

Matplotlib Python-biblioteket bruges til at generere enkle, men kraftfulde visualiseringer. Det er mere end et årti gammelt og er det mest udbredte bibliotek til plotting i Python-fællesskabet. Matplotlib bruges til at plotte en lang række grafer – fra histogrammer til heatplots.

Matplotlob er det første Python-bibliotek til datavisualisering, og derfor er mange andre biblioteker bygget oven på Matplotlib og er designet til at arbejde sammen med analysen. Biblioteker som pandas og matplotlib er “wrappers” over Matplotlib, der giver adgang til en række af Matplotlibs metoder med mindre kode.

Matplotlib’s alsidighed kan bruges til at lave visualiseringstyper som f.eks:

  • Scatter plots
  • Bar charts og Histogrammer
  • Line plots
  • Pie charts
  • Stem plots
  • Contour plots
  • Quiver plots
  • Spectrograms

Du kan lave gitre, labels, legends osv. med lethed, da alt nemt kan tilpasses.

Seaborn

Seaborn er et populært datavisualiseringsbibliotek, som er bygget oven på Matplotlib. Seaborns standard stilarter og farvepaletter er meget mere sofistikerede end Matplotlib. Seaborn sætter visualisering i centrum for forståelsen af alle data. Seaborn er et bibliotek på et højere niveau – det er lettere at generere visse typer plot, herunder varmekort, tidsserier og violinplots.

ggplot

Ggplot er et visualiseringsbibliotek i Python baseret på R’s ggplot2 og Grammar of Graphics. Du kan konstruere plot ved hjælp af grammatik på højt niveau uden at bekymre dig om implementeringsdetaljerne. Ggplot fungerer anderledes sammenlignet med Matplotlib: det giver brugerne mulighed for at lægge komponenter i lag for at skabe et komplet plot. Brugeren kan f.eks. starte med akser og derefter tilføje punkter, derefter en linje, en tendenslinje osv. The Grammar of Graphics er blevet hyldet som en “intuitiv” metode til plotning, men erfarne Matplotlib-brugere skal måske bruge tid til at vænne sig til denne nye tankegang.

Bokeh

Bokeh, der er hjemmehørende i Python, er også baseret på The Grammar of Graphics ligesom ggplot. Den understøtter også streaming og data i realtid. Det unikke salgsargument er dens evne til at skabe interaktive, web-ready plots, som nemt kan udgives som JSON-objekter, HTML-dokumenter eller interaktive webapplikationer.
Bokeh har tre grænseflader med forskellige grader af kontrol for at imødekomme forskellige typer af brugere. Det øverste niveau er til hurtig oprettelse af diagrammer. Det indeholder metoder til at oprette almindelige diagrammer som f.eks. søjlediagrammer, boksdiagrammer og histogrammer. Det mellemste niveau giver brugeren mulighed for at kontrollere de grundlæggende byggesten i hvert diagram (f.eks. prikkerne i et scatter plot) og har samme specificitet som Matplotlib. Det nederste niveau er rettet mod udviklere og softwareingeniører. Det har ingen forudindstillede standardindstillinger og kræver, at brugeren definerer hvert enkelt element i diagrammet.

Plotly

Mens Plotly er bredt kendt som en onlineplatform til datavisualisering, er der meget få, der ved, at den kan være kan tilgås fra en Python-notebook. Ligesom Bokeh ligger Plotlys styrke i at lave interaktive plots, og den tilbyder konturplots, som ikke findes i de fleste biblioteker.

Pygal

Pygal tilbyder ligesom Plotly og Bokeh interaktive plots, som kan indlejres i en webbrowser. Muligheden for at output diagrammer som SVG’er er dens primære differentiator. Til arbejde, der involverer mindre datasæt, vil SVG’er være helt fint nok. Men for diagrammer med hundredtusindvis af datapunkter bliver de sløve og har problemer med at rendere.
Det er nemt at skabe et flot udseende diagram med kun få linjer kode, da hver diagramtype er pakket i en metode, og de indbyggede stilarter er fantastiske.

Altair

Altair er et deklarativt pythonbibliotek til statistisk visualisering baseret på Vega-Lite. Du behøver kun at nævne forbindelserne mellem datakolonnerne til kodningskanalerne, såsom x-akse, y-akse, farve osv. og resten af plottingsdetaljerne håndteres automatisk. Dette gør Altair enkelt, venligt og konsistent. Det er nemt at designe effektive og smukke visualiseringer med en minimal mængde kode ved hjælp af Altair.

Geoplotlib

Geoplotlib er en værktøjskasse, der bruges til plotting af geografiske data og kortoprettelse. Den kan bruges til at oprette en række korttyper som f.eks. choropleths, heatmaps og dot density maps. Pyglet (en objektorienteret programmeringsgrænseflade) skal installeres for at kunne bruge Geoplotlib.

Geoplotlib reducerer kompleksiteten ved udformning af visualiseringer ved at levere et sæt indbyggede værktøjer til de mest almindelige opgaver såsom tæthedsvisualisering, rumlige grafer og formfiler.

Da de fleste Python-biblioteker til datavisualisering ikke tilbyder kort, er det godt at have et bibliotek dedikeret til dem.

Gleam

Gleam er inspireret af R’s Shiny-pakke. Den gør det muligt for brugeren at omdanne enhver analyse til interaktive webapps ved hjælp af kun Python-scripts. Gleam-brugere behøver ikke at kunne HTML, CSS eller JavaScript for at gøre dette. Gleam fungerer med ethvert Python-bibliotek til datavisualisering. Når brugerne har oprettet et plot, kan de bygge felter oven på det for at filtrere og sortere data.

Missingno

Det er besværligt at håndtere manglende data. Om et datasæt er fuldstændigt, kan hurtigt vurderes med Missingno, i stedet for at skulle søge omhyggeligt i en tabel. Brugeren kan filtrere og sortere data baseret på fuldstændighed eller spotte korrelationer med et varmekort eller et dendrogram.

Leather

Leather er designet til at arbejde med alle datatyper og producerer diagrammer som SVG’er, så de kan skaleres uden at miste billedkvaliteten. Leather’s skaber, Christopher Groskopf, udtrykker det bedst: “Leather er Python-diagrambiblioteket for dem, der har brug for diagrammer nu, og som er ligeglade med, om de er perfekte.” Da dette bibliotek er relativt nyt, er en del af dokumentationen stadig under udarbejdelse. De diagrammer, der kan laves, er ret enkle – men det er hensigten.

Der findes en lang række visualiseringsværktøjer med en enorm mangfoldighed, afhængig af opgavens fokus, til Python. Dette afspejles i det rene antal biblioteker, der er til rådighed. Det er bydende nødvendigt for brugerne at være opmærksom på forskellene mellem tilgange og deres konsekvenser, før de nulstiller sig på en bestemt tilgang.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.