L’indice dei pacchetti Python ha librerie praticamente per ogni esigenza di visualizzazione dei dati, da Pastalog per le visualizzazioni in tempo reale dell’addestramento delle reti neurali a Gaze Parser per la ricerca sui movimenti oculari. Alcune di queste librerie possono essere usate indipendentemente dal campo di applicazione, ma molte di esse sono intensamente focalizzate sull’esecuzione di un compito specifico.
Segue una panoramica di 11 librerie interdisciplinari di visualizzazione dati Python, dalla più popolare alla meno popolare.

Matplotlib

Matplotlib Python Library è usata per generare visualizzazioni semplici ma potenti. Con più di un decennio di vita, è la libreria più utilizzata per il plottaggio nella comunità Python. Matplotlib è usata per tracciare una vasta gamma di grafici, dagli istogrammi ai diagrammi di calore.

Matplotlob è la prima libreria di visualizzazione dati Python, quindi molte altre librerie sono costruite sopra Matplotlib e sono progettate per lavorare insieme all’analisi. Librerie come pandas e matplotlib sono “wrapper” sopra Matplotlib che permettono l’accesso ad un certo numero di metodi di Matplotlib con meno codice.

La versatilità di Matplotlib può essere usata per fare tipi di visualizzazione come:

  • Piani di dispersione
  • Cartelle a barre e istogrammi
  • Piani a linee
  • Cartelle a torta
  • Piani a stelo
  • Piani a contorno
  • Piani a curvatura
  • Spettrogrammi

È possibile creare griglie, etichette, leggende ecc. con facilità poiché tutto è facilmente personalizzabile.

Seaborn

Seaborn è una popolare libreria di visualizzazione dati che è costruita sopra Matplotlib. Gli stili predefiniti di Seaborn e le palette di colori sono molto più sofisticati di Matplotlib. Seaborn mette la visualizzazione al centro della comprensione di qualsiasi dato. Seaborn è una libreria di livello superiore – è più facile generare certi tipi di grafici, tra cui mappe di calore, serie temporali e grafici di violino.

ggplot

Ggplot è una libreria di visualizzazione Python basata su ggplot2 di R e sulla Grammatica della grafica. Puoi costruire trame usando una grammatica di alto livello senza preoccuparti dei dettagli di implementazione. Ggplot opera in modo diverso rispetto a Matplotlib: permette agli utenti di stratificare i componenti per creare una trama completa. Per esempio, l’utente può iniziare con gli assi, e poi aggiungere punti, poi una linea, una linea di tendenza, ecc. The Grammar of Graphics è stato salutato come un metodo “intuitivo” per tracciare, tuttavia gli utenti Matplotlib stagionati potrebbero aver bisogno di tempo per adattarsi a questa nuova mentalità.

Bokeh

Bokeh, nativo di Python è anche basato su The Grammar of Graphics come ggplot. Supporta anche lo streaming e i dati in tempo reale. La proposta di vendita unica è la sua capacità di creare grafici interattivi e pronti per il web, che possono facilmente essere emessi come oggetti JSON, documenti HTML o applicazioni web interattive.
Bokeh ha tre interfacce con vari gradi di controllo per soddisfare diversi tipi di utenti. Il livello più alto è per la creazione rapida di grafici. Include metodi per creare grafici comuni come diagrammi a barre, diagrammi a scatola e istogrammi. Il livello intermedio permette all’utente di controllare gli elementi di base di ogni grafico (per esempio, i punti in un grafico a dispersione) e ha la stessa specificità di Matplotlib. Il livello inferiore è orientato agli sviluppatori e agli ingegneri del software. Non ha impostazioni predefinite e richiede all’utente di definire ogni elemento del grafico.

Plotly

Mentre Plotly è ampiamente conosciuto come una piattaforma online per la visualizzazione dei dati, poche persone sanno che può essere accessibile da un notebook Python. Come Bokeh, la forza di Plotly sta nel fare grafici interattivi, e offre grafici a contorno, che non si trovano nella maggior parte delle librerie.

Pygal

Pygal, come Plotly e Bokeh, offre grafici interattivi che possono essere incorporati in un browser web. La capacità di produrre grafici come SVG è il suo principale elemento di differenziazione. Per il lavoro che coinvolge piccoli insiemi di dati, gli SVG andranno bene. Tuttavia, per i grafici con centinaia di migliaia di punti dati, diventano lenti e hanno problemi di rendering.
È facile creare un bel grafico con poche righe di codice poiché ogni tipo di grafico è impacchettato in un metodo e gli stili incorporati sono ottimi.

Altair

Altair è una libreria python di visualizzazione statistica dichiarativa basata su Vega-Lite. Dovete solo menzionare i collegamenti tra le colonne dei dati ai canali di codifica, come l’asse x, l’asse y, il colore, ecc. e il resto dei dettagli di tracciatura sono gestiti automaticamente. Questo rende Altair semplice, amichevole e coerente. E’ facile progettare visualizzazioni efficaci e belle con una quantità minima di codice usando Altair.

Geoplotlib

Geoplotlib è un toolbox usato per il tracciamento di dati geografici e la creazione di mappe. Può essere usato per creare una varietà di tipi di mappe, come coropletti, mappe di calore e mappe di densità di punti. Pyglet (un’interfaccia di programmazione orientata agli oggetti) deve essere installata per usare Geoplotlib.

Geoplotlib riduce la complessità della progettazione di visualizzazioni fornendo un insieme di strumenti incorporati per i compiti più comuni come la visualizzazione della densità, i grafici spaziali e i file di forma.

Siccome la maggior parte delle librerie di visualizzazione dati Python non offrono mappe, è bene avere una libreria dedicata a loro.

Gleam

Gleam è ispirato al pacchetto Shiny di R. Permette all’utente di trasformare qualsiasi analisi in applicazioni web interattive usando solo script Python. Gli utenti di Gleam non hanno bisogno di conoscere HTML, CSS o JavaScript per farlo. Gleam funziona con qualsiasi libreria di visualizzazione dati Python. Una volta che gli utenti hanno creato una trama, possono costruire campi sopra di essa per filtrare e ordinare i dati.

Missingno

Gestire i dati mancanti è complicato. La completezza di un set di dati può essere misurata rapidamente con Missingno, piuttosto che cercare faticosamente in una tabella. L’utente può filtrare e ordinare i dati in base alla completezza o individuare correlazioni con una mappa di calore o un dendrogramma.

Leather

Leather è progettato per lavorare con tutti i tipi di dati e produce grafici come SVGs, in modo che possano essere scalati senza perdere la qualità dell’immagine. Il creatore di Leather, Christopher Groskopf, lo dice meglio: “Leather è la libreria di grafici Python per coloro che hanno bisogno di grafici ora e non si preoccupano che siano perfetti”. Poiché questa libreria è relativamente nuova, parte della documentazione è ancora in corso. I grafici che possono essere fatti sono piuttosto basilari – ma questa è l’intenzione.

C’è una vasta gamma di strumenti di visualizzazione, con un’enorme diversità, a seconda del focus del compito a portata di mano disponibile per Python. Questo si riflette nell’enorme numero di librerie disponibili. È imperativo per gli utenti tenere a mente le differenze tra gli approcci e le loro implicazioni prima di concentrarsi su un particolare approccio.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.