Indexul pachetelor Python are biblioteci pentru practic orice nevoie de vizualizare a datelor – de la Pastalog pentru vizualizări în timp real ale formării rețelelor neuronale la Gaze Parser pentru cercetarea mișcărilor oculare. Unele dintre aceste biblioteci pot fi utilizate indiferent de domeniul de aplicare, însă multe dintre ele sunt intens concentrate pe îndeplinirea unei sarcini specifice.
O prezentare generală a 11 biblioteci Python interdisciplinare de vizualizare a datelor, de la cele mai populare la cele mai puțin populare urmează.
Matplotlib
Biblioteca Python Matplotlib este utilizată pentru a genera vizualizări simple, dar puternice. Cu o vechime de peste un deceniu, este cea mai utilizată bibliotecă pentru reprezentarea grafică în comunitatea Python. Matplotlib este utilizată pentru a trasa o gamă largă de grafice – de la histograme la diagrame de căldură.
Matplotlob este prima bibliotecă Python de vizualizare a datelor, prin urmare, multe alte biblioteci sunt construite pe Matplotlib și sunt concepute pentru a lucra împreună cu analiza. Biblioteci precum pandas și matplotlib sunt „învelitori” peste Matplotlib care permit accesul la o serie de metode ale Matplotlib cu mai puțin cod.
Versatilitatea Matplotlib poate fi folosită pentru a realiza tipuri de vizualizare cum ar fi:
- Scatter plots
- Bar charts and Histograms
- Line plots
- Pie charts
- Stem plots
- Contour plots
- Quiver plots
- Spectrograms
Se pot crea grile, etichete, legende etc. cu ușurință, deoarece totul este ușor de personalizat.
Seaborn
Seaborn este o bibliotecă populară de vizualizare a datelor care este construită pe Matplotlib. Stilurile și paletele de culori implicite ale lui Seaborn sunt mult mai sofisticate decât Matplotlib. Seaborn plasează vizualizarea în centrul înțelegerii oricăror date. Seaborn este o bibliotecă de nivel superior – este mai ușor de generat anumite tipuri de diagrame, inclusiv hărți de căldură, serii de timp și diagrame de vioară.
ggplot
Ggplot este o bibliotecă de vizualizare Python bazată pe ggplot2 din R și pe Grammar of Graphics. Puteți construi grafice folosind o gramatică de nivel înalt fără a vă îngrijora de detaliile de implementare. Ggplot funcționează diferit în comparație cu Matplotlib: permite utilizatorilor să stratifice componentele pentru a crea un grafic complet. De exemplu, utilizatorul poate începe cu axe, apoi poate adăuga puncte, apoi o linie, o linie de tendință etc. The Grammar of Graphics a fost salutată ca o metodă „intuitivă” de trasare a graficelor, însă utilizatorii experimentați ai Matplotlib ar putea avea nevoie de timp pentru a se adapta la această nouă mentalitate.
Bokeh
Bokeh, nativ pentru Python se bazează, de asemenea, pe The Grammar of Graphics, ca și ggplot. De asemenea, suportă streaming, și date în timp real. Propunerea unică de vânzare este abilitatea sa de a crea diagrame interactive, pregătite pentru web, care pot ieși cu ușurință ca obiecte JSON, documente HTML sau aplicații web interactive.
Bokeh are trei interfețe cu grade diferite de control pentru a se adapta la diferite tipuri de utilizatori. Nivelul cel mai de sus este destinat creării rapide de grafice. Acesta include metode pentru crearea de diagrame comune, cum ar fi diagramele de bare, diagramele de cutie și histogramele. Nivelul de mijloc permite utilizatorului să controleze elementele de bază ale fiecărui grafic (de exemplu, punctele dintr-un grafic de dispersie) și are aceeași specificitate ca Matplotlib. Nivelul inferior este orientat către dezvoltatori și ingineri de software. Nu are valori implicite prestabilite și necesită ca utilizatorul să definească fiecare element al graficului.
Plotly
În timp ce Plotly este cunoscut pe scară largă ca o platformă online pentru vizualizarea datelor, foarte puțini oameni știu că poate fi poate fi accesat dintr-un notebook Python. Ca și Bokeh, punctul forte al lui Plotly constă în realizarea de diagrame interactive și oferă diagrame de contur, care nu pot fi găsite în majoritatea bibliotecilor.
Pygal
Pygal, ca și Plotly și Bokeh, oferă diagrame interactive care pot fi încorporate într-un browser web. Capacitatea de a produce diagrame ca SVG-uri este principalul său diferențiator. Pentru lucrările care implică seturi de date mai mici, SVG-urile se vor descurca foarte bine. Cu toate acestea, pentru diagrame cu sute de mii de puncte de date, acestea devin leneșe și au probleme de redare.
Este ușor să creezi o diagramă arătoasă cu doar câteva linii de cod, deoarece fiecare tip de diagramă este împachetat într-o metodă, iar stilurile încorporate sunt grozave.
Altair
Altair este o bibliotecă python de vizualizare statistică declarativă bazată pe Vega-Lite. Trebuie doar să menționați legăturile dintre coloanele de date la canalele de codificare, cum ar fi axa x, axa y, culoarea etc., iar restul detaliilor de reprezentare grafică sunt gestionate automat. Acest lucru face ca Altair să fie simplu, prietenos și coerent. Este ușor să concepeți vizualizări eficiente și frumoase cu o cantitate minimă de cod folosind Altair.
Geoplotlib
Geoplotlib este o cutie de instrumente folosită pentru reprezentarea grafică a datelor geografice și crearea de hărți. Acesta poate fi utilizat pentru a crea o varietate de tipuri de hărți, cum ar fi coropleți, hărți termice și hărți de densitate a punctelor. Este necesară instalarea Pyglet (o interfață de programare orientată pe obiecte) pentru a utiliza Geoplotlib.
Geoplotlib reduce complexitatea proiectării vizualizărilor prin furnizarea unui set de instrumente încorporate pentru cele mai comune sarcini, cum ar fi vizualizarea densității, grafice spațiale și fișiere de formă.
Din moment ce majoritatea bibliotecilor Python de vizualizare a datelor nu oferă hărți, este bine să avem o bibliotecă dedicată acestora.
Gleam
Gleam este inspirat de pachetul Shiny al lui R. Acesta permite utilizatorului să transforme orice analiză în aplicații web interactive folosind doar scripturi Python. Utilizatorii Gleam nu trebuie să cunoască HTML, CSS sau JavaScript pentru a face acest lucru. Gleam funcționează cu orice bibliotecă Python de vizualizare a datelor. Odată ce utilizatorii au creat un grafic, pot construi câmpuri deasupra acestuia pentru a filtra și sorta datele.
Missingno
Afacerea cu datele lipsă este greoaie. Completitudinea unui set de date poate fi evaluată rapid cu Missingno, mai degrabă decât să căutați cu greu într-un tabel. Utilizatorul poate filtra și sorta datele pe baza completării sau poate repera corelațiile cu o hartă termică sau o dendrogramă.
Leather
Leather este conceput pentru a lucra cu toate tipurile de date și produce diagrame de tip SVG, astfel încât acestea să poată fi scalate fără a pierde calitatea imaginii. Creatorul lui Leather, Christopher Groskopf, o spune cel mai bine: „Leather este biblioteca de grafice Python pentru cei care au nevoie de grafice acum și nu le pasă dacă sunt perfecte.” Deoarece această bibliotecă este relativ nouă, o parte din documentație este încă în curs de realizare. Graficele care pot fi realizate sunt destul de simple – dar aceasta este intenția.
Există o gamă largă de instrumente de vizualizare, cu o diversitate uriașă, în funcție de accentul pe care se pune pe sarcina în cauză, disponibile pentru Python. Acest lucru se reflectă în numărul mare de biblioteci disponibile. Este imperativ ca utilizatorii să țină cont de diferențele dintre abordări și de implicațiile acestora înainte de a se concentra asupra unei anumite abordări.
.