Pythonin pakettihakemistossa on kirjastoja käytännössä kaikkiin datan visualisointitarpeisiin – Pastalogista neuroverkon harjoittelun reaaliaikaiseen visualisointiin ja Gaze Parserista silmänliikkeiden tutkimiseen. Joitakin näistä kirjastoista voi käyttää sovellusalasta riippumatta, mutta monet niistä keskittyvät kuitenkin voimakkaasti tietyn tehtävän suorittamiseen.
Yleiskatsaus 11:een monitieteiseen Python-datan visualisointikirjastoon suosituimmista vähiten suosittuihin seuraa.

Matplotlib

Python-kirjastoa Matplotlib käytetään yksinkertaisten mutta tehokkaiden visualisointien tuottamiseen. Se on yli kymmenen vuotta vanha, ja se on Python-yhteisön laajimmin käytetty kirjasto piirtämiseen. Matplotlibiä käytetään monenlaisten kuvaajien piirtämiseen – histogrammeista lämpökuvioihin.

Matplotlob on ensimmäinen Python-datan visualisointikirjasto, joten monet muut kirjastot on rakennettu Matplotlibin päälle ja suunniteltu toimimaan yhdessä analyysin kanssa. Kirjastot kuten pandas ja matplotlib ovat ”kääreitä” Matplotlibin päällä, jotka mahdollistavat pääsyn useisiin Matplotlibin menetelmiin vähemmällä koodilla.

Matplotlibin monipuolisuutta voidaan käyttää visualisointityyppien, kuten esim:

  • Scatter-diagrammit
  • Palkkikaaviot ja histogrammit
  • Viivadiagrammit
  • Pie-diagrammit
  • Stemplotit
  • Contour-diagrammit
  • Quiver-diagrammit
  • Spektrogrammit

Voit luoda ruudukoita, etikettejä, tarroja, legendoja jne. helposti, koska kaikki on helposti muokattavissa.

Seaborn

Seaborn on suosittu datan visualisointikirjasto, joka on rakennettu Matplotlibin päälle. Seabornin oletustyylit ja väripaletit ovat paljon kehittyneempiä kuin Matplotlibissä. Seaborn asettaa visualisoinnin kaiken datan ymmärtämisen ytimeen. Seaborn on korkeamman tason kirjasto – sillä on helpompi luoda tietyntyyppisiä plotteja, kuten lämpökarttoja, aikasarjoja ja viulukuvioita.

ggplot

Ggplot on Python-visualisointikirjasto, joka perustuu R:n ggplot2:een ja Grammar of Graphicsiin. Voit rakentaa plotteja korkean tason kieliopin avulla huolehtimatta toteutuksen yksityiskohdista. Ggplot toimii eri tavalla kuin Matplotlib: se antaa käyttäjien kerrostaa komponentteja luodakseen kokonaisen plotin. Käyttäjä voi esimerkiksi aloittaa akseleilla ja lisätä sitten pisteitä, sitten viivan, trendiviivan jne. The Grammar of Graphicsia on ylistetty ”intuitiiviseksi” menetelmäksi piirtämiseen, mutta kokeneet Matplotlib-käyttäjät saattavat kuitenkin tarvita aikaa sopeutuakseen tähän uuteen ajattelutapaan.

Bokeh

Pythonille natiivisti kehitetty Bokeh perustuu myös The Grammar of Graphicsiin kuten ggplot. Se tukee myös suoratoistoa ja reaaliaikaista dataa. Ainutlaatuinen myyntivaltti on sen kyky luoda interaktiivisia, web-valmiita plotteja, jotka voidaan helposti tulostaa JSON-objekteina, HTML-dokumentteina tai interaktiivisina web-sovelluksina.
Bokehissa on kolme käyttöliittymää, joissa on eriasteista hallintaa erityyppisten käyttäjien tarpeisiin. Ylin taso on tarkoitettu kaavioiden nopeaan luomiseen. Se sisältää menetelmiä yleisten kaavioiden, kuten pylväsdiagrammien, laatikkodiagrammien ja histogrammien luomiseen. Keskimmäisellä tasolla käyttäjä voi hallita kunkin kaavion perusrakennuspalikoita (esimerkiksi pisteitä hajontadiagrammissa), ja siinä on sama spesifisyys kuin Matplotlibissä. Alin taso on suunnattu kehittäjille ja ohjelmistosuunnittelijoille. Siinä ei ole valmiita oletusasetuksia, ja se vaatii käyttäjää määrittelemään jokaisen kaavion elementin.

Plotly

Vaikka Plotly tunnetaan laajalti datan visualisoinnin verkkoalustana, vain harvat tietävät, että sitä voi käyttää myös Python-muistikirjasta. Bokehin tavoin Plotlyn vahvuus on interaktiivisten piirrosten tekeminen, ja se tarjoaa ääriviivakuvioita, joita ei löydy useimmista kirjastoista.

Pygal

Pygal tarjoaa Plotlyn ja Bokehin tavoin interaktiivisia piirroksia, jotka voidaan upottaa verkkoselaimeen. Kyky tulostaa kaavioita SVG:nä on sen tärkein erottava tekijä. Pienempiä tietokokonaisuuksia sisältävään työhön SVG:t riittävät mainiosti. Satoja tuhansia datapisteitä sisältävissä kaavioissa niistä tulee kuitenkin hitaita ja niiden renderöinnissä on vaikeuksia.
Hienon näköisen kaavion luominen on helppoa muutamalla rivillä koodia, sillä jokainen kaaviotyyppi on paketoitu metodiin ja sisäänrakennetut tyylit ovat loistavia.

Altair

Altair on deklaratiivinen tilastollisten visualisointien python-kirjasto, joka pohjautuu Vega-Liteen. Sinun tarvitsee vain mainita datasarakkeiden väliset yhteydet koodauskanaviin, kuten x-akseli, y-akseli, väri jne. ja loput piirtämisen yksityiskohdat hoituvat automaattisesti. Tämä tekee Altairista yksinkertaisen, ystävällisen ja johdonmukaisen. Altairin avulla on helppo suunnitella tehokkaita ja kauniita visualisointeja minimaalisella määrällä koodia.

Geoplotlib

Geoplotlib on työkalupakki, jota käytetään maantieteellisten tietojen piirtämiseen ja karttojen luomiseen. Sen avulla voidaan luoda erilaisia karttatyyppejä, kuten koropletteja, lämpökarttoja ja pistetiheyskarttoja. Pyglet (olio-ohjelmointirajapinta) on asennettava, jotta Geoplotlibiä voidaan käyttää.

Geoplotlib vähentää visualisointien suunnittelun monimutkaisuutta tarjoamalla joukon sisäänrakennettuja työkaluja yleisimpiin tehtäviin, kuten tiheyden visualisointiin, spatiaalisiin kaavioihin ja shape-tiedostoihin.

Koska useimmat Python-datan visualisointikirjastot eivät tarjoa karttoja, on hyvä, että niille on omistettu kirjasto.

Gleam

Gleam on saanut vaikutteita R:n Shiny-paketista. Sen avulla käyttäjä voi muuttaa minkä tahansa analyysin interaktiivisiksi verkkosovelluksiksi käyttämällä vain Python-skriptejä. Gleamin käyttäjien ei tarvitse osata HTML:ää, CSS:ää tai JavaScriptiä voidakseen tehdä tämän. Gleam toimii minkä tahansa Python-datan visualisointikirjaston kanssa. Kun käyttäjät ovat luoneet kuvaajan, he voivat rakentaa sen päälle kenttiä tietojen suodattamiseksi ja lajittelemiseksi.

Missingno

Puuttuvien tietojen käsittely on hankalaa. Tietokokonaisuuden täydellisyyttä voidaan arvioida nopeasti Missingnon avulla sen sijaan, että etsittäisiin vaivalloisesti taulukkoa läpi. Käyttäjä voi suodattaa ja lajitella tietoja täydellisyyden perusteella tai havaita korrelaatioita lämpökartan tai dendrogrammin avulla.

Leather

Leather on suunniteltu toimimaan kaikkien tietotyyppien kanssa, ja se tuottaa SVG:n kaltaisia diagrammeja, joita voidaan skaalata menettämättä kuvan laatua. Leatherin luoja Christopher Groskopf ilmaisee asian parhaiten: ”Leather on Python-kaaviokirjasto niille, jotka tarvitsevat kaavioita nyt eivätkä välitä siitä, ovatko ne täydellisiä.” Koska tämä kirjasto on suhteellisen uusi, osa dokumentaatiosta on vielä kesken. Kaaviot, joita voi tehdä, ovat melko yksinkertaisia – mutta se on tarkoituskin.

Pythonille on saatavilla laaja valikoima visualisointityökaluja, joiden kirjo on valtava, riippuen siitä, mihin tehtävään keskittyy. Tämä näkyy saatavilla olevien kirjastojen pelkkä määrässä. Käyttäjien on ehdottomasti pidettävä mielessä lähestymistapojen väliset erot ja niiden vaikutukset ennen kuin he nollaavat tietyn lähestymistavan.

Vastaa

Sähköpostiosoitettasi ei julkaista.