The Python Package Index には、ニューラルネットワークトレーニングのリアルタイム視覚化のための Pastalog から眼球運動の研究のための Gaze Parser まで、実質的にあらゆるデータ視覚化のニーズに応えるライブラリーが用意されています。 これらのライブラリのいくつかは、アプリケーションの分野に関係なく使用できますが、それらの多くは、特定のタスクの達成に強く焦点を当てています。
最も人気のあるものからそうでないものまで、11 の学際的な Python データ視覚化ライブラリの概要は次のとおりです。 10 年以上前のものですが、Python コミュニティで最も広く使用されているプロット用ライブラリです。
Matplotlob は最初の Python データ視覚化ライブラリであり、したがって、他の多くのライブラリは Matplotlib の上に構築され、解析と連動するように設計されています。 pandas や matplotlib のようなライブラリは Matplotlib の「ラッパー」であり、より少ないコードで Matplotlib の多くのメソッドにアクセスすることを可能にしています。
Matplotlibの多用途性は、次のような可視化タイプを作るために使用することができます。
- 散布図
- 棒グラフとヒストグラム
- 折れ線グラフ
- 円グラフ
- 茎グラフ
- 輪郭グラフ
- 矢グラフ
- スペクトログラム
グリッド、ラベル、凡例など作ることが可能です。
Seaborn
Seaborn は Matplotlib の上に構築された、人気のデータ視覚化ライブラリです。 Seaborn のデフォルトのスタイルとカラーパレットは、Matplotlib よりもはるかに洗練されています。 Seabornは、あらゆるデータを理解するための核となる視覚化を実現します。
ggplot
Ggplot は R の ggplot2 と Grammar of Graphics に基づいた Python 可視化ライブラリです。 実装の詳細を気にすることなく、高水準の文法を用いてプロットを構築することができます。 Ggplot は Matplotlib とは異なる動作をします:それは、ユーザが完全なプロットを作成するためにコンポーネントを重ねることができることです。 例えば、軸から始めて、点、線、傾向線などを追加することができます。 8063>
Bokeh
Bokeh, native to Python も ggplot と同様に The Grammar of Graphics をベースにしています。 また、ストリーミングやリアルタイムデータもサポートしています。 ユニークな売りは、JSON オブジェクト、HTML ドキュメント、またはインタラクティブなウェブアプリケーションとして簡単に出力できる、インタラクティブでウェブ対応のプロットを作成する能力です。 一番上のレベルは、チャートを素早く作成するためのものです。 棒グラフ、箱ひげ図、ヒストグラムなどの一般的なグラフを作成するためのメソッドが含まれています。 中間レベルでは、各チャートの基本的な構成要素(例えば、散布図のドット)を制御することができ、Matplotlib と同様の特殊性を持っています。 最下層は、開発者やソフトウェアエンジニア向けです。 8063>
Plotly
Plotly はデータ可視化のためのオンラインプラットフォームとして広く知られていますが、Python ノートブックからアクセスできることを知る人は非常に少ないでしょう。 8063>
Pygal
Pygal は Plotly や Bokeh のように、ウェブブラウザに埋め込むことができるインタラクティブなプロットを提供します。 SVG としてチャートを出力する機能は、その主要な差別化要因です。 より小さなデータセットを含む作業では、SVGで十分でしょう。 しかし、何十万ものデータ点を持つチャートでは、動作が重くなり、レンダリングが困難になります。
Altair
Altair は Vega-Lite に基づく宣言型の統計的視覚化 python ライブラリです。 x軸、y軸、色などのエンコーディングチャンネルにデータ列間のリンクを言及するだけで、残りのプロットの詳細は自動的に処理されます。 このため、Altairはシンプルで親しみやすく、一貫性があります。 Altair を使えば、最小限のコードで効果的で美しいビジュアライゼーションを簡単にデザインできます。
Geoplotlib
Geoplotlib は地理データのプロットと地図作成に使われるツールボックスです。 choropleths, heatmaps, dot density maps のような、様々な種類の地図を作成するのに使うことができます。 Geoplotlib を使うには Pyglet (オブジェクト指向プログラミングインタフェース) がインストールされている必要があります。
Geoplotlib は、密度の可視化、空間グラフ、シェイプファイルといった最も一般的なタスクのための内蔵ツールセットを提供し、可視化の設計の複雑さを軽減しています。
Sost Python data visualization libraries don’t offer maps, it’s good to have a library dedicated to them.
Gleam
Gleam は R の Shiny パッケージに触発されています。 これは、ユーザーが Python スクリプトのみを使用して、任意の分析を対話型 Web アプリケーションに変えることを可能にします。 Gleam ユーザーは、これを行うために HTML、CSS、または JavaScript を知る必要はありません。 Gleamは、あらゆるPythonデータ可視化ライブラリと連動しています。 8063>
Missingno
欠損データの扱いは面倒です。 データセットの完全性は、苦労してテーブルを検索するのではなく、Missingno を使用して迅速に測定することができます。
Leather
Leather はすべてのデータ タイプで動作するように設計されており、画像の品質を失うことなく拡大縮小できるように SVG などのチャートを作成します。 Leather の作成者である Christopher Groskopf は、それを最もよく表しています。 “Leatherは、今すぐチャートが必要で、それが完璧であるかどうかは気にしない人のためのPythonチャートライブラリです。” このライブラリは比較的新しいので、いくつかのドキュメントはまだ進行中です。 作成できるチャートはかなり基本的ですが、それが意図するところです。
Python で利用できる可視化ツールは、手元のタスクの焦点によって、大きな多様性を持って、広範囲にわたります。 これは、利用可能なライブラリの膨大な数にも反映されています。 ユーザーは特定のアプローチに絞る前に、アプローチ間の違いとその意味を心に留めておくことが肝要です。