O Python Package Index tem bibliotecas para praticamente todas as necessidades de visualização de dados – do Pastalog para visualizações em tempo real do treinamento da rede neural até o Gaze Parser para pesquisas de movimento ocular. Algumas dessas bibliotecas podem ser usadas não importa o campo de aplicação, mas muitas delas estão intensamente focadas na realização de uma tarefa específica.
Uma visão geral de 11 bibliotecas interdisciplinares de visualização de dados Python, desde as mais populares até as menos seguintes.

Matplotlib

Matplotlib Python Library é usada para gerar visualizações simples mas poderosas. Com mais de uma década, é a biblioteca mais utilizada para plotting na comunidade Python. Matplotlib é usada para plotar uma grande variedade de gráficos – desde histogramas a gráficos de calor.

Matplotlob é a primeira biblioteca de visualização de dados Python, portanto muitas outras bibliotecas são construídas sobre o Matplotlib e são projetadas para trabalhar em conjunto com a análise. Bibliotecas como pandas e matplotlib são “wrappers” sobre Matplotlib permitindo o acesso a um número de métodos Matplotlib com menos código.

A versatilidade da Matplotlib pode ser usada para fazer tipos de visualização como por exemplo:

  • Gráficos de dispersão
  • Gráficos de barras e Histogramas
  • Gráficos de linha
  • Gráficos de torta
  • Gráficos de tronco
  • Gráficos de contorno
  • Gráficos de fígado
  • Spectrogramas

É possível criar grelhas, etiquetas, lendas, etc. com facilidade já que tudo é facilmente personalizável.

Seaborn

Seaborn é uma popular biblioteca de visualização de dados que é construída em cima da Matplotlib. Os estilos e paletas de cores padrão do Seaborn são muito mais sofisticados do que a Matplotlib. Seaborn coloca a visualização no centro da compreensão de qualquer dado. Seaborn é uma biblioteca de nível superior – é mais fácil gerar certos tipos de gráficos, incluindo mapas de calor, séries cronológicas e gráficos de violino.

ggplot

Ggplot é uma biblioteca de visualização Python baseada no ggplot2 do R e na Gramática de Gráficos. Você pode construir gráficos usando gramática de alto nível sem se preocupar com os detalhes de implementação. O Ggplot funciona de forma diferente do Matplotlib: ele permite que os usuários criem um gráfico completo. Por exemplo, o usuário pode começar com eixos, e depois adicionar pontos, depois uma linha, uma linha de tendência, etc. A Gramática dos Gráficos tem sido aclamada como um método “intuitivo” para plotagem, porém usuários experientes do Matplotlib podem precisar de tempo para se ajustar a esta nova mentalidade.

Bokeh

Bokeh, nativo de Python também é baseado na Gramática dos Gráficos como o ggplot. Ele também suporta streaming, e dados em tempo real. A proposta única de venda é sua habilidade de criar gráficos interativos prontos para a web, que podem facilmente sair como objetos JSON, documentos HTML, ou aplicações web interativas.
Bokeh tem três interfaces com diferentes graus de controle para acomodar diferentes tipos de usuários. O nível mais alto é para a criação rápida de gráficos. Ele inclui métodos para criar gráficos comuns como gráficos de barra, gráficos de caixa e histogramas. O nível médio permite ao usuário controlar os blocos básicos de construção de cada gráfico (por exemplo, os pontos em um gráfico de dispersão) e tem a mesma especificidade do Matplotlib. O nível inferior é voltado para desenvolvedores e engenheiros de software. Ele não possui padrões pré-definidos e requer que o usuário defina cada elemento do gráfico.

Plotly

Embora Plotly seja amplamente conhecido como uma plataforma online para visualização de dados, muito poucas pessoas sabem que ele pode ser acessado a partir de um notebook Python. Tal como Bokeh, o ponto forte de Plotly reside em fazer gráficos interactivos, e oferece gráficos de contorno, que não podem ser encontrados na maioria das bibliotecas.

Pygal

>

Pygal, tal como Plotly e Bokeh, oferece gráficos interactivos que podem ser integrados num web browser. A capacidade de produzir gráficos como SVGs é o seu principal diferenciador. Para trabalhos envolvendo conjuntos de dados menores, os SVGs servem perfeitamente. No entanto, para gráficos com centenas de milhares de pontos de dados, eles se tornam lentos e têm dificuldade de renderização.
É fácil criar um gráfico bonito com apenas algumas linhas de código, uma vez que cada tipo de gráfico é empacotado em um método e os estilos incorporados são ótimos.

Altair

Altair é uma biblioteca de python de visualização estatística declarativa baseada em Vega-Lite. Basta mencionar os links entre as colunas de dados para os canais de codificação, tais como eixo x, eixo y, cor, etc. e o resto dos detalhes da plotagem são tratados automaticamente. Isto faz com que Altair seja simples, amigável e consistente. É fácil de desenhar visualizações eficazes e bonitas com uma quantidade mínima de código usando Altair.

Geoplotlib

Geoplotlib é uma caixa de ferramentas usada para plotagem de dados geográficos e criação de mapas. Ela pode ser usada para criar uma variedade de tipos de mapas, como corpúsculos, mapas de calor e mapas de densidade de pontos. Pyglet (uma interface de programação orientada a objetos) é necessário ser instalado para usar Geoplotlib.

Geoplotlib reduz a complexidade do projeto de visualizações, fornecendo um conjunto de ferramentas embutidas para as tarefas mais comuns como visualização de densidade, gráficos espaciais e arquivos de forma.

Desde que a maioria das bibliotecas de visualização de dados Python não oferecem mapas, é bom ter uma biblioteca dedicada a eles.

Gleam

Gleam é inspirado no pacote R’s Shiny. Ele permite ao usuário transformar qualquer análise em aplicações web interativas usando apenas scripts Python. Os usuários do Gleam não precisam saber HTML, CSS, ou JavaScript para fazer isso. Gleam funciona com qualquer biblioteca de visualização de dados Python. Uma vez que os usuários tenham criado um gráfico, eles podem construir campos em cima dele para filtrar e classificar dados.

Missingno

Dealing with missing data is incumberome. A completude de um conjunto de dados pode ser avaliada rapidamente com o Missingno, em vez de procurar cuidadosamente através de uma tabela. O usuário pode filtrar e classificar os dados com base na conclusão ou correlações de pontos com um mapa de calor ou um dendrogram.

>

Couro

>

Couro é projetado para trabalhar com todos os tipos de dados e produz gráficos como SVGs, para que eles possam ser escalados sem perder a qualidade da imagem. O criador do couro, Christopher Groskopf, coloca o melhor: “Leather é a biblioteca de gráficos Python para aqueles que precisam de gráficos agora e não se importam se são perfeitos.” Como esta biblioteca é relativamente nova, parte da documentação ainda está em andamento. Os gráficos que podem ser feitos são bastante básicos – mas essa é a intenção.

Existe uma grande variedade de ferramentas de visualização, com uma enorme diversidade, dependendo do foco da tarefa em mãos disponível para Python. Isto se reflete no grande número de bibliotecas disponíveis. É imperativo que os usuários tenham em mente as diferenças entre as abordagens e suas implicações antes de zerar em uma determinada abordagem.

Deixe uma resposta

O seu endereço de email não será publicado.