- O que é Python Seaborn?
- Tipos de parcelas que podemos construir com Seaborn
- Trabalhando com vários gráficos
- Algumas alternativas para Python Seaborn
Isso parece muito para cobrir. Vamos começar agora.
O que é a biblioteca Python Seaborn?
A biblioteca Seaborn é um pacote Python que nos permite fazer infográficos com base em dados estatísticos. Como é feito em cima do matplotlib, é inerentemente compatível com ele. Além disso, ele suporta a estrutura de dados NumPy e Pandas para que a plotagem possa ser feita diretamente a partir dessas coleções.
Visualizar dados complexos é uma das coisas mais importantes que a Seaborn cuida. Se comparássemos Matplotlib com Seaborn, Seaborn seria capaz de tornar fáceis aquelas coisas que são difíceis de alcançar com Matplotlib. No entanto, é importante notar que Seaborn não é uma alternativa ao Matplotlib, mas um complemento dele. Ao longo desta lição, faremos uso das funções Matplotlib nos trechos de código também. Você irá selecionar trabalhar com a Seaborn nos seguintes casos de uso:
- Você tem dados estatísticos de série temporal a serem plotados com representação de incerteza em torno das estimativas
- Para estabelecer visualmente a diferença entre dois subconjuntos de dados
- Para visualizar as distribuições univariadas e bivariadas
- Adicionando muito mais afeto visual aos gráficos de matplotlib com muitos temas integrados
- Para ajustar e visualizar modelos de aprendizado de máquina por meio de regressão linear com variáveis independentes e dependentes
Apenas uma observação antes de começar é que usamos um ambiente virtual para esta lição que fizemos com o seguinte comando:
python -m virtualenv seabornfonte do mar / bin / ativar
Assim que o ambiente virtual estiver ativo, podemos instalar a biblioteca Seaborn dentro do ambiente virtual para que os exemplos que criaremos a seguir possam ser executados:
pip install seabornVocê pode usar o Anaconda também para executar esses exemplos, o que é mais fácil. Se você deseja instalá-lo em sua máquina, veja a lição que descreve “Como instalar o Anaconda Python no Ubuntu 18.04 LTS ”e compartilhe seu feedback. Agora, vamos avançar para vários tipos de parcelas que podem ser construídas com Python Seaborn.
Usando o conjunto de dados Pokémon
Para manter esta lição prática, usaremos o conjunto de dados Pokémon que pode ser baixado do Kaggle. Para importar este conjunto de dados para o nosso programa, usaremos a biblioteca Pandas. Aqui estão todas as importações que realizamos em nosso programa:
importar pandas como pdde matplotlib importar pyplot como plt
importado do mar como sns
Agora, podemos importar o conjunto de dados para o nosso programa e mostrar alguns dos dados de amostra com o Pandas como:
df = pd.read_csv ('Pokémon.csv ', index_col = 0)df.cabeça()
Observe que para executar o trecho de código acima, o conjunto de dados CSV deve estar presente no mesmo diretório que o próprio programa. Depois de executar o trecho de código acima, veremos a seguinte saída (no bloco de notas do Anaconda Jupyter):
Traçando curva de regressão linear
Uma das melhores coisas sobre o Seaborn são as funções inteligentes de plotagem que ele fornece, que não apenas visualizam o conjunto de dados que fornecemos, mas também constroem modelos de regressão em torno dele. Por exemplo, é possível construir um gráfico de regressão linear com uma única linha de código. Aqui está como fazer isso:
sns.lmplot (x = 'Ataque', y = 'Defesa', dados = df)Depois de executar o snippet de código acima, veremos a seguinte saída:
Percebemos algumas coisas importantes no snippet de código acima:
- Há uma função de plotagem dedicada disponível no Seaborn
- Usamos a função de ajuste e plotagem da Seaborn, que nos forneceu uma linha de regressão linear que modelou a si mesma
Não tenha medo se você pensou que não podemos ter um gráfico sem essa linha de regressão. Podemos ! Vamos tentar um novo snippet de código agora, semelhante ao anterior:
sns.lmplot (x = 'Ataque', y = 'Defesa', dados = df, fit_reg = False)Desta vez, não veremos a linha de regressão em nosso gráfico:
Agora, isso é muito mais claro (se não precisarmos da linha de regressão linear). Mas isso ainda não acabou. Seaborn nos permite fazer um enredo diferente e é isso que faremos.
Construindo Box Plots
Uma das maiores características do Seaborn é como ele aceita prontamente a estrutura de Dataframes do Pandas para traçar dados. Podemos simplesmente passar um Dataframe para a biblioteca Seaborn para que ela possa construir um boxplot a partir dele:
sns.boxplot (dados = df)Depois de executar o snippet de código acima, veremos a seguinte saída:
Podemos remover a primeira leitura do total, pois isso parece um pouco estranho quando, na verdade, estamos plotando colunas individuais aqui:
# Novo boxplot usando stats_df
sns.boxplot (data = stats_df)
Depois de executar o snippet de código acima, veremos a seguinte saída:
Enxame Plot com Seaborn
Podemos construir um enredo Swarm de design intuitivo com Seaborn. Estaremos novamente usando o dataframe do Pandas que carregamos antes, mas desta vez, iremos chamar a função show do Matplotlib para mostrar o gráfico que fizemos. Aqui está o snippet de código:
sns.set_context ("papel")sns.swarmplot (x = "Ataque", y = "Defesa", dados = df)
plt.mostrar()
Depois de executar o snippet de código acima, veremos a seguinte saída:
Ao usar um contexto Seaborn, permitimos que a Seaborn adicione um toque pessoal e design fluido para o enredo. É possível personalizar este gráfico ainda mais com tamanho de fonte personalizado usado para rótulos no gráfico para tornar a leitura mais fácil. Para fazer isso, passaremos mais parâmetros para a função set_context que funciona exatamente como o som. Por exemplo, para modificar o tamanho da fonte das etiquetas, faremos uso da fonte.parâmetro de tamanho. Aqui está o snippet de código para fazer a modificação:
sns.swarmplot (x = "Ataque", y = "Defesa", dados = df)
plt.mostrar()
Depois de executar o snippet de código acima, veremos a seguinte saída:
O tamanho da fonte do rótulo foi alterado com base nos parâmetros que fornecemos e no valor associado à fonte.parâmetro de tamanho. Uma coisa em que a Seaborn é especialista é em tornar o enredo muito intuitivo para uso prático e isso significa que o Seaborn não é apenas um pacote Python de prática, mas na verdade algo que podemos usar em nossas implantações de produção.
Adicionar um título aos gráficos
É fácil adicionar títulos aos nossos enredos. Precisamos apenas seguir um procedimento simples de usar as funções no nível dos eixos, onde chamaremos o set_title () funcionar como mostramos no snippet de código aqui:
sns.set_context ("papel", font_scale = 3, rc = "fonte.tamanho ": 8," eixos.labelize ": 5)my_plot = sns.swarmplot (x = "Ataque", y = "Defesa", dados = df)
my_plot.set_title ("LH Swarm Plot")
plt.mostrar()
Depois de executar o snippet de código acima, veremos a seguinte saída:
Dessa forma, podemos adicionar muito mais informações aos nossos gráficos.
Seaborn vs Matplotlib
Conforme vimos os exemplos nesta lição, podemos identificar que Matplotlib e Seaborn não podem ser comparados diretamente, mas podem ser vistos como complementares. Um dos recursos que levam o Seaborn um passo à frente é a maneira como o Seaborn pode visualizar dados estatisticamente.
Para tirar o melhor proveito dos parâmetros da Seaborn, é altamente recomendável consultar a documentação da Seaborn e descobrir quais parâmetros usar para tornar o seu terreno o mais próximo possível das necessidades de negócios.
Conclusão
Nesta lição, vimos vários aspectos desta biblioteca de visualização de dados que podemos usar com Python para gerar gráficos bonitos e intuitivos que podem visualizar dados em uma forma que a empresa deseja de uma plataforma. O Seaborm é uma das bibliotecas de visualização mais importantes quando se trata de engenharia de dados e apresentação de dados na maioria das formas visuais, definitivamente uma habilidade que precisamos ter sob nosso controle, pois nos permite construir modelos de regressão linear.
Compartilhe seus comentários sobre a lição no Twitter com @sbmaggarwal e @LinuxHint.