Ciência de Dados

Tutorial Python Seaborn

Tutorial Python Seaborn
Nesta lição sobre a biblioteca Seaborn do Python, veremos vários aspectos dessa biblioteca de visualização de dados que podemos usar com o Python para gerar gráficos bonitos e intuitivos que podem visualizar os dados na forma que a empresa deseja de uma plataforma. Para completar esta lição, cobriremos as seguintes seções:

Isso parece muito para cobrir. Vamos começar agora.

O que é a biblioteca Python Seaborn?

A biblioteca Seaborn é um pacote Python que nos permite fazer infográficos com base em dados estatísticos. Como é feito em cima do matplotlib, é inerentemente compatível com ele. Além disso, ele suporta a estrutura de dados NumPy e Pandas para que a plotagem possa ser feita diretamente a partir dessas coleções.

Visualizar dados complexos é uma das coisas mais importantes que a Seaborn cuida. Se comparássemos Matplotlib com Seaborn, Seaborn seria capaz de tornar fáceis aquelas coisas que são difíceis de alcançar com Matplotlib. No entanto, é importante notar que Seaborn não é uma alternativa ao Matplotlib, mas um complemento dele. Ao longo desta lição, faremos uso das funções Matplotlib nos trechos de código também. Você irá selecionar trabalhar com a Seaborn nos seguintes casos de uso:

Apenas uma observação antes de começar é que usamos um ambiente virtual para esta lição que fizemos com o seguinte comando:

python -m virtualenv seaborn
fonte do mar / bin / ativar

Assim que o ambiente virtual estiver ativo, podemos instalar a biblioteca Seaborn dentro do ambiente virtual para que os exemplos que criaremos a seguir possam ser executados:

pip install seaborn

Você pode usar o Anaconda também para executar esses exemplos, o que é mais fácil. Se você deseja instalá-lo em sua máquina, veja a lição que descreve “Como instalar o Anaconda Python no Ubuntu 18.04 LTS ”e compartilhe seu feedback. Agora, vamos avançar para vários tipos de parcelas que podem ser construídas com Python Seaborn.

Usando o conjunto de dados Pokémon

Para manter esta lição prática, usaremos o conjunto de dados Pokémon que pode ser baixado do Kaggle. Para importar este conjunto de dados para o nosso programa, usaremos a biblioteca Pandas. Aqui estão todas as importações que realizamos em nosso programa:

importar pandas como pd
de matplotlib importar pyplot como plt
importado do mar como sns

Agora, podemos importar o conjunto de dados para o nosso programa e mostrar alguns dos dados de amostra com o Pandas como:

df = pd.read_csv ('Pokémon.csv ', index_col = 0)
df.cabeça()

Observe que para executar o trecho de código acima, o conjunto de dados CSV deve estar presente no mesmo diretório que o próprio programa. Depois de executar o trecho de código acima, veremos a seguinte saída (no bloco de notas do Anaconda Jupyter):

Traçando curva de regressão linear

Uma das melhores coisas sobre o Seaborn são as funções inteligentes de plotagem que ele fornece, que não apenas visualizam o conjunto de dados que fornecemos, mas também constroem modelos de regressão em torno dele. Por exemplo, é possível construir um gráfico de regressão linear com uma única linha de código. Aqui está como fazer isso:

sns.lmplot (x = 'Ataque', y = 'Defesa', dados = df)

Depois de executar o snippet de código acima, veremos a seguinte saída:

Percebemos algumas coisas importantes no snippet de código acima:

Não tenha medo se você pensou que não podemos ter um gráfico sem essa linha de regressão. Podemos ! Vamos tentar um novo snippet de código agora, semelhante ao anterior:

sns.lmplot (x = 'Ataque', y = 'Defesa', dados = df, fit_reg = False)

Desta vez, não veremos a linha de regressão em nosso gráfico:

Agora, isso é muito mais claro (se não precisarmos da linha de regressão linear). Mas isso ainda não acabou. Seaborn nos permite fazer um enredo diferente e é isso que faremos.

Construindo Box Plots

Uma das maiores características do Seaborn é como ele aceita prontamente a estrutura de Dataframes do Pandas para traçar dados. Podemos simplesmente passar um Dataframe para a biblioteca Seaborn para que ela possa construir um boxplot a partir dele:

sns.boxplot (dados = df)

Depois de executar o snippet de código acima, veremos a seguinte saída:

Podemos remover a primeira leitura do total, pois isso parece um pouco estranho quando, na verdade, estamos plotando colunas individuais aqui:

stats_df = df.queda (['Total'], eixo = 1)
# Novo boxplot usando stats_df
sns.boxplot (data = stats_df)

Depois de executar o snippet de código acima, veremos a seguinte saída:

Enxame Plot com Seaborn

Podemos construir um enredo Swarm de design intuitivo com Seaborn. Estaremos novamente usando o dataframe do Pandas que carregamos antes, mas desta vez, iremos chamar a função show do Matplotlib para mostrar o gráfico que fizemos. Aqui está o snippet de código:

sns.set_context ("papel")
sns.swarmplot (x = "Ataque", y = "Defesa", dados = df)
plt.mostrar()

Depois de executar o snippet de código acima, veremos a seguinte saída:

Ao usar um contexto Seaborn, permitimos que a Seaborn adicione um toque pessoal e design fluido para o enredo. É possível personalizar este gráfico ainda mais com tamanho de fonte personalizado usado para rótulos no gráfico para tornar a leitura mais fácil. Para fazer isso, passaremos mais parâmetros para a função set_context que funciona exatamente como o som. Por exemplo, para modificar o tamanho da fonte das etiquetas, faremos uso da fonte.parâmetro de tamanho. Aqui está o snippet de código para fazer a modificação:

sns.set_context ("papel", font_scale = 3, rc = "fonte.tamanho ": 8," eixos.labelize ": 5)
sns.swarmplot (x = "Ataque", y = "Defesa", dados = df)
plt.mostrar()

Depois de executar o snippet de código acima, veremos a seguinte saída:

O tamanho da fonte do rótulo foi alterado com base nos parâmetros que fornecemos e no valor associado à fonte.parâmetro de tamanho. Uma coisa em que a Seaborn é especialista é em tornar o enredo muito intuitivo para uso prático e isso significa que o Seaborn não é apenas um pacote Python de prática, mas na verdade algo que podemos usar em nossas implantações de produção.

Adicionar um título aos gráficos

É fácil adicionar títulos aos nossos enredos. Precisamos apenas seguir um procedimento simples de usar as funções no nível dos eixos, onde chamaremos o set_title () funcionar como mostramos no snippet de código aqui:

sns.set_context ("papel", font_scale = 3, rc = "fonte.tamanho ": 8," eixos.labelize ": 5)
my_plot = sns.swarmplot (x = "Ataque", y = "Defesa", dados = df)
my_plot.set_title ("LH Swarm Plot")
plt.mostrar()

Depois de executar o snippet de código acima, veremos a seguinte saída:

Dessa forma, podemos adicionar muito mais informações aos nossos gráficos.

Seaborn vs Matplotlib

Conforme vimos os exemplos nesta lição, podemos identificar que Matplotlib e Seaborn não podem ser comparados diretamente, mas podem ser vistos como complementares. Um dos recursos que levam o Seaborn um passo à frente é a maneira como o Seaborn pode visualizar dados estatisticamente.

Para tirar o melhor proveito dos parâmetros da Seaborn, é altamente recomendável consultar a documentação da Seaborn e descobrir quais parâmetros usar para tornar o seu terreno o mais próximo possível das necessidades de negócios.

Conclusão

Nesta lição, vimos vários aspectos desta biblioteca de visualização de dados que podemos usar com Python para gerar gráficos bonitos e intuitivos que podem visualizar dados em uma forma que a empresa deseja de uma plataforma. O Seaborm é uma das bibliotecas de visualização mais importantes quando se trata de engenharia de dados e apresentação de dados na maioria das formas visuais, definitivamente uma habilidade que precisamos ter sob nosso controle, pois nos permite construir modelos de regressão linear.

Compartilhe seus comentários sobre a lição no Twitter com @sbmaggarwal e @LinuxHint.

Os 10 melhores jogos para jogar no Ubuntu
A plataforma Windows tem sido uma das plataformas dominantes para jogos devido à grande porcentagem de jogos que estão sendo desenvolvidos hoje para o...
5 melhores jogos de arcade para Linux
Hoje em dia, os computadores são máquinas sérias usadas para jogos. Se você não pode obter a nova pontuação máxima, você saberá o que quero dizer. Nes...
Batalha por Wesnoth 1.13.6 Desenvolvimento lançado
Batalha por Wesnoth 1.13.6 lançado no mês passado, é o sexto lançamento de desenvolvimento no 1.13.série x e oferece uma série de melhorias, principal...