Ciência de Dados

Tutorial Python Seaborn

Tutorial Python Seaborn
Nesta lição sobre a biblioteca Seaborn do Python, veremos vários aspectos dessa biblioteca de visualização de dados que podemos usar com o Python para gerar gráficos bonitos e intuitivos que podem visualizar os dados na forma que a empresa deseja de uma plataforma. Para completar esta lição, cobriremos as seguintes seções:

Isso parece muito para cobrir. Vamos começar agora.

O que é a biblioteca Python Seaborn?

A biblioteca Seaborn é um pacote Python que nos permite fazer infográficos com base em dados estatísticos. Como é feito em cima do matplotlib, é inerentemente compatível com ele. Além disso, ele suporta a estrutura de dados NumPy e Pandas para que a plotagem possa ser feita diretamente a partir dessas coleções.

Visualizar dados complexos é uma das coisas mais importantes que a Seaborn cuida. Se comparássemos Matplotlib com Seaborn, Seaborn seria capaz de tornar fáceis aquelas coisas que são difíceis de alcançar com Matplotlib. No entanto, é importante notar que Seaborn não é uma alternativa ao Matplotlib, mas um complemento dele. Ao longo desta lição, faremos uso das funções Matplotlib nos trechos de código também. Você irá selecionar trabalhar com a Seaborn nos seguintes casos de uso:

Apenas uma observação antes de começar é que usamos um ambiente virtual para esta lição que fizemos com o seguinte comando:

python -m virtualenv seaborn
fonte do mar / bin / ativar

Assim que o ambiente virtual estiver ativo, podemos instalar a biblioteca Seaborn dentro do ambiente virtual para que os exemplos que criaremos a seguir possam ser executados:

pip install seaborn

Você pode usar o Anaconda também para executar esses exemplos, o que é mais fácil. Se você deseja instalá-lo em sua máquina, veja a lição que descreve “Como instalar o Anaconda Python no Ubuntu 18.04 LTS ”e compartilhe seu feedback. Agora, vamos avançar para vários tipos de parcelas que podem ser construídas com Python Seaborn.

Usando o conjunto de dados Pokémon

Para manter esta lição prática, usaremos o conjunto de dados Pokémon que pode ser baixado do Kaggle. Para importar este conjunto de dados para o nosso programa, usaremos a biblioteca Pandas. Aqui estão todas as importações que realizamos em nosso programa:

importar pandas como pd
de matplotlib importar pyplot como plt
importado do mar como sns

Agora, podemos importar o conjunto de dados para o nosso programa e mostrar alguns dos dados de amostra com o Pandas como:

df = pd.read_csv ('Pokémon.csv ', index_col = 0)
df.cabeça()

Observe que para executar o trecho de código acima, o conjunto de dados CSV deve estar presente no mesmo diretório que o próprio programa. Depois de executar o trecho de código acima, veremos a seguinte saída (no bloco de notas do Anaconda Jupyter):

Traçando curva de regressão linear

Uma das melhores coisas sobre o Seaborn são as funções inteligentes de plotagem que ele fornece, que não apenas visualizam o conjunto de dados que fornecemos, mas também constroem modelos de regressão em torno dele. Por exemplo, é possível construir um gráfico de regressão linear com uma única linha de código. Aqui está como fazer isso:

sns.lmplot (x = 'Ataque', y = 'Defesa', dados = df)

Depois de executar o snippet de código acima, veremos a seguinte saída:

Percebemos algumas coisas importantes no snippet de código acima:

Não tenha medo se você pensou que não podemos ter um gráfico sem essa linha de regressão. Podemos ! Vamos tentar um novo snippet de código agora, semelhante ao anterior:

sns.lmplot (x = 'Ataque', y = 'Defesa', dados = df, fit_reg = False)

Desta vez, não veremos a linha de regressão em nosso gráfico:

Agora, isso é muito mais claro (se não precisarmos da linha de regressão linear). Mas isso ainda não acabou. Seaborn nos permite fazer um enredo diferente e é isso que faremos.

Construindo Box Plots

Uma das maiores características do Seaborn é como ele aceita prontamente a estrutura de Dataframes do Pandas para traçar dados. Podemos simplesmente passar um Dataframe para a biblioteca Seaborn para que ela possa construir um boxplot a partir dele:

sns.boxplot (dados = df)

Depois de executar o snippet de código acima, veremos a seguinte saída:

Podemos remover a primeira leitura do total, pois isso parece um pouco estranho quando, na verdade, estamos plotando colunas individuais aqui:

stats_df = df.queda (['Total'], eixo = 1)
# Novo boxplot usando stats_df
sns.boxplot (data = stats_df)

Depois de executar o snippet de código acima, veremos a seguinte saída:

Enxame Plot com Seaborn

Podemos construir um enredo Swarm de design intuitivo com Seaborn. Estaremos novamente usando o dataframe do Pandas que carregamos antes, mas desta vez, iremos chamar a função show do Matplotlib para mostrar o gráfico que fizemos. Aqui está o snippet de código:

sns.set_context ("papel")
sns.swarmplot (x = "Ataque", y = "Defesa", dados = df)
plt.mostrar()

Depois de executar o snippet de código acima, veremos a seguinte saída:

Ao usar um contexto Seaborn, permitimos que a Seaborn adicione um toque pessoal e design fluido para o enredo. É possível personalizar este gráfico ainda mais com tamanho de fonte personalizado usado para rótulos no gráfico para tornar a leitura mais fácil. Para fazer isso, passaremos mais parâmetros para a função set_context que funciona exatamente como o som. Por exemplo, para modificar o tamanho da fonte das etiquetas, faremos uso da fonte.parâmetro de tamanho. Aqui está o snippet de código para fazer a modificação:

sns.set_context ("papel", font_scale = 3, rc = "fonte.tamanho ": 8," eixos.labelize ": 5)
sns.swarmplot (x = "Ataque", y = "Defesa", dados = df)
plt.mostrar()

Depois de executar o snippet de código acima, veremos a seguinte saída:

O tamanho da fonte do rótulo foi alterado com base nos parâmetros que fornecemos e no valor associado à fonte.parâmetro de tamanho. Uma coisa em que a Seaborn é especialista é em tornar o enredo muito intuitivo para uso prático e isso significa que o Seaborn não é apenas um pacote Python de prática, mas na verdade algo que podemos usar em nossas implantações de produção.

Adicionar um título aos gráficos

É fácil adicionar títulos aos nossos enredos. Precisamos apenas seguir um procedimento simples de usar as funções no nível dos eixos, onde chamaremos o set_title () funcionar como mostramos no snippet de código aqui:

sns.set_context ("papel", font_scale = 3, rc = "fonte.tamanho ": 8," eixos.labelize ": 5)
my_plot = sns.swarmplot (x = "Ataque", y = "Defesa", dados = df)
my_plot.set_title ("LH Swarm Plot")
plt.mostrar()

Depois de executar o snippet de código acima, veremos a seguinte saída:

Dessa forma, podemos adicionar muito mais informações aos nossos gráficos.

Seaborn vs Matplotlib

Conforme vimos os exemplos nesta lição, podemos identificar que Matplotlib e Seaborn não podem ser comparados diretamente, mas podem ser vistos como complementares. Um dos recursos que levam o Seaborn um passo à frente é a maneira como o Seaborn pode visualizar dados estatisticamente.

Para tirar o melhor proveito dos parâmetros da Seaborn, é altamente recomendável consultar a documentação da Seaborn e descobrir quais parâmetros usar para tornar o seu terreno o mais próximo possível das necessidades de negócios.

Conclusão

Nesta lição, vimos vários aspectos desta biblioteca de visualização de dados que podemos usar com Python para gerar gráficos bonitos e intuitivos que podem visualizar dados em uma forma que a empresa deseja de uma plataforma. O Seaborm é uma das bibliotecas de visualização mais importantes quando se trata de engenharia de dados e apresentação de dados na maioria das formas visuais, definitivamente uma habilidade que precisamos ter sob nosso controle, pois nos permite construir modelos de regressão linear.

Compartilhe seus comentários sobre a lição no Twitter com @sbmaggarwal e @LinuxHint.

Top 5 cartas de captura de jogos
Todos nós vimos e amamos streaming de jogos no YouTube. PewDiePie, Jakesepticye e Markiplier são apenas alguns dos melhores jogadores que ganharam mil...
Como desenvolver um jogo no Linux
Uma década atrás, poucos usuários de Linux preveriam que seu sistema operacional favorito um dia seria uma plataforma de jogos popular para videogames...
Portas de código aberto para motores de jogos comerciais
Recriações gratuitas, de código aberto e de mecanismo de jogo de plataforma cruzada podem ser usadas para jogar jogos antigos, bem como alguns dos tít...