pandas

Como traçar dados no Pandas Python

Como traçar dados no Pandas Python
A visualização de dados desempenha um papel importante na análise de dados. Pandas é uma biblioteca de análise de dados forte em python para ciência de dados. Ele fornece várias opções para visualização de dados com .método plot (). Mesmo se você for um iniciante, você pode facilmente plotar seus dados usando a biblioteca Pandas. Você precisa importar os pandas e matplotlib.pacote pyplot para visualização de dados.

Neste artigo, vamos explorar vários métodos de plotagem de dados usando o Pandas python. Executamos todos os exemplos no editor de código-fonte do pycharm usando o matplotlib.pacote pyplot.

Plotando em Pandas Python

Em Pandas, o .plot () tem vários parâmetros que você pode usar com base em suas necessidades. Principalmente, usando o parâmetro 'kind', você pode definir qual tipo de gráfico você criará.

A sintaxe para traçar dados usando Pandas Python

A seguinte sintaxe é usada para plotar um DataFrame no Pandas Python:

# import pandas e matplotlib.Pacotes pyplot
importar pandas como pd
importar matplotlib.pyplot como plt
# Prepare os dados para criar o DataFrame
data_frame =
'Coluna1': ['campo1', 'campo2', 'campo3', 'campo4',…],
'Coluna2': ['campo1', 'campo2', 'campo3', 'campo4',…]

var_df = pd.DataFrame (data_frame, colunas = ['Coluna1', 'Coluna2])
imprimir (variável)
# gráfico de barras de plotagem
var_df.trama.bar (x = 'Coluna1', y = 'Coluna2')
plt.mostrar()

Você também pode definir o tipo de gráfico usando o parâmetro kind da seguinte maneira:

var_df.plot (x = 'Coluna1', y = 'Coluna2', tipo = 'barra')

Os objetos Pandas DataFrames têm os seguintes métodos de plotagem:

Se um usuário usa apenas o método plot () sem usar nenhum parâmetro, ele cria o gráfico de linha padrão.

Iremos agora elaborar alguns tipos principais de plotagem em detalhes com a ajuda de alguns exemplos.

Plotagem de dispersão em pandas

Neste tipo de plotagem, representamos a relação entre duas variáveis. Vamos dar um exemplo.

Exemplo

Por exemplo, temos dados de correlação entre duas variáveis ​​PIB_crescimento e Petróleo_preço. Para plotar a relação entre duas variáveis, executamos o seguinte trecho de código em nosso editor de código-fonte:

importar matplotlib.pyplot como plt
importar pandas como pd
gdp_cal = pd.Quadro de dados(
'PIB_crescimento': [6.1, 5.8, 5.7, 5.7, 5.8, 5.6, 5.5, 5.3, 5.2, 5.2],
'Oil_Price': [1500, 1520, 1525, 1523, 1515, 1540, 1545, 1560, 1555, 1565]
)
df = pd.DataFrame (gdp_cal, colunas = ['Oil_Price', 'GDP_growth'])
imprimir (df)
df.plot (x = 'Oil_Price', y = 'GDP_growth', kind = 'scatter', color = 'red')
plt.mostrar()

Plotagem de gráficos de linha em pandas  

O gráfico de linha é um tipo básico de plotagem em que as informações fornecidas são exibidas em uma série de pontos de dados que são posteriormente conectados por segmentos de linhas retas. Usando os gráficos de linha, você também pode mostrar as tendências de informações ao longo do tempo.

Exemplo

No exemplo mencionado abaixo, pegamos os dados sobre a taxa de inflação do ano passado. Primeiro, prepare os dados e, em seguida, crie o DataFrame. O código-fonte a seguir representa o gráfico de linha dos dados disponíveis:

importar pandas como pd
importar matplotlib.pyplot como plt
infl_cal = 'Ano': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Infl_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (infl_cal, colunas = ['Ano', 'Infl_Rate'])
quadro de dados.plot (x = 'Ano', y = 'Infl_Rate', tipo = 'linha')
plt.mostrar()

No exemplo acima, você precisa definir o tipo = 'linha' para a plotagem do gráfico de linha.

Método 2 # Usando o gráfico.método line ()

O exemplo acima, você também pode implementar usando o seguinte método:

importar pandas como pd
importar matplotlib.pyplot como plt
inf_cal = 'Ano': [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011],
'Inflation_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (inf_cal, colunas = ['Inflation_Rate'], index = [2001, 2002, 2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011])
quadro de dados.trama.linha()
plt.title ('Resumo da taxa de inflação dos últimos 11 anos')
plt.ylabel ('Inflation_Rate')
plt.xlabel ('Ano')
plt.mostrar()

O seguinte gráfico de linha será exibido após a execução do código acima:

Plotagem de gráfico de barras em pandas

A plotagem do gráfico de barras é usada para representar os dados categóricos. Neste tipo de plotagem, as barras retangulares com diferentes alturas são plotadas com base nas informações fornecidas. O gráfico de barras pode ser traçado em duas direções horizontais ou verticais diferentes.

Exemplo

Pegamos a taxa de alfabetização de vários países no exemplo a seguir. DataFrames são criados em que 'Country_Names' e 'literacy_Rate' são as duas colunas de um DataFrame. Usando o Pandas, você pode plotar as informações no formato do gráfico de barras da seguinte maneira:

importar pandas como pd
importar matplotlib.pyplot como plt
lit_cal =
'Country_Names': ['Paquistão', 'EUA', 'China', 'Índia', 'Reino Unido', 'Áustria', 'Egito', 'Ucrânia', 'Saudia', 'Austrália',
'Malásia'],
'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]

data_frame = pd.DataFrame (lit_cal, colunas = ['Country_Names', 'litr_Rate'])
imprimir (data_frame)
quadro de dados.trama.bar (x = 'Country_Names', y = 'litr_Rate')
plt.mostrar()

Você também pode implementar o exemplo acima usando o seguinte método. Defina kind = "bar" para plotagem de gráfico de barras nesta linha:

quadro de dados.plot (x = 'Country_Names', y = 'litr_Rate', kind = 'bar')
plt.mostrar()

Plotagem de gráfico de barra horizontal

Você também pode plotar os dados em barras horizontais executando o seguinte código:

importar matplotlib.pyplot como plt
importar pandas como pd
data_chart = 'litr_Rate': [5.8, 10, 7, 6.7, 6.8, 6, 5.5, 8.2, 8.5, 9, 10]
df = pd.DataFrame (data_chart, columns = ['litr_Rate'], index = ['Paquistão', 'EUA', 'China', 'Índia', 'Reino Unido', 'Áustria', 'Egito', 'Ucrânia', 'Saudia' , 'Austrália',
'Malásia'])
df.trama.barh ()
plt.title ('Taxa de alfabetização em vários países')
plt.ylabel ('Country_Names')
plt.xlabel ('litr_Rate')
plt.mostrar()

Em df.trama.barh (), o barh é usado para plotagem horizontal. Depois de executar o código acima, o seguinte gráfico de barras é exibido na janela:

Plotagem de gráfico de pizza em pandas

Um gráfico de pizza representa os dados em um formato gráfico circular em que os dados são exibidos em fatias com base na quantidade fornecida.

Exemplo

No exemplo a seguir, exibimos as informações sobre 'Earth_material' em diferentes fatias no gráfico de pizza. Primeiro, crie o DataFrame, em seguida, usando os pandas, exiba todos os detalhes no gráfico.

importar pandas como pd
importar matplotlib.pyplot como plt
material_per = 'Earth_Part': [71,18,7,4]
dataframe = pd.DataFrame (material_per, colunas = ['Earth_Part'], index = ['Água', 'Mineral', 'Areia', 'Metais'])
quadro de dados.trama.pie (y = 'Earth_Part', figsize = (7, 7), autopct = '% 1.1f %% ', startangle = 90)
plt.mostrar()

O código-fonte acima representa o gráfico de pizza dos dados disponíveis:

Conclusão

Neste artigo, você viu como plotar DataFrames no Pandas python. Diferentes tipos de plotagem são realizados no artigo acima. Para plotar mais tipos, como caixa, hexbin, hist, kde, densidade, área, etc., você pode usar o mesmo código-fonte apenas mudando o tipo de plotagem.

O cursor pula ou se move aleatoriamente enquanto digita no Windows 10
Se você descobrir que o cursor do mouse pula ou se move por conta própria, de forma automática e aleatória ao digitar em um laptop ou computador com W...
Como reverter a direção de rolagem do Mouse e Touchpads no Windows 10
Mouse e Touchpads não apenas torna a computação mais fácil, mas mais eficiente e menos demorada. Não podemos imaginar uma vida sem esses dispositivos,...
Como alterar o ponteiro do mouse e tamanho do cursor, cor e esquema no Windows 10
O ponteiro do mouse e o cursor no Windows 10 são aspectos muito importantes do sistema operacional. Isso também pode ser dito para outros sistemas ope...