Ciência de Dados

Como criar Pandas DataFrame em Python?

Como criar Pandas DataFrame em Python?

O Pandas DataFrame é uma estrutura de dados anotada 2D (bidimensional) na qual os dados são alinhados na forma tabular com diferentes linhas e colunas. Para facilitar a compreensão, o DataFrame se comporta como uma planilha que contém três componentes diferentes: índice, colunas e dados. Pandas DataFrames são a forma mais comum de utilizar os objetos do panda.

Pandas DataFrames podem ser criados usando métodos diferentes. Este artigo irá explicar todos os métodos possíveis através dos quais você pode criar Pandas DataFrame em python. Executamos todos os exemplos na ferramenta pycharm. Vamos começar a implementação de cada método um por um.

Sintaxe Básica

Siga a seguinte sintaxe ao criar DataFrames no Pandas python:

pd.DataFrame (Df_data)

Exemplo: Vamos explicar com um exemplo. Neste caso, armazenamos os dados dos nomes e porcentagens dos alunos em uma variável 'Students_Data'. Além disso, usando o pd.DataFrame (), criamos um DataFrames para exibir o resultado do aluno.

importar pandas como pd
Students_Data =
'Nome': ['Samreena', 'Asif', 'Mahwish', 'Raees'],
'Porcentagem': [90,80,70,85]
resultado = pd.DataFrame (Students_Data)
imprimir (resultado)

Métodos para criar DataFrames do Pandas

Os DataFrames do Pandas podem ser criados usando as diferentes maneiras que discutiremos no resto do artigo. Iremos imprimir o resultado dos cursos do Aluno na forma de DataFrames. Portanto, usando um dos métodos a seguir, você pode criar DataFrames semelhantes que são representados na imagem a seguir:

Método # 01: Criando Pandas DataFrame a partir do dicionário de listas

No exemplo a seguir, DataFrames são criados a partir de dicionários de listas relacionadas aos resultados do curso do aluno. Primeiro, importe a biblioteca de um panda e, em seguida, crie um dicionário de listas. As chaves dict representam os nomes das colunas, como 'Student_Name', 'Course_Title' e 'GPA'. As listas representam os dados ou conteúdo da coluna. A variável 'dictionary_lists' contém os dados dos alunos que são posteriormente atribuídos à variável 'df1'. Usando a instrução print, imprima todo o conteúdo de DataFrames.

Exemplo:

# Importar bibliotecas para pandas e numpy
importar pandas como pd
# Importar a biblioteca do panda
importar pandas como pd
# Crie um dicionário de lista
dicionário_listas =
'Student_Name': ['Samreena', 'Raees', 'Sara', 'Sana'],
'Course_Title': ['SQA', 'SRE', 'Fundamentos de TI', 'Inteligência artificial'],
'GPA': [3.1, 3.3, 2.8, 4.0]
# Crie o DataFrame
dframe = pd.DataFrame (dictionary_lists)
imprimir (dframe)

Depois de executar o código acima, a seguinte saída será exibida:

Método # 02: Criar Pandas DataFrame a partir do dicionário da matriz NumPy

O DataFrame pode ser criado a partir do dicionário array / lista. Para este efeito, o comprimento deve ser o mesmo de todos os narrays. Se algum índice for passado, o comprimento do índice deve ser igual ao comprimento do array. Se nenhum índice for passado, então, neste caso, o índice padrão será um intervalo (n). Aqui, n representa o comprimento da matriz.

Exemplo:

importar numpy como np
# Crie uma matriz numpy
nparray = np.variedade(
[['Samreena', 'Raees', 'Sara', 'Sana'],
['SQA', 'SRE', 'Fundamentos de TI', 'Inteligência Artificial'],
[3.1, 3.3, 2.8, 4.0]])
# Crie um dicionário de nparray
dictionary_of_nparray =
'Student_Name': nparray [0],
'Course_Title': nparray [1],
'GPA': nparray [2]
# Crie o DataFrame
dframe = pd.DataFrame (dictionary_of_nparray)
imprimir (dframe)

Método # 03: Criando pandas DataFrame usando a lista de listas

No código a seguir, cada linha representa uma única linha.

Exemplo:

# Importar biblioteca Pandas pd
importar pandas como pd
# Crie uma lista de listas
group_lists = [
['Samreena', 'SQA', 3.1],
['Raees', 'SRE', 3.3],
['Sara', 'Noções básicas de TI', 2.8],
['Sana', 'Inteligência Artificial', 4.0]
# Crie o DataFrame
dframe = pd.DataFrame (group_lists, columns = ['Student_Name', 'Course_Title', 'GPA'])
imprimir (dframe)

Método # 04: Criando pandas DataFrame usando a lista de dicionário

No código a seguir, cada dicionário representa uma única linha e chaves que representam os nomes das colunas.

Exemplo:

# Importar pandas da biblioteca
importar pandas como pd
# Crie uma lista de dicionários
dict_list = [
'Student_Name': 'Samreena', 'Course_Title': 'SQA', 'GPA': 3.1,
'Student_Name': 'Raees', 'Course_Title': 'SRE', 'GPA': 3.3,
'Student_Name': 'Sara', 'Course_Title': 'Noções básicas de TI', 'GPA': 2.8,
'Student_Name': 'Sana', 'Course_Title': 'Inteligência Artificial', 'GPA': 4.0]
# Crie o DataFrame
dframe = pd.DataFrame (dict_list)
imprimir (dframe)

Método # 05: Criando Dataframe de pandas da série dict of pandas

As chaves dict representam os nomes das colunas e cada série representa o conteúdo da coluna. Nas linhas de código a seguir, pegamos três tipos de série: série_nome, série_curso e série_GPA.

Exemplo:

# Importar pandas da biblioteca
importar pandas como pd
# Crie a série de nomes de alunos
Name_series = pd.Série (['Samreena', 'Raees', 'Sara', 'Sana'])
Course_series = pd.Série (['SQA', 'SRE', 'Noções básicas de TI', 'Inteligência artificial'])
GPA_series = pd.Série ([3.1, 3.3, 2.8, 4.0])
# Crie um dicionário da série
dictionary_of_nparray
\
'] = ' Nome ': Nomes série,' Idade ': Curso_série,' Departamento ': GPA_series
# DataFrame creation
dframe = pd.DataFrame (dictionary_of_nparray)
imprimir (dframe)

Método # 06: Crie Pandas DataFrame usando a função zip ().

Listas diferentes podem ser mescladas por meio da função de lista (zip ()). No exemplo a seguir, os pandas DataFrame são criados chamando pd.Função DataFrame (). Três listas diferentes são criadas e mescladas na forma de tuplas.

Exemplo:

importar pandas como pd
# List1
Student_Name = ['Samreena', 'Raees', 'Sara', 'Sana']
# List2
Course_Title = ['SQA', 'SRE', 'Fundamentos de TI', 'Inteligência Artificial']
# List3
GPA = [3.1, 3.3, 2.8, 4.0]
# Leve a lista de tuplas de três listas adiante, mescle-as usando zip ().
tuplas = lista (zip (Student_Name, Course_Title, GPA))
# Atribuir valores de dados a tuplas.
tuplas
# Convertendo a lista de tuplas em pandas Dataframe.
dframe = pd.DataFrame (tuplas, colunas = ['Student_Name', 'Course_Title', 'GPA'])
# Imprimir dados.
imprimir (dframe)

Conclusão

Usando os métodos acima, você pode criar DataFrames Pandas em python. Imprimimos o GPA do curso de um aluno criando DataFrames do Pandas. Esperançosamente, você obterá resultados úteis após executar os exemplos mencionados acima. Todos os programas são bem comentados para melhor compreensão. Se você tiver mais maneiras de criar DataFrames do Pandas, não hesite em compartilhá-los conosco. Obrigado por ler este tutorial.

Vulkan para usuários de Linux
A cada nova geração de placas gráficas, vemos os desenvolvedores de jogos ultrapassarem os limites da fidelidade gráfica e se aproximarem mais do foto...
OpenTTD vs Simutrans
Criar sua própria simulação de transporte pode ser divertido, relaxante e extremamente atraente. É por isso que você precisa ter certeza de experiment...
Tutorial OpenTTD
OpenTTD é um dos jogos de simulação de negócios mais populares que existem. Neste jogo, você precisa criar um maravilhoso negócio de transporte. No en...