O Python Pandas é uma biblioteca amplamente utilizada para manipulação e análise de dados em Python. Com suas estruturas de dados eficientes, como DataFrames e Series, juntamente com uma variedade de funções e métodos úteis, o Pandas simplifica a tarefa de trabalhar com dados. Neste artigo, vamos explorar algumas das funções básicas no Pandas e fornecer exemplos práticos para ilustrar seu uso.
Instalação e Importação do Pandas
Antes de começarmos, certifique-se de ter o Pandas instalado em seu ambiente Python. Você pode instalá-lo utilizando o seguinte comando:
pip install pandas
Após a instalação, importe o Pandas em seu script Python:
import pandas as pd
Agora, vamos explorar algumas das funções básicas disponíveis no Pandas:
1 - Criando um DataFrame
Podemos criar um DataFrame no Pandas a partir de várias fontes, como listas, dicionários, arquivos CSV, Excel, SQL e muito mais. Aqui está um exemplo simples de criação de um DataFrame a partir de um dicionário:
import pandas as pd
# Criando um DataFrame a partir de um dicionário
data = {'Nome': ['Alice', 'Bob', 'Charlie'],
'Idade': [25, 30, 35],
'Cidade': ['São Paulo', 'Rio de Janeiro', 'Curitiba']}
df = pd.DataFrame(data)
print(df)
2 - Exibindo Dados do DataFrame
O Pandas fornece várias funções para exibir os dados de um DataFrame. Aqui estão algumas das funções mais comuns:
-
head()
: exibe as primeiras linhas do DataFrame (por padrão, as cinco primeiras linhas). -
tail()
: exibe as últimas linhas do DataFrame (por padrão, as cinco últimas linhas). -
info()
: fornece informações sobre as colunas do DataFrame, como nome, tipo de dados e valores não nulos. -
describe()
: calcula estatísticas descritivas para as colunas numéricas do DataFrame.
# Exibindo as primeiras linhas do DataFrame
print(df.head())
# Exibindo as últimas linhas do DataFrame
print(df.tail())
# Obtendo informações sobre o DataFrame
print(df.info())
# Calculando estatísticas descritivas para colunas numéricas
print(df.describe())
3 - Manipulação de Dados
O Pandas oferece uma variedade de funções para manipular e transformar os dados em um DataFrame. Aqui estão algumas das funções mais comuns:
-
shape
: retorna as dimensões do DataFrame (número de linhas e colunas). -
columns
: retorna os nomes das colunas do DataFrame. -
loc[]
eiloc[]
: permitem acessar e modificar dados específicos no DataFrame, usando rótulos de índice ou posições numéricas, respectivamente. -
drop()
: remove linhas ou colunas do DataFrame. -
fillna()
: preenche os valores ausentes com um valor específico. -
groupby()
: agrupa os dados com base em uma ou mais colunas. -
sort_values()
: classifica o DataFrame com base em uma ou mais colunas.
# Obtendo as dimensões do DataFrame
print(df.shape)
# Obtendo os nomes das colunas do DataFrame
print(df.columns)
# Acessando e modificando dados específicos no DataFrame
df.loc[1, 'Nome'] = 'Robert'
df.iloc[2, 1] = 36
print(df)
# Removendo uma coluna do DataFrame
df = df.drop('Cidade', axis=1)
print(df)
# Preenchendo valores ausentes com um valor específico
df['Idade'].fillna(0, inplace=True)
print(df)
# Agrupando dados com base em uma coluna
grouped = df.groupby('Idade')
print(grouped.get_group(30))
# Classificando o DataFrame com base em uma coluna
df = df.sort_values('Idade')
print(df)
4 - Leitura e Escrita de Dados
Além de criar um DataFrame a partir de fontes de dados existentes, o Pandas também oferece funções para ler e escrever dados em diferentes formatos, como CSV, Excel, SQL, JSON, HTML e muito mais.
# Lendo dados de um arquivo CSV
data = pd.read_csv('dados.csv')
# Escrevendo dados em um arquivo CSV
df.to_csv('novo_dados.csv', index=False)
# Lendo dados de uma planilha Excel
data = pd.read_excel('dados.xlsx', sheet_name='Planilha1')
# Escrevendo dados em uma planilha Excel
df.to_excel('novo_dados.xlsx', sheet_name='Planilha1', index=False)
# Lendo dados de um banco de dados SQL
import sqlite3
conn = sqlite3.connect('database.db')
data = pd.read_sql('SELECT * FROM tabela', conn)
# Escrevendo dados em um banco de dados SQL
df.to_sql('tabela', conn, if_exists='replace', index=False)
5 - Alterações no DataFrame
Explorando as Possibilidades de Alterações no DataFrame no Python Pandas
O Python Pandas é uma biblioteca poderosa para manipulação e análise de dados em Python. Além de oferecer funções básicas para criação e manipulação de DataFrames, o Pandas também fornece uma variedade de recursos para realizar alterações nos dados existentes. Neste artigo, vamos explorar algumas das possibilidades de alterações no DataFrame no Pandas e fornecer exemplos práticos para ilustrar seu uso.
5.1 - Renomeando Colunas
Podemos renomear as colunas de um DataFrame no Pandas usando o método rename()
. Vamos ver um exemplo:
import pandas as pd
# Criando um DataFrame
data = {'Nome': ['Alice', 'Bob', 'Charlie'],
'Idade': [25, 30, 35],
'Cidade': ['São Paulo', 'Rio de Janeiro', 'Curitiba']}
df = pd.DataFrame(data)
# Renomeando colunas
df.rename(columns={'Nome': 'Nome Completo', 'Cidade': 'Localização'}, inplace=True)
print(df)
5.2 - Adicionando Colunas
Podemos adicionar colunas a um DataFrame existente no Pandas atribuindo um valor a uma nova coluna. Vamos ver um exemplo:
import pandas as pd
# Criando um DataFrame
data = {'Nome': ['Alice', 'Bob', 'Charlie'],
'Idade': [25, 30, 35]}
df = pd.DataFrame(data)
# Adicionando uma nova coluna
df['Profissão'] = ['Engenheira', 'Desenvolvedor', 'Analista']
print(df)
5.3 - Removendo Colunas
Podemos remover colunas de um DataFrame no Pandas usando o método drop()
. Vamos ver um exemplo:
import pandas as pd
# Criando um DataFrame
data = {'Nome': ['Alice', 'Bob', 'Charlie'],
'Idade': [25, 30, 35],
'Cidade': ['São Paulo', 'Rio de Janeiro', 'Curitiba']}
df = pd.DataFrame(data)
# Removendo uma coluna
df = df.drop('Cidade', axis=1)
print(df)
5.4 - Filtrando Linhas
Podemos filtrar linhas de um DataFrame com base em uma condição usando operadores lógicos e comparativos no Pandas. Vamos ver um exemplo:
import pandas as pd
# Criando um DataFrame
data = {'Nome': ['Alice', 'Bob', 'Charlie'],
'Idade': [25, 30, 35]}
df = pd.DataFrame(data)
# Filtrando linhas com base em uma condição
filtro = df['Idade'] > 28
df_filtrado = df[filtro]
print(df_filtrado)
5.5 - Alterando Valores
Podemos alterar valores em um DataFrame com base em uma condição usando operadores lógicos e comparativos no Pandas. Vamos ver um exemplo:
import pandas as pd
# Criando um DataFrame
data = {'Nome': ['Alice', 'Bob', 'Charlie'],
'Idade': [25, 30, 35]}
df = pd.DataFrame(data)
# Alterando valores com base em uma condição
df.loc[df['Idade'] > 28, 'Idade'] = 40
print(df)
5.6 - Ordenando o DataFrame
Podemos ordenar um DataFrame com base em uma ou mais colunas usando o método sort_values()
no Pandas. Vamos ver um exemplo:
import pandas as pd
# Criando um DataFrame
data = {'Nome': ['Alice', 'Bob', 'Charlie'],
'Idade': [25, 30, 35]}
df = pd.DataFrame(data)
# Ordenando o DataFrame com base em uma coluna
df = df.sort_values('Idade')
print(df)
O Python Pandas é uma biblioteca poderosa para manipulação e análise de dados em Python. Neste artigo, exploramos algumas das funções básicas disponíveis no Pandas, incluindo criação de DataFrame, exibição de dados, manipulação de dados e leitura/escrita de dados. Com esses exemplos, você está pronto para começar a explorar e aproveitar ao máximo o Pandas em suas tarefas de análise de dados. Lembre-se de consultar a documentação oficial do Pandas para obter mais detalhes e recursos avançados.
Top comments (0)