DEV Community

Francisco Júnior
Francisco Júnior

Posted on • Edited on

1

Explorando as Funções Básicas no Python Pandas: Manipulação e Análise de Dados Simplificadas

O Python Pandas é uma biblioteca amplamente utilizada para manipulação e análise de dados em Python. Com suas estruturas de dados eficientes, como DataFrames e Series, juntamente com uma variedade de funções e métodos úteis, o Pandas simplifica a tarefa de trabalhar com dados. Neste artigo, vamos explorar algumas das funções básicas no Pandas e fornecer exemplos práticos para ilustrar seu uso.

Instalação e Importação do Pandas

Antes de começarmos, certifique-se de ter o Pandas instalado em seu ambiente Python. Você pode instalá-lo utilizando o seguinte comando:

pip install pandas
Enter fullscreen mode Exit fullscreen mode

Após a instalação, importe o Pandas em seu script Python:

import pandas as pd
Enter fullscreen mode Exit fullscreen mode

Agora, vamos explorar algumas das funções básicas disponíveis no Pandas:

1 - Criando um DataFrame

Podemos criar um DataFrame no Pandas a partir de várias fontes, como listas, dicionários, arquivos CSV, Excel, SQL e muito mais. Aqui está um exemplo simples de criação de um DataFrame a partir de um dicionário:

import pandas as pd

# Criando um DataFrame a partir de um dicionário
data = {'Nome': ['Alice', 'Bob', 'Charlie'],
        'Idade': [25, 30, 35],
        'Cidade': ['São Paulo', 'Rio de Janeiro', 'Curitiba']}

df = pd.DataFrame(data)
print(df)
Enter fullscreen mode Exit fullscreen mode

2 - Exibindo Dados do DataFrame

O Pandas fornece várias funções para exibir os dados de um DataFrame. Aqui estão algumas das funções mais comuns:

  • head(): exibe as primeiras linhas do DataFrame (por padrão, as cinco primeiras linhas).
  • tail(): exibe as últimas linhas do DataFrame (por padrão, as cinco últimas linhas).
  • info(): fornece informações sobre as colunas do DataFrame, como nome, tipo de dados e valores não nulos.
  • describe(): calcula estatísticas descritivas para as colunas numéricas do DataFrame.
# Exibindo as primeiras linhas do DataFrame
print(df.head())

# Exibindo as últimas linhas do DataFrame
print(df.tail())

# Obtendo informações sobre o DataFrame
print(df.info())

# Calculando estatísticas descritivas para colunas numéricas
print(df.describe())
Enter fullscreen mode Exit fullscreen mode

3 - Manipulação de Dados

O Pandas oferece uma variedade de funções para manipular e transformar os dados em um DataFrame. Aqui estão algumas das funções mais comuns:

  • shape: retorna as dimensões do DataFrame (número de linhas e colunas).
  • columns: retorna os nomes das colunas do DataFrame.
  • loc[] e iloc[]: permitem acessar e modificar dados específicos no DataFrame, usando rótulos de índice ou posições numéricas, respectivamente.
  • drop(): remove linhas ou colunas do DataFrame.
  • fillna(): preenche os valores ausentes com um valor específico.
  • groupby(): agrupa os dados com base em uma ou mais colunas.
  • sort_values(): classifica o DataFrame com base em uma ou mais colunas.
# Obtendo as dimensões do DataFrame
print(df.shape)

# Obtendo os nomes das colunas do DataFrame
print(df.columns)

# Acessando e modificando dados específicos no DataFrame
df.loc[1, 'Nome'] = 'Robert'
df.iloc[2, 1] = 36
print(df)

# Removendo uma coluna do DataFrame
df = df.drop('Cidade', axis=1)
print(df)

# Preenchendo valores ausentes com um valor específico
df['Idade'].fillna(0, inplace=True)
print(df)

# Agrupando dados com base em uma coluna
grouped = df.groupby('Idade')
print(grouped.get_group(30))

# Classificando o DataFrame com base em uma coluna
df = df.sort_values('Idade')
print(df)
Enter fullscreen mode Exit fullscreen mode

4 - Leitura e Escrita de Dados

Além de criar um DataFrame a partir de fontes de dados existentes, o Pandas também oferece funções para ler e escrever dados em diferentes formatos, como CSV, Excel, SQL, JSON, HTML e muito mais.

# Lendo dados de um arquivo CSV
data = pd.read_csv('dados.csv')

# Escrevendo dados em um arquivo CSV
df.to_csv('novo_dados.csv', index=False)

# Lendo dados de uma planilha Excel
data = pd.read_excel('dados.xlsx', sheet_name='Planilha1')

# Escrevendo dados em uma planilha Excel
df.to_excel('novo_dados.xlsx', sheet_name='Planilha1', index=False)

# Lendo dados de um banco de dados SQL
import sqlite3
conn = sqlite3.connect('database.db')
data = pd.read_sql('SELECT * FROM tabela', conn)

# Escrevendo dados em um banco de dados SQL
df.to_sql('tabela', conn, if_exists='replace', index=False)
Enter fullscreen mode Exit fullscreen mode

5 - Alterações no DataFrame

Explorando as Possibilidades de Alterações no DataFrame no Python Pandas

O Python Pandas é uma biblioteca poderosa para manipulação e análise de dados em Python. Além de oferecer funções básicas para criação e manipulação de DataFrames, o Pandas também fornece uma variedade de recursos para realizar alterações nos dados existentes. Neste artigo, vamos explorar algumas das possibilidades de alterações no DataFrame no Pandas e fornecer exemplos práticos para ilustrar seu uso.

5.1 - Renomeando Colunas

Podemos renomear as colunas de um DataFrame no Pandas usando o método rename(). Vamos ver um exemplo:

import pandas as pd

# Criando um DataFrame
data = {'Nome': ['Alice', 'Bob', 'Charlie'],
        'Idade': [25, 30, 35],
        'Cidade': ['São Paulo', 'Rio de Janeiro', 'Curitiba']}
df = pd.DataFrame(data)

# Renomeando colunas
df.rename(columns={'Nome': 'Nome Completo', 'Cidade': 'Localização'}, inplace=True)
print(df)
Enter fullscreen mode Exit fullscreen mode

5.2 - Adicionando Colunas

Podemos adicionar colunas a um DataFrame existente no Pandas atribuindo um valor a uma nova coluna. Vamos ver um exemplo:

import pandas as pd

# Criando um DataFrame
data = {'Nome': ['Alice', 'Bob', 'Charlie'],
        'Idade': [25, 30, 35]}
df = pd.DataFrame(data)

# Adicionando uma nova coluna
df['Profissão'] = ['Engenheira', 'Desenvolvedor', 'Analista']
print(df)
Enter fullscreen mode Exit fullscreen mode

5.3 - Removendo Colunas

Podemos remover colunas de um DataFrame no Pandas usando o método drop(). Vamos ver um exemplo:

import pandas as pd

# Criando um DataFrame
data = {'Nome': ['Alice', 'Bob', 'Charlie'],
        'Idade': [25, 30, 35],
        'Cidade': ['São Paulo', 'Rio de Janeiro', 'Curitiba']}
df = pd.DataFrame(data)

# Removendo uma coluna
df = df.drop('Cidade', axis=1)
print(df)
Enter fullscreen mode Exit fullscreen mode

5.4 - Filtrando Linhas

Podemos filtrar linhas de um DataFrame com base em uma condição usando operadores lógicos e comparativos no Pandas. Vamos ver um exemplo:

import pandas as pd

# Criando um DataFrame
data = {'Nome': ['Alice', 'Bob', 'Charlie'],
        'Idade': [25, 30, 35]}
df = pd.DataFrame(data)

# Filtrando linhas com base em uma condição
filtro = df['Idade'] > 28
df_filtrado = df[filtro]
print(df_filtrado)
Enter fullscreen mode Exit fullscreen mode

5.5 - Alterando Valores

Podemos alterar valores em um DataFrame com base em uma condição usando operadores lógicos e comparativos no Pandas. Vamos ver um exemplo:

import pandas as pd

# Criando um DataFrame
data = {'Nome': ['Alice', 'Bob', 'Charlie'],
        'Idade': [25, 30, 35]}
df = pd.DataFrame(data)

# Alterando valores com base em uma condição
df.loc[df['Idade'] > 28, 'Idade'] = 40
print(df)
Enter fullscreen mode Exit fullscreen mode

5.6 - Ordenando o DataFrame

Podemos ordenar um DataFrame com base em uma ou mais colunas usando o método sort_values() no Pandas. Vamos ver um exemplo:

import pandas as pd

# Criando um DataFrame
data = {'Nome': ['Alice', 'Bob', 'Charlie'],
        'Idade': [25, 30, 35]}
df = pd.DataFrame(data)

# Ordenando o DataFrame com base em uma coluna
df = df.sort_values('Idade')
print(df)
Enter fullscreen mode Exit fullscreen mode

O Python Pandas é uma biblioteca poderosa para manipulação e análise de dados em Python. Neste artigo, exploramos algumas das funções básicas disponíveis no Pandas, incluindo criação de DataFrame, exibição de dados, manipulação de dados e leitura/escrita de dados. Com esses exemplos, você está pronto para começar a explorar e aproveitar ao máximo o Pandas em suas tarefas de análise de dados. Lembre-se de consultar a documentação oficial do Pandas para obter mais detalhes e recursos avançados.

Sentry image

See why 4M developers consider Sentry, “not bad.”

Fixing code doesn’t have to be the worst part of your day. Learn how Sentry can help.

Learn more

Top comments (0)

Billboard image

Create up to 10 Postgres Databases on Neon's free plan.

If you're starting a new project, Neon has got your databases covered. No credit cards. No trials. No getting in your way.

Try Neon for Free →

👋 Kindness is contagious

Please leave a ❤️ or a friendly comment on this post if you found it helpful!

Okay