Neste tutorial, vamos explorar algumas técnicas básicas de tratamento de dados utilizando a biblioteca pandas no Python.
Abordaremos tópicos como inclusão e exclusão de colunas, renomeação e ordenação de colunas, ajuste dos valores para letras maiúsculas e minúsculas.
Importando o pandas
Não esqueça de importar o pandas para executar os nossos exemplos:
import pandas as pd
Adicionando novas colunas
Podemos incluir uma nova coluna utilizando diferentes tipos de dados, inclusive fatores lógicos.
Por exemplo, vamos adicionar uma coluna chamada ‘aprovado’ que indica se um aluno foi aprovado ou não com base em sua nota. Suponha que a nota de aprovação seja 7.
df['nota'] = [8, 6, 7, 9, 5]
df['aprovado'] = df['nota'] >= 7
Neste exemplo, a nova coluna ‘aprovado’ terá o valor True para as notas maiores ou iguais a 7 e False para as notas menores que 7.
Excluindo colunas
Para excluir uma coluna, utilizamos o método drop(). O parâmetro axis=1 indica que queremos excluir uma coluna (e não uma linha).
df = df.drop('coluna_indesejada', axis=1)
Renomeando colunas
Podemos renomear colunas utilizando o método rename().
df = df.rename(columns={'coluna_antiga': 'coluna_nova'})
Ajustando as letras para maiúsculas ou minúsculas
Para converter todos os valores de uma coluna para letras maiúsculas, utilizamos o método str.upper().
df['coluna'] = df['coluna'].str.upper()
Para converter para letras minúsculas, utilizamos o método str.lower().
df['coluna'] = df['coluna'].str.lower()
Ordenando colunas
Para mover uma coluna para o início do Dataframe, podemos utilizar a seguinte sintaxe:
df = df[['coluna_movida'] + [coluna for coluna in df.columns if coluna != 'coluna_movida']]
Essa sintaxe cria uma nova ordem para as colunas, colocando ‘coluna_movida’ no início e mantendo a ordem original das demais colunas.
Para mover uma coluna para o fim, podemos usar a seguinte sintaxe:
df = df[[coluna for coluna in df.columns if coluna != 'coluna_movida'] + ['coluna_movida']]
Conclusão
Neste tutorial, aprendemos algumas técnicas básicas de tratamento de dados no Python. Aproveite para explorar esses conceitos nos seus projetos.
Top comments (0)