Detalhando os Diferentes Tipos de Leitura e suas parâmetros Função `read()` no Pandas

#python #programming #pandas #read

O Pandas é uma biblioteca Python amplamente utilizada para manipulação e análise de dados. Uma das funções essenciais oferecidas pelo Pandas é a read(), que permite carregar dados de várias fontes em estruturas de dados como DataFrames. Neste artigo, iremos explorar os diferentes tipos de leitura fornecidos pela função read() e discutiremos seus argumentos específicos, acompanhados por exemplos práticos.

Tipos de Leitura e Seus Argumentos

1. Leitura de Arquivos CSV

A leitura de arquivos CSV é uma das tarefas mais comuns na análise de dados. O Pandas oferece a função read_csv() para essa finalidade. Alguns argumentos importantes são:

filepath: O caminho para o arquivo CSV.
sep ou delimiter: O caractere usado como delimitador entre os campos.
header: A linha a ser usada como cabeçalho das colunas.
index_col: A coluna que será utilizada como índice do DataFrame.
usecols: Lista de colunas a serem selecionadas para leitura.
skiprows: Número de linhas a serem puladas no início do arquivo.
nrows: Número máximo de linhas a serem lidas do arquivo.

Exemplo de Leitura de Arquivo CSV:

import pandas as pd

dados_csv = pd.read_csv('dados.csv', sep=',', header=0, index_col='ID', usecols=['ID', 'Nome'], skiprows=3, nrows=10)
print(dados_csv)

2. Leitura de Arquivos Excel

Para ler dados de planilhas Excel, o Pandas disponibiliza a função read_excel(). Argumentos-chave incluem:

io: O caminho para o arquivo Excel.
sheet_name: O nome da planilha a ser lida.
header: A linha a ser usada como cabeçalho das colunas.
index_col: A coluna que será utilizada como índice do DataFrame.
usecols: Lista de colunas a serem selecionadas para leitura.
skiprows: Número de linhas a serem puladas no início do arquivo.
nrows: Número máximo de linhas a serem lidas da planilha.

Exemplo de Leitura de Arquivo Excel:

import pandas as pd

dados_excel = pd.read_excel('dados.xlsx', sheet_name='Planilha1', header=0, index_col='ID', usecols=['ID', 'Nome'], skiprows=2, nrows=5)
print(dados_excel)

3. Leitura de Dados SQL

Para obter dados de bancos de dados SQL, a função read_sql() é fundamental. Argumentos importantes incluem:

sql: A consulta SQL a ser executada.
con: A conexão ao banco de dados.
index_col: A coluna que será usada como índice do DataFrame.
params: Dicionário de parâmetros para a consulta SQL.

Exemplo de Leitura de Dados SQL:

import pandas as pd
from sqlalchemy import create_engine

conexao = create_engine('sqlite:///banco.db')
consulta = "SELECT * FROM tabela WHERE idade > :idade"
parametros = {'idade': 25}
dados_sql = pd.read_sql(consulta, conexao, index_col='ID', params=parametros)
print(dados_sql.head())

Conclusão

A função read() no Pandas oferece uma gama diversificada de opções para carregar dados de várias fontes em DataFrames. Ao compreender os argumentos específicos de cada tipo de leitura, você pode personalizar a maneira como os dados são carregados e tratados. A versatilidade do Pandas em lidar com diferentes formatos de dados faz dele uma ferramenta essencial para a análise de dados em Python. Lembre-se de consultar a documentação oficial do Pandas para obter mais detalhes sobre os argumentos e funcionalidades avançadas de cada função de leitura.