DEV Community

Francisco Júnior
Francisco Júnior

Posted on • Edited on

3

Detalhando os Diferentes Tipos de Leitura e suas parâmetros Função `read()` no Pandas

O Pandas é uma biblioteca Python amplamente utilizada para manipulação e análise de dados. Uma das funções essenciais oferecidas pelo Pandas é a read(), que permite carregar dados de várias fontes em estruturas de dados como DataFrames. Neste artigo, iremos explorar os diferentes tipos de leitura fornecidos pela função read() e discutiremos seus argumentos específicos, acompanhados por exemplos práticos.

Tipos de Leitura e Seus Argumentos

1. Leitura de Arquivos CSV

A leitura de arquivos CSV é uma das tarefas mais comuns na análise de dados. O Pandas oferece a função read_csv() para essa finalidade. Alguns argumentos importantes são:

  • filepath: O caminho para o arquivo CSV.
  • sep ou delimiter: O caractere usado como delimitador entre os campos.
  • header: A linha a ser usada como cabeçalho das colunas.
  • index_col: A coluna que será utilizada como índice do DataFrame.
  • usecols: Lista de colunas a serem selecionadas para leitura.
  • skiprows: Número de linhas a serem puladas no início do arquivo.
  • nrows: Número máximo de linhas a serem lidas do arquivo.

Exemplo de Leitura de Arquivo CSV:

import pandas as pd

dados_csv = pd.read_csv('dados.csv', sep=',', header=0, index_col='ID', usecols=['ID', 'Nome'], skiprows=3, nrows=10)
print(dados_csv)
Enter fullscreen mode Exit fullscreen mode

2. Leitura de Arquivos Excel

Para ler dados de planilhas Excel, o Pandas disponibiliza a função read_excel(). Argumentos-chave incluem:

  • io: O caminho para o arquivo Excel.
  • sheet_name: O nome da planilha a ser lida.
  • header: A linha a ser usada como cabeçalho das colunas.
  • index_col: A coluna que será utilizada como índice do DataFrame.
  • usecols: Lista de colunas a serem selecionadas para leitura.
  • skiprows: Número de linhas a serem puladas no início do arquivo.
  • nrows: Número máximo de linhas a serem lidas da planilha.

Exemplo de Leitura de Arquivo Excel:

import pandas as pd

dados_excel = pd.read_excel('dados.xlsx', sheet_name='Planilha1', header=0, index_col='ID', usecols=['ID', 'Nome'], skiprows=2, nrows=5)
print(dados_excel)
Enter fullscreen mode Exit fullscreen mode

3. Leitura de Dados SQL

Para obter dados de bancos de dados SQL, a função read_sql() é fundamental. Argumentos importantes incluem:

  • sql: A consulta SQL a ser executada.
  • con: A conexão ao banco de dados.
  • index_col: A coluna que será usada como índice do DataFrame.
  • params: Dicionário de parâmetros para a consulta SQL.

Exemplo de Leitura de Dados SQL:

import pandas as pd
from sqlalchemy import create_engine

conexao = create_engine('sqlite:///banco.db')
consulta = "SELECT * FROM tabela WHERE idade > :idade"
parametros = {'idade': 25}
dados_sql = pd.read_sql(consulta, conexao, index_col='ID', params=parametros)
print(dados_sql.head())
Enter fullscreen mode Exit fullscreen mode

Conclusão

A função read() no Pandas oferece uma gama diversificada de opções para carregar dados de várias fontes em DataFrames. Ao compreender os argumentos específicos de cada tipo de leitura, você pode personalizar a maneira como os dados são carregados e tratados. A versatilidade do Pandas em lidar com diferentes formatos de dados faz dele uma ferramenta essencial para a análise de dados em Python. Lembre-se de consultar a documentação oficial do Pandas para obter mais detalhes sobre os argumentos e funcionalidades avançadas de cada função de leitura.

Image of Timescale

🚀 pgai Vectorizer: SQLAlchemy and LiteLLM Make Vector Search Simple

We built pgai Vectorizer to simplify embedding management for AI applications—without needing a separate database or complex infrastructure. Since launch, developers have created over 3,000 vectorizers on Timescale Cloud, with many more self-hosted.

Read full post →

Top comments (0)

Image of Docusign

🛠️ Bring your solution into Docusign. Reach over 1.6M customers.

Docusign is now extensible. Overcome challenges with disconnected products and inaccessible data by bringing your solutions into Docusign and publishing to 1.6M customers in the App Center.

Learn more