DEV Community

Daniel Capelari
Daniel Capelari

Posted on

Pipeline de Dados com Python e DuckDB

Pipeline de dados eficientes resolvem um problema central.

Por que DuckDB

DuckDB roda embutido no Python sem infraestrutura adicional.

import duckdb
conn = duckdb.connect()
conn.execute("CREATE TABLE v AS SELECT * FROM read_csv_auto(\"data.csv\")")
Enter fullscreen mode Exit fullscreen mode

Na pratica

  1. pip install duckdb
  2. Conecte ao CSV
  3. Rode queries SQL

Hoje: abra um CSV real e rode uma query.

Top comments (0)