DEV Community

Rafaela Carvalho
Rafaela Carvalho

Posted on

Criando consultas SQL no Jupyter Notebook

Saudações, cientistas de dados!

Com a biblioteca JupySQL podemos executar consultas diretamente no Jupyter Notebook, facilitando a análise de dados utilizando a linguagem SQL.

Neste artigo, vamos explorar como utilizar a biblioteca JupySQL para criar consultas de maneira simples e eficiente.

Instalação:

O JupySQL é compatível com diversos bancos de dados e data warehouses. No nosso exemplo vamos usar o DuckDB.

Instale a biblioteca executando o seguinte comando:

!pip install jupysql duckdb-engine
Enter fullscreen mode Exit fullscreen mode

Importando:

Após a instalação, importe a biblioteca JupySQL em seu Jupyter Notebook:

%load_ext sql
Enter fullscreen mode Exit fullscreen mode

Baixando dados de exemplo:

from pathlib import Path
from urllib.request import urlretrieve

if not Path("penguins.csv").is_file():
    urlretrieve(
        "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/penguins.csv",
        "penguins.csv",
    )
Enter fullscreen mode Exit fullscreen mode

Iniciando o banco de dados na memória do DuckDB:

%sql duckdb://
Enter fullscreen mode Exit fullscreen mode

Executando Consultas

Para uma consulta curta e simples, inicie o código com: %sql

%sql SELECT * FROM penguins.csv LIMIT 3
Enter fullscreen mode Exit fullscreen mode

Para consultas mais longas use: %%sql

%%sql
SELECT *
FROM penguins.csv
WHERE bill_length_mm > 40
LIMIT 3
Enter fullscreen mode Exit fullscreen mode

Integrando com o Pandas

resultado = %sql SELECT * FROM penguins.csv
Enter fullscreen mode Exit fullscreen mode
*  duckdb://
Done.
Enter fullscreen mode Exit fullscreen mode
df = resultado.DataFrame()
Enter fullscreen mode Exit fullscreen mode
df.head()
Enter fullscreen mode Exit fullscreen mode

Experimente e explore mais recursos dessa biblioteca para aprimorar suas habilidades em SQL e análise de dados.

Referências:

Top comments (0)