Saudações, cientistas de dados!
Com a biblioteca JupySQL podemos executar consultas diretamente no Jupyter Notebook, facilitando a análise de dados utilizando a linguagem SQL.
Neste artigo, vamos explorar como utilizar a biblioteca JupySQL para criar consultas de maneira simples e eficiente.
Instalação:
O JupySQL é compatível com diversos bancos de dados e data warehouses. No nosso exemplo vamos usar o DuckDB.
Instale a biblioteca executando o seguinte comando:
!pip install jupysql duckdb-engine
Importando:
Após a instalação, importe a biblioteca JupySQL em seu Jupyter Notebook:
%load_ext sql
Baixando dados de exemplo:
from pathlib import Path
from urllib.request import urlretrieve
if not Path("penguins.csv").is_file():
urlretrieve(
"https://raw.githubusercontent.com/mwaskom/seaborn-data/master/penguins.csv",
"penguins.csv",
)
Iniciando o banco de dados na memória do DuckDB:
%sql duckdb://
Executando Consultas
Para uma consulta curta e simples, inicie o código com: %sql
%sql SELECT * FROM penguins.csv LIMIT 3
Para consultas mais longas use: %%sql
%%sql
SELECT *
FROM penguins.csv
WHERE bill_length_mm > 40
LIMIT 3
Integrando com o Pandas
resultado = %sql SELECT * FROM penguins.csv
* duckdb://
Done.
df = resultado.DataFrame()
df.head()
Experimente e explore mais recursos dessa biblioteca para aprimorar suas habilidades em SQL e análise de dados.
Referências:
Top comments (0)