<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Crislane A. Souza</title>
    <description>The latest articles on DEV Community by Crislane A. Souza (@crislane).</description>
    <link>https://dev.to/crislane</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F476314%2F85170fd0-63ab-4841-9104-6d67dd38c817.jpg</url>
      <title>DEV Community: Crislane A. Souza</title>
      <link>https://dev.to/crislane</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/crislane"/>
    <language>en</language>
    <item>
      <title>Entenda como nossa base de Diretórios Brasileiros facilita sua vida</title>
      <dc:creator>Crislane A. Souza</dc:creator>
      <pubDate>Mon, 16 Aug 2021 14:14:34 +0000</pubDate>
      <link>https://dev.to/basedosdados/entenda-como-nossa-base-de-diretorios-brasileiros-facilita-sua-vida-27ji</link>
      <guid>https://dev.to/basedosdados/entenda-como-nossa-base-de-diretorios-brasileiros-facilita-sua-vida-27ji</guid>
      <description>&lt;h2&gt;
  
  
  TL;DR
&lt;/h2&gt;

&lt;p&gt;Neste artigo vamos apresentar nossa base de &lt;a href="https://basedosdados.org/dataset/br-bd-diretorios-brasil"&gt;Diretórios Brasileiros&lt;/a&gt;, que está disponível no nosso datalake público (a BD+), onde disponibilizamos diversas bases de dados públicas já tratadas, organizadas e integradas para análise. Também vamos demonstrar como essa base facilita o cruzamento entre tabelas de diferentes conjuntos de dados e como você pode aplicá-la em sua análise. &lt;/p&gt;

&lt;h1&gt;
  
  
  A Base de Diretórios Brasileiros
&lt;/h1&gt;

&lt;p&gt;Essa base é uma referência de centralização de informações de unidades básicas para análises e funciona como um perfil completo de entidades como município, escola, UF, setores censitários e mais. São tabelas que ligam diversos códigos institucionais e informações de diferentes entidades brasileiras. &lt;/p&gt;

&lt;p&gt;Isso é importante porque resolve o problema de não existir um identificador único para municípios entre as instituições brasileiras, resolve a mudança de IDs e nomes com typos entre anos e instituições, além de IDs novos de municípios que são criados ao longo do tempo. &lt;/p&gt;

&lt;p&gt;Por exemplo, para municípios, essa base liga conjuntos de organizações como IBGE, Receita Federal, Tribunal Superior Eleitoral (TSE), Banco Central do Brasil, comarcas, região de saúde, etc. &lt;/p&gt;

&lt;p&gt;Cada tabela dessa base representa uma entidade do nosso datalake público, como &lt;code&gt;UF&lt;/code&gt;, &lt;code&gt;municipio&lt;/code&gt;, &lt;code&gt;escola&lt;/code&gt;, &lt;code&gt;distrito&lt;/code&gt;, &lt;code&gt;setor_censitario&lt;/code&gt;, categorias &lt;code&gt;CID-10&lt;/code&gt; e &lt;code&gt;CID-9&lt;/code&gt;, &lt;code&gt;CBO-2002&lt;/code&gt; e &lt;code&gt;CBO-1992&lt;/code&gt;, dentre outras.&lt;/p&gt;

&lt;p&gt;Os diretórios criam naturalmente relações entre as diferentes entidades. Por exemplo, a tabela município possui uma coluna &lt;code&gt;sigla_uf&lt;/code&gt;, ou seja, nela identificamos a qual &lt;code&gt;UF&lt;/code&gt; o município pertence. O mesmo vale para &lt;code&gt;escola&lt;/code&gt;, podemos identificar em qual município determinada escola está localizada. &lt;/p&gt;

&lt;p&gt;Para exemplificar como a base de Diretórios Brasileiros facilita o cruzamento de diferentes conjuntos, preparamos os seguintes exemplos de aplicações que demonstram como você pode lançar mão dessa ferramenta em suas análises, apenas com uma query de SQL no BigQuery. &lt;/p&gt;

&lt;h1&gt;
  
  
  Exemplo de aplicação
&lt;/h1&gt;

&lt;ul&gt;
&lt;li&gt;Indicadores de Mobilidade e Transportes&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;No primeiro exemplo, cruzamos a tabela &lt;code&gt;municipio&lt;/code&gt; da base de Diretórios Brasileiros com a tabela  &lt;code&gt;tempo_deslocamento_casa_trabalho&lt;/code&gt;, da base de &lt;a href="https://basedosdados.org/dataset/br-mobilidados-indicadores"&gt;Indicadores de Mobilidade e Transporte&lt;/a&gt; da &lt;a href="https://mobilidados.org.br/"&gt;Mobilidados&lt;/a&gt;, que contém dados sobre tempo médio de deslocamento casa-trabalho, assim como de percentual de pessoas que gastam mais de uma hora neste deslocamento no ano de 2010. &lt;/p&gt;

&lt;p&gt;Para isso, usamos como chave primária a coluna &lt;code&gt;id_municipio&lt;/code&gt;. O objetivo é adicionar as colunas &lt;strong&gt;regiao&lt;/strong&gt; e &lt;strong&gt;municipio&lt;/strong&gt; no novo conjunto de dados. Assim, além de saber o nome dos municípios, também é possível fazer o agrupamento por cidade, grande região ou por estado e ver qual destes têm o tempo médio de deslocamento maior ou menor. &lt;/p&gt;

&lt;p&gt;Confira abaixo a Query utilizada:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;WITH deslocamento_casa_trabalho as
(SELECT ano, id_municipio, tempo_medio_deslocamento
FROM `basedosdados.br_mobilidados_indicadores.tempo_deslocamento_casa_trabalho`)
SELECT t1.id_municipio, regiao, nome as municipio, sigla_uf, tempo_medio_deslocamento
FROM deslocamento_casa_trabalho t1
JOIN `basedosdados.br_bd_diretorios_brasil.municipio` t2
ON t1.id_municipio = t2.id_municipio
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;ul&gt;
&lt;li&gt;Dados de importações e exportações brasileiras&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;No segundo exemplo, usamos a tabela &lt;code&gt;pais&lt;/code&gt; da base de Diretórios, com a tabela  &lt;code&gt;municipio_importacao&lt;/code&gt; da base &lt;a href="https://basedosdados.org/dataset/br-me-comex-stat"&gt;Comex Stat&lt;/a&gt;, que contém dados detalhados das exportações e importações brasileiras, extraídas do &lt;a href="http://www.siscomex.gov.br/"&gt;SISCOMEX&lt;/a&gt;. Esta tabela específica aborda dados de importação, detalhados por município e empresa importadora.  &lt;/p&gt;

&lt;p&gt;Neste exemplo, usamos como chave primária a coluna &lt;code&gt;id_pais&lt;/code&gt; para extrair da base de Diretórios o &lt;strong&gt;nome&lt;/strong&gt; do país. &lt;br&gt;
Ao rodar query, teremos como resultado, além do &lt;strong&gt;ID do País&lt;/strong&gt; e &lt;strong&gt;Valor da Importação&lt;/strong&gt;,  o &lt;strong&gt;nome do país&lt;/strong&gt;, ou seja, os destinos das importações do Brasil no ano de 2020.&lt;/p&gt;

&lt;p&gt;Você pode utilizar a query abaixo para acessar o destino das importações do Brasil no ano de 2020:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;WITH importacao as 
(SELECT ano, id_pais, sigla_uf, SUM(valor_fob_dolar) AS importacao
FROM `basedosdados-dev.br_me_comex_stat.municipio_importacao` 
WHERE ano = 2020
GROUP BY ano, sigla_uf, id_pais
ORDER BY importacao DESC)
SELECT t1.ano, t1.id_pais, nome, importacao, sigla_uf
FROM importacao t1
JOIN `basedosdados-dev.br_bd_diretorios_brasil.pais` t2 
ON t1.id_pais = t2.id_pais
GROUP BY ano, sigla_uf, nome, id_pais, importacao
ORDER BY importacao DESC

```



Vale lembrar que o cruzamento entre bases não é realizável apenas porque a base de Diretórios funciona como uma espécie de dicionário. Além deste fator, existe o **padrão de qualidade da Base dos Dados**, ou seja, nós compatibilizamos todos os dados para que possam ser cruzados entre tabelas. A limpeza das bases disponíveis em nosso datalake público envolve um rigoroso processo de padronização e compatibilização de dados. 

Ficou com alguma dúvida sobre nossa base de Diretórios Brasileiros, ou como aplicá-la? Deixe seu comentário ou procure algum de nossos assistentes de dados no canal *#dados* em nossa [comunidade do Discord](https://discord.com/invite/huKWpsVYx4). 

A Base dos Dados é uma iniciativa sem fins lucrativos e nossa equipe trabalha sempre para facilitar seu trabalho ou pesquisa. Nós criamos nosso datalake público e padrão de dados para que *a distância entre você e sua análise seja apenas uma boa pergunta*. Que tal nos ajudar nessa empreitada? Você pode apoiar a BD mensalmente por [aqui](https://apoia.se/basedosdados) ou via PIX com nossa chave CNPJ 42494318000116. Seu apoio nos ajuda a chegar mais perto da nossa missão de universalizar o acesso a dados de qualidade no Brasil!
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;

</description>
      <category>database</category>
      <category>datascience</category>
      <category>sql</category>
      <category>braziliandevs</category>
    </item>
  </channel>
</rss>
