DEV Community

Cover image for Curtas sobre a DP-900: Conceitos básicos de dados | Parte 1
Mateus Lemos
Mateus Lemos

Posted on • Updated on

Curtas sobre a DP-900: Conceitos básicos de dados | Parte 1

Fala galera, beleza?

Dando continuidade nos assuntos da DP-900, nesse segundo artigo da série, trago mais informações a respeito do conteúdo dessa certificação, então, a série de hoje vai abordar sobre a parte de conceitos básicos de dados. Então pega um café, pega um dado e se prepare para o jogo, digo, para a leitura do artigo 😂.

Nesse artigo vou falar um pouco sobre dados, os tipos de dados e os armazenamentos que podemos usar, dando destaque aos serviços proporcionados pelo Azure, por enquanto, é a primeira parte desse assunto. A ideia é que ao final desse artigo você consiga compreender:

  • O que é dados (joga o dado, com certeza saiu para avançar para a próxima casa, prossiga 😂);
  • Quais são os tipos de dados?
  • Quais são os armazenamentos por tipo de dados, e qual serviço o Azure oferece?

Quando vamos ler um texto dessa temática, uma das primeiras coisas que vemos são os autores falando sobre o volume de dados que tem sido criados nessa última década, não precisamos nem ir tão longe e tentar imaginar, por exemplo, sensores que estejam nesse momento gerando dados em larga escala para dispositivos de IOT de forma diversa.

Podemos olhar para as redes sociais, por exemplo, como o Facebook, Instagram, Linkedin, Twitter e entre outros. Só por ai, podemos imaginar o volume de dados produzidos, várias pessoas postando textos, vídeos, imagens, e podemos também nos perguntar como esses dados são tratados e armazenados.

Para vocês que são novos no assunto, esses dados gerados não ficam soltos de forma aleatória, nem vão parar tudo num HDzão e pá, "tá lá de boa". Dependendo do tipo, esses dados serão "salvos" em algum tipo de armazenamento, que você vai ver mais para frente nesse artigo. E o que vai variar, além da questão tecnológica, é a estratégia de organização nesse armazenamento.

Tá Mateus, você falou essas coisas ai, mas não falou pra gente o que é dados. Opa não posso esquecer! 😂

Dados de acordo com o curso da DP-900 no site da Microsoft, nada mais é do que uma coleção de fatos; já um outro autor, no site da escola dos dados, disse que dados podem ser enxergados como valores atribuídos a algo. Esses fatos ou valores, podem ser números, observações, textos, datas e entre outras possibilidades.

Depois de saber a definição, vamos falar sobre a classificação. Os dados podem ser classificados em três tipos:

  1. Estruturados
  2. Semiestruturados
  3. Não estruturados

Dados Estruturados

Em relação aos dados estruturados, podemos associar de imediato com dados relacionais, dados que são organizados em formato de tabela. Ele tem uma estrutura fixa, por exemplo, para cada linha, ele sempre terá as mesmas colunas. Logo, se fosse pensar em mudanças, levantando um exemplo simples, você precisaria mexer na estrutura dele, caso necessitasse que alguma coluna fosse acrescentada ou removida.

Dados semiestruturados

Os dados semiestruturados se baseiam em uma estrutura um pouco mais flexível, se fosse comparar com os dados estruturados; eles podem ser baseados em documentos (o famoso JSON), chave-valor ou grafos. Esses dados também são chamados de não-relacionais.

Dados Não estruturados

Já os não-estruturados, por sua vez, não possuem uma estrutura, nesse tipo podemos ter dados como áudios, vídeos, imagens, arquivos binários e entre outros.

Image description

Armazenamentos

Se for olhar pela classificação, e você tiver alguma experiência com o assunto, você vai perceber que tem algumas pistas no artigo de qual armazenamento usar para cada um, porém Sherlock se você ainda não tem a pista não se preocupe, você vai desvendar esse mistério agora; para dados estruturados, usamos os bancos de dados relacionais, se tiver anotando os pontos chaves do texto, anota os exemplos aí também: SQL Server, Oracle, MySQL, PostgreSQL e no Azure temos um serviço específico para isso, o banco de dados SQL dele.

Para os dados semiestruturados, usamos o banco de dados não relacional como o MongoDB, Redis, Cassandra, HBase e outras possibilidades, mas no Azure nós temos o Azure CosmosDB, um banco NoSQL muito bacana por sinal, tive a oportunidade de experimentar. E para solucionar de vez o mistério, para os não estruturados podemos usar no Azure o serviço de armazenamento de blobs.

Considerações finais

Se você chegou até aqui, aproveita o resumão desse conteúdo na imagem abaixo, se você não leu o texto, tem um segredo na metade da primeira metade da segunda metade do texto, quando descobrir me conta! No próximo post, vamos falar sobre soluções de processamento de dados e um pouco sobre sistema transacional e analítico. Até lá! 😀

Image description

Agradecimentos

Antes de dar tchau, não posso deixar de agradecer as pessoas que revisaram esse artigo, se esse texto ficou muito legal, foi devido a participação deles: Renan, Ono, Marlei, Genilda, Evelyn e Silson. E agradeço ao Henrique pelo incentivo em relação a escrita desses artigos. Valeu galera! 😀

Oldest comments (6)

Collapse
 
renanbarbosa profile image
Renan Barbosa

Show, parabéns. O conteúdo está muito bom e em breve vou fazer esta certificação.

Collapse
 
mateuslemos profile image
Mateus Lemos

Hahaha muito obrigado mano! Tamo juntos nessa! 😀

Collapse
 
sergiohidekiono profile image
Sergio Hideki Ono • Edited

Parabéns pelo conteúdo!! Artigo que facilita a compreensão do conteúdo de forma descontraída e com ilustrações que ajudam a fixar os conceitos. Rumo a certificação DP-900!!

Collapse
 
mateuslemos profile image
Mateus Lemos

Muito obrigado Ono! Espero facilitar cada vez mais os conteúdos, usando doses de humor, alguns exemplos não convencionais e tentando atender as diversas formas de aprendizado! Tamo juntos! 😀😀🙏🙏

Collapse
 
andrealmeida profile image
André Almeida

Mais um artigo bem escrito!

Collapse
 
mateuslemos profile image
Mateus Lemos

Valeuuuuuu Andrezão! Tmj! 😀😀🙏🙏