<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: João Paulo Dias Estevão</title>
    <description>The latest articles on DEV Community by João Paulo Dias Estevão (@joaodest).</description>
    <link>https://dev.to/joaodest</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F1229167%2Ff319f709-eefa-416b-b4f3-e1896ecf0dc7.jpeg</url>
      <title>DEV Community: João Paulo Dias Estevão</title>
      <link>https://dev.to/joaodest</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/joaodest"/>
    <language>en</language>
    <item>
      <title>Explorando o Apache Lucene com Python: Compreendendo os Mecanismos de Busca</title>
      <dc:creator>João Paulo Dias Estevão</dc:creator>
      <pubDate>Wed, 09 Oct 2024 03:41:46 +0000</pubDate>
      <link>https://dev.to/joaodest/explorando-o-apache-lucene-com-python-compreendendo-os-mecanismos-de-busca-2k9b</link>
      <guid>https://dev.to/joaodest/explorando-o-apache-lucene-com-python-compreendendo-os-mecanismos-de-busca-2k9b</guid>
      <description>&lt;p&gt;Você já se perguntou como os mecanismos de busca conseguem encontrar informações em meio a um monte de texto quase que instantaneamente? Por trás da "magia", existem estruturas e algoritmos que indexam e recuperam essas informações. Uma das ferramentas mais populares para isso é o Apache Lucene.&lt;/p&gt;

&lt;p&gt;E quem é o Apache Lucene?&lt;br&gt;
O Lucene é uma biblioteca open-source escrita em Java, utilizada para indexação e busca de texto e sua implementação é base para outros projetos e plataformas, como ElasticSearch e Solr.&lt;/p&gt;

&lt;p&gt;E para ilustrar os conceitos do Lucene resolvi implementar uma versão simplificada em Python. &lt;/p&gt;

&lt;p&gt;Como a técnica de busca funciona?&lt;br&gt;
A técnica de busca empregada segue os seguintes passos:&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F8f523le29tbzy51pqwin.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F8f523le29tbzy51pqwin.png" alt="Image description" width="800" height="285"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Pré-processamento da Consulta:&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fnzhtiggv591vxoud8o8c.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fnzhtiggv591vxoud8o8c.png" alt="Image description" width="800" height="466"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;A consulta é submetida ao mesmo processo de tokenização, normalização, remoção de stop words e stemming que os documentos passaram durante a indexação.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Busca no Índice Invertido:&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fktsgjg4sml50e7ad9ds6.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fktsgjg4sml50e7ad9ds6.png" alt="Image description" width="800" height="819"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Para cada termo processado na consulta, recuperamos os documentos onde o termo aparece, juntamente com o peso TF-IDF calculado durante a indexação.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Combinação e Pontuação dos Documentos:&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Frfvju1mpcjox87nsj7fi.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Frfvju1mpcjox87nsj7fi.png" alt="Image description" width="800" height="423"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;As pontuações dos termos são somadas para cada documento, refletindo a relevância do documento para todos os termos da consulta.&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Ordenação dos Resultados:&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;&lt;a href="https://media.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F1t0ann5tp869xg1339w0.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F1t0ann5tp869xg1339w0.png" alt="Image description" width="800" height="481"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Os documentos são ordenados de forma decrescente com base na pontuação total, garantindo que os resultados mais relevantes sejam apresentados primeiro.&lt;/p&gt;

&lt;p&gt;Resultado&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4hejxbc7bfffcw3jec6q.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2F4hejxbc7bfffcw3jec6q.png" alt="Image description" width="800" height="340"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Link do repositório no GitHub 🔗&lt;br&gt;
&lt;a href="https://github.com/joaodest/Artigos/lucene.py" rel="noopener noreferrer"&gt;https://github.com/joaodest/Artigos/lucene.py&lt;/a&gt;&lt;/p&gt;

</description>
      <category>python</category>
      <category>webdev</category>
      <category>programming</category>
      <category>tutorial</category>
    </item>
    <item>
      <title>Será mesmo que NoSQL pode resolver seus problemas?</title>
      <dc:creator>João Paulo Dias Estevão</dc:creator>
      <pubDate>Wed, 18 Sep 2024 01:37:35 +0000</pubDate>
      <link>https://dev.to/joaodest/sera-mesmo-que-nosql-pode-resolver-seus-problemas-343g</link>
      <guid>https://dev.to/joaodest/sera-mesmo-que-nosql-pode-resolver-seus-problemas-343g</guid>
      <description>&lt;p&gt;Você sabia que NoSQL não significa, em tradução livre, "NãoSQL" ou "SemSQL"? O acrônimo advém, na verdade, de Not Only SQL (Não Apenas SQL).&lt;/p&gt;

&lt;p&gt;No cenário tecnológico atual, onde a agilidade e a escalabilidade são fundamentais, o uso de bancos de dados não-relacionais se destaca quando você precisa de flexibilidade e performance. Ou seja, quando é necessário um acesso rápido para lidar com dados que nem sempre obedecem a um esquema fixo.&lt;/p&gt;

&lt;p&gt;Por que utilizar um banco NoSQL?&lt;/p&gt;

&lt;p&gt;Flexibilidade de Esquema: &lt;br&gt;
Diferente dos bancos relacionais, o NoSQL permite trabalhar com estruturas de dados não fixas&lt;/p&gt;

&lt;p&gt;Escalabilidade Horizontal: &lt;br&gt;
Projetados para escalar horizontalmente de forma eficiente, os bancos NoSQL suportam grandes volumes de dados e acessos simultâneos&lt;/p&gt;

&lt;p&gt;Alto Desempenho:&lt;br&gt;
Otimizados para operações de leitura e escrita rápidas, são ideais para aplicações que exigem baixa latência e alta taxa de transferência de dados.&lt;/p&gt;

&lt;p&gt;Imagine um cenário de microtransações de um jogo, onde os dados devem ser acessados e processados em tempo real (ou algo próximo disso). Para esse caso, sistemas de SGBD padrões podem não ser a melhor solução, pois o acesso e a escrita desses dados demandam algum tempo. Bancos de dados não-relacionais podem se destacar, realizando a escrita e leitura desses dados em pouquíssimo tempo.&lt;/p&gt;

&lt;p&gt;Mas calma, como foi dito, tudo é uma questão de necessidade e alguns pontos devem ser considerados, inclusive dentre as opções NoSQL, como descreve o teorema CAP.&lt;/p&gt;

&lt;p&gt;E como tudo no mundo da tecnologia leva em conta um espectro, a decisão entre SQL ou NoSQL não precisa ser exclusiva. Compreender as características de cada tipo de banco e como elas se alinham às necessidades específicas do seu projeto é fundamental. Ao incorporar conceitos sólidos de system design, é possível arquitetar sistemas robustos, escaláveis e eficientes, aproveitando ao máximo as vantagens que cada tecnologia oferece.&lt;/p&gt;

</description>
      <category>database</category>
      <category>beginners</category>
      <category>programming</category>
    </item>
    <item>
      <title>Será mesmo que NoSQL pode resolver seus problemas?</title>
      <dc:creator>João Paulo Dias Estevão</dc:creator>
      <pubDate>Wed, 18 Sep 2024 01:34:16 +0000</pubDate>
      <link>https://dev.to/joaodest/sera-mesmo-que-nosql-pode-resolver-seus-problemas-147l</link>
      <guid>https://dev.to/joaodest/sera-mesmo-que-nosql-pode-resolver-seus-problemas-147l</guid>
      <description>&lt;p&gt;Você sabia que NoSQL não significa, em tradução livre, "NãoSQL" ou "SemSQL"? O acrônimo advém, na verdade, de Not Only SQL (Não Apenas SQL).&lt;/p&gt;

&lt;p&gt;No cenário tecnológico atual, onde a agilidade e a escalabilidade são fundamentais, o uso de bancos de dados não-relacionais se destaca quando você precisa de flexibilidade e performance. Ou seja, quando é necessário um acesso rápido para lidar com dados que nem sempre obedecem a um esquema fixo.&lt;/p&gt;

&lt;p&gt;Por que utilizar um banco NoSQL?&lt;/p&gt;

&lt;p&gt;Flexibilidade de Esquema: &lt;br&gt;
Diferente dos bancos relacionais, o NoSQL permite trabalhar com estruturas de dados não fixas&lt;/p&gt;

&lt;p&gt;Escalabilidade Horizontal: &lt;br&gt;
Projetados para escalar horizontalmente de forma eficiente, os bancos NoSQL suportam grandes volumes de dados e acessos simultâneos&lt;/p&gt;

&lt;p&gt;Alto Desempenho:&lt;br&gt;
Otimizados para operações de leitura e escrita rápidas, são ideais para aplicações que exigem baixa latência e alta taxa de transferência de dados.&lt;/p&gt;

&lt;p&gt;Imagine um cenário de microtransações de um jogo, onde os dados devem ser acessados e processados em tempo real (ou algo próximo disso). Para esse caso, sistemas de SGBD padrões podem não ser a melhor solução, pois o acesso e a escrita desses dados demandam algum tempo. Bancos de dados não-relacionais podem se destacar, realizando a escrita e leitura desses dados em pouquíssimo tempo.&lt;/p&gt;

&lt;p&gt;Mas calma, como foi dito, tudo é uma questão de necessidade e alguns pontos devem ser considerados, inclusive dentre as opções NoSQL, como descreve o teorema CAP.&lt;/p&gt;

&lt;p&gt;E como tudo no mundo da tecnologia leva em conta um espectro, a decisão entre SQL ou NoSQL não precisa ser exclusiva. Compreender as características de cada tipo de banco e como elas se alinham às necessidades específicas do seu projeto é fundamental. Ao incorporar conceitos sólidos de system design, é possível arquitetar sistemas robustos, escaláveis e eficientes, aproveitando ao máximo as vantagens que cada tecnologia oferece.&lt;/p&gt;

</description>
      <category>database</category>
      <category>programming</category>
      <category>beginners</category>
    </item>
  </channel>
</rss>
