<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Letícia Oliveira</title>
    <description>The latest articles on DEV Community by Letícia Oliveira (@leticiaoliv).</description>
    <link>https://dev.to/leticiaoliv</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F1582074%2Fc1e0b0fb-0d6d-416a-b0af-34d95256fa4f.jpg</url>
      <title>DEV Community: Letícia Oliveira</title>
      <link>https://dev.to/leticiaoliv</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/leticiaoliv"/>
    <language>en</language>
    <item>
      <title>📖 Leitura Atual – Capítulo 1: Introdução à Ciência de Dados</title>
      <dc:creator>Letícia Oliveira</dc:creator>
      <pubDate>Thu, 06 Feb 2025 20:49:41 +0000</pubDate>
      <link>https://dev.to/leticiaoliv/leitura-atual-capitulo-1-introducao-a-ciencia-de-dados-168d</link>
      <guid>https://dev.to/leticiaoliv/leitura-atual-capitulo-1-introducao-a-ciencia-de-dados-168d</guid>
      <description>&lt;p&gt;&lt;em&gt;"Dados! Dados! Dados!" — esbravejou impaciente. "Não posso fazer tijolos sem barro." — Arthur Conan Doyle&lt;/em&gt;&lt;/p&gt;

&lt;p&gt;O primeiro capítulo do livro Data Science do Zero, de Joel Grus, começa com uma citação que, na minha visão, resume bem o trabalho de um cientista de dados. Como uma introdução ao universo dos dados, ele nos lembra da quantidade absurda de informações que geramos diariamente — através de celulares, relógios, carros, eletrodomésticos... Estamos imersos em dados. Afinal, sem eles, o que seria da internet?&lt;/p&gt;

&lt;h2&gt;
  
  
  O Papel do Cientista de Dados
&lt;/h2&gt;

&lt;p&gt;Uma frase famosa (que provavelmente você já ouviu se está nesse meio) diz que &lt;em&gt;o cientista de dados entende mais de estatística do que um cientista da computação, e mais de ciência da computação do que um estatístico.&lt;/em&gt; Joel cita essa frase, não discordando completamente, mas trazendo nuances interessantes.&lt;/p&gt;

&lt;p&gt;De acordo com a realidade do mercado (ao meu ponto de vista) é que há cientistas de dados com formações bem distintas: alguns são excelentes estatísticos, outros são excelentes engenheiros de software. Enquanto alguns dominam machine learning profundamente, outros têm um foco mais analítico. Mas um ponto específico me chamou a atenção por ser um tópico bem pessoal pra mim: Joel menciona que alguns cientistas de dados são PhDs que escrevem artigos acadêmicos, enquanto outros nunca leram um artigo sequer — &lt;strong&gt;e ele deixa claro que isso é um erro.&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Ao ler isso, fiquei pensativa. Apesar de nunca ter considerado seguir a carreira acadêmica, durante meus estudos em ciência de dados, precisei ler muito mais artigos do que imaginava. No meu primeiro estágio, por exemplo, trabalhei em um ambiente cercado por mestres e doutorandos, onde a pesquisa acadêmica era fundamental para o projeto. No início, fiquei insegura por não ter a mesma bagagem acadêmica que todos ao meu redor. Então, passei a consumir cada vez mais artigos científicos, não apenas sobre ciência de dados, mas também sobre tecnologia da informação como um todo, e percebi a imensidão de conteúdos científicos que auxiliam no processo de aprendizado. Isso me fez perceber que, mesmo que você não queira seguir esse caminho, entender trabalhos acadêmicos é essencial para aprofundar seus conhecimentos.&lt;/p&gt;

&lt;h2&gt;
  
  
  Data Science na Prática
&lt;/h2&gt;

&lt;p&gt;Uma das mensagens principais desse capítulo é que a ciência de dados pode significar coisas diferentes para pessoas e empresas diferentes. Dependendo da necessidade, um cientista de dados pode trabalhar:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Identificando tendências de mercado e comportamento do consumidor&lt;/li&gt;
&lt;li&gt;Criando sistemas de recomendação para plataformas de streaming&lt;/li&gt;
&lt;li&gt;Desenvolvendo chatbots e assistentes virtuais&lt;/li&gt;
&lt;li&gt;Até mesmo dando um up em suas campanhas eleitorais (como apresentado neste &lt;a href="https://www.wired.com/2016/11/facebook-won-trump-election-not-just-fake-news/" rel="noopener noreferrer"&gt;artigo da Wired&lt;/a&gt;
&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;E com esse contexto, o livro nos apresenta a &lt;strong&gt;Motivação Hipotética: DataSciencester&lt;/strong&gt;.&lt;/p&gt;

&lt;h2&gt;
  
  
  DataSciencester: Uma Experiência Imersiva
&lt;/h2&gt;

&lt;p&gt;Essa parte me empolgou desde a primeira vez que vi o livro. Joel nos coloca em uma situação hipotética: acabamos de ser contratados para liderar o setor de ciência de dados de uma nova rede social para cientistas de dados, chamada &lt;strong&gt;DataSciencester&lt;/strong&gt;.&lt;/p&gt;

&lt;p&gt;A partir disso, ele propõe desafios práticos, nos fazendo pensar como verdadeiros cientistas de dados. Algumas das tarefas incluem:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Sugestão de conexões&lt;/strong&gt; – Criar um sistema de "cientistas de dados que você talvez conheça" para fortalecer a rede.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Salários e experiência&lt;/strong&gt; – Analisar salários com base nos anos de experiência dos usuários (e fazer nossa primeira visualização de dados!).&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Contas pagas&lt;/strong&gt; – Identificar quais usuários pagam suas contas e quais não.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Tópicos de interesse&lt;/strong&gt; – Analisar as palavras mais usadas por cada usuário para definir estratégias de conteúdo.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;E para isso, já começamos a implementar algumas funções em Python! Construímos um dicionário para armazenar os usuários (&lt;code&gt;user_id&lt;/code&gt; → &lt;code&gt;user_name&lt;/code&gt;) e um conjunto de tuplas para representar as conexões de amizade. Além disso, criamos diagramas para visualizar a rede e aplicamos conceitos essenciais de programação, como &lt;strong&gt;dicionários, tuplas, bibliotecas, loops e funções&lt;/strong&gt;.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fn4a4n05b44trw8xevwyf.png" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Fn4a4n05b44trw8xevwyf.png" alt="Diagrama da rede DataSciencester baseado nas conexões entre os usuários" width="800" height="279"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Ah! não deixa de conferir os códigos que implementei com base nos exercícios do livro. Eles estão disponíveis no meu repositório: &lt;a href="https://github.com/leticia-oliv/current-reading/tree/main/01_Introducao" rel="noopener noreferrer"&gt;https://github.com/leticia-oliv/current-reading/tree/main/01_Introducao&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  Conclusão
&lt;/h2&gt;

&lt;p&gt;Foi só o primeiro capítulo, e já trabalhamos com tantas funcionalidades sem nem ter uma formação na área — como o próprio Joel brinca, "culpem o RH". O próximo capítulo será um &lt;strong&gt;Curso Intensivo de Python&lt;/strong&gt;, e estou curiosa para ver como ele irá apresentar os fundamentos da linguagem dentro dessa narrativa interativa (&lt;em&gt;spoiler da Letícia do futuro: ele consegue fazer isso muito bem!&lt;/em&gt;).&lt;/p&gt;

&lt;p&gt;Se quiser trocar uma ideia, tirar dúvidas, fazer sugestões ou até apontar alguma besteira que eu tenha falado, fique à vontade! Só peço que seja gentil. Até a próxima! 💚&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Leitura Atual: Começando 'Data Science do Zero'</title>
      <dc:creator>Letícia Oliveira</dc:creator>
      <pubDate>Thu, 06 Feb 2025 18:18:11 +0000</pubDate>
      <link>https://dev.to/leticiaoliv/leitura-atual-comecando-data-science-do-zero-kd</link>
      <guid>https://dev.to/leticiaoliv/leitura-atual-comecando-data-science-do-zero-kd</guid>
      <description>&lt;p&gt;&lt;a href="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ff31j7ravdxq4fu5blga4.jpg" class="article-body-image-wrapper"&gt;&lt;img src="https://media2.dev.to/dynamic/image/width=800%2Cheight=%2Cfit=scale-down%2Cgravity=auto%2Cformat=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Farticles%2Ff31j7ravdxq4fu5blga4.jpg" alt="Image description" width="709" height="1000"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;O objetivo dessa série é registrar meu aprendizado com o livro &lt;em&gt;Data Science do Zero – Noções Fundamentais com Python&lt;/em&gt;, de Joel Grus. Para contextualizar, recebi esse livro em 2023, quando consegui uma bolsa para estudar na Ada Tech, patrocinada pelo programa do iFood. Mas, entre projetos e preocupações pessoais, acabei não lendo na época. Mas sem desculpas! Agora estou mais motivada e confiante para extrair o máximo desse material.&lt;/p&gt;

&lt;p&gt;Não sou iniciante em ciência de dados — já tive experiência como estagiária —, então não estou começando literalmente do zero. Mas conhecimento nunca é demais, certo?! Sinto que reforçar a base me vai me ajudar a ganhar mais confiança no meu desenvolvimento profissional e alcançar uma vaga de júnior, que é meu principal objetivo no momento. Essa série será uma forma de revisar conceitos fundamentais e aprender conceitos novos com exemplos práticos e uma abordagem diferente da que encontramos em vídeo aulas e cursos online.&lt;/p&gt;

&lt;p&gt;Mas destaco que, além do livro, também estou estudando por fora, aproveitando bolsas que consegui recentemente em programas como o &lt;strong&gt;ONE (Oracle Next Education)&lt;/strong&gt; e o &lt;strong&gt;Santander Tech+ (Ada Tech)&lt;/strong&gt;.&lt;/p&gt;

&lt;p&gt;A proposta aqui é ser &lt;strong&gt;prática e direta&lt;/strong&gt;. Vou compartilhar minhas anotações, insights e aplicações dos conceitos em projetos pessoais (juntando o útil ao agradável). Se você não tem o livro, não se preocupe! Vou respeitar os direitos do autor, mas vou me preocupar em fazer minhas anotações detalhadas o suficiente para que qualquer pessoa consiga acompanhar. Também vou disponibilizar um repositório no GitHub com os arquivos &lt;code&gt;.md&lt;/code&gt; e códigos: &lt;a href="https://github.com/leticia-oliv/current-reading/tree/main" rel="noopener noreferrer"&gt;https://github.com/leticia-oliv/current-reading/tree/main&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Dito isso, será um prazer compartilhar essa nova fase da minha jornada de (re)aprendizado. Conto com seu apoio e sugestões! Fiquem à vontade para entrar em contato e trocar ideias comigo. 💚&lt;/p&gt;

</description>
    </item>
    <item>
      <title>Medidas de Posição</title>
      <dc:creator>Letícia Oliveira</dc:creator>
      <pubDate>Wed, 24 Jul 2024 21:39:07 +0000</pubDate>
      <link>https://dev.to/leticiaoliv/medidas-de-posicao-28ao</link>
      <guid>https://dev.to/leticiaoliv/medidas-de-posicao-28ao</guid>
      <description>&lt;p&gt;&lt;strong&gt;Medidas de posição&lt;/strong&gt; são conceitos utilizados na estatística descritiva para entender um conjunto de dados sob diferentes aspectos e são amplamente aplicadas na análise de dados.&lt;/p&gt;

&lt;p&gt;Para facilitar o entendimento e proporcionar uma visualização do que será explicado, usarei como exemplo um conjunto de dados de uma turma fictícia com 20 alunos.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;import pandas as pd

turma = {
    'idade': [12, 7, 7, 9, 7, 7, 11, 9, 11, 12, 12, 11, 12, 9, 6, 11, 10, 10, 7, 12],
    'instrumento': ['Violão', 'Piano', 'Flauta', 'Bateria', 'Violino', 'Bateria', 'Bateria', 'Piano', 'Bateria', 'Flauta', 'Bateria', 'Piano', 'Flauta', 'Violão', 'Bateria', 'Piano', 'Violão', 'Violão', 'Violino', 'Flauta'],
    'nota': [8, 9, 8, 6, 8, 10, 10, 7, 8, 10, 9, 7, 9, 5, 8, 10, 8, 6, 8, 6]
}

df = pd.DataFrame(turma)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Fazendo uma análise introdutória, observamos que o aluno mais novo da turma tem 6 anos, enquanto o mais velho tem 12. No entanto, isso não nos dá uma visão completa sobre a turma como um todo. Vamos realizar algumas análises utilizando medidas de posição para entender melhor esse conceito.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;print(df['idade'].min())
print(df['idade'].max())

# Output: 6, 12
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h3&gt;
  
  
  Média
&lt;/h3&gt;

&lt;p&gt;Tenho certeza que você já precisou calcular a sua média de notas na escola ou na faculdade. É exatamente assim que iremos utilizar a média no nosso conjunto de dados.&lt;/p&gt;

&lt;p&gt;A escola de música deseja premiar a turma que obteve uma média de 8 no teste de leitura e escrita de partituras. Para descobrir se a turma analisada consegue o prêmio, precisamos somar todas as notas e dividir pelo número de alunos.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;media = df['nota'].mean()
print(media)

# Output: 8.0
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;A média da turma é 8, então os alunos conseguem o prêmio da escola.&lt;/p&gt;

&lt;p&gt;Vale destacar que o cálculo da média pode ser muito influenciado por valores extremos, o que pode distorcer a interpretação dos dados, dependendo do conjunto.&lt;/p&gt;

&lt;h3&gt;
  
  
  Mediana
&lt;/h3&gt;

&lt;p&gt;A mediana é o valor central quando os dados estão ordenados. Se tivermos um número ímpar de dados, a mediana é o valor central. No entanto, como temos um número par de dados, a mediana é a média dos dois valores centrais (10º e 11º).&lt;/p&gt;

&lt;p&gt;A mediana é útil para entender a tendência central de um conjunto de dados sem ser influenciada por valores extremos. Suponha que, dentre os alunos da turma, os dados das notas fossem:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;'nota': [0, 9, 8, 6, 8, 10, 10, 7, 8, 10, 9, 7, 9, 5, 8, 10, 8, 6, 8, 6]
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Um aluno faltou à prova e não conseguiu repor a nota, ficando com 0 na avaliação final. Assim, a média da turma cai de 8 para 7,6. Esse valor atípico é chamado de &lt;em&gt;outlier&lt;/em&gt;, que ocorre quando um valor se desvia muito da série.&lt;/p&gt;

&lt;p&gt;Embora a diferença possa parecer pequena, isso poderia afetar uma análise de desempenho acadêmico de toda a turma. Para obter uma visão mais realista do desempenho central dos alunos, calculamos a mediana.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;mediana = df['nota'].median()
print(mediana)

# Output: 8.0
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Concluímos que, mesmo com a nota zero de um único aluno, isso não reflete o desempenho geral da turma, que obteve 8 como resultado da mediana.&lt;/p&gt;

&lt;h3&gt;
  
  
  Moda
&lt;/h3&gt;

&lt;p&gt;A moda é o valor que aparece com maior frequência em um conjunto de dados. É especialmente útil para analisar dados categóricos, onde a média e a mediana não são aplicáveis.&lt;/p&gt;

&lt;p&gt;Por exemplo, baseado no nosso conjunto de dados, a escola deseja descobrir qual é o instrumento favorito dos alunos para decidir em quais aulas investir no próximo ano.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;# utilizando o método 'mode'
moda = df['instrumento'].mode()
print(moda)

# contando a frequência de cada instrumento e verificando o que mais aparece:
frequencia_instrumentos = df['instrumento'].value_counts()
max_instrumentos = frequencia_instrumentos.max()
print(frequencia_instrumentos)
print(max_instrumentos)

# Output:
0    Bateria
Name: instrumento, dtype: object
instrumento
Bateria    6
Violão     4
Piano      4
Flauta     4
Violino    2
Name: count, dtype: int64
6
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Agora, a escola sabe que deve investir mais em aulas de percussão, já que a bateria é o instrumento mais popular entre os alunos da turma.&lt;/p&gt;

&lt;p&gt;A moda também pode ter mais de um valor. Se os alunos empatarem entre violão e bateria, por exemplo, a moda poderia ser ambos os instrumentos.&lt;/p&gt;

&lt;h3&gt;
  
  
  Em resumo:
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;
&lt;strong&gt;Média&lt;/strong&gt;: Oferece uma visão geral do desempenho médio, mas pode ser distorcida por valores extremos.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Mediana&lt;/strong&gt;: Reflete o valor central dos dados, fornecendo uma visão mais robusta quando há outliers presentes.&lt;/li&gt;
&lt;li&gt;
&lt;strong&gt;Moda&lt;/strong&gt;: Identifica o valor mais frequente, sendo útil para dados categóricos e para entender preferências ou padrões dominantes.&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Compreender essas medidas ajuda a construir uma base sólida para a análise de dados e a tomar decisões informadas com base em nosso conjunto de dados.&lt;/p&gt;

</description>
    </item>
  </channel>
</rss>
