<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
  <channel>
    <title>DEV Community: Beatriz Maia</title>
    <description>The latest articles on DEV Community by Beatriz Maia (@beatrizmaiads).</description>
    <link>https://dev.to/beatrizmaiads</link>
    <image>
      <url>https://media2.dev.to/dynamic/image/width=90,height=90,fit=cover,gravity=auto,format=auto/https:%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%2Fuser%2Fprofile_image%2F388253%2Fc38e8f7f-c181-4601-aa7b-ffe18a7e969e.jpg</url>
      <title>DEV Community: Beatriz Maia</title>
      <link>https://dev.to/beatrizmaiads</link>
    </image>
    <atom:link rel="self" type="application/rss+xml" href="https://dev.to/feed/beatrizmaiads"/>
    <language>en</language>
    <item>
      <title>Analisando meus dados da Netflix</title>
      <dc:creator>Beatriz Maia</dc:creator>
      <pubDate>Thu, 12 Nov 2020 11:55:08 +0000</pubDate>
      <link>https://dev.to/beatrizmaiads/analisando-meus-dados-da-netflix-40c</link>
      <guid>https://dev.to/beatrizmaiads/analisando-meus-dados-da-netflix-40c</guid>
      <description>&lt;p&gt;Aqui vamos nós para mais um post de Análise de Dados. Dessa vez mais incrível ainda, nós não vamos utilizar dados de outras pessoas para fazer uma análise, vamos utilizar nossos próprios dados. Incrível né?&lt;/p&gt;

&lt;p&gt;Neste artigo você vai conseguir responder perguntas relacionadas à series e filmes assistidos por você. &lt;/p&gt;

&lt;p&gt;Perguntas como:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;strong&gt;Quanto tempo passei assistindo determinada serie ou filme?&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Qual temporada eu mais assisti?&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Quais foram os episódios mais assistidos?&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Em quais dias da semana eu assisti mais episódios?&lt;/strong&gt;&lt;/li&gt;
&lt;li&gt;&lt;strong&gt;Em que hora do dia eu assisto episódios de Friends com mais frequência?&lt;/strong&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Primeiro vou começar fazendo uma Análise Exploratória geral nos dados. Depois irei filtrar os dados  e analisar mais detalhadamente uma série de comédia que eu amo: &lt;strong&gt;Friends.&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Vamos lá??&lt;/p&gt;

&lt;p&gt;&lt;a href="https://i.giphy.com/media/de4aRYwfD7T7q/giphy.gif" class="article-body-image-wrapper"&gt;&lt;img src="https://i.giphy.com/media/de4aRYwfD7T7q/giphy.gif" alt="Friends" width="453" height="250"&gt;&lt;/a&gt;&lt;/p&gt;




&lt;p&gt;Para começar preciso dizer que esta análise foi inspirada em um artigo postado pelo &lt;a href="http://dataquest.io/blog/"&gt;Dataquest&lt;/a&gt;. Vou pedir para que vocês acessarem &lt;a href="https://www.dataquest.io/blog/python-tutorial-analyze-personal-netflix-data/"&gt;esse link&lt;/a&gt;, onde eles explicam o passo a passo para solicitar seus dados no site da Netflix. Além disso, você consegue ver a análise feita pelo autor do artigo.&lt;/p&gt;

&lt;p&gt;Como de costume, começamos importando as bibliotecas necessárias. Aqui, para essa analise simples, foram utilizadas apenas essas três.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;h2&gt;
  
  
  &lt;strong&gt;Conhecendo e Preparando os Dados&lt;/strong&gt;
&lt;/h2&gt;

&lt;p&gt;Vamos conhecer melhor nossos dados e prepara-los para a análise. Foram feitas transformações bem interessantes, tenho certeza que vai ser enriquecedor para você.&lt;br&gt;
Depois de ler os dados que vieram no formato csv, vamos mostrar as 5 primeiras linhas do nosso DataFrame:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;df = pd.read_csv('ViewingActivity.csv')
df.head()
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Utilizando o &lt;code&gt;.info()&lt;/code&gt; e &lt;code&gt;.shape&lt;/code&gt; obtemos informações sobre nossas colunas e a quantidade de linhas e colunas, respectivamente.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;df.shape

df.info()
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--8Mi4V_2s--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AP6V_tNOAG5ldqDUr" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--8Mi4V_2s--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AP6V_tNOAG5ldqDUr" alt="image1" width="721" height="581"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Optei por eliminar algumas colunas que para minha analise não seriam interessantes. &lt;/p&gt;

&lt;p&gt;Além disso também renomeei a primeira coluna, apenas substituindo o espaço no &lt;code&gt;'Start Time'&lt;/code&gt; por um underscore . E claro, verifiquei a existência de valores NaN.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;df.drop(['Profile Name', 'Attributes', 'Supplemental Video Type', 'Device Type',
         'Bookmark', 'Latest Bookmark', 'Country'], axis=1, inplace=True)
df.head()
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--whXfDRCV--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AfkJVF6XmlfwsSB1x" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--whXfDRCV--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AfkJVF6XmlfwsSB1x" alt="image1" width="875" height="624"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  &lt;strong&gt;Convertendo tipo Object em Datetime e Timedelta&lt;/strong&gt;
&lt;/h2&gt;

&lt;p&gt;Os dados das colunas &lt;code&gt;'Start_Time'&lt;/code&gt; e &lt;code&gt;'Duration'&lt;/code&gt; parecem corretos, mas se você reparar bem eles não estão armazenados no formato correto. Podemos usar &lt;code&gt;df.dtypes&lt;/code&gt; para obter uma lista dos tipos de dados de cada coluna do nosso dataframe:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;df.dtypes
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--EjjDQP3b--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/374/0%2AxMFrFymsEvBLgL4K" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--EjjDQP3b--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/374/0%2AxMFrFymsEvBLgL4K" alt="image1" width="299" height="176"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Todas as três colunas são armazenadas como &lt;strong&gt;object&lt;/strong&gt;, o que significa que são &lt;strong&gt;strings&lt;/strong&gt;. Isso não é bom para as duas colunas relacionadas ao tempo. Vamos converter essas duas colunas para trabalharmos com elas.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;O objetivo é:&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Converter &lt;code&gt;Start_Time&lt;/code&gt; para Datetime (um formato de data e hora que o Pandas pode entender e realizar cálculos)&lt;/li&gt;
&lt;li&gt;Converter &lt;code&gt;Start_Time&lt;/code&gt; de UTC para nosso fuso horário local&lt;/li&gt;
&lt;li&gt;Converter &lt;code&gt;Duration&lt;/code&gt; para Timedelta (um formato de duração de tempo que o Pandas podem entender e realizar cálculos)&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Começando com a conversão &lt;code&gt;Start_Time&lt;/code&gt; para datetime usando &lt;code&gt;pd.to_datetime()&lt;/code&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--ioDown69--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AwkC6vi2r3GDbF6EL" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--ioDown69--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AwkC6vi2r3GDbF6EL" alt="image1" width="735" height="233"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Adicionamos o argumento opcional &lt;code&gt;utc=True&lt;/code&gt; para que nossos dados de data e hora tenham o fuso horário UTC anexado a eles.&lt;br&gt;
Agora que temos essa coluna no formato correto, é hora de alterar o fuso horário para o horário local.&lt;/p&gt;

&lt;p&gt;Podemos converter data e hora para qualquer fuso horário usando o &lt;code&gt;.tz_convert()&lt;/code&gt; e passando um argumento com a string para o fuso horário que queremos converter.&lt;/p&gt;

&lt;p&gt;Obs: Precisamos realizar mais um passo. Só podemos usar &lt;code&gt;.tz_convert()&lt;/code&gt; em um DatetimeIndex, portanto, precisamos definir a coluna &lt;code&gt;Start_Time&lt;/code&gt; como o índice usando &lt;code&gt;set_index()&lt;/code&gt;.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--fUHiTLaI--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AxdC1udYEyTRDfvZj" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--fUHiTLaI--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AxdC1udYEyTRDfvZj" alt="image1" width="875" height="530"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Agora, vamos lidar com a coluna &lt;code&gt;Duration&lt;/code&gt;. Em vez de convertê-lo em uma data e hora, precisamos convertê-lo em um Timedelta, que é uma medida de duração de tempo que o pandas entende.&lt;/p&gt;

&lt;p&gt;Fazemos isso utilizando &lt;code&gt;pd.to_timedelta()&lt;/code&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--mlVqDCX---/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/695/0%2AHLiVleEpaWxre2ZL" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--mlVqDCX---/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/695/0%2AHLiVleEpaWxre2ZL" alt="image1" width="556" height="220"&gt;&lt;/a&gt;&lt;/p&gt;
&lt;h2&gt;
  
  
  &lt;strong&gt;Análise de Dados Gerais&lt;/strong&gt;
&lt;/h2&gt;

&lt;p&gt;Se notarmos bem, a coluna &lt;code&gt;Title&lt;/code&gt; contém o nome da série(ou filme), temporada e título do episódio. Essas informações poderiam ser "quebradas" em novas colunas, concordam?&lt;/p&gt;

&lt;p&gt;E foi exatamente isso que eu fiz no código abaixo utilizando &lt;code&gt;str.split()&lt;/code&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--UqBCzssO--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AtqMvNzIrz4wexuMK" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--UqBCzssO--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AtqMvNzIrz4wexuMK" alt="image1" width="875" height="323"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Além disso, decidi criar mais duas colunas a partir da coluna &lt;code&gt;'Start_Time'&lt;/code&gt;. Como temos data e hora, criei a coluna &lt;code&gt;'Weekday'&lt;/code&gt; que nos informa o dia da semana (Segunda=0, Domingo=6) e a coluna &lt;code&gt;'Hour'&lt;/code&gt; com o horário.&lt;/p&gt;

&lt;p&gt;Podemos usar os métodos &lt;code&gt;.dt.weekday&lt;/code&gt; e .&lt;code&gt;dt.hour&lt;/code&gt; para fazer isso.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--fIJJfgzb--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AC-HZCI-Mva0QteG2" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--fIJJfgzb--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AC-HZCI-Mva0QteG2" alt="image1" width="875" height="294"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;Quantas vezes foi dado play em cada série/filme?&lt;/strong&gt;&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--gZV27Awr--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/776/0%2AmyP4maU4XWTncl5M" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--gZV27Awr--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/776/0%2AmyP4maU4XWTncl5M" alt="image1" width="621" height="376"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;Qual é o top 10 series/filmes mais assistidos?&lt;/strong&gt;&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--GbQQ9VzI--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AkacyCqkQjPaiiCvI" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--GbQQ9VzI--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AkacyCqkQjPaiiCvI" alt="image1" width="794" height="608"&gt;&lt;/a&gt;&lt;/p&gt;
&lt;h2&gt;
  
  
  &lt;strong&gt;Análise de Dados - Friends&lt;/strong&gt;
&lt;/h2&gt;

&lt;p&gt;Como dito anteriormente, irei fazer uma análise mais detalhada selecionando apenas registros relacionados à série &lt;strong&gt;Friends&lt;/strong&gt;.&lt;/p&gt;

&lt;p&gt;Para isso irei criar um outro DataFrame somente com registros onde &lt;code&gt;'Title_Name'&lt;/code&gt; é igual à Friends. Aqui você pode adaptar selecionando a sua série ou filme preferido.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--2VG-T1GQ--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2ARFjs-JYTSHq-ceaZ" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--2VG-T1GQ--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2ARFjs-JYTSHq-ceaZ" alt="image1" width="875" height="249"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Percebemos em nossa exploração de dados que, quando algo como uma prévia de um episódio é reproduzido automaticamente, ele conta como uma visualização em nossos dados.&lt;/p&gt;

&lt;p&gt;Então, vamos filtrar nosso dataframe &lt;code&gt;friends&lt;/code&gt;, limitando para apenas linhas onde o valor de &lt;code&gt;Duration&lt;/code&gt; seja maior que dois minutos.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s---lbf5QzF--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2A0c4bYTQm5u-agU5U" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s---lbf5QzF--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2A0c4bYTQm5u-agU5U" alt="image1" width="875" height="218"&gt;&lt;/a&gt;&lt;/p&gt;
&lt;h3&gt;
  
  
  &lt;strong&gt;Respondendo mais algumas perguntas:&lt;/strong&gt;
&lt;/h3&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;Quanto tempo passei assistindo Friends?&lt;/strong&gt;&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--Loy_Vb-t--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/395/0%2AMWW4s6K-HTxXjIj6" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--Loy_Vb-t--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/395/0%2AMWW4s6K-HTxXjIj6" alt="image1" width="316" height="87"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Confesso que esperava mais até haha. &lt;br&gt;
Não sei vocês, mas eu tenho o costume dar play em alguma série enquanto faço outra coisa só para ter um "companhia" enquanto, por exemplo, lavo a louça, arrumo a casa, almoço, janto… Então na verdade, uma parte desse tempo nem foi assistindo ativamente.&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;Qual temporada de Friends eu mais assisti?&lt;/strong&gt;&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--FW7E2tu7--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/573/0%2A8qHdKOhqgT042qfE" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--FW7E2tu7--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/573/0%2A8qHdKOhqgT042qfE" alt="image1" width="458" height="306"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Caso você não saiba, a temporada 10 é a última temporada de Friends, está ai o porquê de ser a temporada que menos assisti, não gosto de ver os últimos episódios pois fico triste :(&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;Quais foram os episódios mais assistidos em Friends?&lt;/strong&gt;&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--9rn1MiXW--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2A7ssjdXtxtlPbeOH1" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--9rn1MiXW--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2A7ssjdXtxtlPbeOH1" alt="image1" width="814" height="353"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Mais um caso, apesar de simples, de como a análise de dados é incrível, eu não fazia ideia de que esse era o episódio que eu mais tinha assistido até então.&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;Qual dia da semana costumo assistir Friends?&lt;/strong&gt;&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--Loy_Vb-t--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/395/0%2AMWW4s6K-HTxXjIj6" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--Loy_Vb-t--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/395/0%2AMWW4s6K-HTxXjIj6" alt="image1" width="316" height="87"&gt;&lt;/a&gt;&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;print(friends.groupby('Weekday').agg({'Start_Time':'count'}))

# Monday=0, Sunday=6
plt.figure(figsize=(10,5))
ax = sns.countplot(x='Weekday', data=friends, color='blueviolet')
ax.set_title('Episódios de Friends assistidos por Dia da Semana', fontsize=17);
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--D9BdKuHV--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AO6Xj0J9fMrcWiSgL" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--D9BdKuHV--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/0%2AO6Xj0J9fMrcWiSgL" alt="image1" width="822" height="636"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Sábado é o dia em que mais assisti episódio de Friends, mas veja como Quarta-Feira está bem próximo também.&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;&lt;strong&gt;Em que hora do dia eu assisto episódios de Friends com mais frequência?&lt;/strong&gt;&lt;br&gt;
&lt;/p&gt;
&lt;/blockquote&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;print(friends.groupby('Hour').agg({'Start_Time':'count'}))

plt.figure(figsize=(10,5))
ax = sns.countplot(x='Hour', data=friends, color='blueviolet')
ax.set_title('Episódios de Friends assistidos por Hora', fontsize=17);
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--_BJ2ac6B--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/840/0%2AmJOmAQQeXZPbuP8T" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--_BJ2ac6B--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/840/0%2AmJOmAQQeXZPbuP8T" alt="image1" width="672" height="772"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Por essa eu já esperava… Como eu disse, costumo assistir episódios enquanto estou almoçando, isso justifica o porque dessa barrinha tãao grande no horário de 12h.&lt;/p&gt;




&lt;p&gt;Aqui você encontra a minha análise no GitHub: &lt;a href="https://bit.ly/2Uo7JL5"&gt;https://bit.ly/2Uo7JL5&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Espero que vocês tenham gostado do post e da análise, foi algo simples, mas creio que consegui mostrar como conseguimos usar essas técnicas para saber mais sobre nossos gostos e hábitos.&lt;br&gt;
Não esqueçam de conferir meus posts no &lt;a href="https://www.linkedin.com/in/beatrizmaiads/"&gt;LinkedIn&lt;/a&gt; e me seguir por lá ♥&lt;/p&gt;

&lt;h3&gt;
  
  
  &lt;strong&gt;Contatos:&lt;/strong&gt;
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;[LinkedIn]: &lt;a href="https://www.linkedin.com/in/beatrizmaiads/"&gt;https://www.linkedin.com/in/beatrizmaiads/&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[GitHub]: &lt;a href="https://github.com/beatrizmaiads"&gt;https://github.com/beatrizmaiads&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[Instagram]: &lt;a href="https://www.instagram.com/beatrizmaiads/"&gt;https://www.instagram.com/beatrizmaiads/&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[Dev.to]: &lt;a href="https://dev.to/beatrizmaiads"&gt;https://dev.to/beatrizmaiads&lt;/a&gt;
&lt;/li&gt;
&lt;/ul&gt;

</description>
      <category>datascience</category>
      <category>python</category>
      <category>analyst</category>
      <category>womenintech</category>
    </item>
    <item>
      <title>Analisando os dados do Airbnb - Rio de Janeiro #5</title>
      <dc:creator>Beatriz Maia</dc:creator>
      <pubDate>Tue, 01 Sep 2020 20:15:50 +0000</pubDate>
      <link>https://dev.to/beatrizmaiads/analisando-os-dados-do-airbnb-rio-de-janeiro-5-549h</link>
      <guid>https://dev.to/beatrizmaiads/analisando-os-dados-do-airbnb-rio-de-janeiro-5-549h</guid>
      <description>&lt;p&gt;Para o post de hoje resolvi trazer um projeto de análise de dados utilizando os dados do Airbnb - Rio de Janeiro. Nesse post, quero mostrar um pouco como é feita uma análise de dados. Espero que goste :)&lt;/p&gt;

&lt;p&gt;Claro que como boa carioca escolhi os dados do meu RJ rs&lt;/p&gt;

&lt;p&gt;&lt;a href="https://i.giphy.com/media/tnykatMsOoyJO/giphy.gif" class="article-body-image-wrapper"&gt;&lt;img src="https://i.giphy.com/media/tnykatMsOoyJO/giphy.gif" width="375" height="211"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Se você ainda não conhece o Airbnb, saiba que essa empresa só vem ganhando o coração dos viajantes, mas caso você não conheça trago uma breve explicação do que o Airbnb oferece.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Airbnb&lt;/strong&gt; é um serviço online comunitário para as pessoas anunciarem, descobrirem e reservarem acomodações e meios de hospedagem.&lt;/p&gt;

&lt;p&gt;O Airbnb permite aos indivíduos alugar todo ou parte de sua própria casa, assim os anfitriões conseguem transformar um cômodo extra ou uma casa extra em uma graninha. O site fornece uma plataforma de busca e reservas entre a pessoa que oferece a acomodação e a pessoa que busca pela locação.&lt;/p&gt;

&lt;h2&gt;
  
  
  &lt;strong&gt;Vamos para as análises?&lt;/strong&gt;
&lt;/h2&gt;

&lt;p&gt;&lt;a href="https://i.giphy.com/media/Y3MbPtRn74uR3Ziq4P/giphy.gif" class="article-body-image-wrapper"&gt;&lt;img src="https://i.giphy.com/media/Y3MbPtRn74uR3Ziq4P/giphy.gif" width="480" height="270"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Vamos começar pelo nosso clássico import de bibliotecas, aqui como vamos fazer apenas uma análise, acaba que não temos muitas bibliotecas para importar, mas espera só vir posts de projetos de Machine Learning para vocês verem o quão cheia essa célula vai ficar rs&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;!pip install missingno 

# importar os pacotes necessários
%matplotlib inline
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import missingno as msno  

# configurar as visualizações
sns.set_style('darkgrid')
sns.set_palette('Accent')
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Ali em cima também fiz o &lt;strong&gt;!pip&lt;/strong&gt; de uma biblioteca que iremos utilizar para visualizar, através de um gráfico, as colunas com dados faltantes do nosso dataset. &lt;/p&gt;

&lt;p&gt;O próximo passo é carregador os nossos dados para dentro de um DataFrame.&lt;br&gt;
Como temos um arquivo csv, vamos utilizar o &lt;strong&gt;pd.read_csv&lt;/strong&gt;, como mostro abaixo:&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;# obtendo os dados
data_path = 'http://data.insideairbnb.com/brazil/rj/rio-de-janeiro/2020-04-20/visualisations/listings.csv'

df = pd.read_csv(data_path)
df.head()
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Além disso, como a função &lt;strong&gt;.head()&lt;/strong&gt; conseguimos mostras as 5 primeiras linhas do nosso DataFrame. Caso você queira mostrar mais que 5 linhas, basta colocar a quantidade de linhas dentro dos parênteses :) O default da função é mostrar apenas 5 linhas.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--haxdcFN4--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/1250/1%2AsKTliHMqgGa5b3ixquAwXQ.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--haxdcFN4--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/1250/1%2AsKTliHMqgGa5b3ixquAwXQ.png" width="880" height="222"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Algo que gosto de acrescentar nos projetos é o &lt;strong&gt;Dicionário de Variáveis&lt;/strong&gt;. Ele nos diz o que é cada variável. Isso é ótimo para conhecermos melhor os nossos dados e com certeza vai nos ajudar nas análises.&lt;/p&gt;

&lt;h2&gt;
  
  
  &lt;strong&gt;Análise Exploratória de Dados&lt;/strong&gt;
&lt;/h2&gt;

&lt;p&gt;Nesse projeto eu fiz uma série de perguntas e fui respondendo com os códigos. Na época, eu estava iniciando os estudos e fazer isso me ajudou bastante a entender um pouco como uma análise deve ser feito, quais respostas eu devo trazer ao projeto.&lt;/p&gt;

&lt;h4&gt;
  
  
  &lt;strong&gt;Quantos atributos/variáveis/colunas e quantas entradas/linhas possui o nosso dataframe?&lt;/strong&gt;
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;print('DIMENSÕES DO DATAFRAME:')
print(f'Linhas:  {df.shape[0]}')
print(f'Colunas:  {df.shape[1]}')
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;O &lt;strong&gt;.shape&lt;/strong&gt; nos retorna uma tupla representando a dimensionalidade do DataFrame. (linhas, colunas)&lt;br&gt;
Para acessar o primeiro elemento dessa tupla eu utilizei o &lt;strong&gt;[0]&lt;/strong&gt; e para acessar o segundo elemento utilizei o &lt;strong&gt;[1]&lt;/strong&gt; junto do &lt;strong&gt;.shape&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--0K7M6T9H--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/425/1%2Ag8qLV8DGuzAUxS1MVTmR-w.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--0K7M6T9H--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/425/1%2Ag8qLV8DGuzAUxS1MVTmR-w.png" width="340" height="89"&gt;&lt;/a&gt;&lt;/p&gt;
&lt;h4&gt;
  
  
  &lt;strong&gt;Quais são os tipos de dados (dtypes) das nossas variáveis?&lt;/strong&gt;
&lt;/h4&gt;


&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;df.dtypes
df.dtypes.value_counts()
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;


&lt;p&gt;A propriedade .dtypes retorna uma série com o tipos de dado de cada coluna.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--4DJ_hdN4--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/531/1%2AfoWOWxCssaQEOudNWSC82w.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--4DJ_hdN4--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/531/1%2AfoWOWxCssaQEOudNWSC82w.png" width="425" height="370"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Se você quiser saber quantas colunas de cada tipo de dados esse dataframe possui e não quer ficar contando na mão, utilize o método &lt;strong&gt;.value_counts()&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--bjp10TEV--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/205/1%2ACnqB5Of3GEnLDDZAbXNXfQ.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--bjp10TEV--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/205/1%2ACnqB5Of3GEnLDDZAbXNXfQ.png" width="164" height="121"&gt;&lt;/a&gt;&lt;/p&gt;
&lt;h4&gt;
  
  
  &lt;strong&gt;Nosso dataset possui valores ausentes?&lt;/strong&gt;
&lt;/h4&gt;


&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;df.isna().any()
df.isna().sum() 

# visualização das entradas de cada coluna
msno.bar (df, figsize = (10,5));

#eliminando a colunaneighbourhood_group
df.drop('neighbourhood_group', axis=1, inplace=True)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;


&lt;p&gt;Para “perguntar” ao dataframe se existe alguma coluna com valor NaN, utilizamos o &lt;strong&gt;.isna().any()&lt;/strong&gt;. Ele irá retornar &lt;em&gt;True&lt;/em&gt; ou &lt;em&gt;False&lt;/em&gt; para cada coluna.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--VDMT5E5V--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/505/1%2AC5a2ERJkbugxJnoxgBVO4A.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--VDMT5E5V--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/505/1%2AC5a2ERJkbugxJnoxgBVO4A.png" width="404" height="362"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;E para saber quantos valores ausentes cada coluna possui, utilizamos &lt;strong&gt;.isna().sum()&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--z3OOOU1P--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/523/1%2AoIzrucJJWYtGb9JetH0zMw.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--z3OOOU1P--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/523/1%2AoIzrucJJWYtGb9JetH0zMw.png" width="418" height="361"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Lembra da biblioteca missingno que importamos? Então, ela nos traz mais uma forma de visualizar os dados faltantes de cada coluna.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--aW_Ulgvg--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2AFxHm4jJFwTlvpoSQXbx_fw.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--aW_Ulgvg--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2AFxHm4jJFwTlvpoSQXbx_fw.png" width="843" height="669"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Como vimos anteriormente, nosso dataset possui 35.870 entradas. E analisando os valores ausentes no comando anterior notamos que a variável &lt;em&gt;neighbourhood_group&lt;/em&gt; não tem dados. Sendo assim, ela não acrescentará em nada na nossa análise, com o &lt;strong&gt;.drop()&lt;/strong&gt; eliminei essa variável do DataFrame.&lt;/p&gt;
&lt;h3&gt;
  
  
  &lt;strong&gt;Histograma das Variáveis&lt;/strong&gt;
&lt;/h3&gt;

&lt;p&gt;Você sabe o que é um histograma?&lt;br&gt;
O histograma, também é conhecido como distribuição de frequências, é a representação gráfica em colunas ou em barras de um conjunto de dados. Se você quer entender melhor sobre, &lt;a href="https://pt.wikipedia.org/wiki/Histograma"&gt;clique aqui&lt;/a&gt;.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;# análise visual das variáveis númericas através de um gráfico de frequências (histogramas)
df.hist(bins=15, figsize=(15,10));
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--ckMNOxtU--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2AIj18NIAfbjL-uy4i10bNTQ.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--ckMNOxtU--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2AIj18NIAfbjL-uy4i10bNTQ.png" width="875" height="563"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Notamos que há índicios da presença de outliers nos nossos dados, como vemos nas colunas &lt;strong&gt;price, minimum_nights e calculated_host_listings_count&lt;/strong&gt;. Um dos indícios é o fato de não conseguirmos visualizar uma distribuição porque possivelmente os outliers, se presentes, estão distorcento a representação gráfica.&lt;/p&gt;

&lt;h3&gt;
  
  
  &lt;strong&gt;Detecção de Outliers&lt;/strong&gt;
&lt;/h3&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;# visualizando um resumo estatístico das variáveis númericas
df[['price', 'minimum_nights', 'number_of_reviews',      'reviews_per_month', 'calculated_host_listings_count', 'availability_365']].describe().round(2)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;Esse método traz muitas informaçãoes relevantes para a análise exploratória. Como média das colunas, o valor mínimo e máximo, seus quartis e também o valor do desvio padrão. Muitas vezes conseguimos visualizar possíveis outliers por aqui.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--Zk0KCnco--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2ARYDyhfwERJpMbZqWFazoUw.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--Zk0KCnco--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2ARYDyhfwERJpMbZqWFazoUw.png" width="875" height="244"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Pontos principais da análise feita através do método describe:&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt; O valor mínimo da variável price é 0&lt;/li&gt;
&lt;li&gt; O valor máximo da variável price é 131.727&lt;/li&gt;
&lt;li&gt; O valor máximo da variável minimum_nights é 1.123&lt;/li&gt;
&lt;li&gt; O valor máximo da variável calculated_host_listinings_count é 200&lt;/li&gt;
&lt;/ul&gt;

&lt;h3&gt;
  
  
  &lt;strong&gt;Boxplot das variáveis que possivelmente apresentam outliers&lt;/strong&gt;
&lt;/h3&gt;

&lt;p&gt;Em estatística descritiva, diagrama de caixa, diagrama de extremos e quartis, boxplot ou box plot é uma ferramenta gráfica para representar a variação de dados observados de uma variável numérica por meio de quartis. &lt;a href="https://pt.wikipedia.org/wiki/Diagrama_de_caixa"&gt;Wikipédia&lt;/a&gt;&lt;/p&gt;

&lt;h4&gt;
  
  
  Boxplot da variável &lt;strong&gt;minimum_nights&lt;/strong&gt;
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;plt.figure(figsize=(15,3))
sns.boxplot(data=df, x='minimum_nights')
plt.title('Boxplot minimum_nights')
plt.show() 

# ver quantidade de valores acima de 30 dias para minimum_nights
print(f'[minimun_nights]\nValores acima de 30:{len(df[df.minimum_nights &amp;gt; 30])} entradas')

print('Porcentagem: {:.4f}%'.format(len(df[df.minimum_nights &amp;gt; 30])/ len(df.minimum_nights)* 100))
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--SL9Izwk---/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2ArQ-D56dfT2tCNNQnwrSiig.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--SL9Izwk---/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2ArQ-D56dfT2tCNNQnwrSiig.png" width="875" height="291"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Temos &lt;strong&gt;224 entradas com minimum_nights acima de 30&lt;/strong&gt;, o que corresponde a &lt;strong&gt;0.62% dos dados&lt;/strong&gt;.&lt;/p&gt;

&lt;h4&gt;
  
  
  Boxplot da variável &lt;strong&gt;Price&lt;/strong&gt;
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;plt.figure(figsize=(15,3))
sns.boxplot(data=df, x='price')
plt.title('Boxplot price')
plt.show() 

# ver quantidade de valores acima de 1500 para price
print(f'[price]\nValores acima de 1500: {len(df[df.price &amp;gt; 1500])} entradas')
print('Porcentagem: {:.4f}%'.format(len(df[df.price &amp;gt; 1500])/ len(df.price) * 100)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--5WIb1G69--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2AjlBYNsmkuxGnkumUVcUrww.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--5WIb1G69--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2AjlBYNsmkuxGnkumUVcUrww.png" width="875" height="294"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Temos &lt;strong&gt;3.360 entradas com Price acima de 1.500&lt;/strong&gt;, o que corresponde a &lt;strong&gt;9.36% dos dados&lt;/strong&gt;.&lt;/p&gt;

&lt;h3&gt;
  
  
  &lt;strong&gt;Histograma sem Outlier&lt;/strong&gt;
&lt;/h3&gt;

&lt;p&gt;Depois de identificar os outliers, vamos plotar novamente o histograma para visualizarmos os dados limpos.&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;# histogramas com valores de minimum_nights menor que 30 e price menor que 1500
df_clean = df.copy()
df_clean = df_clean.query('minimum_nights &amp;lt; 30 &amp;amp; price &amp;lt; 1500')
df_clean.hist(bins=15, figsize=(15,10));
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--dZb8IKN4--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2AK2ikOy6Kyq3_kFDAtSecMw.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--dZb8IKN4--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2AK2ikOy6Kyq3_kFDAtSecMw.png" width="875" height="576"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h3&gt;
  
  
  &lt;strong&gt;Correlação existente entre as variáveis&lt;/strong&gt;
&lt;/h3&gt;

&lt;p&gt;Correlação é a relação estatística entre duas variáveis. Os coeficientes de correlação são métodos estatísticos para se medir as relações entre variáveis.&lt;/p&gt;

&lt;p&gt;Calculamos o coeficiente de correlação com a função &lt;strong&gt;.corr()&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Irei apresentar essa correlação através de uma matriz e de uma forma mais visual através de um heatmap (mapa de calor).&lt;br&gt;
&lt;/p&gt;

&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;corr = df_clean[['price', 'minimum_nights', 'number_of_reviews', 'reviews_per_month',
'calculated_host_listings_count', 'availability_365']].corr() 

#plotando a matriz de correlação
sns.set_context("notebook", font_scale=1.0, rc={"lines.linewidth": 2.5})
plt.figure(figsize=(10,5))

#criando uma máscara para ver apenas os valores de correlação uma vez
mask = np.zeros_like(corr)
mask[np.triu_indices_from(mask, 1)] = True
a = sns.heatmap(corr, mask=mask, annot=True, fmt='.2f')
rotx = a.set_xticklabels(a.get_xticklabels(), rotation=90)
roty = a.set_yticklabels(a.get_yticklabels(), rotation=30)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--ovLTeZS---/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/861/1%2A0R3izIB18NyrRBlwvlDA4Q.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--ovLTeZS---/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/861/1%2A0R3izIB18NyrRBlwvlDA4Q.png" width="689" height="467"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h4&gt;
  
  
  &lt;strong&gt;Qual é o tipo de hospedagem mais alugado?&lt;/strong&gt;
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;# a quantidade de cada tipo de imóvel disponível
df_clean['room_type'].value_counts() 

# porcentagem de cada tipo de imóvel disponível
df_clean['room_type'].value_counts() / len(df_clean)
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--Q7ujizJz--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/379/1%2A_zMhcfqaUcm8Na7EmFh9AA.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--Q7ujizJz--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/379/1%2A_zMhcfqaUcm8Na7EmFh9AA.png" width="303" height="121"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--Dr7N4TnS--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/478/1%2AP6__FcI-S3K3SSz1baJ-Lw.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--Dr7N4TnS--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/478/1%2AP6__FcI-S3K3SSz1baJ-Lw.png" width="382" height="121"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h4&gt;
  
  
  &lt;strong&gt;Qual é a localidade mais cara?&lt;/strong&gt;
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;# média de preço do top 10 localidades mais caras
df_clean.groupby('neighbourhood')['price'].mean().sort_values(ascending=False)[:10] 

# contagem de imóveis por localidade
df_clean['neighbourhood'].value_counts()
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--92xmCd0_--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/459/1%2A0NjzxFR1h4H_77yFe6t-aw.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--92xmCd0_--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/459/1%2A0NjzxFR1h4H_77yFe6t-aw.png" width="367" height="287"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Observação: Como podemos ver existem bairros com mais imóveis alugados, o que pode influenciar diretamente na média de preços por localidade.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--dpEZDyp4--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/616/1%2AE3E7BJpXHc6Hf8_R7cl3IQ.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--dpEZDyp4--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/616/1%2AE3E7BJpXHc6Hf8_R7cl3IQ.png" width="493" height="259"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h4&gt;
  
  
  &lt;strong&gt;Plotando os imóveis pela latitude-longitude&lt;/strong&gt;
&lt;/h4&gt;



&lt;div class="highlight js-code-highlight"&gt;
&lt;pre class="highlight plaintext"&gt;&lt;code&gt;df_clean.plot(kind='scatter', x='longitude', y='latitude',

alpha=0.4, c=df_clean['price'], s=8, cmap=plt.get_cmap('jet'),

figsize=(12,8));
&lt;/code&gt;&lt;/pre&gt;

&lt;/div&gt;



&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--NtvUhkhL--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2Ak50QPhxhd5gAgIT9kbLoOQ.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--NtvUhkhL--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2Ak50QPhxhd5gAgIT9kbLoOQ.png" width="709" height="455"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h3&gt;
  
  
  &lt;strong&gt;Conclusões:&lt;/strong&gt;
&lt;/h3&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;Aqui foi feita uma análise superficial sobre os dados disponíveis no arquivo citado anteriormente. Para uma análise mais completa recomendo que seja utilizado o dataset que contém mais variáveis/atributos.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;Conseguimos identificar valores ausentes e outliers, fazer seu tratamento, plotamos alguns gráficos para análise e no final conseguimos responder algumas perguntas.&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;Link do projeto no GitHub: &lt;a href="https://bit.ly/3fHgAzX"&gt;https://bit.ly/3fHgAzX&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;Link do projeto no Google Colab: &lt;a href="https://bit.ly/3hQ18Da"&gt;https://bit.ly/3hQ18Da&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  &lt;strong&gt;Contatos:&lt;/strong&gt;
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;[LinkedIn]: &lt;a href="https://www.linkedin.com/in/beatrizmaiads/"&gt;https://www.linkedin.com/in/beatrizmaiads/&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[GitHub]: &lt;a href="https://github.com/beatrizmaiads"&gt;https://github.com/beatrizmaiads&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[Instagram]: &lt;a href="https://dev.to/beatrizmaiads"&gt;@beatrizmaiads&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[Dev.to]: &lt;a href="https://dev.to/beatrizmaiads"&gt;https://dev.to/beatrizmaiads&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[Medium]: &lt;a href="https://medium.com/@beatrizmaiads"&gt;https://medium.com/@beatrizmaiads&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[E-mail]: &lt;a href="//mailto:beatrizmaiads@outlook.com"&gt;beatrizmaiads@outlook.com&lt;/a&gt;
&lt;/li&gt;
&lt;/ul&gt;

</description>
      <category>datascience</category>
      <category>python</category>
      <category>computerscience</category>
      <category>womenintech</category>
    </item>
    <item>
      <title>O que é um Podcast? + Dicas de Podcasts sobre tecnologia #4</title>
      <dc:creator>Beatriz Maia</dc:creator>
      <pubDate>Mon, 17 Aug 2020 20:20:36 +0000</pubDate>
      <link>https://dev.to/beatrizmaiads/o-que-e-um-podcast-dicas-de-podcasts-sobre-tecnologia-4-159d</link>
      <guid>https://dev.to/beatrizmaiads/o-que-e-um-podcast-dicas-de-podcasts-sobre-tecnologia-4-159d</guid>
      <description>&lt;p&gt;Hoje eu vou falar um pouco sobre uma das formas que eu mais gosto de ficar atualizada sobre as notícias e também para estudar sobre a minha área.&lt;/p&gt;

&lt;p&gt;Você provavelmente já deve ter ouvido falar sobre os podcasts, mas eu quero saber, você já escutou algum? &lt;br&gt;
Se não, hoje eu te convido a entrar nesse mundo. E para isso eu vou listar alguns podcasts sobre tecnologia que podem ser a porta de entrada para você se apaixonar por esse mundo.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://i.giphy.com/media/h8yhqgovaZ5z58j7hg/giphy.gif" class="article-body-image-wrapper"&gt;&lt;img src="https://i.giphy.com/media/h8yhqgovaZ5z58j7hg/giphy.gif" width="440" height="247"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h1&gt;
  
  
  &lt;strong&gt;Primeiro, o que é um Podcast?&lt;/strong&gt;
&lt;/h1&gt;

&lt;p&gt;Acho que a forma mais fácil de explicar é: &lt;strong&gt;podcast é um conteúdo de mídia (áudio) que funciona como um programa de rádio, só que com algumas vantagens.&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Você pode escutar podcasts a hora que você quiser. Além de poder dar pausas, voltar os minutos, avançar os minutos, acelerar a velocidade do áudio... &lt;br&gt;
E além de tudo, você pode criar um podcast seu para compartilhar o que você quiser. &lt;br&gt;
Existem podcasts de vários temas, como: tecnologia, esporte, notícias no geral, comédia e entretenimento, lifestyle, histórias, games, kids, relaxamento e outros...&lt;/p&gt;

&lt;p&gt;Eu particularmente adoro escutar no trânsito, arrumando a casa, lavando a louça ou naquele tempinho que você consegue tirar só para relaxar e escutar o episódio de um tema que você gosta para se distrair.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://i.giphy.com/media/fX1hwPu5NzXfq/giphy.gif" class="article-body-image-wrapper"&gt;&lt;img src="https://i.giphy.com/media/fX1hwPu5NzXfq/giphy.gif" width="250" height="208"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h1&gt;
  
  
  &lt;strong&gt;Tá, mas onde eu escuto esse trem?&lt;/strong&gt;
&lt;/h1&gt;

&lt;p&gt;Aqui você não precisa sintonizar em nenhuma estação, você pode acessar seus podcasts favoritos de diversas formas. &lt;br&gt;
Se você já utiliza o &lt;em&gt;Spotify&lt;/em&gt;, você pode escutar por lá mesmo, tanto pelo aplicativo para celular quanto no seu navegador através do site &lt;a href="https://open.spotify.com/"&gt;open.spotify.com&lt;/a&gt;. &lt;br&gt;
Existe uma aba somente para esse tipo de conteúdo na plataforma.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--VsvSIXEg--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2AXvGIuiBb6VEhr4KOgj7EOA.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--VsvSIXEg--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2AXvGIuiBb6VEhr4KOgj7EOA.png" width="875" height="406"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Agora, se você utiliza outro serviço de streaming de áudio(Google Podcasts, Deezer, Overcast e outros) não tem problema, você também irá encontrar uma seção dedicada a podcasts. &lt;/p&gt;

&lt;h1&gt;
  
  
  &lt;strong&gt;Agora vamos para as dicas?&lt;/strong&gt;
&lt;/h1&gt;

&lt;p&gt;Aqui eu vou listar as minhas humildes indicações de podcasts sobre tecnologia, sinta-se a vontade para indicar outros nos comentários ♥&lt;/p&gt;

&lt;p&gt;&lt;a href="https://i.giphy.com/media/5brZO0mKcP2VxvQxXc/giphy.gif" class="article-body-image-wrapper"&gt;&lt;img src="https://i.giphy.com/media/5brZO0mKcP2VxvQxXc/giphy.gif" width="480" height="270"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/0dTUNs8tpqAC5d71m8SGU0?si=OpVMvnUWR6Soxway63MdBw"&gt;Start Coding&lt;/a&gt; (nesse inclusive eu irei participar como host de alguns episódios, ele nasceu hoje e no primeiro episódio você pode conhecer um pouco mais sobre a nossa iniciativa)&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/2p0Vx75OmfsXktyLBuLuSf?si=6q7v_hOCRIaGD2DRXNhMgQ"&gt;Hipsters Ponto Tech&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/3LarGq2mUuzZD070OGf4In?si=Y-ZLMb90QSWJkyeP5eFQFQ"&gt;Bit de Prosa&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/1oMIHOXsrLFENAeM743g93?si=re_XnkCeQGmMXSiv1t2lig"&gt;Data Hackers&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/5k0Ei0MSg5BuiHshr43aSg?si=JaNMaseCTlWKF1hi-GL0Dg"&gt;Pizza de Dados&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/34rFVm8snXU7G9f1yVK3Wj?si=v6GVQIiBTlu0lANnLJXthg"&gt;TradingCast&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/16ZtU9p6Pja5H87W35owjY"&gt;PodProgramar&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/6yDVxOBnkzwlOfcWyI8M1i?si=ei243d6wSa2gRlqC3RxyrA"&gt;Coluna7&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/7CfgmCGepjTPu9rwzkt4K2?si=-n0PjVgOT8--MJuoGsBTdQ"&gt;Ciência Pod&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/4sKgJqaCEQdUECeCViknr5?si=H7yOJ8azTQSvP4DX25ywVQ"&gt;Loop Matinal&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/3pDA5LoCPmOJ2qHkQoV1t5?si=zvbutxGjRtWJehfL4S_3Gg"&gt;Mario Filho - Data Science/Machine Learning&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/2yaqJ4H0jc11phvCA60wKn?si=NLiArUV-QumUno7jAeVUXw"&gt;Data Science Academy&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/6jYjcj4oQ31J85jGhbiRkK?si=yI66Fsk_T0yo2GcDJmjPMg"&gt;Cabeça de Lab&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/4cqX5o40bClwqtYHv9X7Lp?si=ZWvYCK5xS--CFWV42WsjNQ"&gt;Depois do Café&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/6TBtAsUzZxqnOYPuwmrFrl?si=iH4qbaruQ3WFQrFbZJbCsA"&gt;Carreira sem Fronteiras&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://open.spotify.com/show/4t6OryBWxliv82lw751ckf?si=RkW2uhrBTIGzfUFRsyGRTQ"&gt;MIT Technology Review Brasil&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;p&gt;Espero que você escute e goste de pelo menos um (acho díficil gostar de só um rs) desses podcasts. Em posts futuros pretendo trazer indicações de outros temas também.&lt;/p&gt;

&lt;h2&gt;
  
  
  &lt;strong&gt;Contatos:&lt;/strong&gt;
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;[LinkedIn]: &lt;a href="https://www.linkedin.com/in/beatrizmaiads/"&gt;https://www.linkedin.com/in/beatrizmaiads/&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[GitHub]: &lt;a href="https://github.com/beatrizmaiads"&gt;https://github.com/beatrizmaiads&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[Instagram]: &lt;a href="https://dev.to/beatrizmaiads"&gt;@beatrizmaiads&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[Dev.to]: &lt;a href="https://dev.to/beatrizmaiads"&gt;https://dev.to/beatrizmaiads&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[Medium]: &lt;a href="https://medium.com/@beatrizmaiads"&gt;https://medium.com/@beatrizmaiads&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[E-mail]: &lt;a href="//mailto:beatrizmaiads@outlook.com"&gt;beatrizmaiads@outlook.com&lt;/a&gt;
&lt;/li&gt;
&lt;/ul&gt;

</description>
      <category>datascience</category>
      <category>computerscience</category>
      <category>womenintech</category>
      <category>podcast</category>
    </item>
    <item>
      <title>Tipos de Aprendizado de Máquina #3</title>
      <dc:creator>Beatriz Maia</dc:creator>
      <pubDate>Fri, 14 Aug 2020 21:12:36 +0000</pubDate>
      <link>https://dev.to/beatrizmaiads/tipos-de-aprendizado-de-maquina-3-5d66</link>
      <guid>https://dev.to/beatrizmaiads/tipos-de-aprendizado-de-maquina-3-5d66</guid>
      <description>&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--e0geSTWM--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2AlJcamouoOv8-8EtMlV8m1g.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--e0geSTWM--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2AlJcamouoOv8-8EtMlV8m1g.png" width="875" height="437"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Fazendo um link (literalmente rs) com &lt;a href="https://dev.to/beatrizmaiads/o-que-e-inteligencia-artificial-data-science-machine-learning-e-deep-learning-primeiros-passos-2-41l7"&gt;o post da semana passada&lt;/a&gt;, o post de hoje será destinado a explicar um pouco melhor sobre os tipos de Aprendizado de Máquina. &lt;br&gt;
Sempre tentando trazer o conteúdo de maneira visual para facilitar o entendimento e claro, com a ajudinha de alguns gifs para deixar tudo mais divertido.&lt;/p&gt;

&lt;p&gt;As máquinas podem aprender de formas diferentes e hoje você irá entender como isso é possível.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--FAPU1ZIn--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://isitics.com/wp-content/uploads/2018/05/WP2-IA000000-07-1024x599.jpg" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--FAPU1ZIn--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://isitics.com/wp-content/uploads/2018/05/WP2-IA000000-07-1024x599.jpg" width="880" height="515"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h1&gt;
  
  
  &lt;strong&gt;Aprendizado Supervisionado (Supervised Learning).&lt;/strong&gt;
&lt;/h1&gt;

&lt;p&gt;No &lt;strong&gt;Aprendizado Supervisionado&lt;/strong&gt;, os dados são apresentados ao algoritmo com os dados de entrada e com os resultados que acompanha aquele conjunto de dados, isso tudo para auxiliar no aprendizado. &lt;/p&gt;

&lt;p&gt;Se você pensar bem, de certa forma, o seu aprendizado também foi supersionado. Como assim?&lt;br&gt;
Bom, quando você era jovem nesse mundo e não precisava pagar boletos e ter preocupações (saudades né?), muito provavelmente alguém chegou para você e disse "olha ali o au au" enquanto apontava para um cachorro ou cachorra. Então tinhamos ali alguém te ajudando a aprender que animal era aquele. E com o tempo você foi aprendendo as características de cada animalzinho e foi ficando mais fácil identificar cada um, mas para isso você teve que ter contato com uma quantidade de dados considerável para esse seu aprendizado ser eficiente. &lt;/p&gt;

&lt;p&gt;Essa é uma analogia que você pode considerar até boba, mas é bem utilizada para explicar superficialmente como alguns algoritmos funcionam.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://i.giphy.com/media/T7nRl5WHw7Yru/giphy.gif" class="article-body-image-wrapper"&gt;&lt;img src="https://i.giphy.com/media/T7nRl5WHw7Yru/giphy.gif" width="320" height="240"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Agora vamos para um outro exemplo, dessa vez algo mais parecido com o que você pode encontrar por ai. Vamos supor que estamos trabalhando em cima de um conjunto de dados referente a imóveis de uma região do Rio de Janeiro e precisamos prever o valor de aluguel de imóveis dessa região. &lt;/p&gt;

&lt;p&gt;Dentro desse conjunto de dados temos algumas características desses imóveis, como quantidade de quartos, quantidade de banheiros, se possui garagem, renda média de quem alugou aquele imóvel e etc… E além disso, também é fornecido o valor de aluguel daquele imóvel em questão.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--wk1LF4YZ--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2AqhoReW3mZz__GKbrI0eWPg.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--wk1LF4YZ--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://miro.medium.com/max/875/1%2AqhoReW3mZz__GKbrI0eWPg.png" width="875" height="213"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Aqui nós temos algumas características dos imóveis, além do valor de aluguel representado na coluna &lt;strong&gt;Valor&lt;/strong&gt;. Esse é um típico caso de &lt;strong&gt;Regressão&lt;/strong&gt;, onde queremos &lt;strong&gt;prever um valor contínuo&lt;/strong&gt;, como nesse caso, o valor do aluguel.&lt;/p&gt;

&lt;p&gt;Outro exemplo, é o filtro de Spam, ele é treinado com muitos exemplos de emails junto a suas classes (spam ou não spam) e conforme novos dados são fornecido a este modelo, ele consegue fazer a &lt;strong&gt;Classificação&lt;/strong&gt; pois já foi ensinado a reconhecer padrões dentro daquelas classes (spam ou não spam). &lt;br&gt;
&lt;strong&gt;O Aprendizado Supervisionado aprende com os dados já rotulados.&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Algoritmos comuns nesse tipo de Aprendizado:&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;K-NN (K-Nearest Neighbours).&lt;/li&gt;
&lt;li&gt;Decision Tree e Random Forest (Árvores de Decisão e Florestas Aleatórias).&lt;/li&gt;
&lt;li&gt;Regressão Linear.&lt;/li&gt;
&lt;li&gt;Regressão Logística.&lt;/li&gt;
&lt;li&gt;SVM — Máquinas de Vetores de Suporte.&lt;/li&gt;
&lt;/ul&gt;

&lt;h1&gt;
  
  
  &lt;strong&gt;Aprendizado Não Supervisionado (Unsupervised Learning).&lt;/strong&gt;
&lt;/h1&gt;

&lt;p&gt;No &lt;strong&gt;Aprendizado Não Supervisionado&lt;/strong&gt;, os dados forncedidos para o treinamento do modelo não são rotulados. O modelo tenta aprender sem um supervisor.&lt;/p&gt;

&lt;p&gt;Vamos supor que você tenha um e-commerce e que tenha um volume muito grande de dados sobre os visitantes do seu site. Como já foi dito, dados são informações, você pode fazer inferências em cima desses dados. Nesse caso, você pode querer aplicar um algoritmo de &lt;em&gt;clustering&lt;/em&gt; para detectar grupos de visitantes semelhantes para tentar identificar comportamentos parecidos em relação as compras do seu site. Como esses dados não são rotulados, você não tem a informação de quais grupos existem e nem em qual grupo cada visitante pertence. O algoritmo tentará encontrar essas conexões sem a sua ajuda, sem a sua supervisão.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Alguns algoritmos desse tipo de Aprendizado:&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;Clustering:&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;Clustering Hierárquico(HCA)&lt;/li&gt;
&lt;li&gt;k-Means
Aprendizado da regra de associação:&lt;/li&gt;
&lt;li&gt;Apriori&lt;/li&gt;
&lt;li&gt;Eclat&lt;/li&gt;
&lt;/ul&gt;

&lt;h1&gt;
  
  
  &lt;strong&gt;Aprendizado Semi-Supervisionado (Semi-Supervised Learning).&lt;/strong&gt;
&lt;/h1&gt;

&lt;p&gt;O google fotos é um bom exemplo desse tipo de aprendizado e você já deve ter notado isso nas suas fotos em família ou amigos. O serviço carrega todas as suas fotos e automaticamente reconhece as pessoas que estão ali. Por exemplo, ele reconhce que a pessoa &lt;strong&gt;A&lt;/strong&gt; aparece nas fotos &lt;strong&gt;1, 3 e 5&lt;/strong&gt;, enquanto a pessoa B aparece nas fotos &lt;strong&gt;2, 4 e 6&lt;/strong&gt;. O algoritmo faz um agrupamento, sendo assim a parte não supervisionada. Já a parte supervisionada é quando você precisa rotular aquelas pessoas, ou seja, dizer ao aplicativo quem são aquelas pessoas.&lt;/p&gt;

&lt;h1&gt;
  
  
  &lt;strong&gt;Aprendizado por Reforço (Reinforcement Learning).&lt;/strong&gt;
&lt;/h1&gt;

&lt;p&gt;Aqui o sistema de aprendizado é chamado de &lt;strong&gt;agente&lt;/strong&gt;. Esse agente irá interagir com o ambiente externo para realizar uma ação e atingir um determinado objetivo. O ambiente irá recompensar ou punir o agente de acordo com suas ações. E assim, com base no feedback que ele recebeu por ter executado tal ação, ele aprenderá por si só qual é a melhor estratégia a seguir.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://i.giphy.com/media/S0hxMGYFhEMzm/giphy.gif" class="article-body-image-wrapper"&gt;&lt;img src="https://i.giphy.com/media/S0hxMGYFhEMzm/giphy.gif" width="500" height="365"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Você já deve ter ouvido falar da AlphaGo, uma inteligência artificial desenvolvida para jogar um jogo chamado Go e que durante uma disputa, venceu o campeão mundial Ke Jie no jogo. O AlphaGo analisou milhões de jogos e depois praticou muito contra si mesmo para atingir esse resultado. Leia mais sobre &lt;a href="https://deepmind.com/research/case-studies/alphago-the-story-so-far"&gt;aqui.&lt;/a&gt;.&lt;/strong&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  &lt;strong&gt;Referências:&lt;/strong&gt;
&lt;/h2&gt;

&lt;p&gt;&lt;em&gt;&lt;a href="https://www.amazon.com.br/M%C3%A3os-Obra-Aprendizado-Scikit-Learn-TensorFlow/dp/8550803812/ref=asc_df_8550803812/?tag=googleshopp00-20&amp;amp;linkCode=df0&amp;amp;hvadid=379748659420&amp;amp;hvpos=&amp;amp;hvnetw=g&amp;amp;hvrand=5950424541098989292&amp;amp;hvpone=&amp;amp;hvptwo=&amp;amp;hvqmt=&amp;amp;hvdev=c&amp;amp;hvdvcmdl=&amp;amp;hvlocint=&amp;amp;hvlocphy=1031613&amp;amp;hvtargid=pla-812887614657&amp;amp;psc=1"&gt;Livro Mãos à Obra: Aprendizado de Máquina com Scikit-Learn &amp;amp; TensorFlow&lt;/a&gt;&lt;/em&gt;&lt;br&gt;
&lt;em&gt;&lt;a href="https://www.amazon.com.br/Hands-Deep-Learning-Algorithms-Python-ebook/dp/B07LH43V8P"&gt;Livro Hands-On Deep Learning Algorithms with Python&lt;/a&gt;&lt;/em&gt;&lt;/p&gt;

&lt;h2&gt;
  
  
  &lt;strong&gt;Contatos:&lt;/strong&gt;
&lt;/h2&gt;

&lt;ul&gt;
&lt;li&gt;[LinkedIn]: &lt;a href="https://www.linkedin.com/in/beatrizmaiads/"&gt;https://www.linkedin.com/in/beatrizmaiads/&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[GitHub]: &lt;a href="https://github.com/beatrizmaiads"&gt;https://github.com/beatrizmaiads&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[Instagram]: &lt;a class="mentioned-user" href="https://dev.to/beatrizmaiads"&gt;@beatrizmaiads&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[Dev.to]: &lt;a href="https://dev.to/beatrizmaiads"&gt;https://dev.to/beatrizmaiads&lt;/a&gt;
&lt;/li&gt;
&lt;li&gt;[Email]: &lt;a href="mailto:beatrizmaiads@outlook.com"&gt;beatrizmaiads@outlook.com&lt;/a&gt;
&lt;/li&gt;
&lt;/ul&gt;

</description>
      <category>datascience</category>
      <category>machinelearning</category>
      <category>womenintech</category>
      <category>computerscience</category>
    </item>
    <item>
      <title>O que é Inteligência Artificial, Data Science, Machine Learning e Deep Learning? Primeiros Passos #2</title>
      <dc:creator>Beatriz Maia</dc:creator>
      <pubDate>Sat, 08 Aug 2020 04:27:29 +0000</pubDate>
      <link>https://dev.to/beatrizmaiads/o-que-e-inteligencia-artificial-data-science-machine-learning-e-deep-learning-primeiros-passos-2-41l7</link>
      <guid>https://dev.to/beatrizmaiads/o-que-e-inteligencia-artificial-data-science-machine-learning-e-deep-learning-primeiros-passos-2-41l7</guid>
      <description>&lt;p&gt;Acho que um bom começo, antes de chegar aqui postando projetos finalizados, seria apresentar os conceitos de Inteligência Artificial, Data Science, Machine Learning e Deep Learning.&lt;br&gt;
Vejo que no início muitas pessoas acabam tendo um pouco de dificuldade de entender as diferenças de cada área. Espero que com esse post eu consiga ajudar a esclarecer as coisas para você.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://i.giphy.com/media/STkpRjwVGYj1oX3qmb/giphy.gif" class="article-body-image-wrapper"&gt;&lt;img src="https://i.giphy.com/media/STkpRjwVGYj1oX3qmb/giphy.gif" width="480" height="270"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;h1&gt;
  
  
  &lt;strong&gt;Artificial Intelligence (Inteligência Artificial):&lt;/strong&gt;
&lt;/h1&gt;

&lt;p&gt;Para começar a falar sobre IA é necessário primeiro falarmos sobre o processo de transformação digital que vem acontecendo nos últimos tempos. Mas o que essa transformação digital provocou? O que ela transformou? &lt;/p&gt;

&lt;p&gt;Bom… praticamente tudo. Quem aqui nunca pediu uma comidinha no final de semana pelo ifood? Quem nunca se pegou, enquanto planejava uma viagem, comparando os preços dos hoteis com os preços oferecido pelo airbnb? Ou se pegou pedindo um uber? &lt;br&gt;
Essas e outras formas de agir vem sendo mudadas com o avanço da tecnologia e com as empresas ditas como disruptivas.&lt;/p&gt;

&lt;p&gt;Junto com isso a produção de dados cresceu e MUITO. Só para ter uma noção, vou deixar aqui abaixo uma imagem que mostra a quantidade de dados gerados em 60 minutos, no ano de 2019, por alguns aplicativos bem conhecidos que com certeza você utiliza no seu dia a dia.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--zoIbjbdx--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://cdn-images-1.medium.com/max/1000/0%2AJpfcdidXzyIhnpCu" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--zoIbjbdx--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://cdn-images-1.medium.com/max/1000/0%2AJpfcdidXzyIhnpCu" width="820" height="950"&gt;&lt;/a&gt;&lt;br&gt;
E ai, vocês tinham noção desse número? Pois eu fiquei bem surpresa.&lt;/p&gt;

&lt;h1&gt;
  
  
  &lt;strong&gt;Data Science (Ciência de Dados):&lt;/strong&gt;
&lt;/h1&gt;

&lt;p&gt;Você provavelmente já deve ter ouvido falar que Data Science é "o emprego mais sexy do século 21". Hey, não sou eu que tô falando…&lt;/p&gt;

&lt;p&gt;&lt;a href="https://i.giphy.com/media/UVOcaihjOgH3q/giphy.gif" class="article-body-image-wrapper"&gt;&lt;img src="https://i.giphy.com/media/UVOcaihjOgH3q/giphy.gif" width="187" height="136"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Vou deixar o artigo &lt;a href="https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century"&gt;aqui&lt;/a&gt; para você conferir.&lt;/p&gt;

&lt;p&gt;Data Science é só computação? Não!!! Apenas formados em T.I trabalham nessa área? Não mesmo.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Data Science&lt;/strong&gt; é a soma de algumas áreas como matemática, programação, estatística… Aqui precisamos ter (ou desenvolver) a capacidade de solucionar problemas e claro, ter um entendimento de negócio. Já deu pra perceber que estamos falando de um(a) profissional multidisciplinar, não é? &lt;/p&gt;

&lt;p&gt;A pessoa Cientista de Dados é responsável por transformar dados em informações úteis que podem auxiliar as empresas no processo de tomada de decisão. Muitas vezes essa pessoa responde perguntas que antes nem mesmo tinham sido formuladas.&lt;/p&gt;

&lt;p&gt;As funções de um/uma Cientista de Dados podem variar de acordo com a empresa em que trabalha e o seu nível. Mas a pessoa Cientista de Dados utiliza modelos estatísticos, algoritmos de Machine Learning e outras ferramentas e estratégias para obter e trabalhar em cima dos dados. &lt;br&gt;
O que muita gente não sabe é que os dados não chegam prontos da sua fonte, um trabalho minucioso precisa ser feito. Eles precisam ser tratados e modelados para se chegar no resultado que se espera.&lt;/p&gt;

&lt;h1&gt;
  
  
  &lt;strong&gt;Machine Learning (Aprendizado de Máquina):&lt;/strong&gt;
&lt;/h1&gt;

&lt;p&gt;Vou utilizar a definição que encontrei em um livro de Machine Learning (Aprendizado de Máquina com Scikit-Learn &amp;amp; TensorFlow) que gosto muito:&lt;/p&gt;

&lt;blockquote&gt;
&lt;p&gt;*&lt;b&gt;"Aprendizado de Máquina&lt;/b&gt; é a ciência (e a arte) da programação de computadores para que eles possam aprender com os dados.&lt;/p&gt;

&lt;p&gt;Veja uma definição um pouco mais abrangente: &lt;/p&gt;

&lt;p&gt;Aprendizado de Máquina é o campo de estudo que dá aos computadores a habilidade de aprender sem ser explicitamente programado. - Arthur Samuel, 1959"&lt;br&gt;
Géron, Aurélien. Mãos à Obra: Aprendizado de Máquina com Scikit-Learn &amp;amp; TensorFlow.*&lt;/p&gt;
&lt;/blockquote&gt;

&lt;p&gt;Como já foi dito anteriormente, milhões de dados são gerados a cada minuto e uma coisa que você precisa entender é que dado é informação e que além de ser informação por si só, ele pode te trazer ainda mais informações quando analisados de forma correta. &lt;/p&gt;

&lt;p&gt;Os dados podem dizer muito sobre o gosto dos seus clientes. Por exemplo, o que eles gostam de consumir e até o que de acordo com o histórico de compras dele (ou de outras pessoas com gosto similar) iria ser interessante de ser apresentado a ele através de um anúncio.&lt;/p&gt;

&lt;p&gt;Um exemplo muito utilizado para exemplificar o que pode ser feito através do Aprendizado de Máquina é a classificação de e-mails em spam e não spam. Isso mesmo, o filtro de spam do seu e-mail é um programa de A.M. Assim, com base nos e-mails já conhecidos e rotulados como spam e não spam, o nosso modelo consegue aprender com esses dados e classificar os novos e-mails de forma correta (bom, é isso que a gente espera né).&lt;/p&gt;

&lt;p&gt;É claro que conseguimos fazer mais coisas com os algoritmos de A.M. Além de classificar, também podemos prever valores, como prever o valor do aluguel de um imóvel com base nas suas características (nº de quartos, banheiros, se possui garagem e etc) e também podemos fazer agrupamentos, para fazer uma segmentação de clientes por exemplo.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--QjSiQo0N--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://cdn-images-1.medium.com/max/1000/0%2Aux7NpwstkORfPyu2.png" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--QjSiQo0N--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://cdn-images-1.medium.com/max/1000/0%2Aux7NpwstkORfPyu2.png" width="880" height="332"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Para se chegar em um modelo que performa bem, um caminho com alguns passos precisa ser percorrido, precisamos entender o problema, obter os dados, conhecer melhor esses dados, tratar esses dados e etc… Além disso, existem tipos de Aprendizado de Máquina, como o Aprendizado Supervisionado e o Não Supervisionado (já dando um spoiler, esse será o assunto do próximo post rs).&lt;/p&gt;

&lt;p&gt;Aqui estou citando alguns exemplos para tornar o seu entendimento mais claro, mas pretendo trazer conteúdos detalhados a certa dos modelos que podem ser criados e que soluções eles podem trazer.&lt;/p&gt;

&lt;h1&gt;
  
  
  &lt;strong&gt;Deep Learning (Aprendizado Profundo):&lt;/strong&gt;
&lt;/h1&gt;

&lt;p&gt;O Deep Learning vem sendo muito utilizado por grandes empresas como Amazon, Microsoft, Google e outras principalmente para classificação, reconhecimento de voz e reconhecimento de imagem.&lt;br&gt;
Explicando de uma forma mais simples, o Deep Learning é um ramo dentro do Machine Learning voltado à análise mais aprofundada de dados e em um volume muito mais amplo de dados.&lt;/p&gt;

&lt;p&gt;O principal objetivo é permitir que as máquinas aprendam a observar padrões e correlações em um grande volume de dados e tentar reproduzir com esse aprendizado, o funcionamento das redes neurais do cérebro humano.&lt;/p&gt;

&lt;p&gt;&lt;a href="https://res.cloudinary.com/practicaldev/image/fetch/s--FB122NZJ--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://cdn-images-1.medium.com/max/1000/0%2AiiYn4uFOmqRizG3w.jpg" class="article-body-image-wrapper"&gt;&lt;img src="https://res.cloudinary.com/practicaldev/image/fetch/s--FB122NZJ--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_880/https://cdn-images-1.medium.com/max/1000/0%2AiiYn4uFOmqRizG3w.jpg" width="880" height="622"&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Esse aprendizado é feito através de múltiplas camadas e envolve diversos neurônios que utilizam funções matemáticas no seu interior.&lt;/p&gt;

&lt;p&gt;Um assunto tão lindo e amplo merece um post mais explicativo só para si, então em breve entraremos a fundo (olha a piadinha rs) dentro do Deep Learning.&lt;/p&gt;

&lt;p&gt;Esse foi um post mais básico onde quis trazer os principais conceitos das áreas e tecnologias que você já deve ter ouvido falar por ai. Aqui damos inicio a nossa caminhada no mundo dos 🎲.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;Abaixo vou deixar mais alguns link de conteúdos relacionados ao assunto para te auxiliar nos estudos:&lt;/strong&gt;&lt;/p&gt;

&lt;ul&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://www.amazon.com.br/M%C3%A3os-Obra-Aprendizado-Scikit-Learn-TensorFlow/dp/8550803812/ref=pd_lpo_14_img_1/142-3753912-5004328?_encoding=UTF8&amp;amp;pd_rd_i=8550803812&amp;amp;pd_rd_r=89412840-f289-471b-b326-2ae0852d1286&amp;amp;pd_rd_w=sHSOM&amp;amp;pd_rd_wg=dNl3N&amp;amp;pf_rd_p=e7e26e7d-6256-4aae-92f9-7ffa337ed626&amp;amp;pf_rd_r=GS6YXTMPAH0KRMRHH1TS&amp;amp;psc=1&amp;amp;refRID=GS6YXTMPAH0KRMRHH1TS"&gt;Livro Mãos à Obra: Aprendizado de Máquina com scikit-Learn &amp;amp; TensorFlow&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a&gt;CURSO DE INTELIGÊNCIA ARTIFICIAL PARA TODOS&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://www.youtube.com/watch?v=TNDiiVwQ5Vo&amp;amp;t=1433s"&gt;Machine Learning - Primeiros Passos&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;li&gt;&lt;p&gt;&lt;a href="https://www.youtube.com/watch?v=ccZ2pyr3YDw&amp;amp;t=758s"&gt;Qual a diferença entre Inteligência Artificial, Machine Learning, Data Science, Deep Learning, etc?&lt;/a&gt;&lt;/p&gt;&lt;/li&gt;
&lt;/ul&gt;

&lt;h2&gt;
  
  
  &lt;strong&gt;Contatos:&lt;/strong&gt;
&lt;/h2&gt;

</description>
      <category>datascience</category>
      <category>machinelearning</category>
      <category>python</category>
      <category>womenintech</category>
    </item>
  </channel>
</rss>
