DEV Community

Sthe Monica
Sthe Monica

Posted on

Velozes, Furiosos e... Estatísticos? Explicando Teste de Hipótese com Drift.

Alt Text

Foi essa pergunta que me fiz neste final de semana, após assistir a "Velozes e Furiosos: Desafio em Tóquio" pela primeira vez: como usar a ousadia dos drifts para explicar um belo Teste de Hipótese para meus alunos? Afinal, como transformar um conceito estatístico, essencial na área de dados, em algo que não seja confuso ao primeiro olhar?

A resposta veio na aula de hoje. No final, para cativar a galera, usei um exemplo que fez todo mundo rir, e resolvi compartilhar aqui.


O ponto de partida

Enquanto assistia ao filme PELA PRIMEIRA VEZ, duas perguntas surgiram:

  • "Será que eu consigo fazer drift com meu golzinho?"
  • "Será que o número de capotamentos de carro aumentou depois do lançamento do filme?"

A primeira pergunta deixaremos de lado (pela segurança do golzinho), mas a segunda é um ponto de partida perfeito para um teste de hipótese.

Alt Text

Tudo começa com uma pergunta. No nosso caso:
"O número médio de capotamentos aumentou após o lançamento do filme?"


Definindo as hipóteses

Com a pergunta definida, criamos nossas hipóteses. Eu gosto de começar pela Hipótese Alternativa (Hₐ) e depois ir para a Hipótese Nula (H₀), então vamos seguir essa ordem por aqui. A Hₐ é basicamente a nossa suspeita, aquilo que queremos investigar.

  • Hipótese Alternativa (Hₐ): O número médio de capotamentos aumentou após o lançamento do filme.

A H₀ é sempre o antagonista da nossa Hₐ, ou seja, vamos fazer ela ao contrário da alternativa (também podemos pensar nela sendo a nossa normalidade :D)

  • Hipótese Nula (H₀): O número médio de capotamentos permaneceu o mesmo ou diminuiu após o lançamento do filme.

Alt Text


Alpha (α) e p-valor

A partir daqui, nosso teste de hipótese depende de dois valores cruciais: o alpha (α) e o p-value.

  • Alpha (α): nosso limite, a régua de aceitação. É um valor definido antes do teste (geralmente 0.05 ou 5%).

    • Ele representa o nível de significância, ou seja, a probabilidade máxima de cometer um Erro Tipo I (rejeitar a H₀ por engano, um “falso positivo”).
    • Exemplo: definir α = 0.05 significa aceitar uma chance de 5% de cometer esse erro.
  • p-value: é calculado a partir dos nossos dados e funciona como um índice de surpresa. Varia de 0 a 1 e indica quão provável seria obter os resultados se a H₀ fosse verdadeira.

    • p-value baixo (ex: 0.01): resultado muito surpreendente! Talvez a nossa suspeita (Hₐ) esteja correta.
    • p-value alto (ex: 0.70): nada surpreendente, poderia acontecer por acaso, mesmo que nada tenha mudado.

Alt Text


Tomando a decisão

A conclusão vem da comparação entre p-value e α:

  • Se p-value ≤ α: rejeitamos a H₀.
    Há evidência estatística para apoiar nossa suspeita.
    → No exemplo, diríamos que sim, o lançamento do filme parece ter relação com o aumento de acidentes por capotamento.

  • Se p-value > α: falhamos em rejeitar a H₀.
    Não encontramos evidências suficientes para afirmar que o filme causou um aumento.
    → Concluímos que não houve mudança estatisticamente significativa.

Alt Text

Testando na prática com Python

Se você quiser rodar essa análise no Python, usaria provavelmente a biblioteca scipy. Para comparar os acidentes “antes” e “depois”, o teste ideal seria o Teste T de Amostras Independentes:

from scipy import stats

# Supondo que 'antes' e 'depois' são listas com o número de acidentes
stats.ttest_ind(depois, antes, alternative='greater')
Enter fullscreen mode Exit fullscreen mode

O parâmetro alternative='greater' especifica que estamos fazendo um teste unilateral, exatamente como em nossa pergunta original!


E aí, você já tinha pensado em testes estatísticos dessa forma?

Alt Text

Top comments (4)

Collapse
 
srcsoftwareengineer profile image
SANDRO REGIS CARDOSO

Muito bom o artigo! Uma outra hipótese interessante e que certamente haverá uma resposta conclusiva é: As indústrias de pneus aumentaram suas vendas? Provavelmente, sim e muitoooo rsrssss.. Obrigado pelo conhecimento compartilhado! 🥋

Collapse
 
sthemonica profile image
Sthe Monica

Essa é uma ótima! Vi depois o primeiro filme onde eles falam muito sobre o tipo de pneu e a Pirelli é o pneu em destaque, analisar esse ponto também seria ótimo! E ainda no primeiro filme eles fazem muita propaganda da cerveja Corona, será que o consumo/popularidade dela também aumentou?
Depois que começa a entender como fazer um teste estatístico é quase impossível "desver" em vários momentos cotidianos hahahaha

Collapse
 
guilherme_tolentino_a00f3 profile image
Guilherme Tolentino

Muito interessante! Explica de forma clara e didática um conceito muito importante para nossa área.

Acho bem provável que a Corona tenha vendido mais depois desse filme! Antes dele, quase não ouvia falar dela.

"You can have any brew you want.. as long as it's a Corona" Toretto

Collapse
 
sthemonica profile image
Sthe Monica

Pior que é isso mesmo. Eu já conhecia a Corona, mas porque demorei MUITOS anos depois do primeiro filme para ver ele (só 24 anos hahaha), e tenho certeza que foi alguma estruturação de marca/aumento de vendas!