Foi essa pergunta que me fiz neste final de semana, após assistir a "Velozes e Furiosos: Desafio em Tóquio" pela primeira vez: como usar a ousadia dos drifts para explicar um belo Teste de Hipótese para meus alunos? Afinal, como transformar um conceito estatístico, essencial na área de dados, em algo que não seja confuso ao primeiro olhar?
A resposta veio na aula de hoje. No final, para cativar a galera, usei um exemplo que fez todo mundo rir, e resolvi compartilhar aqui.
O ponto de partida
Enquanto assistia ao filme PELA PRIMEIRA VEZ, duas perguntas surgiram:
- "Será que eu consigo fazer drift com meu golzinho?"
- "Será que o número de capotamentos de carro aumentou depois do lançamento do filme?"
A primeira pergunta deixaremos de lado (pela segurança do golzinho), mas a segunda é um ponto de partida perfeito para um teste de hipótese.
Tudo começa com uma pergunta. No nosso caso:
"O número médio de capotamentos aumentou após o lançamento do filme?"
Definindo as hipóteses
Com a pergunta definida, criamos nossas hipóteses. Eu gosto de começar pela Hipótese Alternativa (Hₐ) e depois ir para a Hipótese Nula (H₀), então vamos seguir essa ordem por aqui. A Hₐ é basicamente a nossa suspeita, aquilo que queremos investigar.
- Hipótese Alternativa (Hₐ): O número médio de capotamentos aumentou após o lançamento do filme.
A H₀ é sempre o antagonista da nossa Hₐ, ou seja, vamos fazer ela ao contrário da alternativa (também podemos pensar nela sendo a nossa normalidade :D)
- Hipótese Nula (H₀): O número médio de capotamentos permaneceu o mesmo ou diminuiu após o lançamento do filme.
Alpha (α) e p-valor
A partir daqui, nosso teste de hipótese depende de dois valores cruciais: o alpha (α) e o p-value.
-
Alpha (α): nosso limite, a régua de aceitação. É um valor definido antes do teste (geralmente 0.05 ou 5%).
- Ele representa o nível de significância, ou seja, a probabilidade máxima de cometer um Erro Tipo I (rejeitar a H₀ por engano, um “falso positivo”).
- Exemplo: definir α = 0.05 significa aceitar uma chance de 5% de cometer esse erro.
-
p-value: é calculado a partir dos nossos dados e funciona como um índice de surpresa. Varia de 0 a 1 e indica quão provável seria obter os resultados se a H₀ fosse verdadeira.
- p-value baixo (ex: 0.01): resultado muito surpreendente! Talvez a nossa suspeita (Hₐ) esteja correta.
- p-value alto (ex: 0.70): nada surpreendente, poderia acontecer por acaso, mesmo que nada tenha mudado.
Tomando a decisão
A conclusão vem da comparação entre p-value e α:
Se p-value ≤ α: rejeitamos a H₀.
Há evidência estatística para apoiar nossa suspeita.
→ No exemplo, diríamos que sim, o lançamento do filme parece ter relação com o aumento de acidentes por capotamento.Se p-value > α: falhamos em rejeitar a H₀.
Não encontramos evidências suficientes para afirmar que o filme causou um aumento.
→ Concluímos que não houve mudança estatisticamente significativa.
Testando na prática com Python
Se você quiser rodar essa análise no Python, usaria provavelmente a biblioteca scipy. Para comparar os acidentes “antes” e “depois”, o teste ideal seria o Teste T de Amostras Independentes:
from scipy import stats
# Supondo que 'antes' e 'depois' são listas com o número de acidentes
stats.ttest_ind(depois, antes, alternative='greater')
O parâmetro alternative='greater'
especifica que estamos fazendo um teste unilateral, exatamente como em nossa pergunta original!
E aí, você já tinha pensado em testes estatísticos dessa forma?
Top comments (4)
Muito bom o artigo! Uma outra hipótese interessante e que certamente haverá uma resposta conclusiva é: As indústrias de pneus aumentaram suas vendas? Provavelmente, sim e muitoooo rsrssss.. Obrigado pelo conhecimento compartilhado! 🥋
Essa é uma ótima! Vi depois o primeiro filme onde eles falam muito sobre o tipo de pneu e a Pirelli é o pneu em destaque, analisar esse ponto também seria ótimo! E ainda no primeiro filme eles fazem muita propaganda da cerveja Corona, será que o consumo/popularidade dela também aumentou?
Depois que começa a entender como fazer um teste estatístico é quase impossível "desver" em vários momentos cotidianos hahahaha
Muito interessante! Explica de forma clara e didática um conceito muito importante para nossa área.
Acho bem provável que a Corona tenha vendido mais depois desse filme! Antes dele, quase não ouvia falar dela.
"You can have any brew you want.. as long as it's a Corona" Toretto
Pior que é isso mesmo. Eu já conhecia a Corona, mas porque demorei MUITOS anos depois do primeiro filme para ver ele (só 24 anos hahaha), e tenho certeza que foi alguma estruturação de marca/aumento de vendas!