Introdução:
Como tomar decisão a partir de dados de um experimento? Como saber se os resultados de um experimento representam fielmente a população estudada? Como verificar se a diferença entre dois experimentos é realmente significativa? Essas são perguntas que podem ser respondidas pelos testes de hipótese.
Este artigo foi escrito para ser uma introdução sobre testes de hipótese, focado em testes da média paramétricos com variância conhecida. Em posts posteriores pretendo abordar diferentes testes e metodologias um pouco mais complexas.
Estes testes foram desenvolvidos para validar algum tipo de afirmação (hipótese) sobre algum parâmetro estatístico de uma dada população. Como exemplo, vamos formalizar hipóteses a respeito da velocidade de uma partícula :
- H0: μ = 50 centímetros por segundo
- H1 : μ ≠ 50 centímetros por segundo
H0 é chamada de hipótese nula, tida inicialmente como verdade.
H1 é chamada de hipótese alternativa, e contradiz a hipótese nula.
O teste de hipótese do exemplo é chamado de teste bilateral, uma vez que a hipótese alternativa estabelece que os valores para a média que podem ser maiores ou menores do que 50 centímetros por segundo. Caso contrário chamamos de teste unilateral.
O procedimento básico do teste de hipótese é utilizar valores de uma amostra e checá-los contra a hipótese nula. Caso os valores estejam de acordo com a hipótese nula, estabelecemos que “não há evidências suficientes para rejeitar a hipótese nula”. Caso contrário, dizemos que “rejeitamos hipótese nula em favor da hipótese alternativa”.
Tipos de erro:
Em testes de hipótese, podem ocorrer dois tipos de erros: Erros do tipo I e erros do tipo II.
Erros do tipo I ocorrem quando rejeitamos a hipótese nula quando ela é verdadeira.
Erros do tipo II ocorrem quando falhamos em rejeitar H0 quando ela é falsa
Nível de Significância:
A probabilidade de ocorrência do erro do tipo I (α) é chamada de nível de significância, tamanho do teste ou α-error.
α = P(Rejeitar H0 quando ela é verdadeira)
Tipos de teste de hipótese:
Testes de hipótese podem ser utilizados para validar hipóteses referentes a vários parâmetros estatísticos como média, mediana, proporção e várias outras. Os testes da média são os mais conhecidos, e vamos iniciar por eles.
Nesse tipo de teste, fazemos afirmações (hipóteses) sobre a média de uma determinada variável aleatória. O primeiro passo é estruturar as hipóteses de acordo com o experimento realizado. Dependendo da hipótese alternativa temos testes bilaterais e unilaterais.
H1: μ ≠ μ0 (Teste Bilateral)
H1: μ < μ0 (teste Unilateral à esquerda)
H1: μ > μ0 (teste Unilateral à direita)
O passo seguinte (altamente recomendado) é esquematizar as distribuições de probabilidade e suas regiões de aceitação e crítica.
A região de aceitação é onde a estatística de teste deve estar para que haja falha ao rejeitar a hipótese nula. Região crítica é onde a hipótese nula é rejeitada.
Nos testes bilaterais avaliamos a probabilidade de haver valores menores ou maiores do que o estabelecido na hipótese nula, então dividimos a significância e criamos duas regiões críticas.
Nos testes unilaterais definimos uma única região de rejeição, à direita ou à esquerda dependendo da hipótese alternativa.
Devemos agora definir os limites entre as regiões de aceitação e região crítica. Calculamos utilizando a tabela normal padrão ou a biblioteca statsmodels os valores de Zα para testes unilaterais ou Z2para testes bilaterais.
Após calculamos a estatística de teste apropriada, para a média com a variância populacional conhecida, temos:
Onde:
μ: É a média amostra
μ0: É o valor da média populacional sob hipótese nula
σ: Desvio padrão populacional
n: Tamanho da amostra
Caso o valor calculado de Z esteja dentro da região crítica, rejeitamos a hipótese nula. Caso contrário, falhamos em rejeitar a hipótese nula.
Exemplo:
Queremos avaliar se a média de velocidade de uma partícula é 50 centímetros por segundo, com desvio padrão de 2, 25 amostras , média amostral de 51.3 e com α= 5%(0.05) . Formalizando as hipóteses, temos:
H0: μ = 50 centímetros por segundo
H1 : μ ≠ 50 centímetros por segundo
Temos um teste bilateral, logo, devem calcular os os valores limite que separam a região crítica da região de aceitação (Z2). Pela tabela normal, temos:
Z 0.025 = 1.96
-Z 0.025 = -1.96
Graficamente:
Calculamos a estatística de teste Z0:
Z0 = 3.25
Como 3.32 > 1.96, rejeitamos a hipótese nula. E a velocidade média é diferente de 50 cm/s.
Top comments (0)