Entre os objetivos do teste de hipótese, destam-se:
formular hipóteses de pesquisa de tal forma que sejam estatisticamente comprováveis;
transformar hipóteses de pesquisa em hipóteses estatísticas;
estabelecer a hipótese nula e a hipótese alternativa;
elaborar regras de decisão unilaterais e bilaterais, de acordo com a natureza do teste;
saber diferenciar testes paramétricos dos testes não-paramétricos;
realizar testes de significância a partir da ferramenta mais adequada;
utilizar os resultados dos testes para decidir sobre a hipótese de pesquisa
Em todas as ciências, efetuam-se pesquisas a fim de se determinar o grau de acertabilidade de hipóteses oriundas de teorias apresentadas.
Tais pesquisas levam o pesquisador a coletar dados por meio de amostras aleatórias para proporcionar-lhes a informação sobre a hipótese proposta pela teoria. Depois do estudo adequado dos dados, o pesquisador pode manter, rever ou rejeitar a hipótese e a teoria que a originou.
Para chegar a uma decisão objetiva sobre a aceitabilidade ou rejeição de uma hipóteses, o conjunto de dados coletados deve ser representativo e sofrer um tratamento estatístico adequado. Dá-se ênfase à objetividade porque o método científico exige conclusões científicas por meio de processos que possam ser repetidos por outros pesquisadores.
Os processos que nos permitem decidir aceitar ou rejeitar uma hipótese, ou determinar se amostras observadas diferem significativamente dos resultados esperados são denominados de Testes de Hipóteses. O objetivo é fornecer ferramentas que nos permitam validar ou refutar uma hipótese, por meio de resultados da amostra.
Para que serve um teste estatístico? a) Para obter conclusões válidas a respeito de uma população usando apenas dados de uma amostra. b) Como apoio à tomada de decisões:
|
Tipos de Testes de Hipóteses
Os Testes de Hipóteses podem ser de dois tipos:
Paramétricos
Quando se formula a hipótese com respeito ao valor de um parâmetro populacional.
Exemplos: a) a estatura média brasileira é de 1,65 m; b) a proporção de maringaenses com a doença X é de 38%. |
Não-paramétricos
Quando se formula hipótese com respeito à natureza da distribuição da população, estes testes não dependem dos parâmetros populacionais, nem de suas respectivas estimativas.
Exemplos: a) a distribuição dos pesos dos alunos do INSTITUIÇÃO X é normal; b) a chegada de navios no Porto de Santos segue uma distribuição de Poisson. |
Conceitos Fundamentais
Hipóteses de Pesquisa
São elaboradas sobre fatos com base nos objetivos da pesquisa. Para terem valor científico precisam ser postas à prova, isto é, precisam ser testadas estatisticamente. Muitas destas hipóteses não podem ser testadas, pois não é possível obterem-se observações controladas sobre o fato.
A estatística se preocupa apenas com as hipóteses de pesquisa possíveis de comparação. São hipóteses possíveis de comprovação todas aquelas que podem ser transformadas em hipóteses estatísticas, em geral, consistem de afirmações sobre as distribuições de probabilidade das populações.
Exemplo: Pode-se concluir que a estatística média brasileira masculina não é 1,65m. |
Hipóteses Estatísticas
Uma hipótese estatística é uma alegação sobre uma população. São suposições formuladas sob forma operacional.
Hipótese Nula (H0)
A Hipótese Nula (H0) é aquela que será testada. É uma afirmação que o parâmetro populacional é tal como especificado (isto é, a afirmação é verdadeira). É uma suposição de que não haja diferença. Admite-se aqui, que a diferença observada, entre o estimador amostral e o parâmetro populacional, é devida apenas ao fator aleatório na seleção da amostra, ou seja, essa diferença não é significativa.
A hipótese nula H0 contém uma alternativa de igualdade =.
Hipótese Alternativa (H1)
A Hipótese Alternativa (H1) é aquela que será aceita caso o teste inclique que H0 deva ser rejeitada. É originária da hipótese de pesquisa. A hipótese alternativa geralmente representa a suposição que o pesquisador quer provar, sendo H0 formulada com expresso propósito de ser rejeitada. H1 é uma afirmação que oferece uma alternativa à legação, isto é, o parâmetro é maior, menor ou diferente que o valor alegado.
A hipótese alternativa H1 contém uma afirmativa de desigualdade < ou >.
As hipóteses estatísticas para uma parâmetro teta, podem ser formuladas como segue:
Teste Bilateral: quando se utilizam ambas as “caudas” da distribuição. É utilizada quando não há qualquer parâmetro de comparação em pesquisas anteriores.
Teste Unilateral à Direita: quando utiliza-se a cauda à direita da distribuição.
Teste Unilateral à Esquerda: quando se utiliza a cauda esquerda da distribuição.
Exemplo 1 Hipótese de pesquisa: Pode-se concluir que a estatística média brasileira masculina não é 1,65 m. Hipótese estatística:
Exemplo 2 Hipótese de pesquisa: O preconceito de cor, num dado país, tem intensidade diferente do preconceito contra os judeus. Considere-se µ1 a intensidade média do preconceito de cor na população de um dado país e µ2 a intensidade do preconceito contra os judeus no mesmo país. Hipótese estatística:
Exemplo 3 Hipótese de pesquisa: Os homens são menos eficientes em destreza manual do que as mulheres. Considere-se µ1 a média de pontos relativos a eficiência em destreza manual da população masculina e µ2 a média da população feminina. Hipótese estatística:
Exemplo 4 Hipótese de pesquisa: A proporção de brasileiros com a doença X é maior do que 40% Hipótese estatística:
Regras de Decisão
É uma regra de decisão para acertar ou rejeitar uma hipótese estatística com base em dados amostrais.
O objetivo de se testar uma hipótese é tomar uma decisão, se possível correta. Deve-se aceitar ou rejeitar, no que é a hipótese usada como referência. Entretanto, ao se tomar a decisão sobre a hipótese proposta, baseada nos dados amostrais, se está sujeito a cometer dois tipos de erros.

Erro do tipo I : constitui-se em rejeitar H0 quando ela é verdadeira --> α (alfa)
Erro do tipo II : constitui-se em não rejeitar H0 quando ela é falsa --> B (beta)
Nível de significância α = Probabilidade máxima de se cometer um erro do tipo I. |
Tipos de Regras de Decisão
A Região Crítica é a de rejeição da hipótese H0, e sua construção depende do tipo de teste que está realizando.
Teste bilateral:

Teste unilateral à direita:

Teste unilateral à esquerda:

A construção da região crítica é sempre feita sob a hipótese de H0 ser verdadeira.
RH0: rejeita-se H0
AH0 : aceita-se H0
Valor P
O Valor P ou P-valor ou p-value é a probabilidade de se obter uma estatística amostral com um valor tão ou mais extremo que o determinado pelos dados da amostra.
É denominado também “significância real do teste”.
Em testes efetuados com o auxílio de planilhas eletrônicas (Excel) e pacotes estatísticos (SPSS, Statistica, etc), o valor P é apresentado juntamente com os demais resultados.
Decisões baseadas no valor P
Após comparar o valor P ao valor de , o nível de significância do teste, podemos decidir se há evidência suficiente para rejeitar a hipótese nula.
Se Valor P < α, rejeita-se a hipótese nula (H0). Se Valor P >= α, não rejeita-se a hipótese nula (H0).
Exemplo: O Valor P de um teste de hipóteses é 0,0749. Tome sua decisão a um nível de significância de 0,05. Compare o Valor P com α Como 0,0749 > 0,05, não rejeita-se H0. |
Passos do teste de hipóteses
1. Estabeleça as hipóteses nula e alternativa
Escreva H0 e H1 como afirmativas matemáticas. Lembre que H0 sempre contém o símbolo =
2. Estabeleça o nível de significância α
Ele representa a probabilidade máxima de se rejeitar a hipótese nula, caso ela seja a realmente verdadeira (ou seja, de se cometer um erro do tipo I)
3. Faça o teste
Escolha a opção de teste adequada e obtenha os resultados, usando a planilha ou o pacote estatístico de sua preferência. Identifique o Valor P e outros resultados de interesse
4. Tome sua decisão
Se Valor P < α, rejeita-se a hipótese nula (H0).
Se Valor P >= α, não rejeita-se a hipótese nula (H0).
5. Interprete sua decisão / Conclua sobre a hipótese Se a alegação for a hipótese nula, você poderá rejeitá-la ou determinar que não há evidência suficiente para isso Se a alegação for a hipótese alternativa, você poderá aceitá-la ou determinar que não há evidência suficiente para isso
Escolha do teste adequado
A escolha do teste mais adequado pode depender do propósito da análise, do número de variáveis e grupos ou de características das variáveis.
Segue esquema que pode ajudar na decisão pelo teste mais adequado:

Teste de Normalidade
Os testes de normalidade são utilizados para verificar se a distribuição de probabilidade associada a um conjunto de dados pode ser aproximada pela distribuição normal.
Entre as técnicas disponíveis, destaca-se a técnica gráfica e testes estatísticos.
Técnica Gráfica
A análise gráfica permite a adequação dos dados a distribuição normal por aproximação visual.
Considerando um modelo normal, com média µ e variância (Sigma2), em que
e a transformação Z
tem distribuição normal padrão (média zero e variância 1).
Assumindo que a distribuição acumulada de Z é denotada como Fi e F é a função distribuição acumulada da distribuição normal com média µ e variância (Sigma2), temos que
Aplicando a função Fi^-1 em ambos os lados, temos
de onde obtemos que
é o quantil da distribuição normal padrão, calculado no ponto F(x).
Como x tem o formato de uma expressão linear, ao construir o gráfico entre x e Fi espera-se um comportamento linear dos pontos, caso a distribuição Normal seja adequada.
Gráfico de Probabilidade Normal
Exemplo: ![]() |
Gráfico QQ
Exemplo: ![]() |
A normalidade dos dados está relacionada com a linearidade do gráfico, quanto "mais linear" for o gráfico melhor a normalidade dos dados. |
Histograma É possível comparar o histograma da distribuição dos dados com a função de densidade teórica (distribuição normal com média e desvio padrão correspondentes).
Exemplo: ![]() |
No caso do histograma, o que espera-se em uma distribuição normal, é o alinhamento entre a distribuição dos dados e a função de densidade, como segue no exemplo abaixo:

Teste de Kolmogorov-Smirnov
Este teste observa a máxima diferença absoluta entre a função de distribuição acumulada assumida para os dados, no caso a Normal, e a função de distribuição empírica dos dados. Como critério, comparamos esta diferença com um valor crítico, para um dado nível de significância.
Considere uma amostra aleatória simples X1, X2, ... Xn de uma população com função de distribuição acumulada contínua FX desconhecida. A estatística utilizada para o teste é:
Esta função corresponde a distância máxima vertical entre os gráficos de Fx e Fnx sobre a amplitude dos possíveis valores de x. Em Dn temos que
Fx representa a função de distribuição acumulada assumida para os dados;
Fnx representa a função de distribuição acumulada empírica dos dados.
O teste de Kolmogorov-Smirnov é analisado a partir das seguintes hipóteses estatísticas:
H0 : Os dados seguem uma distribuição normal
H1 : Os dados não seguem uma distribuição normal
Neste caso, queremos testar a hipótese H0 : Fx = F contra a hipótese alternativa H0 : Fx <> F .
Teste de Anderson-Darling
O teste de Anderson-Darling é analisado a partir das seguintes hipóteses estatísticas:
H0 : A amostra segue uma distribuição normal
H1 : A amostra não segue uma distribuição normal
Teste de Shapiro-Wilk
O teste Shapiro-Wilk, proposto em 1965, é baseado na estatística W dada por:
em que xi são os valores da amostra ordenados (xi é o menor).
O teste de Shapiro-Wilk é analisado a partir das seguintes hipóteses estatísticas:
H0 : A amostra provém de uma distribuição normal
H1 : A amostra não provém de uma distribuição normal
Teste de Ryan-Joiner
O teste de Ryan-Joiner é similar ao teste de Shapiro-Wilk, pois também se baseia na relação linear entre a estatística de ordem da distribuição normal de uma amostra de tamanho n e a amostra da população em estudo após ser ordenada.
O teste se propõe a estudar o gráfico normal de probabilidade entre Z e Y atravéz do método de regressão linear. Caso a amostra X provenha de uma população normal espera-se que Z e Y tenha uma relação linear.
O teste de Ryan-Joiner é analisado a partir das seguintes hipóteses estatísticas:
H0 : A amostra provém de uma distribuição normal
H1 : A amostra não provém de uma distribuição normal
Uso prático do teste de normalidade
O teste de normalidade dos dados é útil em mais de uma situação:
Escolha do grupo de testes inferenciais: se a distribuição se aproxima da normalidade, pode-se utilizar as ferramentas paramétricas para a análise; caso não, é preciso utilizar testes não-paramétricos
Avaliação da qualidade da análise: A regressão linear, por exemplo, só pode ser usada se os erros (resíduos) forem normais. Se o teste acusar não-normalidade, os resultados da regressão não devem ser usados e modelo precisa ser revisto.
Testes Paramétricos e Não-Paramétricos
Entre os diversos testes disponíveis para análise inferencial. Os testes destinados à análise quantitativa dos dados são, normalmente, divididos em dois grandes grupos: paramétricos e não-paramétricos.
Os paramétricos são apropriados para análise de dados que se aproximam da normalidade. Já os não-paramétricos se ocupam dos demais casos.
Segue uma breve lista de testes, agrupados de acordo com suas similaridades e sinalizados com o tipo do teste:
Teste de uma amostra
Teste de Média
Teste Binomial
Teste de Proporção
Teste de Qui-Quadrado
Teste de Kolmorogov-Smirnov
Teste de Sinais de Wilcoxon
Teste de Sequência para Aleatoriedade
Teste de Amostras Independentes
Teste de Igualdade de Média
Análise de Variância (ANOVA)
Teste de Postos
Correlação de Pearson
Correlação Bisserial e Bisserial por Pontos
Teste de Mann-Whitney
Teste de Igualdade de Proporção
Teste de Kolmorogov-Smirnov
Teste de Wald-Wolfowitz
Teste de Kruskal-Wallis
Teste de Jonckheere-Terpstra
Teste de Mediana
Moses Extreme Reaction
Teste de Qui-Quadrado
Correlação de Spearman
Correlação de Kendall
Teste de Amostras Pareadas
Teste de Médias Pareadas
Teste de McNemar
Teste de Cochran Q
Teste de Homogeneidade Marginal
Teste de Wilcoxon para Dados Pareados
Teste de Friedman
Regressão
Regressão Linear
Regressão Binária
Regressão Logística
Regressão Ordinal
Métodos de Previsão e Séries Temporais
Método Delphi
Análise de Cenários
Júri Executivo de Opiniões
Composição de Forças de Vendas
Pesquisa de Mercado
Suavização por Média
Suavização Exponencial Simples
Método Holt
Método Holt-Winters
ARIMA
Redes Neurais Artificiais
Lógica Fuzzy
Inteligência Artificial
Referências: prof. Wesley Almeida, Escola de Negócios, PUCPR NUNES, Elvira Maria Alves; ALMEIDA, Wesley Marcos. Estatística Aplicada Usando Excel. Maringá: EDUEM, 2016. BARBETTA, P. A.; REIS, M. M.; BORNIA, A. C. **Estatística para cursos de Engenharia e Informática**. 2. ed, São Paulo: Atlas, 2009. THODE Jr, H. C. **Testing for Normality**. New York: Marcel Dekker, 2002.
Comments