top of page

Testes de Hipóteses

Atualizado: 2 de mai. de 2022

Entre os objetivos do teste de hipótese, destam-se:

  • formular hipóteses de pesquisa de tal forma que sejam estatisticamente comprováveis;

  • transformar hipóteses de pesquisa em hipóteses estatísticas;

  • estabelecer a hipótese nula e a hipótese alternativa;

  • elaborar regras de decisão unilaterais e bilaterais, de acordo com a natureza do teste;

  • saber diferenciar testes paramétricos dos testes não-paramétricos;

  • realizar testes de significância a partir da ferramenta mais adequada;

  • utilizar os resultados dos testes para decidir sobre a hipótese de pesquisa

Em todas as ciências, efetuam-se pesquisas a fim de se determinar o grau de acertabilidade de hipóteses oriundas de teorias apresentadas.


Tais pesquisas levam o pesquisador a coletar dados por meio de amostras aleatórias para proporcionar-lhes a informação sobre a hipótese proposta pela teoria. Depois do estudo adequado dos dados, o pesquisador pode manter, rever ou rejeitar a hipótese e a teoria que a originou.


Para chegar a uma decisão objetiva sobre a aceitabilidade ou rejeição de uma hipóteses, o conjunto de dados coletados deve ser representativo e sofrer um tratamento estatístico adequado. Dá-se ênfase à objetividade porque o método científico exige conclusões científicas por meio de processos que possam ser repetidos por outros pesquisadores.


Os processos que nos permitem decidir aceitar ou rejeitar uma hipótese, ou determinar se amostras observadas diferem significativamente dos resultados esperados são denominados de Testes de Hipóteses. O objetivo é fornecer ferramentas que nos permitam validar ou refutar uma hipótese, por meio de resultados da amostra.

Para que serve um teste estatístico?

a) Para obter conclusões válidas a respeito de uma população usando apenas dados de uma amostra.

b) Como apoio à tomada de decisões:

  • Investir / não investir

  • Exportar / não exportar

  • Renovar a frota / manter a atual


Tipos de Testes de Hipóteses


Os Testes de Hipóteses podem ser de dois tipos:


Paramétricos

Quando se formula a hipótese com respeito ao valor de um parâmetro populacional.

Exemplos:

a) a estatura média brasileira é de 1,65 m;

b) a proporção de maringaenses com a doença X é de 38%.

Não-paramétricos

Quando se formula hipótese com respeito à natureza da distribuição da população, estes testes não dependem dos parâmetros populacionais, nem de suas respectivas estimativas.

Exemplos:

a) a distribuição dos pesos dos alunos do INSTITUIÇÃO X é normal;

b) a chegada de navios no Porto de Santos segue uma distribuição de Poisson.


Conceitos Fundamentais


Hipóteses de Pesquisa


São elaboradas sobre fatos com base nos objetivos da pesquisa. Para terem valor científico precisam ser postas à prova, isto é, precisam ser testadas estatisticamente. Muitas destas hipóteses não podem ser testadas, pois não é possível obterem-se observações controladas sobre o fato.

A estatística se preocupa apenas com as hipóteses de pesquisa possíveis de comparação. São hipóteses possíveis de comprovação todas aquelas que podem ser transformadas em hipóteses estatísticas, em geral, consistem de afirmações sobre as distribuições de probabilidade das populações.

Exemplo:

Pode-se concluir que a estatística média brasileira masculina não é 1,65m.

Hipóteses Estatísticas


Uma hipótese estatística é uma alegação sobre uma população. São suposições formuladas sob forma operacional.


Hipótese Nula (H0)


A Hipótese Nula (H0) é aquela que será testada. É uma afirmação que o parâmetro populacional é tal como especificado (isto é, a afirmação é verdadeira). É uma suposição de que não haja diferença. Admite-se aqui, que a diferença observada, entre o estimador amostral e o parâmetro populacional, é devida apenas ao fator aleatório na seleção da amostra, ou seja, essa diferença não é significativa.

A hipótese nula H0 contém uma alternativa de igualdade =.


Hipótese Alternativa (H1)


A Hipótese Alternativa (H1) é aquela que será aceita caso o teste inclique que H0 deva ser rejeitada. É originária da hipótese de pesquisa. A hipótese alternativa geralmente representa a suposição que o pesquisador quer provar, sendo H0 formulada com expresso propósito de ser rejeitada. H1 é uma afirmação que oferece uma alternativa à legação, isto é, o parâmetro é maior, menor ou diferente que o valor alegado.

A hipótese alternativa H1 contém uma afirmativa de desigualdade < ou >.

As hipóteses estatísticas para uma parâmetro teta, podem ser formuladas como segue:


Teste Bilateral: quando se utilizam ambas as “caudas” da distribuição. É utilizada quando não há qualquer parâmetro de comparação em pesquisas anteriores.






Teste Unilateral à Direita: quando utiliza-se a cauda à direita da distribuição.






Teste Unilateral à Esquerda: quando se utiliza a cauda esquerda da distribuição.







Exemplo 1 Hipótese de pesquisa: Pode-se concluir que a estatística média brasileira masculina não é 1,65 m. Hipótese estatística:






Exemplo 2 Hipótese de pesquisa: O preconceito de cor, num dado país, tem intensidade diferente do preconceito contra os judeus. Considere-se µ1 a intensidade média do preconceito de cor na população de um dado país e µ2 a intensidade do preconceito contra os judeus no mesmo país. Hipótese estatística:






Exemplo 3 Hipótese de pesquisa: Os homens são menos eficientes em destreza manual do que as mulheres. Considere-se µ1 a média de pontos relativos a eficiência em destreza manual da população masculina e µ2 a média da população feminina. Hipótese estatística:






Exemplo 4 Hipótese de pesquisa: A proporção de brasileiros com a doença X é maior do que 40% Hipótese estatística:






Regras de Decisão


É uma regra de decisão para acertar ou rejeitar uma hipótese estatística com base em dados amostrais.

O objetivo de se testar uma hipótese é tomar uma decisão, se possível correta. Deve-se aceitar ou rejeitar, no que é a hipótese usada como referência. Entretanto, ao se tomar a decisão sobre a hipótese proposta, baseada nos dados amostrais, se está sujeito a cometer dois tipos de erros.

  • Erro do tipo I : constitui-se em rejeitar H0 quando ela é verdadeira --> α (alfa)

  • Erro do tipo II : constitui-se em não rejeitar H0 quando ela é falsa --> B (beta)


Nível de significância

α = Probabilidade máxima de se cometer um erro do tipo I.


Tipos de Regras de Decisão


A Região Crítica é a de rejeição da hipótese H0, e sua construção depende do tipo de teste que está realizando.

Teste bilateral:


Teste unilateral à direita:


Teste unilateral à esquerda:


A construção da região crítica é sempre feita sob a hipótese de H0 ser verdadeira.

  • RH0: rejeita-se H0

  • AH0 : aceita-se H0


Valor P


O Valor P ou P-valor ou p-value é a probabilidade de se obter uma estatística amostral com um valor tão ou mais extremo que o determinado pelos dados da amostra. É denominado também “significância real do teste”.

Em testes efetuados com o auxílio de planilhas eletrônicas (Excel) e pacotes estatísticos (SPSS, Statistica, etc), o valor P é apresentado juntamente com os demais resultados.


Decisões baseadas no valor P


Após comparar o valor P ao valor de , o nível de significância do teste, podemos decidir se há evidência suficiente para rejeitar a hipótese nula.

Se Valor P < α, rejeita-se a hipótese nula (H0). Se Valor P >= α, não rejeita-se a hipótese nula (H0).

Exemplo:

O Valor P de um teste de hipóteses é 0,0749. Tome sua decisão a um nível de significância de 0,05.

Compare o Valor P com α

Como 0,0749 > 0,05, não rejeita-se H0.


Passos do teste de hipóteses


1. Estabeleça as hipóteses nula e alternativa Escreva H0 e H1 como afirmativas matemáticas. Lembre que H0 sempre contém o símbolo =

2. Estabeleça o nível de significância α Ele representa a probabilidade máxima de se rejeitar a hipótese nula, caso ela seja a realmente verdadeira (ou seja, de se cometer um erro do tipo I)

3. Faça o teste Escolha a opção de teste adequada e obtenha os resultados, usando a planilha ou o pacote estatístico de sua preferência. Identifique o Valor P e outros resultados de interesse

4. Tome sua decisão Se Valor P < α, rejeita-se a hipótese nula (H0). Se Valor P >= α, não rejeita-se a hipótese nula (H0).

5. Interprete sua decisão / Conclua sobre a hipótese Se a alegação for a hipótese nula, você poderá rejeitá-la ou determinar que não há evidência suficiente para isso Se a alegação for a hipótese alternativa, você poderá aceitá-la ou determinar que não há evidência suficiente para isso



Escolha do teste adequado


A escolha do teste mais adequado pode depender do propósito da análise, do número de variáveis e grupos ou de características das variáveis.

Segue esquema que pode ajudar na decisão pelo teste mais adequado:


Teste de Normalidade


Os testes de normalidade são utilizados para verificar se a distribuição de probabilidade associada a um conjunto de dados pode ser aproximada pela distribuição normal.

Entre as técnicas disponíveis, destaca-se a técnica gráfica e testes estatísticos.


Técnica Gráfica


A análise gráfica permite a adequação dos dados a distribuição normal por aproximação visual.

Considerando um modelo normal, com média µ e variância (Sigma2), em que



e a transformação Z


tem distribuição normal padrão (média zero e variância 1).



Assumindo que a distribuição acumulada de Z é denotada como Fi e F é a função distribuição acumulada da distribuição normal com média µ e variância (Sigma2), temos que





Aplicando a função Fi^-1 em ambos os lados, temos



de onde obtemos que


é o quantil da distribuição normal padrão, calculado no ponto F(x).


Como x tem o formato de uma expressão linear, ao construir o gráfico entre x e Fi espera-se um comportamento linear dos pontos, caso a distribuição Normal seja adequada.


Gráfico de Probabilidade Normal




Exemplo:


Gráfico QQ





Exemplo:



A normalidade dos dados está relacionada com a linearidade do gráfico, quanto "mais linear" for o gráfico melhor a normalidade dos dados.

Histograma É possível comparar o histograma da distribuição dos dados com a função de densidade teórica (distribuição normal com média e desvio padrão correspondentes).

Exemplo:


No caso do histograma, o que espera-se em uma distribuição normal, é o alinhamento entre a distribuição dos dados e a função de densidade, como segue no exemplo abaixo:


Teste de Kolmogorov-Smirnov


Este teste observa a máxima diferença absoluta entre a função de distribuição acumulada assumida para os dados, no caso a Normal, e a função de distribuição empírica dos dados. Como critério, comparamos esta diferença com um valor crítico, para um dado nível de significância.

Considere uma amostra aleatória simples X1, X2, ... Xn de uma população com função de distribuição acumulada contínua FX desconhecida. A estatística utilizada para o teste é:




Esta função corresponde a distância máxima vertical entre os gráficos de Fx e Fnx sobre a amplitude dos possíveis valores de x. Em Dn temos que

  • Fx representa a função de distribuição acumulada assumida para os dados;

  • Fnx representa a função de distribuição acumulada empírica dos dados.

O teste de Kolmogorov-Smirnov é analisado a partir das seguintes hipóteses estatísticas:

  • H0 : Os dados seguem uma distribuição normal

  • H1 : Os dados não seguem uma distribuição normal

Neste caso, queremos testar a hipótese H0 : Fx = F contra a hipótese alternativa H0 : Fx <> F .


Teste de Anderson-Darling


O teste de Anderson-Darling é analisado a partir das seguintes hipóteses estatísticas:

  • H0 : A amostra segue uma distribuição normal

  • H1 : A amostra não segue uma distribuição normal


Teste de Shapiro-Wilk


O teste Shapiro-Wilk, proposto em 1965, é baseado na estatística W dada por:


em que xi são os valores da amostra ordenados (xi é o menor).




O teste de Shapiro-Wilk é analisado a partir das seguintes hipóteses estatísticas:

  • H0 : A amostra provém de uma distribuição normal

  • H1 : A amostra não provém de uma distribuição normal


Teste de Ryan-Joiner


O teste de Ryan-Joiner é similar ao teste de Shapiro-Wilk, pois também se baseia na relação linear entre a estatística de ordem da distribuição normal de uma amostra de tamanho n e a amostra da população em estudo após ser ordenada.

O teste se propõe a estudar o gráfico normal de probabilidade entre Z e Y atravéz do método de regressão linear. Caso a amostra X provenha de uma população normal espera-se que Z e Y tenha uma relação linear.


O teste de Ryan-Joiner é analisado a partir das seguintes hipóteses estatísticas:

  • H0 : A amostra provém de uma distribuição normal

  • H1 : A amostra não provém de uma distribuição normal


Uso prático do teste de normalidade


O teste de normalidade dos dados é útil em mais de uma situação:

  • Escolha do grupo de testes inferenciais: se a distribuição se aproxima da normalidade, pode-se utilizar as ferramentas paramétricas para a análise; caso não, é preciso utilizar testes não-paramétricos

  • Avaliação da qualidade da análise: A regressão linear, por exemplo, só pode ser usada se os erros (resíduos) forem normais. Se o teste acusar não-normalidade, os resultados da regressão não devem ser usados e modelo precisa ser revisto.


Testes Paramétricos e Não-Paramétricos


Entre os diversos testes disponíveis para análise inferencial. Os testes destinados à análise quantitativa dos dados são, normalmente, divididos em dois grandes grupos: paramétricos e não-paramétricos.

Os paramétricos são apropriados para análise de dados que se aproximam da normalidade. Já os não-paramétricos se ocupam dos demais casos.


Segue uma breve lista de testes, agrupados de acordo com suas similaridades e sinalizados com o tipo do teste:

  • Teste de uma amostra

    • Teste de Média

    • Teste Binomial

    • Teste de Proporção

    • Teste de Qui-Quadrado

    • Teste de Kolmorogov-Smirnov

    • Teste de Sinais de Wilcoxon

    • Teste de Sequência para Aleatoriedade

  • Teste de Amostras Independentes

    • Teste de Igualdade de Média

    • Análise de Variância (ANOVA)

    • Teste de Postos

    • Correlação de Pearson

    • Correlação Bisserial e Bisserial por Pontos

    • Teste de Mann-Whitney

    • Teste de Igualdade de Proporção

    • Teste de Kolmorogov-Smirnov

    • Teste de Wald-Wolfowitz

    • Teste de Kruskal-Wallis

    • Teste de Jonckheere-Terpstra

    • Teste de Mediana

    • Moses Extreme Reaction

    • Teste de Qui-Quadrado

    • Correlação de Spearman

    • Correlação de Kendall

  • Teste de Amostras Pareadas

    • Teste de Médias Pareadas

    • Teste de McNemar

    • Teste de Cochran Q

    • Teste de Homogeneidade Marginal

    • Teste de Wilcoxon para Dados Pareados

    • Teste de Friedman

  • Regressão

    • Regressão Linear

    • Regressão Binária

    • Regressão Logística

    • Regressão Ordinal

  • Métodos de Previsão e Séries Temporais

    • Método Delphi

    • Análise de Cenários

    • Júri Executivo de Opiniões

    • Composição de Forças de Vendas

    • Pesquisa de Mercado

    • Suavização por Média

    • Suavização Exponencial Simples

    • Método Holt

    • Método Holt-Winters

    • ARIMA

    • Redes Neurais Artificiais

    • Lógica Fuzzy

    • Inteligência Artificial



Referências: prof. Wesley Almeida, Escola de Negócios, PUCPR NUNES, Elvira Maria Alves; ALMEIDA, Wesley Marcos. Estatística Aplicada Usando Excel. Maringá: EDUEM, 2016. BARBETTA, P. A.; REIS, M. M.; BORNIA, A. C. **Estatística para cursos de Engenharia e Informática**. 2. ed, São Paulo: Atlas, 2009. THODE Jr, H. C. **Testing for Normality**. New York: Marcel Dekker, 2002.

Posts recentes

Ver tudo

Teste de Média

A hipótese que parte de uma variável quantitativa contínua, em que segue distribuição normal, pode comparar os dados em relação a um...

Teste de Proporção

No caso da análise de variável qualitativa, com amostra > 30, em que a proporção pode ser descrita como podemos partir da distribuição...

Komentarze


bottom of page