top of page
Foto do escritorWesley Almeida

Testes de Hipóteses em Dados Sociais usando Statistica

Conceito: Teste de Hipótese

Aplicação: Análise de indicadores sociais dos estados brasileiros

Ferramenta utilizada: TIBCO Statistica v13.5.0


Base de dados utilizada nos exercícios:


Quais variáveis apresentam correlação com o IDH?


Teste: Correlação de Pearson (IDH e demais quantitativas)

H0: não existe correlação

H1: existe correlação


Alfa = 5%


Caminho: Statistics, basic Statistics, Correlation

IDH x Densidade = direta e moderada (0,5552)

IDH x Receitas = direta e moderada (0,4785)

IDH x Despesas = direta e moderada (0,4549)

IDH x Renda per capita = direta e forte (0,9479)

IDH x Total de veículos = direta e moderada (0,4833)

IDH x Água canalizada = direta e forte (0,8449)

IDH x Acesso a internet = direta e forte (0,9249)

IDH x IDEB = direta e forte (0,7533)

IDH x Expectativa de vida = direta e forte (0.8397)

IDH x TMI = inversa e moderada (-0,6987)


Teste: Correlação de Kendall (IDH e 3 qualitativas)

IDH x Região = direta e moderada (0,7296)

IDH maior implica em Região maior, ou seja, o IDH é maior nas regiões SD e SU

1 – ND

2 – NO

3 – CO

4 – SD

5 - SU

IDH x Comparação IDEB = inversa e moderada (-0,3455)


Podemos estimar um modelo que explique o comportamento de IDH?


Teste: Regressão Linear

Variável dependente: IDH

Caminho: Statistics, Multiple Regression

O poder de explicação de IDH é de 94,83% (capacidade de prever os valores de IDH)

Como Valor P < 5%, modelo de regressão é significativo

Equação: IDH = 0,3524 + 0,000045xRenda + 0,002715xInternet + 0,015967xIDEB


Hipótese: Expectativa de vida de ambos os sexos é de 80 anos


H0: Média = 80

H1: Média ≠ 80


α = 5%


Teste: Média

Caminho: t-test, single sample

Como Valor P < 5%, rejeita-se H0

A expectativa de vida média é significativamente diferente de 80 anos


Hipótese: Expectativa de vida dos homens e mulheres é diferente


H0: MédiaH = MédiaM

H1: MédiaH ≠ MédiaM


α = 5%


Teste: Igualdade de média

Caminho: t-test, independent by variable

Como Valor P < 5%, rejeita-se H0

Existe diferença na expectativa de vida entre homens e mulheres, logo a expectativa de vida das mulheres é significativamente superior a dos homens


Hipótese: Existe diferença da TMI entre as regiões do Brasil


H0 : a média de todos os grupos é igual

H1 : pelo menos um dos grupos tem média diferente


α = 0,05


Teste: ANOVA

Caminho: Basic Statistics, Breakdown & One-Way ANOVA


Indique TMI como dependente e Região como agrupadora, clique em Ok:


Vá em Descritives, selecione Conf. Limits for mean e clique em Summary: Table of statistics:


O relatório mostra as medidas descritivas e intervalo de confiança da TMI para cada região:


Em ANOVA & tests, clique em Analysis of Variance:

Como valor P < 5%, rejeita-se H0, ou seja, existe diferença na média do TMI em pelo menos uma região.

Como existe diferença em pelo menos um dos grupos, deve seguir com teste de Post Hoc para descobrir em quais subgrupos temos diferença significativa


Um dos testes mais adequados para este teste é o de Tukey. Em Post-hoc, clique em Tukey honest significant difference (HSD):

De acordo com teste de postos (Tukey), as seguintes regiões apresentaram diferença significativa na média de TMI:

  • Nordeste (16,044) tem média superior ao Sudeste (9,8750)

  • Nordeste (16,044) tem média superior ao Sul (9,0333)

  • Norte (17,857) tem média superior ao Sudeste (9,8750)

  • Norte (17,857) tem média superior ao Sul (9,0333)


Hipótese: Existe associação (diferença significativa) entre as regiões e a classificação de IDH


H0: São independentes / Não há associação / Não há diferença significativa

H1: São dependentes / Há associação / Há diferença


α = 0,05


Teste: Qui-Quadrado

Caminho: basic statistics, Tables and Banners


Clique em Specify tables, selecione as duas variáveis e clique em ok

Clique em Ok novamente


Marque as opções Expected Frequencies e Pearson & M-L Chi-square e clique em Summary


Uma das tabelas apresentada é a tabela de frequência cruzada:


Como primeiro passo do cálculo do teste é o cálculo da frequência esperada para a tabela cruzada:

Como Valor P (0,002017) < 5%, rejeita-se H0, ou seja, existe diferença significativa entre região e classificação do IDH



Referência: prof. Wesley Almeida

Posts recentes

Ver tudo

Comments


bottom of page