top of page

Análise de Cluster no SPSS

Conceito abordado: Cluster (Agrupamento)

Ferramenta utilizada: SPSS v18


Método

  • Hierárquico (deixa o software indicar o número de clusters)

  • Não hierárquico (exige saber quantos clusters terá)

Como sugestão, a análise deve iniciar pelo método hierárquico para decidir sobre o número ideal de clusters (grupos)


Método hierárquico


Para iniciar, clique no menu Analisar, Classificar, Cluster hierárquico. Inclua os indicadores desejados em variáveis


Clique em Estatísticas e marque planejamento de aglomeração e matriz de proximidade


Marque o gráfico Dendrograma em Gráficos


Em Método, escolha o método mais adequado de acordo com a estratégia da pesquisa. O mais comum é Ligação entre grupos

Escolha a medida de Intervalo. O mais comum é a Distância Euclidiana quadrática (distância geométrica entre pontos)

Escolha forma de padronização dos valores. O mais comum é padronizar utilizando Escores Z (principalmente se quiser realizar agrupamento por k-médias depois)


Resultados do método hierárquico


A matriz de proximidade mostra a distância geométrica entre os casos


Já o dendrograma dá uma ideia mais fácil sobre as possibilidades de agrupamento utilizando o método de distanciamento escolhido. No exemplo abaixo, poderíamos assumir 4 clusters (primeiro nível) ou 2 clusters (quarto nível)


Método não-hierárquico


Depois de decidido o número de clusters, pode seguir para o método não-hierárquico

Vá em Classificar e escolha k-médias. Inclua os indicadores em variáveis. Indique o número de clusters. Em método, deve marcar Iterar e classificar para que a ferramenta efetue simulações


Em opções, desmarque os centros iniciais e marque a tabela ANOVA e informações do cluster para cada caso


Resultados do método não-hierárquico


A tabela de associação de cluster mostra a identificação do cluster de cada caso, além da distância dele para o centro do cluster


Os centros mostram o ponto médio de cada indicador em cada cluster. O cluster 1 tem idade média de 33,8 e período 4, enquanto o cluster 2 tem idade média de 20,4 e período 4. O cluster 1 representa o grupo de pessoas mais velhas

Já o teste ANOVA avalia se existe diferença significativa da média entre os clusters, logo, em casos com sig < 5%, podemos assumir que o indicador contribui para a formação dos clusters. Neste caso, o período não contribui para o agrupamento


Decisões a partir dos resultados


Deve simular a análise com os números de clusters diferentes (caso tenha dúvida). Faça análise crítica dos centros do cluster e número de casos por grupo para decidir sobre agrupamento mais adequado


Depois de confirmar o número de clusters, volte a tela de análise, marque a opção Associação de cluster na aba Salvar e rode a análise novamente com o número de clusters escolhido


Será criada nova variável com a indicação do cluster de casa caso.


Pronto, os cluster foram criados. Agora você pode analisar os indicadores a partir da nova variável, usando ANOVA, por exemplo



Referência: prof. Wesley Almeida
441 visualizações0 comentário

Posts recentes

Ver tudo

Distribuição Binomial no Excel

Conceito abordado: Distribuição Binomial Ferramenta utilizada: Microsoft Excel v2016 Quando são fornecidos os valores de x, n e p, o Excel calcula a probabilidade acima pela função: =DISTR.BINOM(núm_s

Distribuição Normal no Excel

Conceito abordado: Distribuição Normal Ferramenta utilizada: Microsoft Excel v2016 Quando são fornecidos os valores de x, μ e σ, o Excel calcula a probabilidade acima aplicando a função: =DIST.NORM.N(

Commentaires


bottom of page