- 4 de mai. de 2022
- 2 min para ler

Análise de Cluster no SPSS

Conceito abordado: Cluster (Agrupamento)

Ferramenta utilizada: SPSS v18

Método

Hierárquico (deixa o software indicar o número de clusters)
Não hierárquico (exige saber quantos clusters terá)

Como sugestão, a análise deve iniciar pelo método hierárquico para decidir sobre o número ideal de clusters (grupos)

Método hierárquico

Para iniciar, clique no menu Analisar, Classificar, Cluster hierárquico. Inclua os indicadores desejados em variáveis

Clique em Estatísticas e marque planejamento de aglomeração e matriz de proximidade

Marque o gráfico Dendrograma em Gráficos

Em Método, escolha o método mais adequado de acordo com a estratégia da pesquisa. O mais comum é Ligação entre grupos

Escolha a medida de Intervalo. O mais comum é a Distância Euclidiana quadrática (distância geométrica entre pontos)

Escolha forma de padronização dos valores. O mais comum é padronizar utilizando Escores Z (principalmente se quiser realizar agrupamento por k-médias depois)

Resultados do método hierárquico

A matriz de proximidade mostra a distância geométrica entre os casos

Já o dendrograma dá uma ideia mais fácil sobre as possibilidades de agrupamento utilizando o método de distanciamento escolhido. No exemplo abaixo, poderíamos assumir 4 clusters (primeiro nível) ou 2 clusters (quarto nível)

Método não-hierárquico

Depois de decidido o número de clusters, pode seguir para o método não-hierárquico

Vá em Classificar e escolha k-médias. Inclua os indicadores em variáveis. Indique o número de clusters. Em método, deve marcar Iterar e classificar para que a ferramenta efetue simulações

Em opções, desmarque os centros iniciais e marque a tabela ANOVA e informações do cluster para cada caso

Resultados do método não-hierárquico

A tabela de associação de cluster mostra a identificação do cluster de cada caso, além da distância dele para o centro do cluster

Os centros mostram o ponto médio de cada indicador em cada cluster. O cluster 1 tem idade média de 33,8 e período 4, enquanto o cluster 2 tem idade média de 20,4 e período 4. O cluster 1 representa o grupo de pessoas mais velhas

Já o teste ANOVA avalia se existe diferença significativa da média entre os clusters, logo, em casos com sig < 5%, podemos assumir que o indicador contribui para a formação dos clusters. Neste caso, o período não contribui para o agrupamento

Decisões a partir dos resultados

Deve simular a análise com os números de clusters diferentes (caso tenha dúvida). Faça análise crítica dos centros do cluster e número de casos por grupo para decidir sobre agrupamento mais adequado

Depois de confirmar o número de clusters, volte a tela de análise, marque a opção Associação de cluster na aba Salvar e rode a análise novamente com o número de clusters escolhido

Será criada nova variável com a indicação do cluster de casa caso.

Pronto, os cluster foram criados. Agora você pode analisar os indicadores a partir da nova variável, usando ANOVA, por exemplo

Referência: prof. Wesley Almeida