Conceito abordado: Cluster (Agrupamento)
Ferramenta utilizada: SPSS v18
Método
Hierárquico (deixa o software indicar o número de clusters)
Não hierárquico (exige saber quantos clusters terá)
Como sugestão, a análise deve iniciar pelo método hierárquico para decidir sobre o número ideal de clusters (grupos)
Método hierárquico
Para iniciar, clique no menu Analisar, Classificar, Cluster hierárquico. Inclua os indicadores desejados em variáveis
Clique em Estatísticas e marque planejamento de aglomeração e matriz de proximidade
Marque o gráfico Dendrograma em Gráficos
Em Método, escolha o método mais adequado de acordo com a estratégia da pesquisa. O mais comum é Ligação entre grupos
Escolha a medida de Intervalo. O mais comum é a Distância Euclidiana quadrática (distância geométrica entre pontos)
Escolha forma de padronização dos valores. O mais comum é padronizar utilizando Escores Z (principalmente se quiser realizar agrupamento por k-médias depois)
Resultados do método hierárquico
A matriz de proximidade mostra a distância geométrica entre os casos
Já o dendrograma dá uma ideia mais fácil sobre as possibilidades de agrupamento utilizando o método de distanciamento escolhido. No exemplo abaixo, poderíamos assumir 4 clusters (primeiro nível) ou 2 clusters (quarto nível)
Método não-hierárquico
Depois de decidido o número de clusters, pode seguir para o método não-hierárquico
Vá em Classificar e escolha k-médias. Inclua os indicadores em variáveis. Indique o número de clusters. Em método, deve marcar Iterar e classificar para que a ferramenta efetue simulações
Em opções, desmarque os centros iniciais e marque a tabela ANOVA e informações do cluster para cada caso
Resultados do método não-hierárquico
A tabela de associação de cluster mostra a identificação do cluster de cada caso, além da distância dele para o centro do cluster
Os centros mostram o ponto médio de cada indicador em cada cluster. O cluster 1 tem idade média de 33,8 e período 4, enquanto o cluster 2 tem idade média de 20,4 e período 4. O cluster 1 representa o grupo de pessoas mais velhas
Já o teste ANOVA avalia se existe diferença significativa da média entre os clusters, logo, em casos com sig < 5%, podemos assumir que o indicador contribui para a formação dos clusters. Neste caso, o período não contribui para o agrupamento
Decisões a partir dos resultados
Deve simular a análise com os números de clusters diferentes (caso tenha dúvida). Faça análise crítica dos centros do cluster e número de casos por grupo para decidir sobre agrupamento mais adequado
Depois de confirmar o número de clusters, volte a tela de análise, marque a opção Associação de cluster na aba Salvar e rode a análise novamente com o número de clusters escolhido
Será criada nova variável com a indicação do cluster de casa caso.
Pronto, os cluster foram criados. Agora você pode analisar os indicadores a partir da nova variável, usando ANOVA, por exemplo
Referência: prof. Wesley Almeida
Σχόλια