top of page

Técnica de Cluster

Técnica multivariada (também conhecida como análise de conglomerado ou de agrupamento) com o objetivo de agrupar dados de acordo com as similaridades entre eles


É uma ferramenta estatística na qual é possível formar grupos com homogeneidade dentro do agrupamento e heterogeneidade entre eles


Pontos importantes

  • A técnica não distingue relevância das variáveis

  • A técnica não-inferencial

  • A amostra deve ser representativa da população

  • A colinearidade múltipla entre as variáveis deve ser mínima


Etapas da análise de cluster


Medidas de Similaridade ou Distância


A análise de aglomerados inicia criando uma matriz que indica a similaridade (ou distância) entre cada par de objetos relativos às k variáveis contidas na base de dados

  • Medidas de distância

  • Medidas correlacionadas

  • Medidas de associação

Como são determinados os grupos?

Existem diferentes métodos para isto, que deverão ser selecionados em função da quantidade de dados disponíveis e do número de agrupamentos a serem formados


Determinação dos agrupamentos


Escolha do algoritmo de agrupamento: