Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/72490
Tipo: | TCC |
Título: | Análise de agrupamento hierárquicos |
Autor(es): | Oliveira, Natália Lima de |
Orientador: | Freitas, Silvia Maria de |
Palavras-chave: | Agrupamento;Dendograma;Similaridade;Grouping;Dendrogram;Similarity |
Data do documento: | 2022 |
Citação: | OLIVEIRA, Natália Lima de. Análise de agrupamento hierárquicos. 2022. 50 f. Monografia (Graduação em Estatística) – Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2022. |
Resumo: | A análise de agrupamento hierárquico é uma forma eficaz de agrupar elementos, com o objetivo de facilitar a análise exploratória de dados. Os grupos são selecionados de forma que dentro de cada grupo os elementos sejam homogênios e os grupos sejam heterogênios entre si. Sua importância se dá na necessidade de estabelecer um perfil e dessa forma entender o comportamento de cada grupo. Primeiramente foi realizada a apresentação dos coeficientes de similaridade e associação, utilizados para cálculos das distâncias com diferentes tipo de variáveis. Diante disso, foram diferenciados os métodos hieráquicos que são: método da ligação simples, ligação completa, centróide, média das distâncias e ward, com suas particularidades. Também foram apresentados os algoritmos Agnes e Diana. Em seguida foram apresentados métodos de ajute e escolha do número ideal de grupos. Por último, foi utilizado o software R para a demonstração dos métodos e a comparação das distâncias euclidiana e manhattan. |
Abstract: | Hierarchical cluster analysis is an effective way to group elements together to facilitate exploratory data analysis. The groups are selected so that within each group the elements are homogeneous and the groups are heterogeneous to each other. Its importance lies in the need to establish a profile and thus understand the behavior of each group. First, the similarity and association coefficients were presented, used to calculate distances with different types of variables. In view of this, the hierarchical methods were differentiated, which are: single link method, complete link, centroid, average of distances and ward, with their particularities. The Agnes and Diana algorithms were also presented. Then, methods of adjustment and choice of the ideal number of groups were presented. Finally, the R software was used to demonstrate the methods and compare the euclidean and manhattan distances. |
URI: | http://www.repositorio.ufc.br/handle/riufc/72490 |
Aparece nas coleções: | ESTATÍSTICA - Monografias |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2022_tcc_nloliveira.pdf | 999,38 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.