Please use this identifier to cite or link to this item:
http://repositorio.ufc.br/handle/riufc/72490
Type: | TCC |
Title: | Análise de agrupamento hierárquicos |
Authors: | Oliveira, Natália Lima de |
Advisor: | Freitas, Silvia Maria de |
Keywords: | Agrupamento;Dendograma;Similaridade;Grouping;Dendrogram;Similarity |
Issue Date: | 2022 |
Citation: | OLIVEIRA, Natália Lima de. Análise de agrupamento hierárquicos. 2022. 50 f. Monografia (Graduação em Estatística) – Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2022. |
Abstract in Brazilian Portuguese: | A análise de agrupamento hierárquico é uma forma eficaz de agrupar elementos, com o objetivo de facilitar a análise exploratória de dados. Os grupos são selecionados de forma que dentro de cada grupo os elementos sejam homogênios e os grupos sejam heterogênios entre si. Sua importância se dá na necessidade de estabelecer um perfil e dessa forma entender o comportamento de cada grupo. Primeiramente foi realizada a apresentação dos coeficientes de similaridade e associação, utilizados para cálculos das distâncias com diferentes tipo de variáveis. Diante disso, foram diferenciados os métodos hieráquicos que são: método da ligação simples, ligação completa, centróide, média das distâncias e ward, com suas particularidades. Também foram apresentados os algoritmos Agnes e Diana. Em seguida foram apresentados métodos de ajute e escolha do número ideal de grupos. Por último, foi utilizado o software R para a demonstração dos métodos e a comparação das distâncias euclidiana e manhattan. |
Abstract: | Hierarchical cluster analysis is an effective way to group elements together to facilitate exploratory data analysis. The groups are selected so that within each group the elements are homogeneous and the groups are heterogeneous to each other. Its importance lies in the need to establish a profile and thus understand the behavior of each group. First, the similarity and association coefficients were presented, used to calculate distances with different types of variables. In view of this, the hierarchical methods were differentiated, which are: single link method, complete link, centroid, average of distances and ward, with their particularities. The Agnes and Diana algorithms were also presented. Then, methods of adjustment and choice of the ideal number of groups were presented. Finally, the R software was used to demonstrate the methods and compare the euclidean and manhattan distances. |
URI: | http://www.repositorio.ufc.br/handle/riufc/72490 |
Appears in Collections: | ESTATÍSTICA - Monografias |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
2022_tcc_nloliveira.pdf | 999,38 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.