Por favor, use este identificador para citar o enlazar este ítem:
http://repositorio.ufc.br/handle/riufc/72490
Tipo: | TCC |
Título : | Análise de agrupamento hierárquicos |
Autor : | Oliveira, Natália Lima de |
Tutor: | Freitas, Silvia Maria de |
Palabras clave : | Agrupamento;Dendograma;Similaridade;Grouping;Dendrogram;Similarity |
Fecha de publicación : | 2022 |
Citación : | OLIVEIRA, Natália Lima de. Análise de agrupamento hierárquicos. 2022. 50 f. Monografia (Graduação em Estatística) – Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2022. |
Resumen en portugués brasileño: | A análise de agrupamento hierárquico é uma forma eficaz de agrupar elementos, com o objetivo de facilitar a análise exploratória de dados. Os grupos são selecionados de forma que dentro de cada grupo os elementos sejam homogênios e os grupos sejam heterogênios entre si. Sua importância se dá na necessidade de estabelecer um perfil e dessa forma entender o comportamento de cada grupo. Primeiramente foi realizada a apresentação dos coeficientes de similaridade e associação, utilizados para cálculos das distâncias com diferentes tipo de variáveis. Diante disso, foram diferenciados os métodos hieráquicos que são: método da ligação simples, ligação completa, centróide, média das distâncias e ward, com suas particularidades. Também foram apresentados os algoritmos Agnes e Diana. Em seguida foram apresentados métodos de ajute e escolha do número ideal de grupos. Por último, foi utilizado o software R para a demonstração dos métodos e a comparação das distâncias euclidiana e manhattan. |
Abstract: | Hierarchical cluster analysis is an effective way to group elements together to facilitate exploratory data analysis. The groups are selected so that within each group the elements are homogeneous and the groups are heterogeneous to each other. Its importance lies in the need to establish a profile and thus understand the behavior of each group. First, the similarity and association coefficients were presented, used to calculate distances with different types of variables. In view of this, the hierarchical methods were differentiated, which are: single link method, complete link, centroid, average of distances and ward, with their particularities. The Agnes and Diana algorithms were also presented. Then, methods of adjustment and choice of the ideal number of groups were presented. Finally, the R software was used to demonstrate the methods and compare the euclidean and manhattan distances. |
URI : | http://www.repositorio.ufc.br/handle/riufc/72490 |
Aparece en las colecciones: | ESTATÍSTICA - Monografias |
Ficheros en este ítem:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
2022_tcc_nloliveira.pdf | 999,38 kB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.