Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.ufc.br/handle/riufc/72490
Tipo: TCC
Título : Análise de agrupamento hierárquicos
Autor : Oliveira, Natália Lima de
Tutor: Freitas, Silvia Maria de
Palabras clave : Agrupamento;Dendograma;Similaridade;Grouping;Dendrogram;Similarity
Fecha de publicación : 2022
Citación : OLIVEIRA, Natália Lima de. Análise de agrupamento hierárquicos. 2022. 50 f. Monografia (Graduação em Estatística) – Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2022.
Resumen en portugués brasileño: A análise de agrupamento hierárquico é uma forma eficaz de agrupar elementos, com o objetivo de facilitar a análise exploratória de dados. Os grupos são selecionados de forma que dentro de cada grupo os elementos sejam homogênios e os grupos sejam heterogênios entre si. Sua importância se dá na necessidade de estabelecer um perfil e dessa forma entender o comportamento de cada grupo. Primeiramente foi realizada a apresentação dos coeficientes de similaridade e associação, utilizados para cálculos das distâncias com diferentes tipo de variáveis. Diante disso, foram diferenciados os métodos hieráquicos que são: método da ligação simples, ligação completa, centróide, média das distâncias e ward, com suas particularidades. Também foram apresentados os algoritmos Agnes e Diana. Em seguida foram apresentados métodos de ajute e escolha do número ideal de grupos. Por último, foi utilizado o software R para a demonstração dos métodos e a comparação das distâncias euclidiana e manhattan.
Abstract: Hierarchical cluster analysis is an effective way to group elements together to facilitate exploratory data analysis. The groups are selected so that within each group the elements are homogeneous and the groups are heterogeneous to each other. Its importance lies in the need to establish a profile and thus understand the behavior of each group. First, the similarity and association coefficients were presented, used to calculate distances with different types of variables. In view of this, the hierarchical methods were differentiated, which are: single link method, complete link, centroid, average of distances and ward, with their particularities. The Agnes and Diana algorithms were also presented. Then, methods of adjustment and choice of the ideal number of groups were presented. Finally, the R software was used to demonstrate the methods and compare the euclidean and manhattan distances.
URI : http://www.repositorio.ufc.br/handle/riufc/72490
Aparece en las colecciones: ESTATÍSTICA - Monografias

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
2022_tcc_nloliveira.pdf999,38 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.