Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/75485
Type: TCC
Title: Utilizando clusterização para identificar padrões em publicações de artigo na América Latina
Authors: Sombra, João Victor Fonseca
Advisor: Figueiredo, Tatiane Fernandes
Keywords in Brazilian Portuguese : Agrupamento;MiniBatch K-Means;Artigos Científicos
Keywords in English : Clustering;Minibatch K-means;Scientific articles
Issue Date: 2023
Abstract in Brazilian Portuguese: Com o avanço da tecnologia e o fácil acesso às informações, o número de publicações de artigos científicos cresceu exponencialmente. No entanto, devido à enorme quantidade de informação, identificar padrões relevantes tornou-se um desafio. Este trabalho propõe uma abordagem de agrupamento utilizando o método MiniBatch K-Means aplicado em dados de artigos publicados nos últimos 20 anos na América Latina, bem como uma exploração de seus resultados. A metodologia aplicada resultou na criação de 50 grupos distintos. Cada um desses grupos é composto por artigos relacionados a temas específicos, alguns exemplos são a existência de um grupo contendo artigos apenas relacionados a ªexpressão gênica e metabolismo em proteínas e célulasº e outro grupo relacionado a ªotimização em tempo polinomial e complexidade combinatóriaº. Os resultados obtidos pelo método de agrupamento demonstraram a capacidade do algoritmo em identificar e organizar eficientemente artigos científicos com base em seus resumos e palavras-chave.
Abstract: With the technology advancement and easy access to information, the number of publications scientific articles have grown exponentially. However, due to the massive amount of information, identifying relevant patterns has become a challenge. This work proposes an approach clustering using the MiniBatch K-Means method appplied in data from articles published in the last 20 years in Latin America, as well as an exploration of its results. The methodology applied resulted in the creation of 50 distinct groups. Each of these groups is composed of articles related to specific topics, some examples is the existence of a group containing articles only related to "gene expression and metabolism in proteins and cells"and another group related to "polynomial- time optimization and combinatorial complexity". The results obtained by clustering method demonstrated algorithm’s ability to identify and efficiently organize scientific articles based on their abstract and keywords.
URI: http://repositorio.ufc.br/handle/riufc/75485
Access Rights: Acesso Aberto
Appears in Collections:ENGENHARIA DE SOFTWARE - RUSSAS - Monografias

Files in This Item:
File Description SizeFormat 
2023_tcc_ jsombra.pdfa.pdf360,25 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.