Please use this identifier to cite or link to this item:
http://repositorio.ufc.br/handle/riufc/75485
Type: | TCC |
Title: | Utilizando clusterização para identificar padrões em publicações de artigo na América Latina |
Authors: | Sombra, João Victor Fonseca |
Advisor: | Figueiredo, Tatiane Fernandes |
Keywords in Brazilian Portuguese : | Agrupamento;MiniBatch K-Means;Artigos Científicos |
Keywords in English : | Clustering;Minibatch K-means;Scientific articles |
Issue Date: | 2023 |
Abstract in Brazilian Portuguese: | Com o avanço da tecnologia e o fácil acesso às informações, o número de publicações de artigos científicos cresceu exponencialmente. No entanto, devido à enorme quantidade de informação, identificar padrões relevantes tornou-se um desafio. Este trabalho propõe uma abordagem de agrupamento utilizando o método MiniBatch K-Means aplicado em dados de artigos publicados nos últimos 20 anos na América Latina, bem como uma exploração de seus resultados. A metodologia aplicada resultou na criação de 50 grupos distintos. Cada um desses grupos é composto por artigos relacionados a temas específicos, alguns exemplos são a existência de um grupo contendo artigos apenas relacionados a ªexpressão gênica e metabolismo em proteínas e célulasº e outro grupo relacionado a ªotimização em tempo polinomial e complexidade combinatóriaº. Os resultados obtidos pelo método de agrupamento demonstraram a capacidade do algoritmo em identificar e organizar eficientemente artigos científicos com base em seus resumos e palavras-chave. |
Abstract: | With the technology advancement and easy access to information, the number of publications scientific articles have grown exponentially. However, due to the massive amount of information, identifying relevant patterns has become a challenge. This work proposes an approach clustering using the MiniBatch K-Means method appplied in data from articles published in the last 20 years in Latin America, as well as an exploration of its results. The methodology applied resulted in the creation of 50 distinct groups. Each of these groups is composed of articles related to specific topics, some examples is the existence of a group containing articles only related to "gene expression and metabolism in proteins and cells"and another group related to "polynomial- time optimization and combinatorial complexity". The results obtained by clustering method demonstrated algorithm’s ability to identify and efficiently organize scientific articles based on their abstract and keywords. |
URI: | http://repositorio.ufc.br/handle/riufc/75485 |
Access Rights: | Acesso Aberto |
Appears in Collections: | ENGENHARIA DE SOFTWARE - RUSSAS - Monografias |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
2023_tcc_ jsombra.pdfa.pdf | 360,25 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.