Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/85887| Tipo: | TCC |
| Título: | Avaliação do modelo TabPFN na predição de diabetes com variação no número de instâncias |
| Autor(es): | Souza, Iarley Natã Lopes |
| Orientador: | Souza, Criston Pereira de |
| Palavras-chave em português: | Diabetes;escassez de dados;aprendizado de máquina;TabPFN |
| CNPq: | CNPQ: CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
| Data do documento: | 2026 |
| Citação: | SOUZA, Iarley Natã Lopes. Avaliação do modelo TabPFN na predição de diabetes com variação no número de instâncias. 2026. 76 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação) - Campus de Quixadá, Universidade Federal do Ceará, Quixadá, 2026. |
| Resumo: | A diabetes mellitus é uma das doenças crônicas mais comuns em todo o mundo, representando um dos maiores desafios de saúde pública da atualidade. Essa condição afeta a capacidade do organismo de produzir ou utilizar adequadamente a insulina, hormônio responsável pela regulação dos níveis de glicose no sangue, contribuindo para o desenvolvimento de complicações secundárias e ressaltando a importância do diagnóstico precoce. Com os avanços nas técnicas de aprendizado de máquina, essas abordagens têm sido cada vez mais utilizadas para auxiliar na predição de doenças como a diabetes; contudo, a escassez de dados clínicos, ligada a políticas de proteção de dados e limitações de recursos, ainda representa um obstáculo relevante. Nesse contexto, destaca-se o modelo TabPFN, uma rede baseada em Transformers capaz de realizar predições rápidas e precisas mesmo com quantidades reduzidas de dados. Diante desse cenário, este trabalho avalia o desempenho do TabPFN na predição de casos de diabetes mellitus, analisando seu comportamento frente a diferentes volumes de dados e comparando-o a modelos consagrados na literatura. Os resultados demonstraram que o TabPFN apresentou desempenho altamente competitivo, destacando-se a partir de 100 instâncias de treino e alcançando F1-score próximo de 0,80 com 1.000 amostras, mesmo sem técnicas de balanceamento, além de evidenciar variáveis relacionadas à glicose como as mais determinantes para a classificação. Conclui-se que o TabPFN se apresenta como uma alternativa promissora para a predição de diabetes em cenários de escassez de dados. |
| Abstract: | Diabetes mellitus is one of the most common chronic diseases worldwide, representing one of the greatest public health challenges of today. This condition affects the body’s ability to produce or properly use insulin, the hormone responsible for regulating blood glucose levels, contributing to the development of secondary complications and highlighting the importance of early diagnosis. With advances in machine learning techniques, these approaches have been increasingly used to support the prediction of diseases such as diabetes; however, the scarcity of clinical data, linked to data protection policies and resource limitations, still represents a significant obstacle. In this context, the TabPFN model stands out as a Transformer-based network capable of performing fast and accurate predictions even with limited amounts of data. Given this scenario, this work evaluates the performance of TabPFN in predicting cases of diabetes mellitus, analyzing its behavior under different data volumes and comparing it with well-established models in the literature. The results demonstrated that TabPFN achieved highly competitive performance, standing out from 100 training instances onward and reaching an F1-score close to 0.80 with 1,000 samples, even without the use of balancing techniques, while also identifying glucose-related variables as the most decisive for classification. It is concluded that TabPFN represents a promising alternative for diabetes prediction in data-scarce scenarios. |
| URI: | http://repositorio.ufc.br/handle/riufc/85887 |
| Currículo Lattes do Orientador: | http://lattes.cnpq.br/1556476759915826 |
| Tipo de Acesso: | Acesso Aberto |
| Aparece nas coleções: | CIÊNCIA DA COMPUTAÇÃO-QUIXADÁ - Monografias |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| 2026_tcc_inlsouza (1).pdf | 2,88 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.