Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.ufc.br/handle/riufc/81748
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorMattos, César Lincoln Cavalcante-
dc.contributor.authorBarros, Caio Martim-
dc.date.accessioned2025-07-30T13:42:48Z-
dc.date.available2025-07-30T13:42:48Z-
dc.date.issued2023-
dc.identifier.citationBARROS, Caio Martim. Avaliação de técnicas de geração de dados sintéticos tabulares em tarefas de classificação. 2025. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) – Universidade Federal do Ceará, Fortaleza, 2023.pt_BR
dc.identifier.urihttp://repositorio.ufc.br/handle/riufc/81748-
dc.description.abstractThe generation of synthetic data plays a crucial role in machine learning across various domains. This study explores SDV, a tool that utilizes machine learning methods to produce high-quality synthetic data. To achieve this, a complete data pipeline is developed to ensure the automated and accurate persistence of training and testing data, covering the generation, application, and evaluation of synthetic data in ML algorithms for classification. The effectiveness of these steps is verified through comparisons between different strategies for creating synthetic data generator models and their use in classification models, using metrics suitable for each approach. By employing SDV on different datasets, this research highlights the relevance and utility of creating and using artificial data, enabling more robust analyses and more accurate machine learning models. Thus, SDV provides a promising solution to address the challenges of data scarcity, imbalance, and privacy, driving research and applications in the field.pt_BR
dc.language.isopt_BRpt_BR
dc.rightsAcesso Abertopt_BR
dc.titleAvaliação de técnicas de geração de dados sintéticos tabulares em tarefas de classificaçãopt_BR
dc.typeTCCpt_BR
dc.description.abstract-ptbrA geração de dados sintéticos desempenha um papel crucial em aprendizado de máquina em diversos domínios. Este estudo explora o Synthetic Data Vault (SDV), uma ferramenta que utiliza métodos de aprendizado de máquina para produzir dados sintéticos de alta qualidade. Para isso, desenvolve-se uma pipeline de dados completa, a fim de assegurar a persistência automatizada e correta dos dados de treino e teste, que abrange a geração, aplicação e avaliação dos dados sintéticos em algoritmos de Machine Learning (ML) para classificação. A eficácia destas etapas são verificadas por meio de comparações entre diferentes estratégias para as etapas de criação de modelos geradores de dados sintéticos e seu uso em modelos de classificação, utilizando métricas adequadas para cada abordagem. Dessa forma, ao empregar o SDV em diferentes conjuntos de dados, esta pesquisa evidencia a relevância e a utilidade da criação e uso de dados artificiais, possibilitando análises mais robustas e modelos de aprendizado de máquina mais precisos. Assim, o SDV oferece uma solução promissora para enfrentar o problema de escassez, balanceamento e privacidade de dados, impulsionando a pesquisa e as aplicações na área.pt_BR
dc.subject.ptbrSynthetic data vault (SDV)pt_BR
dc.subject.ptbrDados sintéticos tabularespt_BR
dc.subject.ptbrAprendizado de máquinapt_BR
dc.subject.ptbrIA generativapt_BR
dc.subject.ptbrAdição de dadospt_BR
dc.subject.enSynthetic data vault (SDV)pt_BR
dc.subject.enSynthetic tabular datapt_BR
dc.subject.enMachine learningpt_BR
dc.subject.enGenerative AIpt_BR
dc.subject.enData augmentationpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOpt_BR
local.author.latteshttp://lattes.cnpq.br/8786631279167065pt_BR
local.advisor.orcidhttps://orcid.org/0000-0002-2404-3625pt_BR
local.advisor.latteshttp://lattes.cnpq.br/2445571161029337pt_BR
local.date.available2025-07-30-
Aparece en las colecciones: ENGENHARIA DE COMPUTAÇÃO - Monografias

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
2023_tcc_cmbarros.pdf2,02 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.