Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/82930
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorSouza, Marcelo Marques Simões de-
dc.contributor.authorSantos, Vitor Hugo Muniz de Sousa-
dc.date.accessioned2025-10-07T17:26:06Z-
dc.date.available2025-10-07T17:26:06Z-
dc.date.issued2025-
dc.identifier.citationSANTOS, Vitor Hugo Muniz de Sousa. Estratégias de ampliação e balanceamento de dados para a detecção de áudios verdadeiros e falsos. 2025. 54 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Campus de Sobral, Universidade Federal do Ceará, Sobral, 2025.pt_BR
dc.identifier.urihttp://repositorio.ufc.br/handle/riufc/82930-
dc.description.abstractThis work investigates the impact of data augmentation and class balancing strategies on improving the performance of supervised classification models in the detection of speech audio manipulated by text-to-speech (TTS) systems. The Fake or Real (FoR) dataset, developed by the Lassonde School of Engineering, was used. It consists of authentic and synthetic speech samples generated by different TTS architectures. Five data augmentation techniques were applied: noise addition, speed variation, pitch shifting, time-frequency masking, and random spectral equalization. To address class imbalance, Synthetic Minority Over-sampling Technique (SMOTE) and random undersampling were used. The audio signals were represented by Mel- Frequency Cepstral Coefficients (MFCCs), which served as input to the following classifiers: Random Forest (RF), Light Gradient Boosting Machine (LGBM), Naive Bayes, Long Short-Term Memory (LSTM) neural network, and k-Nearest Neighbors (KNN). The combination of data augmentation with balancing via SMOTE provided the best overall performance. In this scenario, the Random Forest (RF) model stood out, achieving accuracy and F1-score of 95%.pt_BR
dc.language.isopt_BRpt_BR
dc.rightsAcesso Abertopt_BR
dc.titleEstratégias de ampliação e balanceamento de dados para a detecção de áudios verdadeiros e falsospt_BR
dc.typeTCCpt_BR
dc.description.abstract-ptbrEste trabalho investiga o impacto de estratégias de ampliação e balanceamento de dados na melhoria do desempenho de modelos de classificação supervisionada na detecção de áudios de fala manipulados por sistemas de conversão de texto em fala (TTS). Utilizou-se a base de dados Fake or Real (FoR), desenvolvida pela Lassonde School of Engineering, composta por amostras de fala autênticas e sintéticas, geradas por diferentes arquiteturas de conversão de texto em fala. Foram aplicadas cinco técnicas de ampliação de dados: adição de ruído, mudança de velocidade, mudança de tom, mascaramento tempo-frequência e equalização espectral aleatória. Para mitigar o desbalanceamento entre classes, foram utilizadas as técnicas de sobreamostragem de minoria sintética (SMOTE) e subamostragem aleatória. Os sinais de áudio foram representados por coeficientes cepstrais na escala de frequência Mel (MFCCs), e esses últimos foram utilizados como entrada para os classificadores floresta aleatória (RF), máquina de aumento de gradiente leve (LGBM), Naive Bayes, rede neural de longo e curto prazo (LSTM) e algoritmo k-vizinhos próximos (KNN). A combinação da ampliação de dados com o balanceamento via SMOTE proporcionou o melhor desempenho geral. Nesse cenário, o modelo Floresta Aleatória (RF) destacou-se, alcançando acurácia e F1-score de 95%.pt_BR
dc.subject.ptbrDetecção de manipulação de áudiopt_BR
dc.subject.ptbrVoz sintéticapt_BR
dc.subject.ptbrAmpliação de dadospt_BR
dc.subject.ptbrBalanceamento de classespt_BR
dc.subject.ptbrClassificação supervisionadapt_BR
dc.subject.enAudio manipulation detectionpt_BR
dc.subject.enSynthetic voicept_BR
dc.subject.enData augmentationpt_BR
dc.subject.enClass balancingpt_BR
dc.subject.enSupervised classificationpt_BR
dc.subject.cnpqCNPQ::ENGENHARIASpt_BR
local.author.latteshttp://lattes.cnpq.br/7952217240547780pt_BR
local.advisor.orcidhttps://orcid.org/0000-0002-7590-9898pt_BR
local.advisor.latteshttp://lattes.cnpq.br/1617071773481762pt_BR
local.date.available2025-08-09-
Aparece nas coleções:ENGENHARIA DE COMPUTAÇÃO-SOBRAL - Monografias

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2025_tcc_vhmssantos.pdf10,28 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.