Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/82472
Type: TCC
Title: Detecção de áudios falsos através de Wavelets e Redes Neurais Convolucionais
Authors: Felix, Emanuel Devid Paulino
Advisor: Souza, Marcelo Marques Simões de
Keywords in Brazilian Portuguese : Audio Deepfakes;Detecção de áudio sintético;Transformada Wavelet;Redes Neurais Convolucionais
Keywords in English : Audio Deepfakes;Synthetic Audio Detection;Wavelet Transform;Convolutional Neural Networks
Knowledge Areas - CNPq: CNPQ::ENGENHARIAS
Issue Date: 2025
Citation: FELIX, Emanuel Devid Paulino. Detecção de áudios falsos através de Wavelets e Redes Neurais Convolucionais. 2025. 66 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Campus de Sobral, Universidade Federal do Ceará, Sobral, 2025.
Abstract in Brazilian Portuguese: O avanço da Inteligência Artificial (IA) permitiu a criação de deepfakes de áudio—manipulações de voz sintética que imitam vozes de pessoas reais com grande precisão. Essa tecnologia, embora aplicada de forma útil e legítima, representa um risco significativo para a segurança da informação, sendo também utilizada em fraudes e desinformação. A sofisticação dos algoritmos de geração de áudios falsos torna a detecção um desafio, dificultando a capacidade de análise humana e de algoritmos convencionais, sendo necessário, portanto, o desenvolvimento de métodos de detecção mais eficientes. Para enfrentar este desafio, este trabalho propõe e avalia uma metodologia que combina processamento de sinais de áudio e aprendizado profundo. A abordagem transforma os sinais de áudio em escalogramas—imagens que representam a energia do sinal no tempo e na frequência—por meio da Transformada Wavelet Contínua (Continuous Wavelet Transform (CWT)). Para análise comparativa, o estudo utiliza escalogramas gerados a partir de três famílias de wavelets (Morlet, Complex Morlet e Mexican Hat) para treinar a arquitetura de Rede Neural Convolucional (Convolutional Neural Network (CNN)) MobileNet. Os experimentos, conduzidos sobre a base de dados Fake or Real (FoR), demonstram que a escolha da família de wavelet é um fator determinante para o desempenho. A configuração com a wavelet Morlet apresentou o melhor desempenho equilibrado, alcançando acurácia de 84,01% e F1-Score de 84,24%, o que demonstra a viabilidade da abordagem e estabelece esta combinação como a mais eficaz do estudo.
Abstract: The advancement of Artificial Intelligence (AI) has enabled the creation of audio deepfakes— synthetic voice manipulations that mimic real human voices with high precision. This technology, while having useful and legitimate applications, represents a significant risk to information security, being also used in fraud and disinformation. The sophistication of fake audio generation algorithms makes detection a challenge, hindering the analytical capabilities of both humans and conventional algorithms, thus necessitating the development of more effective detection methods. To address this challenge, this work proposes and evaluates a methodology that combines audio signal processing and deep learning. The approach transforms audio signals into scalograms— images representing the signal’s energy in the time-frequency domain— by means of the Continuous Wavelet Transform (CWT). For a comparative analysis, the study uses scalograms generated from three wavelet families (Morlet, Complex Morlet, and Mexican Hat) to train the MobileNet Convolutional Neural Network (CNN) architecture. The experiments, conducted on the FoR dataset, demonstrate that the choice of wavelet family is a determining factor for performance. The configuration with the Morlet wavelet showed the best balanced performance, achieving an accuracy of 84.01% and an F1-Score of 84.24%, which demonstrates the feasibility of the approach and establishes this combination as the most effective in the study.
URI: http://repositorio.ufc.br/handle/riufc/82472
Author's Lattes: http://lattes.cnpq.br/3846126071452892
Advisor's ORCID: https://orcid.org/0000-0002-7590-9898
Advisor's Lattes: http://lattes.cnpq.br/1617071773481762
Access Rights: Acesso Aberto
Appears in Collections:ENGENHARIA DE COMPUTAÇÃO-SOBRAL - Monografias

Files in This Item:
File Description SizeFormat 
2025_tcc_edpfelix.pdf8,2 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.