Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/82472| Tipo: | TCC |
| Título: | Detecção de áudios falsos através de Wavelets e Redes Neurais Convolucionais |
| Autor(es): | Felix, Emanuel Devid Paulino |
| Orientador: | Souza, Marcelo Marques Simões de |
| Palavras-chave em português: | Audio Deepfakes;Detecção de áudio sintético;Transformada Wavelet;Redes Neurais Convolucionais |
| Palavras-chave em inglês: | Audio Deepfakes;Synthetic Audio Detection;Wavelet Transform;Convolutional Neural Networks |
| CNPq: | CNPQ::ENGENHARIAS |
| Data do documento: | 2025 |
| Citação: | FELIX, Emanuel Devid Paulino. Detecção de áudios falsos através de Wavelets e Redes Neurais Convolucionais. 2025. 66 f. Trabalho de Conclusão de Curso (Graduação em Engenharia de Computação) – Campus de Sobral, Universidade Federal do Ceará, Sobral, 2025. |
| Resumo: | O avanço da Inteligência Artificial (IA) permitiu a criação de deepfakes de áudio—manipulações de voz sintética que imitam vozes de pessoas reais com grande precisão. Essa tecnologia, embora aplicada de forma útil e legítima, representa um risco significativo para a segurança da informação, sendo também utilizada em fraudes e desinformação. A sofisticação dos algoritmos de geração de áudios falsos torna a detecção um desafio, dificultando a capacidade de análise humana e de algoritmos convencionais, sendo necessário, portanto, o desenvolvimento de métodos de detecção mais eficientes. Para enfrentar este desafio, este trabalho propõe e avalia uma metodologia que combina processamento de sinais de áudio e aprendizado profundo. A abordagem transforma os sinais de áudio em escalogramas—imagens que representam a energia do sinal no tempo e na frequência—por meio da Transformada Wavelet Contínua (Continuous Wavelet Transform (CWT)). Para análise comparativa, o estudo utiliza escalogramas gerados a partir de três famílias de wavelets (Morlet, Complex Morlet e Mexican Hat) para treinar a arquitetura de Rede Neural Convolucional (Convolutional Neural Network (CNN)) MobileNet. Os experimentos, conduzidos sobre a base de dados Fake or Real (FoR), demonstram que a escolha da família de wavelet é um fator determinante para o desempenho. A configuração com a wavelet Morlet apresentou o melhor desempenho equilibrado, alcançando acurácia de 84,01% e F1-Score de 84,24%, o que demonstra a viabilidade da abordagem e estabelece esta combinação como a mais eficaz do estudo. |
| Abstract: | The advancement of Artificial Intelligence (AI) has enabled the creation of audio deepfakes— synthetic voice manipulations that mimic real human voices with high precision. This technology, while having useful and legitimate applications, represents a significant risk to information security, being also used in fraud and disinformation. The sophistication of fake audio generation algorithms makes detection a challenge, hindering the analytical capabilities of both humans and conventional algorithms, thus necessitating the development of more effective detection methods. To address this challenge, this work proposes and evaluates a methodology that combines audio signal processing and deep learning. The approach transforms audio signals into scalograms— images representing the signal’s energy in the time-frequency domain— by means of the Continuous Wavelet Transform (CWT). For a comparative analysis, the study uses scalograms generated from three wavelet families (Morlet, Complex Morlet, and Mexican Hat) to train the MobileNet Convolutional Neural Network (CNN) architecture. The experiments, conducted on the FoR dataset, demonstrate that the choice of wavelet family is a determining factor for performance. The configuration with the Morlet wavelet showed the best balanced performance, achieving an accuracy of 84.01% and an F1-Score of 84.24%, which demonstrates the feasibility of the approach and establishes this combination as the most effective in the study. |
| URI: | http://repositorio.ufc.br/handle/riufc/82472 |
| Currículo Lattes do(s) Autor(es): | http://lattes.cnpq.br/3846126071452892 |
| ORCID do Orientador: | https://orcid.org/0000-0002-7590-9898 |
| Currículo Lattes do Orientador: | http://lattes.cnpq.br/1617071773481762 |
| Tipo de Acesso: | Acesso Aberto |
| Aparece nas coleções: | ENGENHARIA DE COMPUTAÇÃO-SOBRAL - Monografias |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| 2025_tcc_edpfelix.pdf | 8,2 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.