Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/84629
Tipo: Dissertação
Título: A new methodology for edge intelligence data quality evaluation in IDD abd Non-IID datasets in federated learning
Autor(es): Valente Neto, Ernesto Gurgel
Orientador: Anjos, Julio César Santos dos
Coorientador: Peixoto, Solon Alves
Palavras-chave em português: Acurácia dos dados;Aprendizagem profunda;Aprendizado federado;Internet das coisas
Palavras-chave em inglês: Data accuracy;Deep learning;Federated learning;Internet of things
CNPq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Data do documento: 2025
Citação: VALENTE NETO, Ernesto Gurgel. A new methodology for edge intelligence data quality evaluation in IDD abd Non-IID datasets in federated learning. 2024. 116 f. Dissertação (Mestrado em Engenharia de Teleinformática) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2024.
Resumo: A geração maciça de dados a partir de dispositivos da Internet das Coisas (IoT) aumenta a procura por uma análise de dados eficiente, capaz de extrair informações significativas. O Aprendizado Federado (FL) permite que dispositivos IoT colaborem na construção de modelos de Inteligência Artificial (IA), preservando a privacidade dos dados. No entanto, a seleção de dados de alta qualidade para o treinamento permanece como um desafio crítico, especialmente em ambientes de FL com dados não independentes e identicamente distribuídos (non-iid). Dados de baixa qualidade introduzem erros, retardam a convergência dos modelos e elevam os custos computacionais. Para enfrentar esses desafios, este estudo propõe um algoritmo para análise da qualidade dos dados, aplicável tanto em ambientes centralizados quanto em cenários de FL. O algoritmo proposto reduz os custos computacionais, elimina o processamento desnecessário de dados e acelera a convergência dos modelos de IA. As experiências foram conduzidas com os conjuntos de dados MNIST, Fashion-MNIST, CIFAR-10 e CIFAR-100. A avaliação de desempenho baseou-se nas principais métricas da literatura: Accuracy, Recall, F1-score e Precision. Os resultados demonstram, no melhor dos cenários, reduções no tempo de execução de até 56,49%, com uma perda de acurácia em torno de apenas 0,50%.
Abstract: Massive data generation from Internet of Things (IoT) devices increases the demand for efficient data analysis to extract meaningful insights. Federated Learning (FL) allows IoT devices to collaborate in Artificial Intelligence (AI) training models while preserving data privacy. However, selecting high-quality data for training remains a critical challenge in FL environments with non-independent and identically distributed (non-iid) data. Poor-quality data introduce errors, delay convergence, and increase computational costs. This study develops a data quality analysis algorithm for FL and centralized environments to address these challenges. The proposed algorithm reduces computational costs, eliminates unnecessary data processing, and accelerates AI model convergence. The experiments used the MNIST, Fashion-MNIST, CIFAR-10, and CIFAR-100 datasets, and performance evaluation was based on main literature metrics like accuracy, recall, F1 score, and precision. Results show the best-case execution time reductions of up to 56.49%, with an accuracy loss of around 0.50%.
Descrição: Este documento está disponível online com base na Portaria no 348, de 08 de dezembro de 2022, disponível em: https://biblioteca.ufc.br/wp-content/uploads/2022/12/portaria348-2022.pdf, que autoriza a digitalização e a disponibilização no Repositório Institucional (RI) da coleção retrospectiva de TCC, dissertações e teses da UFC, sem o termo de anuência prévia dos autores. Em caso de trabalhos com pedidos de patente e/ou de embargo, cabe, exclusivamente, ao autor(a) solicitar a restrição de acesso ou retirada de seu trabalho do RI, mediante apresentação de documento comprobatório à Direção do Sistema de Bibliotecas.
URI: http://repositorio.ufc.br/handle/riufc/84629
Currículo Lattes do(s) Autor(es): http://lattes.cnpq.br/6702662597621445
ORCID do Orientador: https://orcid.org/0000-0003-3623-2762
Currículo Lattes do Orientador: http://lattes.cnpq.br/8203523299943090
Currículo Lattes do Coorientador: http://lattes.cnpq.br/8203523299943090
Tipo de Acesso: Acesso Aberto
Aparece nas coleções:DETE - Dissertações defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2024_dis_egvalenteneto.pdfTese23,78 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.