Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.ufc.br/handle/riufc/84629
Tipo: Dissertação
Título : A new methodology for edge intelligence data quality evaluation in IDD abd Non-IID datasets in federated learning
Autor : Valente Neto, Ernesto Gurgel
Tutor: Anjos, Julio César Santos dos
Co-asesor: Peixoto, Solon Alves
Palabras clave en portugués brasileño: Acurácia dos dados;Aprendizagem profunda;Aprendizado federado;Internet das coisas
Palabras clave en inglés: Data accuracy;Deep learning;Federated learning;Internet of things
Áreas de Conocimiento - CNPq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Fecha de publicación : 2025
Citación : VALENTE NETO, Ernesto Gurgel. A new methodology for edge intelligence data quality evaluation in IDD abd Non-IID datasets in federated learning. 2024. 116 f. Dissertação (Mestrado em Engenharia de Teleinformática) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2024.
Resumen en portugués brasileño: A geração maciça de dados a partir de dispositivos da Internet das Coisas (IoT) aumenta a procura por uma análise de dados eficiente, capaz de extrair informações significativas. O Aprendizado Federado (FL) permite que dispositivos IoT colaborem na construção de modelos de Inteligência Artificial (IA), preservando a privacidade dos dados. No entanto, a seleção de dados de alta qualidade para o treinamento permanece como um desafio crítico, especialmente em ambientes de FL com dados não independentes e identicamente distribuídos (non-iid). Dados de baixa qualidade introduzem erros, retardam a convergência dos modelos e elevam os custos computacionais. Para enfrentar esses desafios, este estudo propõe um algoritmo para análise da qualidade dos dados, aplicável tanto em ambientes centralizados quanto em cenários de FL. O algoritmo proposto reduz os custos computacionais, elimina o processamento desnecessário de dados e acelera a convergência dos modelos de IA. As experiências foram conduzidas com os conjuntos de dados MNIST, Fashion-MNIST, CIFAR-10 e CIFAR-100. A avaliação de desempenho baseou-se nas principais métricas da literatura: Accuracy, Recall, F1-score e Precision. Os resultados demonstram, no melhor dos cenários, reduções no tempo de execução de até 56,49%, com uma perda de acurácia em torno de apenas 0,50%.
Abstract: Massive data generation from Internet of Things (IoT) devices increases the demand for efficient data analysis to extract meaningful insights. Federated Learning (FL) allows IoT devices to collaborate in Artificial Intelligence (AI) training models while preserving data privacy. However, selecting high-quality data for training remains a critical challenge in FL environments with non-independent and identically distributed (non-iid) data. Poor-quality data introduce errors, delay convergence, and increase computational costs. This study develops a data quality analysis algorithm for FL and centralized environments to address these challenges. The proposed algorithm reduces computational costs, eliminates unnecessary data processing, and accelerates AI model convergence. The experiments used the MNIST, Fashion-MNIST, CIFAR-10, and CIFAR-100 datasets, and performance evaluation was based on main literature metrics like accuracy, recall, F1 score, and precision. Results show the best-case execution time reductions of up to 56.49%, with an accuracy loss of around 0.50%.
Descripción en portugués brasileño : Este documento está disponível online com base na Portaria no 348, de 08 de dezembro de 2022, disponível em: https://biblioteca.ufc.br/wp-content/uploads/2022/12/portaria348-2022.pdf, que autoriza a digitalização e a disponibilização no Repositório Institucional (RI) da coleção retrospectiva de TCC, dissertações e teses da UFC, sem o termo de anuência prévia dos autores. Em caso de trabalhos com pedidos de patente e/ou de embargo, cabe, exclusivamente, ao autor(a) solicitar a restrição de acesso ou retirada de seu trabalho do RI, mediante apresentação de documento comprobatório à Direção do Sistema de Bibliotecas.
URI : http://repositorio.ufc.br/handle/riufc/84629
Lattes del autor: http://lattes.cnpq.br/6702662597621445
ORCID del tutor: https://orcid.org/0000-0003-3623-2762
Lattes del tutor: http://lattes.cnpq.br/8203523299943090
Lattes del co-asesor: http://lattes.cnpq.br/8203523299943090
Derechos de acceso: Acesso Aberto
Aparece en las colecciones: DETE - Dissertações defendidas na UFC

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
2024_dis_egvalenteneto.pdfTese23,78 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.