Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/84629| Tipo: | Dissertação |
| Título: | A new methodology for edge intelligence data quality evaluation in IDD abd Non-IID datasets in federated learning |
| Autor(es): | Valente Neto, Ernesto Gurgel |
| Orientador: | Anjos, Julio César Santos dos |
| Coorientador: | Peixoto, Solon Alves |
| Palavras-chave em português: | Acurácia dos dados;Aprendizagem profunda;Aprendizado federado;Internet das coisas |
| Palavras-chave em inglês: | Data accuracy;Deep learning;Federated learning;Internet of things |
| CNPq: | CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA |
| Data do documento: | 2025 |
| Citação: | VALENTE NETO, Ernesto Gurgel. A new methodology for edge intelligence data quality evaluation in IDD abd Non-IID datasets in federated learning. 2024. 116 f. Dissertação (Mestrado em Engenharia de Teleinformática) - Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2024. |
| Resumo: | A geração maciça de dados a partir de dispositivos da Internet das Coisas (IoT) aumenta a procura por uma análise de dados eficiente, capaz de extrair informações significativas. O Aprendizado Federado (FL) permite que dispositivos IoT colaborem na construção de modelos de Inteligência Artificial (IA), preservando a privacidade dos dados. No entanto, a seleção de dados de alta qualidade para o treinamento permanece como um desafio crítico, especialmente em ambientes de FL com dados não independentes e identicamente distribuídos (non-iid). Dados de baixa qualidade introduzem erros, retardam a convergência dos modelos e elevam os custos computacionais. Para enfrentar esses desafios, este estudo propõe um algoritmo para análise da qualidade dos dados, aplicável tanto em ambientes centralizados quanto em cenários de FL. O algoritmo proposto reduz os custos computacionais, elimina o processamento desnecessário de dados e acelera a convergência dos modelos de IA. As experiências foram conduzidas com os conjuntos de dados MNIST, Fashion-MNIST, CIFAR-10 e CIFAR-100. A avaliação de desempenho baseou-se nas principais métricas da literatura: Accuracy, Recall, F1-score e Precision. Os resultados demonstram, no melhor dos cenários, reduções no tempo de execução de até 56,49%, com uma perda de acurácia em torno de apenas 0,50%. |
| Abstract: | Massive data generation from Internet of Things (IoT) devices increases the demand for efficient data analysis to extract meaningful insights. Federated Learning (FL) allows IoT devices to collaborate in Artificial Intelligence (AI) training models while preserving data privacy. However, selecting high-quality data for training remains a critical challenge in FL environments with non-independent and identically distributed (non-iid) data. Poor-quality data introduce errors, delay convergence, and increase computational costs. This study develops a data quality analysis algorithm for FL and centralized environments to address these challenges. The proposed algorithm reduces computational costs, eliminates unnecessary data processing, and accelerates AI model convergence. The experiments used the MNIST, Fashion-MNIST, CIFAR-10, and CIFAR-100 datasets, and performance evaluation was based on main literature metrics like accuracy, recall, F1 score, and precision. Results show the best-case execution time reductions of up to 56.49%, with an accuracy loss of around 0.50%. |
| Descrição: | Este documento está disponível online com base na Portaria no 348, de 08 de dezembro de 2022, disponível em: https://biblioteca.ufc.br/wp-content/uploads/2022/12/portaria348-2022.pdf, que autoriza a digitalização e a disponibilização no Repositório Institucional (RI) da coleção retrospectiva de TCC, dissertações e teses da UFC, sem o termo de anuência prévia dos autores. Em caso de trabalhos com pedidos de patente e/ou de embargo, cabe, exclusivamente, ao autor(a) solicitar a restrição de acesso ou retirada de seu trabalho do RI, mediante apresentação de documento comprobatório à Direção do Sistema de Bibliotecas. |
| URI: | http://repositorio.ufc.br/handle/riufc/84629 |
| Currículo Lattes do(s) Autor(es): | http://lattes.cnpq.br/6702662597621445 |
| ORCID do Orientador: | https://orcid.org/0000-0003-3623-2762 |
| Currículo Lattes do Orientador: | http://lattes.cnpq.br/8203523299943090 |
| Currículo Lattes do Coorientador: | http://lattes.cnpq.br/8203523299943090 |
| Tipo de Acesso: | Acesso Aberto |
| Aparece nas coleções: | DETE - Dissertações defendidas na UFC |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| 2024_dis_egvalenteneto.pdf | Tese | 23,78 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.