Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/82335| Tipo: | TCC |
| Título: | FedKMeans: uma abordagem baseada em clusterização para agregação em aprendizado federado aplicado à geração de ECG sintético |
| Autor(es): | Monteiro, Matheus Rocha |
| Orientador: | Rocha, Atslands Rego da |
| Palavras-chave em português: | ECG;PPG;Aprendizado federado;Privacidade de dados;Dispositivos vestíveis |
| Palavras-chave em inglês: | Synthetic ECG;PPG;Federated learning;Data privacy;Wearable devices |
| CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| Data do documento: | 2024 |
| Citação: | MONTEIRO, Matheus Rocha. FedKMeans: uma abordagem baseada em clusterização para agregação em aprendizado federado aplicado à geração de ECG sintético. 2025. 66 f. Trabalho de Conclusão de Curso (Bacharelado em Engenharia de Computação) — Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2024. |
| Resumo: | O eletrocardiograma (ECG) é uma ferramenta essencial para o diagnóstico de condições cardíacas, fornecendo informações detalhadas sobre o ritmo e a atividade elétrica do coração. No entanto, sua obtenção tradicional é invasiva, exigindo equipamentos especializados, eletrodos fixados ao corpo do paciente e colaboração ativa, o que limita sua acessibilidade e monitoramento contínuo. Com o advento de dispositivos vestíveis, como relógios inteligentes, tornou-se possível coletar biossinais de forma passiva, como a fotopletismografia (PPG). Entretanto, o PPG isoladamente não oferece a riqueza diagnóstica do ECG, e a medição direta de ECG nesses dispositivos ainda enfrenta barreiras técnicas. Neste trabalho é proposto uma abordagem baseada em aprendizado de máquina para estimar sinais de ECG a partir de dados de PPG, utilizando redes neurais BiLSTM (Bidirecionais de Memória de Longo Curto Prazo) e técnicas de aprendizado federado para aprimorar a privacidade dos dados e a robustez dos modelos em ambientes distribuídos. A metodologia inclui o pré-processamento dos sinais de PPG e ECG da base de dados MIMIC-II, a modelagem do problema como uma tarefa de regressão sequencial e a implementação de duas estratégias de agregação federada: o FedAvg (padrão) e o FedKMeans, desenvolvida neste trabalho, que introduz uma etapa de clusterização (K-Means) para agrupar modelos locais com características semelhantes antes da agregação. Nos experimentos, quatro cenários foram comparados: treinamento centralizado, local individual, federado com FedAvg e federado com FedKMeans. As métricas de avaliação incluíram RMSE, MSE, coeficiente de Pearson, tempo de execução e uso de memória. Os resultados demonstraram que o FedKMeans apresenta vantagens em cenários heterogêneos, oferecendo maior precisão na geração de ECG sintéticos e melhor eficiência computacional em comparação ao FedAvg. Além disso, a abordagem proposta aborda questões éticas associadas à coleta centralizada de dados médicos, garantindo a privacidade dos pacientes. Essa combinação de técnicas transforma dispositivos vestíveis em ferramentas avançadas para detecção precoce de doenças cardiovasculares, com potencial para aplicações clínicas práticas e escaláveis. O trabalho contribui para a área de aprendizado federado ao explorar uma solução eficiente e segura para a geração de dados médicos sintéticos, preservando a privacidade e a utilidade clínica. |
| Abstract: | The electrocardiogram (ECG) is an essential tool for diagnosing cardiac conditions, providing detailed information about the heart’s rhythm and electrical activity. However, traditional ECG acquisition is invasive, requiring specialized equipment, electrodes attached to the patient’s body, and active collaboration, which limits its accessibility and continuous monitoring. With the advent of wearable devices, such as smartwatches, it has become possible to passively collect biosignals, such as photoplethysmography (PPG). However, PPG alone does not offer the diagnostic richness of ECG, and direct ECG measurement on these devices still faces technical barriers. This work proposes a machine learning-based approach to estimate ECG signals from PPG data, using Bidirectional Long Short-Term Memory (BiLSTM) neural networks and federated learning techniques to enhance data privacy and model robustness in distributed environments. The methodology includes preprocessing PPG and ECG signals from the MIMIC-II database, modeling the problem as a sequential regression task, and implementing two federated aggregation strategies: FedAvg (standard) and FedKMeans, which introduces a clustering step (K-Means) to group local models with similar characteristics before aggregation. Experiments compared four scenarios: centralized training, individual local training, federated training with FedAvg, and federated training with FedKMeans. Evaluation metrics included RMSE, MSE, Pearson correlation coefficient, execution time, and memory usage. The results demonstrated that FedKMeans offers advantages in heterogeneous scenarios, providing higher accuracy in synthetic ECG generation and better computational efficiency compared to FedAvg. Additionally, the proposed approach overcomes the diagnostic limitations of PPG and addresses ethical concerns associated with centralized medical data collection, ensuring patient privacy. This combination of techniques transforms wearable devices into advanced tools for early detection and management of cardiovascular diseases, with potential for practical and scalable clinical applications. The work contributes to the federated learning field by exploring an efficient and secure solution for generating synthetic medical data, preserving privacy and clinical utility. |
| URI: | http://repositorio.ufc.br/handle/riufc/82335 |
| ORCID do Orientador: | https://orcid.org/0000-0002-3069-132X |
| Currículo Lattes do Orientador: | http://lattes.cnpq.br/3272159643458627 |
| Tipo de Acesso: | Acesso Aberto |
| Aparece nas coleções: | ENGENHARIA DE COMPUTAÇÃO - Monografias |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| 2024_tcc_mrmonteiro.pdf | 744,16 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.