Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/84824
Tipo: Tese
Título: SEPTRON : Predição de sepse usando transformer, ontologia e algoritmo bioinspirado
Título em inglês: SEPTRON: Sepsis Prediction with transformer, ontology, and bio-inspired algorithm
Autor(es): Silva Júnior, Lourival Gerardo da
Orientador: Andrade, Rossana Maria de Castro
Coorientador: Celestino Júnior, Joaquim
Palavras-chave em português: Predição de sepse;Ontologia da sepse;Algoritmo genético;Transformer
Palavras-chave em inglês: Sepsis prediction;Sepsis ontology;Genetic algorithm;Transformer
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Data do documento: 2025
Citação: SILVA JÚNIOR, Lourival Gerardo da. SEPTRON: Predição de sepse usando transformer, ontologia e algoritmo bioinspirado. 2025. 170 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2025.
Resumo: O uso de técnicas de Aprendizado de Máquina (AM) para predição de sepse tem evoluído globalmente, mas a seleção de variáveis clínicas relevantes, essencial para a construção de modelos preditivos robustos, permanece como um dos principais desafios. Esse aspecto é particularmente importante em pacientes com suspeita de sepse, que exigem monitoramento intensivo nas primeiras horas após a admissão em Unidades de Terapia Intensiva (UTIs), com o objetivo de viabilizar diagnóstico e tratamento precoces. Neste contexto, este trabalho propõe o modelo SEpsis Prediction with TRansformer, Ontology and BioiNspired Algorithm (SEPTRON), construído sobre a arquitetura Transformer adaptada para dados estruturados. O modelo utiliza variáveis selecionadas inicialmente a partir de um modelo conceitual ontológico da sepse e refinadas por um Algoritmo Genético (AG). As contribuições incluem: (i) pipeline estruturado e replicável, processo que contempla desde a extração dos dados à avaliação dos modelos; (ii) criação do dataset curado MIMIC-IV-EXT-ONTO-SEPSE, derivado da base MIMIC-IV; (iii) arquitetura Transformer adaptada para dados estruturados; e (iv) evidências sobre a relevância das variáveis clínicas selecionadas. A avaliação comparativa focou no desempenho do Transformer em relação a quatro modelos clássicos: Logistic Regression, Random Forest, XGBoost e Long Short-Term Memory (LSTM). Com janelas temporais de 4 horas ao longo das primeiras 72 horas de internação na UTI, o Transformer com todas as 17 variáveis clínicas apresentou desempenho superior (AUC-ROC 0,85; revocação 0,83). Já o SEPTRON, que integra o Algoritmo Genético para reduzir o conjunto de variáveis clínicas de 17 para 8, manteve desempenho competitivo (AUC-ROC 0,83; revocação 0,76), conciliando robustez, interpretabilidade e viabilidade computacional. Essa eficácia foi reforçada pela análise temporal da evolução da probabilidade de sepse ao longo das 72 horas. Conclui-se, portanto, que o SEPTRON representa uma proposta relevante para a área de saúde digital, oferecendo um modelo preditivo capaz de antecipar o risco de sepse em UTI com bom equilíbrio entre desempenho, interpretabilidade e aplicabilidade clínica.
Abstract: The use of Machine Learning (ML) techniques for sepsis prediction has evolved globally, but the selection of clinically relevant variables, essential for building robust predictive models, remains one of the main challenges. This aspect is particularly important for patients with suspected sepsis, who require intensive monitoring during the first hours after admission to Intensive Care Units (ICUs), in order to enable early diagnosis and treatment. In this context, this work proposes the model SEpsis Prediction with TRansformer, Ontology and BioiNspired Algorithm (SEPTRON), built on a Transformer architecture adapted for structured data. The model uses variables initially selected from a conceptual ontological model of sepsis and further refined by a Genetic Algorithm (GA). The contributions include: (i) a structured and replicable pipeline, covering the entire process from data extraction to model evaluation; (ii) creation of the curated dataset MIMIC-IV-EXT-ONTO-SEPSE, derived from the MIMIC-IV database; (iii) Transformer architecture adapted for structured data; and (iv) evidence of the relevance of the chosen clinical variables. The comparative evaluation focused on the performance of the Transformer against four classic models: Logistic Regression, Random Forest, XGBoost, and Long Short-Term Memory (LSTM). Using 4-hour time windows over the first 72 hours of ICU stay, the Transformer with all 17 clinical variables achieved superior performance (AUC-ROC 0.85; recall 0.83). In turn, the SEPTRON, which integrates the Genetic Algorithm to reduce the set of clinical variables from 17 to 8, maintained competitive performance (AUC-ROC 0.83; recall 0.76), combining robustness, interpretability, and computational feasibility. This effectiveness was reinforced by the temporal analysis of the evolution of sepsis probability over the 72 hours. It is concluded, therefore, that SEPTRON represents a relevant proposal to the field of digital health, providing a predictive model capable of anticipating the risk of sepsis in ICU with a good balance between performance, interpretability, and clinical applicability.
URI: http://repositorio.ufc.br/handle/riufc/84824
ORCID do(s) Autor(es): https://orcid.org/0000-0001-7012-5106
Currículo Lattes do(s) Autor(es): http://lattes.cnpq.br/8938995062360776
ORCID do Orientador: https://orcid.org/0000-0002-0186-2994
Currículo Lattes do Orientador: http://lattes.cnpq.br/9576713124661835
ORCID do Coorientador: https://orcid.org/0000-0002-4256-1522
Currículo Lattes do Coorientador: http://lattes.cnpq.br/2855716620920623
Tipo de Acesso: Acesso Aberto
Aparece nas coleções:DCOMP - Teses defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2025_tese_lgsilvajunior.pdf15,46 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.