Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/74683
Tipo: Tese
Título: IVS: interpretative variable selection via perfect bipartite matching
Autor(es): Caldas, Weslley Lioba
Orientador: Gomes, João Paulo Pordeus
Coorientador: Madeiro, João Paulo do Vale
Palavras-chave em português: Doença de Chagas;Interpretabilidade;Seleção de atributos;Aprendizagem de máquina
Palavras-chave em inglês: Chagas disease;Interpretability;Feature selection;Machine learning
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Data do documento: 2023
Citação: CALDAS, Weslley Lioba. IVS: interpretative variable selection via perfect bipartite matching. 2023. 65 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2023.
Resumo: A seleção de características é um processo fundamental em aprendizado de máquina para identificar o subconjunto mais relevante de atributos para um determinado problema. Entre as várias abordagens de seleção de características, os métodos de filtro se destacam por sua simplicidade e eficiência. No entanto, esses métodos carecem de interpretabilidade em relação às relações entre as características selecionadas e não selecionadas. Para enfrentar esse desafio, propomos um novo método de seleção de características em pares baseado em Emparelhamento Bipartido Perfeito, que estabelece relações lineares otimizadas entre as características, facilitando assim a interpretação das conexões entre elas. Também demonstramos como incorporar conhecimento de domínio, permitindo aos usuários excluir/incluir padrões desejáveis (por exemplo, pré-selecionar características específicas). Avaliações empíricas utilizando 17 conjuntos de dados demonstram a eficácia de nossa abordagem em comparação com os métodos de referência. Além disso, apresentamos um estudo de caso sobre a doença de Chagas, mostrando resultados de interpretação detalhados e a importância das características selecionadas na prevenção da morte súbita cardíaca.
Abstract: Feature selection is a fundamental process in machine learning to identify the most relevant subset of features for a given problem. Among the various feature selection approaches, filter methods stand out for their simplicity and efficiency. However, these methods lack interpretability regarding the relationships between the selected and unselected features. To address this challenge, we propose a novel pairwise feature selection method based on Perfect Bipartite Matching, which establishes optimized linear relationships between features, thus facilitating the interpretation of feature connections. We also demonstrate how to incorporate domain knowledge, allowing users to exclude/include desirable patterns (e.g., pre-select specific features). Empirical evaluations using 17 datasets demonstrate the effectiveness of our approach compared to baseline methods. Furthermore, we present a case study on Chagas disease, showcasing detailed interpretation results and the significance of selected features in sudden cardiac death prevention.
URI: http://repositorio.ufc.br/handle/riufc/74683
Currículo Lattes do(s) Autor(es): http://lattes.cnpq.br/3450623955098872
Currículo Lattes do Orientador: http://lattes.cnpq.br/9553770402705512
Currículo Lattes do Coorientador: http://lattes.cnpq.br/4328159466506074
Tipo de Acesso: Acesso Aberto
Aparece nas coleções:DCOMP - Teses defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2023_tese_wlcaldas.pdf836,82 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.