Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/74683
Type: Tese
Title: IVS: interpretative variable selection via perfect bipartite matching
Authors: Caldas, Weslley Lioba
Advisor: Gomes, João Paulo Pordeus
Co-advisor: Madeiro, João Paulo do Vale
Keywords in Brazilian Portuguese : Doença de Chagas;Interpretabilidade;Seleção de atributos;Aprendizagem de máquina
Keywords in English : Chagas disease;Interpretability;Feature selection;Machine learning
Knowledge Areas - CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Issue Date: 2023
Citation: CALDAS, Weslley Lioba. IVS: interpretative variable selection via perfect bipartite matching. 2023. 65 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2023.
Abstract in Brazilian Portuguese: A seleção de características é um processo fundamental em aprendizado de máquina para identificar o subconjunto mais relevante de atributos para um determinado problema. Entre as várias abordagens de seleção de características, os métodos de filtro se destacam por sua simplicidade e eficiência. No entanto, esses métodos carecem de interpretabilidade em relação às relações entre as características selecionadas e não selecionadas. Para enfrentar esse desafio, propomos um novo método de seleção de características em pares baseado em Emparelhamento Bipartido Perfeito, que estabelece relações lineares otimizadas entre as características, facilitando assim a interpretação das conexões entre elas. Também demonstramos como incorporar conhecimento de domínio, permitindo aos usuários excluir/incluir padrões desejáveis (por exemplo, pré-selecionar características específicas). Avaliações empíricas utilizando 17 conjuntos de dados demonstram a eficácia de nossa abordagem em comparação com os métodos de referência. Além disso, apresentamos um estudo de caso sobre a doença de Chagas, mostrando resultados de interpretação detalhados e a importância das características selecionadas na prevenção da morte súbita cardíaca.
Abstract: Feature selection is a fundamental process in machine learning to identify the most relevant subset of features for a given problem. Among the various feature selection approaches, filter methods stand out for their simplicity and efficiency. However, these methods lack interpretability regarding the relationships between the selected and unselected features. To address this challenge, we propose a novel pairwise feature selection method based on Perfect Bipartite Matching, which establishes optimized linear relationships between features, thus facilitating the interpretation of feature connections. We also demonstrate how to incorporate domain knowledge, allowing users to exclude/include desirable patterns (e.g., pre-select specific features). Empirical evaluations using 17 datasets demonstrate the effectiveness of our approach compared to baseline methods. Furthermore, we present a case study on Chagas disease, showcasing detailed interpretation results and the significance of selected features in sudden cardiac death prevention.
URI: http://repositorio.ufc.br/handle/riufc/74683
Author's Lattes: http://lattes.cnpq.br/3450623955098872
Advisor's Lattes: http://lattes.cnpq.br/9553770402705512
Co-advisor's Lattes: http://lattes.cnpq.br/4328159466506074
Access Rights: Acesso Aberto
Appears in Collections:DCOMP - Teses defendidas na UFC

Files in This Item:
File Description SizeFormat 
2023_tese_wlcaldas.pdf836,82 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.