Please use this identifier to cite or link to this item:
http://repositorio.ufc.br/handle/riufc/74683
Type: | Tese |
Title: | IVS: interpretative variable selection via perfect bipartite matching |
Authors: | Caldas, Weslley Lioba |
Advisor: | Gomes, João Paulo Pordeus |
Co-advisor: | Madeiro, João Paulo do Vale |
Keywords in Brazilian Portuguese : | Doença de Chagas;Interpretabilidade;Seleção de atributos;Aprendizagem de máquina |
Keywords in English : | Chagas disease;Interpretability;Feature selection;Machine learning |
Knowledge Areas - CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Issue Date: | 2023 |
Citation: | CALDAS, Weslley Lioba. IVS: interpretative variable selection via perfect bipartite matching. 2023. 65 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2023. |
Abstract in Brazilian Portuguese: | A seleção de características é um processo fundamental em aprendizado de máquina para identificar o subconjunto mais relevante de atributos para um determinado problema. Entre as várias abordagens de seleção de características, os métodos de filtro se destacam por sua simplicidade e eficiência. No entanto, esses métodos carecem de interpretabilidade em relação às relações entre as características selecionadas e não selecionadas. Para enfrentar esse desafio, propomos um novo método de seleção de características em pares baseado em Emparelhamento Bipartido Perfeito, que estabelece relações lineares otimizadas entre as características, facilitando assim a interpretação das conexões entre elas. Também demonstramos como incorporar conhecimento de domínio, permitindo aos usuários excluir/incluir padrões desejáveis (por exemplo, pré-selecionar características específicas). Avaliações empíricas utilizando 17 conjuntos de dados demonstram a eficácia de nossa abordagem em comparação com os métodos de referência. Além disso, apresentamos um estudo de caso sobre a doença de Chagas, mostrando resultados de interpretação detalhados e a importância das características selecionadas na prevenção da morte súbita cardíaca. |
Abstract: | Feature selection is a fundamental process in machine learning to identify the most relevant subset of features for a given problem. Among the various feature selection approaches, filter methods stand out for their simplicity and efficiency. However, these methods lack interpretability regarding the relationships between the selected and unselected features. To address this challenge, we propose a novel pairwise feature selection method based on Perfect Bipartite Matching, which establishes optimized linear relationships between features, thus facilitating the interpretation of feature connections. We also demonstrate how to incorporate domain knowledge, allowing users to exclude/include desirable patterns (e.g., pre-select specific features). Empirical evaluations using 17 datasets demonstrate the effectiveness of our approach compared to baseline methods. Furthermore, we present a case study on Chagas disease, showcasing detailed interpretation results and the significance of selected features in sudden cardiac death prevention. |
URI: | http://repositorio.ufc.br/handle/riufc/74683 |
Author's Lattes: | http://lattes.cnpq.br/3450623955098872 |
Advisor's Lattes: | http://lattes.cnpq.br/9553770402705512 |
Co-advisor's Lattes: | http://lattes.cnpq.br/4328159466506074 |
Access Rights: | Acesso Aberto |
Appears in Collections: | DCOMP - Teses defendidas na UFC |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
2023_tese_wlcaldas.pdf | 836,82 kB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.