Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/74683
Tipo: | Tese |
Título: | IVS: interpretative variable selection via perfect bipartite matching |
Autor(es): | Caldas, Weslley Lioba |
Orientador: | Gomes, João Paulo Pordeus |
Coorientador: | Madeiro, João Paulo do Vale |
Palavras-chave em português: | Doença de Chagas;Interpretabilidade;Seleção de atributos;Aprendizagem de máquina |
Palavras-chave em inglês: | Chagas disease;Interpretability;Feature selection;Machine learning |
CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Data do documento: | 2023 |
Citação: | CALDAS, Weslley Lioba. IVS: interpretative variable selection via perfect bipartite matching. 2023. 65 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2023. |
Resumo: | A seleção de características é um processo fundamental em aprendizado de máquina para identificar o subconjunto mais relevante de atributos para um determinado problema. Entre as várias abordagens de seleção de características, os métodos de filtro se destacam por sua simplicidade e eficiência. No entanto, esses métodos carecem de interpretabilidade em relação às relações entre as características selecionadas e não selecionadas. Para enfrentar esse desafio, propomos um novo método de seleção de características em pares baseado em Emparelhamento Bipartido Perfeito, que estabelece relações lineares otimizadas entre as características, facilitando assim a interpretação das conexões entre elas. Também demonstramos como incorporar conhecimento de domínio, permitindo aos usuários excluir/incluir padrões desejáveis (por exemplo, pré-selecionar características específicas). Avaliações empíricas utilizando 17 conjuntos de dados demonstram a eficácia de nossa abordagem em comparação com os métodos de referência. Além disso, apresentamos um estudo de caso sobre a doença de Chagas, mostrando resultados de interpretação detalhados e a importância das características selecionadas na prevenção da morte súbita cardíaca. |
Abstract: | Feature selection is a fundamental process in machine learning to identify the most relevant subset of features for a given problem. Among the various feature selection approaches, filter methods stand out for their simplicity and efficiency. However, these methods lack interpretability regarding the relationships between the selected and unselected features. To address this challenge, we propose a novel pairwise feature selection method based on Perfect Bipartite Matching, which establishes optimized linear relationships between features, thus facilitating the interpretation of feature connections. We also demonstrate how to incorporate domain knowledge, allowing users to exclude/include desirable patterns (e.g., pre-select specific features). Empirical evaluations using 17 datasets demonstrate the effectiveness of our approach compared to baseline methods. Furthermore, we present a case study on Chagas disease, showcasing detailed interpretation results and the significance of selected features in sudden cardiac death prevention. |
URI: | http://repositorio.ufc.br/handle/riufc/74683 |
Currículo Lattes do(s) Autor(es): | http://lattes.cnpq.br/3450623955098872 |
Currículo Lattes do Orientador: | http://lattes.cnpq.br/9553770402705512 |
Currículo Lattes do Coorientador: | http://lattes.cnpq.br/4328159466506074 |
Tipo de Acesso: | Acesso Aberto |
Aparece nas coleções: | DCOMP - Teses defendidas na UFC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2023_tese_wlcaldas.pdf | 836,82 kB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.