Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.ufc.br/handle/riufc/74683
Tipo: Tese
Título : IVS: interpretative variable selection via perfect bipartite matching
Autor : Caldas, Weslley Lioba
Tutor: Gomes, João Paulo Pordeus
Co-asesor: Madeiro, João Paulo do Vale
Palabras clave en portugués brasileño: Doença de Chagas;Interpretabilidade;Seleção de atributos;Aprendizagem de máquina
Palabras clave en inglés: Chagas disease;Interpretability;Feature selection;Machine learning
Áreas de Conocimiento - CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Fecha de publicación : 2023
Citación : CALDAS, Weslley Lioba. IVS: interpretative variable selection via perfect bipartite matching. 2023. 65 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2023.
Resumen en portugués brasileño: A seleção de características é um processo fundamental em aprendizado de máquina para identificar o subconjunto mais relevante de atributos para um determinado problema. Entre as várias abordagens de seleção de características, os métodos de filtro se destacam por sua simplicidade e eficiência. No entanto, esses métodos carecem de interpretabilidade em relação às relações entre as características selecionadas e não selecionadas. Para enfrentar esse desafio, propomos um novo método de seleção de características em pares baseado em Emparelhamento Bipartido Perfeito, que estabelece relações lineares otimizadas entre as características, facilitando assim a interpretação das conexões entre elas. Também demonstramos como incorporar conhecimento de domínio, permitindo aos usuários excluir/incluir padrões desejáveis (por exemplo, pré-selecionar características específicas). Avaliações empíricas utilizando 17 conjuntos de dados demonstram a eficácia de nossa abordagem em comparação com os métodos de referência. Além disso, apresentamos um estudo de caso sobre a doença de Chagas, mostrando resultados de interpretação detalhados e a importância das características selecionadas na prevenção da morte súbita cardíaca.
Abstract: Feature selection is a fundamental process in machine learning to identify the most relevant subset of features for a given problem. Among the various feature selection approaches, filter methods stand out for their simplicity and efficiency. However, these methods lack interpretability regarding the relationships between the selected and unselected features. To address this challenge, we propose a novel pairwise feature selection method based on Perfect Bipartite Matching, which establishes optimized linear relationships between features, thus facilitating the interpretation of feature connections. We also demonstrate how to incorporate domain knowledge, allowing users to exclude/include desirable patterns (e.g., pre-select specific features). Empirical evaluations using 17 datasets demonstrate the effectiveness of our approach compared to baseline methods. Furthermore, we present a case study on Chagas disease, showcasing detailed interpretation results and the significance of selected features in sudden cardiac death prevention.
URI : http://repositorio.ufc.br/handle/riufc/74683
Lattes del autor: http://lattes.cnpq.br/3450623955098872
Lattes del tutor: http://lattes.cnpq.br/9553770402705512
Lattes del co-asesor: http://lattes.cnpq.br/4328159466506074
Derechos de acceso: Acesso Aberto
Aparece en las colecciones: DCOMP - Teses defendidas na UFC

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
2023_tese_wlcaldas.pdf836,82 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.