Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/83875
Tipo: Tese
Título: Sparse kernel prototype-based classifiers: new contributions
Título em inglês: Sparse kernel prototype-based classifiers: new contributions
Autor(es): Coelho, David Nascimento
Orientador: Barreto, Guilherme de Alencar
Palavras-chave em português: Kernel, funções de;Métodos de esparsificação;Algoritmos adaptativos
Palavras-chave em inglês: Kernel functions;Sparsification methods;Adaptive algorithms
CNPq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Data do documento: 2025
Citação: COELHO, David Nascimento. Sparse kernel prototype-based classifiers: new contributions. 2025. 140 f. Tese (Doutorado em Engenharia de Teleinformática) – Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2025.
Resumo: Esta tese tem por objetivo contribuir para o desenvolvimento de classificadores baseados em protótipos utilizando métodos de kernel. Inicialmente, investiga-se a aplicação do truque de kernel à rede neural self-organizing map (SOM) na classificação de bancos de dados do tipo batch, avaliando-se a influência de diferentes funções de kernel e métodos de rotulação. Os resultados indicaram que o uso de funções de kernel além das tradicionais (Gaussiana e Linear) pode gerar desempenhos superiores. Verificou-se também que, nos bancos de dados analisados, há vantagens em computar tanto a medida de distância quanto a definição do protótipo vencedor no espaço de atributos. Em seguida, considerando a importância da definição do número de protótipos para a acurácia de classificadores baseados em protótipos, propõe-se a utilização de métodos de esparsificação, tais como approximate linear dependence, novelty, surprise e coherence, para seleção automática dessa quantidade, utilizando, como classificador, o algoritmo K-vizinhos mais próximos ponderados. Esses métodos são comparados quanto à influência na acurácia e na quantidade de protótipos selecionados para o modelo. Nos testes com o modelo proposto, denominado sparse kernel (SPARK), nenhum método de esparsificação ou função kernel apresentou desempenho consistentemente superior em todos os conjuntos de dados, destacando que a eficácia do modelo depende das características do problema e requer seleção criteriosa de métodos, funções kernel e hiperparâmetros. Na maioria dos casos, o desempenho superou o do kernelSOM, no qual a definição da quantidade de protótipos apresenta maior custo computacional. Por fim, considerando aplicações em que os dados chegam em fluxo contínuo, propõe-se um novo arcabouço teórico, denominado sparse online kernel (SPOK), para a construção de modelos adaptativos baseados em protótipos utilizando métodos de kernel. O modelo foi avaliado na classificação de dados sintéticos e reais em fluxo contínuo. Os resultados evidenciaram que, mesmo utilizando apenas protótipos e estratégias de K-vizinhos mais próximos, o modelo atinge, com poucos protótipos, desempenho comparável ao estado da arte em classificadores de fluxo contínuo, os quais são, geralmente, baseados em janelamento, comitês ou árvores de decisão.
Abstract: The main purpose of this thesis is to contribute to the development of prototype-based classifiers using kernel methods. Initially, the application of the kernel trick to the artificial neural network self-organizing map (SOM) is investigated for the classification of batch datasets (in which all training data are simultaneously available), also verifying the influence of different kernel functions and labeling methods. The results of these initial experiments showed that using kernel functions other than the commonly employed ones (Gaussian and Linear) can lead to superior performance. Furthermore, it was verified that, in the analyzed datasets, there are advantages in computing both the distance measure and the definition of the winning prototype in the feature space. Then, considering that defining the number of prototypes is very important for the accuracy of prototype-based classifiers, this work proposes the use of sparsification methods, such as approximate linear dependence (ALD), novelty, surprise and coherence, for the automatic selection of this quantity, employing the weighted K-nearest neighbors algorithm as the classifier. These methods are compared with respect to their influence on classifier accuracy and on the number of prototypes selected. In the experiments carried out with the proposed model, here referred to as sparse kernel (SPARK), no sparsification method or kernel function consistently outperformed the others across all datasets. These findings highlight that the effectiveness of the model depends on the dataset characteristics, reinforcing the need for a careful selection of sparsification methods, kernel functions, and hyperparameters adapted to each specific task. Moreover, in most cases, the performance was superior to that of the kernel-SOM algorithm, in which the definition of the number of prototypes implies a higher computational cost. Finally, in many recent applications, data may be provided as a continuous stream. In this context, a new theoretical framework, here referred to as sparse online kernel (SPOK), is proposed for building adaptive prototypebased models using kernel methods. The proposed model was evaluated in the classification of synthetic and real data streams. The results showed that, even relying solely on prototypes and K-nearest neighbor strategies, the model achieved, with only a few prototypes, performance comparable to the state-of-the-art in data stream classifiers, which are often based on data windowing, ensembles or decision trees.
Descrição: Este documento está disponível online com base na Portaria no 348, de 08 de dezembro de 2022, disponível em: https://biblioteca.ufc.br/wp-content/uploads/2022/12/portaria348-2022.pdf, que autoriza a digitalização e a disponibilização no Repositório Institucional (RI) da coleção retrospectiva de TCC, dissertações e teses da UFC, sem o termo de anuência prévia dos autores. Em caso de trabalhos com pedidos de patente e/ou de embargo, cabe, exclusivamente, ao autor(a) solicitar a restrição de acesso ou retirada de seu trabalho do RI, mediante apresentação de documento comprobatório à Direção do Sistema de Bibliotecas.
URI: http://repositorio.ufc.br/handle/riufc/83875
ORCID do(s) Autor(es): https://orcid.org/0000-0002-7410-5601
Currículo Lattes do(s) Autor(es): http://lattes.cnpq.br/6772633589426873
ORCID do Orientador: https://orcid.org/0000-0002-7002-1216
Currículo Lattes do Orientador: http://lattes.cnpq.br/8902002461422112
Tipo de Acesso: Acesso Aberto
Aparece nas coleções:DETE - Teses defendidas na UFC

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2025_tese_dncoelho.pdfTese1,7 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.