Métodos para treinamento rápido e esparso de máquinas de vetores-suporte de mínimos quadrados: uma abordagem dual

Marinho, Felipe Pinto

Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/86656

Tipo:	Tese
Título:	Métodos para treinamento rápido e esparso de máquinas de vetores-suporte de mínimos quadrados: uma abordagem dual
Autor(es):	Marinho, Felipe Pinto
Orientador:	Rocha Neto, Ajalmar Rêgo da
Coorientador:	Rocha, Paulo Alexandre Costa
Palavras-chave em português:	Máquinas de vetores-suporte de mínimos quadrados;otimização sequencial mínima;Direções conjugadas;Gradiente conjugado espectral;Esparsidade
Palavras-chave em inglês:	Least squares support vector machines;Sequential minimal optimization;Conjugate directions;Spectral conjugate gradient;Sparsity
CNPq:	CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Data do documento:	2025
Citação:	MARINHO, Felipe Pinto. Métodos para treinamento rápido e esparso de máquinas de vetores-suporte de mínimos quadrados: uma abordagem dual. 2025. 135 f. Tese (Doutorado em Engenharia de Teleinformática) – Centro de Tecnologia, Universidade Federal do Ceará, Fortaleza, 2025
Resumo:	O modelo de máquinas de vetores-suporte de mínimos quadrados e uma variante do clássico modelo de máquinas de vetores-suporte que utiliza restrições de igualdade na formulação de seu problema primal. Isto permite a obtenção de um sistema linear ao aplicar as condições de Karush-Kuhn-Tucker para a otimalidade do problema, simplificando consideravelmente o treinamento deste modelo quando comparado ao ajuste das máquinas de vetores-suporte. No entanto, uma desvantagem dessa formulação está no fato de que o vetor ótimo de multiplicadores de Lagrange do problema e não esparso. Assim, todos os padrões de treinamento serão considerados vetores-suporte, fazendo com que o estágio de predição seja oneroso quando se trabalha com grandes bases de dados. Em muitos casos, a solução do sistema e dada pelo uso de métodos iterativos baseados em direções conjugadas, o que por um lado e vantajoso, uma vez que evita as dificuldades numéricas relacionadas a inversão de matrizes, por outro, torna o estágio de treinamento lento para bases com alta volumetria, já que é necessário operar com matrizes de kernel densas. Neste contexto, propõem-se duas novas metodologias para o treinamento rápido e esparso de máquinas de vetores-suporte de mínimos quadrados. Na primeira abordagem, o problema dual das máquinas de vetores-suporte de mínimos quadrados e resolvido via algoritmo de otimização sequencial mínima com uma nova direção de descida conjugada de três termos, que combinada a uma estratégia de seleção de conjunto de trabalho baseada no ganho funcional permite uma aceleração na convergência, reduzindo o número de iterações quando comparado ao algoritmo de otimização sequencial mínima padrão. Além disso, um processo de poda iterativa baseado no ganho funcional do problema de otimização e adotado com o intuito de esparsificar os multiplicadores de Lagrange obtidos. Por fim, a última proposta consiste no uso de um novo método do gradiente conjugado espectral para a solução do problema dual correspondente e esparsificacao via poda iterativa utilizando a proximidade do padrão ao hiperplano de decisão como critério para a remoção. Experimentos numéricos realizados sobre várias bases de dados reais e artificiais comprovam que as duas abordagens apresentam desempenho competitivo, com rápido treinamento e alto nível de esparsidade dos multiplicadores de Lagrange. Para as bases de classificação binária, o ganho de esparsidade chegou a aproximadamente 80% quando comparado ao total de amostras de treino para o conjunto de dados considerado. A redução no tempo de treinamento foi de cerca de 99.9% em relação as máquinas de vetores-suporte de mínimos quadrados padrão. Para bases de maior volumetria, as propostas foram as únicas que forneceram um tempo de treinamento hábil com estabilidade na convergência. A qualidade das fronteiras de decisão foram ainda analisadas para conjuntos de dados sintéticos, em que os resultados indicam geração de fronteiras similares ao modelo de benchmarking considerado, ratificando a capacidade preditiva das novas metodologias. Por fim, os resultados para as bases de regressão indicam que a proposta baseada no gradiente conjugado espectral pode ser uma alternativa esparsa e com rápido treinamento ao modelo de regressores de vetores-suporte de mínimos quadrados.
Abstract:	The least squares support vector machine model is a variant of the classical support vector machine model that employs equality constraints in the formulation of its primal problem. This allows the derivation of a linear system when applying the Karush–Kuhn–Tucker optimality conditions, considerably simplifying the training of this model when compared to the adjustment of support vector machines. However, a drawback of this formulation lies in the fact that the optimal vector of Lagrange multipliers of the problem is dense. Thus, all training patterns are considered support vectors, making the prediction stage computationally expensive when working with large datasets. In many cases, the solution of the system is obtained through the use of iterative methods based on conjugate directions, which, on the one hand, is advantageous since it avoids numerical difficulties related to matrix inversion, but, on the other hand, makes the training stage slow for datasets with high volume, as it is necessary to operate with dense kernel matrices. In this context, two new methodologies are proposed for the fast and sparse training of least squares support vector machines. In the first approach, the dual problem of least squares support vector machines is solved via a sequential minimal optimization algorithm with a new three-term conjugate descent direction which, combined with a working set selection strategy based on functional gain, allows an acceleration in convergence, reducing the number of iterations when compared to the standard sequential minimal optimization algorithm. In addition, an iterative pruning process based on the functional gain of the optimization problem is adopted in order to sparsify the obtained Lagrange multipliers. Finally, the last proposal consists of the use of a new spectral conjugate gradient method for solving the corresponding dual problem and sparsification through iterative pruning using the proximity of the pattern to the decision hyperplane as the criterion for removal. Numerical experiments carried out on several real and artificial datasets demonstrate that both approaches present competitive performance, with fast training and a high level of sparsity of the Lagrange multipliers. For binary classification datasets, the sparsity gain reached approximately 80% when compared to the total number of training samples for the considered dataset. The reduction in training time was approximately 99.9% in relation to standard least squares support vector machines. For datasets with higher volume, the proposals were the only ones that provided feasible training time with stable convergence. The quality of the decision boundaries was further analyzed for synthetic datasets, where the results indicate the generation of boundaries similar to the considered benchmarking model, confirming the predictive capability of the new methodologies. Finally, the results for regression datasets indicate that the proposal based on the spectral conjugate gradient method may be a sparse and fast-training alternative to the least squares support vector machine regression model.
Descrição:	Este documento está disponível online com base na Portaria no 348, de 08 de dezembro de 2022, disponível em: https://biblioteca.ufc.br/wp-content/uploads/2022/12/portaria348-2022.pdf, que autoriza a digitalização e a disponibilização no Repositório Institucional (RI) da coleção retrospectiva de TCC, dissertações e teses da UFC, sem o termo de anuência prévia dos autores. Em caso de trabalhos com pedidos de patente e/ou de embargo, cabe, exclusivamente, ao autor(a) solicitar a restrição de acesso ou retirada de seu trabalho do RI, mediante apresentação de documento comprobatório à Direção do Sistema de Bibliotecas.
URI:	http://repositorio.ufc.br/handle/riufc/86656
Currículo Lattes do(s) Autor(es):	https://lattes.cnpq.br/8458749333214447
ORCID do Orientador:	https://orcid.org/0000-0002-4512-5531
Currículo Lattes do Orientador:	http://lattes.cnpq.br/4524723055652545
Currículo Lattes do Coorientador:	http://lattes.cnpq.br/5339964546831976
Tipo de Acesso:	Acesso Aberto
Aparece nas coleções:	DETE - Teses defendidas na UFC

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2025_tese_fpmarinho.pdf	Tese	5,59 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas