Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/60533
Type: Dissertação
Title: Processos t-student em classificação
Authors: Assunção, Alan da Silva
Advisor: Andrade, José Aílton Alencar
Keywords: Classificador de processo gaussiano;Robustez;Classificador de processo t-student;Modelagem não-paramétrica;Gaussian process classifier;Robustness;T-student process classifier;Non-parametric modeling
Issue Date: 2021
Citation: ASSUNÇÃO, Alan da Silva. Processos t-student em classificação. 2021. 117 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Departamento de Estatística e Matemática Aplicada, Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2021.
Abstract in Brazilian Portuguese: Modelos de regressão baseados em Processo Gaussiano (GPR) são excelentes alternativas não-paramétricas para modelagem de problemas complexos, e apresentam muitas atratividades das quais podemos citar: boa performance preditiva, flexibilidade não-paramétrica, interpretabilidade e relativamente fácil implementação conceitual. Dessa forma, a proposta de modelos de classificação de GP ´e um caminho bastante útil para lidar com os mais diversos problemas de classificação. Entretanto, modelos de Processo Gaussiano não possuem robustez a outliers, devido à natureza de cauda leve da distribuição Gaussiana. Com isso, neste trabalho, propomos um novo classificador com um Processo t-Student (TPC), como distribuição a priori, como forma alternativa aos Processos Gaussianos. O TPC tem por objetivo lidar de forma adequada com problemas de classificação cujos dados de entrada x estejam contaminados por outliers. O classificador proposto teve seu desempenho avaliado junto ao tradicional classificador de Processo Gaussiano (GPC) em conjuntos de dados reais da área biomédica, em que os outliers foram gerados artificialmente. Para as aplicações no caso de classificação binária, dados de diagnóstico de coluna vertebral e diagnóstico de câncer de mama foram utilizados. Para as aplicações no caso multiclasse, o conjunto de observações de coluna vertebral em sua versão multiclasse foi considerado. As inferências sobre os modelos abordados nesta pesquisa foram feitas por meio do método NUTS, uma técnica MCMC variante do Monte Carlo Hamiltoniano. Pelos resultados das aplicações realizadas neste trabalho, o classificador TPC alcançou resultados bastante promissores, principalmente na tarefa de classificação multiclasse, em que a proposta de robustez em dados contaminados por outliers foi bem atendida.
Abstract: Gaussian Process regression models (GPR) are excellent non-parametric alternatives for modeling complex problems, among the advantages, we can mention: good predictive performance, non-parametric flexibility, interpretability and easy computational implementation. Thus, the proposal for GP classification models is useful to deal with most diverse classification problems. However, Gaussian Process models are not robust to outliers, due to the light-tailed nature of the Gaussian distribution. In this work, we propose a new t-Student Process classifier (TPC), as an alternative to Gaussian Processes. The TPC aproach is able to deal most adequately with classification problems which input data x are contaminated by outliers. The proposed classifier had its performance evaluated with the traditional Gaussian Process classifier (GPC) in real data sets from the biomedical area, where the outliers were generated artificially. For applications in the case of binary classification, spinal diagnostic data and breast cancer diagnosis were used. For applications in the multiclass case, the set of vertebral column observations in its multiclass version was considered. The inferences about the models covered in this work were made using the NUTS method, an MCMC technique variant of Hamiltonian Monte Carlo. Due to the results of the applications carried out in this work, the TPC classifier achieved very promising results, mainly in the task of multiclass classification, in which the proposal of robustness in data contaminated by textit outliers was well attended.
URI: http://www.repositorio.ufc.br/handle/riufc/60533
Appears in Collections:DEMA - Dissertações defendidas na UFC

Files in This Item:
File Description SizeFormat 
2021_dis_asassunção.pdf2,1 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.