Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/60533
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | Andrade, José Aílton Alencar | - |
dc.contributor.author | Assunção, Alan da Silva | - |
dc.date.accessioned | 2021-09-20T11:38:01Z | - |
dc.date.available | 2021-09-20T11:38:01Z | - |
dc.date.issued | 2021 | - |
dc.identifier.citation | ASSUNÇÃO, Alan da Silva. Processos t-student em classificação. 2021. 117 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Departamento de Estatística e Matemática Aplicada, Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2021. | pt_BR |
dc.identifier.uri | http://www.repositorio.ufc.br/handle/riufc/60533 | - |
dc.description.abstract | Gaussian Process regression models (GPR) are excellent non-parametric alternatives for modeling complex problems, among the advantages, we can mention: good predictive performance, non-parametric flexibility, interpretability and easy computational implementation. Thus, the proposal for GP classification models is useful to deal with most diverse classification problems. However, Gaussian Process models are not robust to outliers, due to the light-tailed nature of the Gaussian distribution. In this work, we propose a new t-Student Process classifier (TPC), as an alternative to Gaussian Processes. The TPC aproach is able to deal most adequately with classification problems which input data x are contaminated by outliers. The proposed classifier had its performance evaluated with the traditional Gaussian Process classifier (GPC) in real data sets from the biomedical area, where the outliers were generated artificially. For applications in the case of binary classification, spinal diagnostic data and breast cancer diagnosis were used. For applications in the multiclass case, the set of vertebral column observations in its multiclass version was considered. The inferences about the models covered in this work were made using the NUTS method, an MCMC technique variant of Hamiltonian Monte Carlo. Due to the results of the applications carried out in this work, the TPC classifier achieved very promising results, mainly in the task of multiclass classification, in which the proposal of robustness in data contaminated by textit outliers was well attended. | pt_BR |
dc.language.iso | pt_BR | pt_BR |
dc.subject | Classificador de processo gaussiano | pt_BR |
dc.subject | Robustez | pt_BR |
dc.subject | Classificador de processo t-student | pt_BR |
dc.subject | Modelagem não-paramétrica | pt_BR |
dc.subject | Gaussian process classifier | pt_BR |
dc.subject | Robustness | pt_BR |
dc.subject | T-student process classifier | pt_BR |
dc.subject | Non-parametric modeling | pt_BR |
dc.title | Processos t-student em classificação | pt_BR |
dc.type | Dissertação | pt_BR |
dc.description.abstract-ptbr | Modelos de regressão baseados em Processo Gaussiano (GPR) são excelentes alternativas não-paramétricas para modelagem de problemas complexos, e apresentam muitas atratividades das quais podemos citar: boa performance preditiva, flexibilidade não-paramétrica, interpretabilidade e relativamente fácil implementação conceitual. Dessa forma, a proposta de modelos de classificação de GP ´e um caminho bastante útil para lidar com os mais diversos problemas de classificação. Entretanto, modelos de Processo Gaussiano não possuem robustez a outliers, devido à natureza de cauda leve da distribuição Gaussiana. Com isso, neste trabalho, propomos um novo classificador com um Processo t-Student (TPC), como distribuição a priori, como forma alternativa aos Processos Gaussianos. O TPC tem por objetivo lidar de forma adequada com problemas de classificação cujos dados de entrada x estejam contaminados por outliers. O classificador proposto teve seu desempenho avaliado junto ao tradicional classificador de Processo Gaussiano (GPC) em conjuntos de dados reais da área biomédica, em que os outliers foram gerados artificialmente. Para as aplicações no caso de classificação binária, dados de diagnóstico de coluna vertebral e diagnóstico de câncer de mama foram utilizados. Para as aplicações no caso multiclasse, o conjunto de observações de coluna vertebral em sua versão multiclasse foi considerado. As inferências sobre os modelos abordados nesta pesquisa foram feitas por meio do método NUTS, uma técnica MCMC variante do Monte Carlo Hamiltoniano. Pelos resultados das aplicações realizadas neste trabalho, o classificador TPC alcançou resultados bastante promissores, principalmente na tarefa de classificação multiclasse, em que a proposta de robustez em dados contaminados por outliers foi bem atendida. | pt_BR |
Aparece nas coleções: | DEMA - Dissertações defendidas na UFC |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2021_dis_asassunção.pdf | 2,1 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.