Por favor, use este identificador para citar o enlazar este ítem:
http://repositorio.ufc.br/handle/riufc/80973| Tipo: | Dissertação |
| Título : | Funções de covariância e robustez a outliers em processos Gaussianos |
| Título en inglés: | Covariance functions and robustness to outliers in Gaussian processes |
| Autor : | Martinho, Wasley Correia |
| Tutor: | Andrade, José Ailton Alencar |
| Palabras clave en portugués brasileño: | Processos gaussianos;Kernel;Outliers |
| Palabras clave en inglés: | Gaussian processes;Kernel;Outliers |
| Áreas de Conocimiento - CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::TEORIA GERAL E PROCESSOS ESTOCASTICOS |
| Fecha de publicación : | feb-2025 |
| Citación : | MARTINHO, Wasley Correia. Funções de covariância e robustez a outliers em processos Gaussianos. 2025. 103 f. Dissertação (Mestrado em Modelagem e Métodos Quantitativos) - Centro de Ciências, Universidade Federal do Ceará, 2025. |
| Resumen en portugués brasileño: | Na Teoria de Regressão, os Processos Gaussianos surgem como uma alternativa eficiente para simplificar a obtenção de estimativas em Modelos Bayesianos. Um Processo Gaussiano é uma generalização da distribuição gaussiana, totalmente definido por sua média e função de covariância (ou kernel). Este modelo não-paramétrico tem ganhado destaque devido à facilidade de cálculos e sua eficácia em predições. Nas predições com Processo Gaussiano, a escolha da função de covariância desempenha um papel crucial, pois ela depende diretamente dos valores de entrada das observações. Entretanto, a presença de outliers nos dados pode comprometer as inferências do modelo, resultando em predições inadequadas. Este trabalho analisa, por meio de simulações com dados contendo outliers, como diferentes funções de covariância afetam o desempenho de Modelos Preditivos de Processos Gaussianos. O objetivo é identificar quais kernels são mais sensíveis à presença de dados extremos e quais são mais robustos, além de categorizar essas funções em suas respectivas famílias de variação. Adicionalmente, propõe-se um novo kernel, denominado DC-LogExp, como uma alternativa para melhorar a robustez dos Processos Gaussianos. Os resultados mostram que o desempenho do modelo é significativamente impactado pela escolha do kernel e pela proporção de outliers nas amostras. As funções de covariância classificadas como função de variação regular, especificamente Rational Quadratic e DC-LogExp, destacaram-se por sua baixa sensibilidade à presença de outliers. Em particular, a função DC-LogExp mostrou-se ser uma alternativa promissora, apresentando bons ajustes em cenários com ou sem outliers, além de resultados satisfatórios em termos de convergência dos parâmetros e erros preditivos. |
| Abstract: | In Regression Theory, Gaussian Processes emerge as an efficient alternative to simplify the estimation process in Bayesian Models. A Gaussian Process is a generalization of the Gaussian distribution, fully defined by its mean and covariance function (or kernel). This non-parametric model has gained prominence due to its computational ease and effectiveness in predictions. In Gaussian Process predictions, the choice of the covariance function plays a crucial role, as it directly depends on the input values of the observations. However, the presence of outliers in the data can compromise model inferences, leading to inadequate predictions. This study analyzes, through simulations with data containing outliers, how different covariance functions affect the performance of Predictive Gaussian Process Models. The objective is to identify which kernels are more sensitive to extreme data points and which are more robust, as well as to categorize these functions within their respective families of variation. Additionally, a new kernel, called DC-LogExp, is proposed as an alternative to improve the robustness of Gaussian Processes. The results show that model performance is significantly impacted by the choice of kernel and the proportion of outliers in the samples. Covariance functions classified as belonging to the regular variation family, specifically Rational Quadratic and DC-LogExp, stood out for their low sensitivity to the presence of outliers. In particular, the DC-LogExp function proved to be a promising alternative, providing good fits in scenarios with and without outliers, as well as satisfactory results in terms of parameter convergence and predictive errors. |
| URI : | http://repositorio.ufc.br/handle/riufc/80973 |
| Lattes del autor: | http://lattes.cnpq.br/3021669807444789 |
| Lattes del tutor: | http://lattes.cnpq.br/0493375103185241 |
| Derechos de acceso: | Acesso Aberto |
| Aparece en las colecciones: | DEMA - Dissertações defendidas na UFC |
Ficheros en este ítem:
| Fichero | Descripción | Tamaño | Formato | |
|---|---|---|---|---|
| 2025_dis_wcmartinho.pdf | Dissertação Wasley | 29,11 MB | Adobe PDF | Visualizar/Abrir |
Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.