Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/72492
Type: TCC
Title: Aspectos teóricos dos modelos GAMLSS e aplicação a dados longitudinais
Authors: Pacheco Filho, Alípio José de Souza
Advisor: Nobre, Juvêncio Santos
Keywords: Modelos de regressão;Modelos lineares (Estatística);Modelos aditivos generalizados;Selection models;Linear models (Statistics);Generalized additive models
Issue Date: 2021
Citation: PACHECO FILHO, Alípio José de Souza. Aspectos teóricos dos modelos GAMLSS e aplicação a dados longitudinais. 2021. 64 f. Monografia (Graduação em Estatística) – Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2021.
Abstract in Brazilian Portuguese: A suposição de normalidade dos erros é comumente considerada na utilização de modelos de regressão linear (MRL). Embora outros modelos tenham surgido para lidar com essa limitação, tais como os modelos lineares generalizados (MLGs) e os aditivos generalizados (MAGs), eles ainda se restringem à família exponencial linear. Na expectativa de superar tais limitações, foi proposto o modelo aditivo generalizado para localização, escala e forma (Generalized additive model for location, scale and shape - GAMLSS), que é capaz de modelar dados com, teoricamente, qualquer distribuição. Mesmo com toda essa flexibilidade, o GAMLSS ainda apresenta uma utilização pouco expressiva frente aos outros modelos que lidam com distribuições distintas da normal (tais como MLGs e MAGs). Essa expressividade é ainda menor quando se trata da classe de modelos com variáveis latentes (modelos mistos). Neste trabalho, é apresentado um referencial teórico sobre essa classe de modelos e realizada uma aplicação a um conjunto de dados de natureza longitudinal de produção polínica. Empregando o pacote gamlss implementado no software R, percebe-se a enorme flexibilidade do GAMLSS (dada a grande quantidade de distribuições disponíveis no pacote e a capacidade de modela explicitamente diferentes tipos de parâmetros, por exemplo). A utilização do modelo GAMLSS com distribuição marginal gama generalizada mostrou bom ajuste aos dados de produção polínica, sendo capaz de lidar com a assimetria dos dados. A modelagem dos dados de produção de pólen via modelos lineares mistos (MLM) violou alguns pressupostos (tais como normalidade dos resíduos e homogeneidade da variância). Por outro lado, o emprego do GAMLSS apresentou bom ajuste sem violar pressupostos, sugerindo que esta classe de modelos é capaz de fornecer inferências e estimativas mais confiáveis. Contudo, a ausência de ferramental para análise de influência (amplamente abundante nos MLM) ainda é uma limitação do GAMLSS.
Abstract: he assumption of normality of errors is commonly considered when using linear regression models (LRM). Although other models have emerged to deal with this limitation, such as generalized linear models (GLMs) and generalized aditives models (GAMs), they are still restricted to the linear exponential family. In order to overcome such limitations, the generalized additive model for location, scale and shape (GAMLSS) was proposed, which is capable of modeling data with, theoretically, any distribution. Even with all this flexibility, GAMLSS still has a little expressive use compared to other models that deal with distributions different from the normal (such as GLMs and GAMs). This expressiveness is even lower when it comes to the class of models with latent variables (mixed models). In this work, a theoretical framework on this class of models is presented and an application is made to a dataset of longitudinal nature of pollen production. Using the gamlss package implemented in the R software, one can see the enormous flexibility of GAMLSS (given the large number of distributions available in the package and the ability to explicitly model different types of parameters, for example). The use of the GAMLSS model with generalized gamma marginal distribution showed a good fit to the pollen production data, being able to deal with the asymmetry of the data. The modeling of pollen production data via mixed linear models (MLM) violated some assumptions (such as normality of residuals and homogeneity of variance). On the other hand, the use of GAMLSS showed a good fit without violating assumptions, suggesting that this class of models is able to provide more reliable inferences and estimates. However, the absence of influence analysis tools (largely abundant in MLM) is still a limitation of GAMLSS.
URI: http://www.repositorio.ufc.br/handle/riufc/72492
Appears in Collections:ESTATÍSTICA - Monografias

Files in This Item:
File Description SizeFormat 
2021_tcc_ajspachecofilho.pdfMonografia de Alípio Pacheco Filho1,21 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.