Please use this identifier to cite or link to this item:
http://repositorio.ufc.br/handle/riufc/72493
Type: | TCC |
Title: | Uso das distribuições Poisson, Poisson-Gama, Poisson-Inversa Gaussiana e Poisson-Lindley Generalizada para dados de contagem |
Authors: | Duarte, Caroline Gomes |
Advisor: | Freitas, Silvia Maria de |
Keywords: | Dados de contagem;Superdispersão;Distribuição Poisson;Distribuição composta;Counting data;Overdispersion;Poisson distribution;Compound distribution |
Issue Date: | 2021 |
Citation: | DUARTE, Caroline Gomes. Uso das distribuições Poisson, Poisson-Gama, Poisson-Inversa Gaussiana e Poisson-Lindley Generalizada para dados de contagem. 2021. 103 f. Monografia (Graduação em Estatística) – Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2021. |
Abstract in Brazilian Portuguese: | Os Modelos Lineares Generalizados (MLGs) surgiram como uma alternativa aos Modelos Lineares Clássicos quando a variável resposta não segue uma distribuição Normal. Caso o espaço paramétrico da variável aleatória assuma valores discretos e não negativos, tem-se um estudo para dados de contagem. A análise comum para estes dados é através de uma distribuição de Poisson, Binomial ou Binomial Negativa, via MLG. Entretanto, um dos cuidados que se deve ter ao fazer a análise de dados discretos, é com a superdispersão. Esse termo é utilizado, na área da Estatística, quando estamos trabalhando com dados de contagem, em que a média da variável resposta é maior que a variância, segundo o modelo proposto. Dessa forma, a utilização de um modelo com base apenas na distribuição Poisson, que tem como suposição a equidispersão, isto é, média igual à variância, poderia ser bem sensível e não muito útil, na presença de superdispersão. Uma alternativa para dados com essa característica é o uso das distribuições compostas, através dos modelos em dois estágios, ou hierárquicos, como uma forma para modelar essa superdispersão. A metodologia dos modelos em dois estágios associa, uma distribuição à resposta condicionada a sua média e, posteriormente, uma distribuição ao parâmetro de média, de forma que, incondicionalmente, se tem uma distribuição composta para a variável resposta. Neste trabalho é utilizada a distribuição clássica de Poisson, para dados de contagem, e as distribuições Gama, Inversa Gaussiana e Lindley Generalizada para o parâmetro de média da Poisson, que implicam nas distribuições compostas Poisson-Gama, Poisson-Inversa Gaussiana e a Poisson-Lindley Generalizada. Assim, o objetivo principal deste trabalho é apresentar esses modelos hierárquicos, ou modelos em dois estágios, que permitem a modelagem de dados de contagem com superdispersão. Também foram abordados alguns tipos de resíduos da estrutura dos MLGs (Pearson, Componente da deviance e Quantílicos), adaptados para as distribuições compostas utilizadas na monografia. A performance de cada abordagem foi realizada usando-se conjuntos de dados reais descritos na literatura. Palavras-chave: Dados de Contagem, Superdispersão, Distribuição Poisson, Distribuição Compostas. |
Abstract: | The Generalized Linear Models (GLM) is an alternative to Normal Models when the response variable does not come from a normal distribution. When the parametric space of the the variable of interest assumes discrete and non-negative values, we study the Count Models. The common approach when analyzing these data is through a Poisson distribution. However, one of the precautions to be taken when analyzing discrete data is overdispersion. This term is used, in the area of Statistics, when the average of the variance of the response variable exceeds the nominal variance predicted by the proposed model. Thus, the use of a model based on the Poisson distribution, which assumes equidispersion, would be unfounded in the presence of overdispersion. An alternative to this problem is to use mixed distributions, through models in two stages, or hierarchical, as a way to accommodate this overdispersion. The methodology of the two-stage models associates a distribution to the response conditioned to its average and, later, a distribution to the average parameter, so that, unconditionally, there is a compound distribution for the response variable. In this work, the classical Poisson distribution is used for counting data, and the Gama, Inverse Gaussian and Generalized Lindley distributions for the Poisson mean parameter, thus generating the Poisson-Gama, Poisson-Inverse Gaussian and Generalized Poisson-Lindley. So, the main objective of this work is to present these hierarchical models, or models in two stages, that allow the modeling of count data with overdispersion. Also addressed were some types of residues in the MLG structure (Pearson, deviance component, randomized quantile), adapted for the composite distributions used in the monograph. The performance of each approach was performed using real data sets described in the literature. |
URI: | http://www.repositorio.ufc.br/handle/riufc/72493 |
Appears in Collections: | ESTATÍSTICA - Monografias |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
2021_tcc_cgduarte.pdf | 1,01 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.