Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/85718
Tipo: TCC
Título: Ferramentas de diagnóstico para dados de contagem inflacionados de zeros
Autor(es): Lira, José Diego Souza
Orientador: Freitas, Sílvia Maria de
Palavras-chave em português: Dados de contagem;Superdispersão;Excesso de zeros;Modelos inflacionados de zero;ZIP;ZINB;Diagnóstico de modelos
Palavras-chave em inglês: Data;Overdispersion;Excess of zeros;Zero-inflated mode;ZIP;ZINB;Model diagnostics
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA
Data do documento: 2026
Citação: LIRA, José Diego Souza. Ferramentas de diagnóstico para dados de contagem inflacionados de zeros. 2026. 114 f. Monografia (Graduação em Estatística) - Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2026.
Resumo: Dados de contagem com excesso de zeros são frequentes em diversas áreas aplicadas, tais como saúde, ciências sociais e agronomia, apresentando desafios para modelagem tradicional baseada inicialmente na distribuição de Poisson, que pressupõe equidispersão. Neste trabalho, foram estudados e aplicados modelos da ordem dos Modelos Lineares Generalizados (MLGs) para lidar com tais conjuntos de dados, em particular o modelo Poisson, o modelo Binomial Negativo e os modelos inflacionados de zeros ZIP (Zero-Inflated Poisson) e ZINB (Zero-Inflated Negative Binomial). O objetivo central foi comparar o desempenho desses modelos em um conjunto de dados reais provenientes de um estudo sobre terapia conjugal, no qual a variável resposta é o número de passos em direção ao divórcio (MSI), caracterizada por excesso de zeros e superdispersão. Além da modelagem, foram desenvolvidas e aplicadas ferramentas de diagnóstico, como resíduos de Pearson, de Deviance e quantílicos, gráficos de HNP, Quantil-Quantil com envelopes simulados, Worm-plot e Distância de Cook, visando avaliar a qualidade do ajuste e identificar possíveis observações influentes. Os resultados indicaram que os modelos ZIP e ZINB apresentaram melhor adequação aos dados, com menor AIC e BIC, resíduos com melhor comportamento. O teste de Vuong não apontou diferença significativa entre ZIP e ZINB, sugerindo que o modelo ZIP, por ser mais parcimonioso, pode ser preferível para o conjunto analisado.
Abstract: Count data with excess zeros are common in several applied fields, such as health sciences, social sciences, and agronomy, posing challenges to traditional modeling approaches initially based on the Poisson distribution, which assumes equidispersion. In this study, models within the framework of Generalized Linear Models (GLMs) were investigated and applied to handle such data sets, namely the Poisson model, the Negative Binomial model, and the zero-inflated models ZIP (Zero-Inflated Poisson) and ZINB (Zero-Inflated Negative Binomial). The main objective was to compare the performance of these models using a real data set from a marital therapy study, in which the response variable is the number of steps toward divorce (MSI), characterized by excess zeros and overdispersion. In addition to model fitting, diagnostic tools were developed and applied, including Pearson and deviance residuals, quantile residuals, HNP plots, Quantile–Quantile plots with simulated envelopes, worm plots, and Cook’s distance, in order to assess model adequacy and identify potential influential observations. The results indicated that the ZIP and ZINB models provided a better fit to the data, presenting lower AIC and BIC values and residuals with more satisfactory behavior. The Vuong test did not indicate a statistically significant difference between the ZIP and ZINB models, suggesting that the ZIP model, due to its greater parsimony, may be preferable for the analyzed data set.
URI: http://repositorio.ufc.br/handle/riufc/85718
ORCID do(s) Autor(es): https://orcid.org/0009-0001-7116-4876
Currículo Lattes do(s) Autor(es): http://lattes.cnpq.br/8081693945595529
ORCID do Orientador: https://orcid.org/0000-0003-3455-2228
Currículo Lattes do Orientador: http://lattes.cnpq.br/3371082476399709
Tipo de Acesso: Acesso Aberto
Aparece nas coleções:ESTATÍSTICA - Monografias

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
2026_tcc_jdslira.pdf1,3 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.