Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.ufc.br/handle/riufc/85718
Tipo: TCC
Título : Ferramentas de diagnóstico para dados de contagem inflacionados de zeros
Autor : Lira, José Diego Souza
Tutor: Freitas, Sílvia Maria de
Palabras clave en portugués brasileño: Dados de contagem;Superdispersão;Excesso de zeros;Modelos inflacionados de zero;ZIP;ZINB;Diagnóstico de modelos
Palabras clave en inglés: Data;Overdispersion;Excess of zeros;Zero-inflated mode;ZIP;ZINB;Model diagnostics
Áreas de Conocimiento - CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA
Fecha de publicación : 2026
Citación : LIRA, José Diego Souza. Ferramentas de diagnóstico para dados de contagem inflacionados de zeros. 2026. 114 f. Monografia (Graduação em Estatística) - Centro de Ciências, Universidade Federal do Ceará, Fortaleza, 2026.
Resumen en portugués brasileño: Dados de contagem com excesso de zeros são frequentes em diversas áreas aplicadas, tais como saúde, ciências sociais e agronomia, apresentando desafios para modelagem tradicional baseada inicialmente na distribuição de Poisson, que pressupõe equidispersão. Neste trabalho, foram estudados e aplicados modelos da ordem dos Modelos Lineares Generalizados (MLGs) para lidar com tais conjuntos de dados, em particular o modelo Poisson, o modelo Binomial Negativo e os modelos inflacionados de zeros ZIP (Zero-Inflated Poisson) e ZINB (Zero-Inflated Negative Binomial). O objetivo central foi comparar o desempenho desses modelos em um conjunto de dados reais provenientes de um estudo sobre terapia conjugal, no qual a variável resposta é o número de passos em direção ao divórcio (MSI), caracterizada por excesso de zeros e superdispersão. Além da modelagem, foram desenvolvidas e aplicadas ferramentas de diagnóstico, como resíduos de Pearson, de Deviance e quantílicos, gráficos de HNP, Quantil-Quantil com envelopes simulados, Worm-plot e Distância de Cook, visando avaliar a qualidade do ajuste e identificar possíveis observações influentes. Os resultados indicaram que os modelos ZIP e ZINB apresentaram melhor adequação aos dados, com menor AIC e BIC, resíduos com melhor comportamento. O teste de Vuong não apontou diferença significativa entre ZIP e ZINB, sugerindo que o modelo ZIP, por ser mais parcimonioso, pode ser preferível para o conjunto analisado.
Abstract: Count data with excess zeros are common in several applied fields, such as health sciences, social sciences, and agronomy, posing challenges to traditional modeling approaches initially based on the Poisson distribution, which assumes equidispersion. In this study, models within the framework of Generalized Linear Models (GLMs) were investigated and applied to handle such data sets, namely the Poisson model, the Negative Binomial model, and the zero-inflated models ZIP (Zero-Inflated Poisson) and ZINB (Zero-Inflated Negative Binomial). The main objective was to compare the performance of these models using a real data set from a marital therapy study, in which the response variable is the number of steps toward divorce (MSI), characterized by excess zeros and overdispersion. In addition to model fitting, diagnostic tools were developed and applied, including Pearson and deviance residuals, quantile residuals, HNP plots, Quantile–Quantile plots with simulated envelopes, worm plots, and Cook’s distance, in order to assess model adequacy and identify potential influential observations. The results indicated that the ZIP and ZINB models provided a better fit to the data, presenting lower AIC and BIC values and residuals with more satisfactory behavior. The Vuong test did not indicate a statistically significant difference between the ZIP and ZINB models, suggesting that the ZIP model, due to its greater parsimony, may be preferable for the analyzed data set.
URI : http://repositorio.ufc.br/handle/riufc/85718
ORCID del autor: https://orcid.org/0009-0001-7116-4876
Lattes del autor: http://lattes.cnpq.br/8081693945595529
ORCID del tutor: https://orcid.org/0000-0003-3455-2228
Lattes del tutor: http://lattes.cnpq.br/3371082476399709
Derechos de acceso: Acesso Aberto
Aparece en las colecciones: ESTATÍSTICA - Monografias

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
2026_tcc_jdslira.pdf1,3 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.