Título: | Ensaios em econometria, estatística e aprendizado de máquina aplicados à violência doméstica |
Autor(es): | Oliveira, Eduardo Cândido de |
Orientador: | Carvalho Júnior, José Raimundo de Araújo |
Coorientador: | André, Diego de Maria |
Palavras-chave em português: | Violência doméstica;Dados longitudinais;Atrito;Reposição;Inconsistência lógica |
Palavras-chave em inglês: | Domestic violence;Longitudinal data;Attrition;Replacement;Logical inconsistency |
Data do documento: | 2024 |
Citação: | OLIVEIRA, Eduardo Cândido de. Ensaios em econometria, estatística e aprendizado de máquina aplicados à violência doméstica. 2024. 157f. Tese (Doutorado) - Faculdade de Economia, Administração, Atuária e Contabilidade - FEAAC, Programa de Pós-Graduação em Economia - CAEN, Universidade Federal do Ceará - UFC, Fortaleza (CE), 2024. |
Resumo: | Esta tese apresenta três ensaios sobre a temática da violência doméstica, utilizando os dados da Pesquisa sobre Condições Socioeconômicas e Violência Doméstica e Familiar contra a Mulher (PCSVDF-Mulher). O primeiro capítulo busca analisar a ocorrência da perda de unidades amostrais, isto é, o atrito amostral, na PCSVDF-Mulher. Durante as duas primeiras ondas da pesquisa, que ocorreram entre 2016 e 2017, foi encontrado um percentual de 55,13% de atrito. Para entender melhor o fenômeno, foram utilizadas técnicas de machine learning e um modelo de escolha discreta, capaz de identificar variáveis e a sua importância na ocorrência do atrito. Os resultados mostraram que características da moradia da mulher (tipo de domicílio - próprio ou não - e se há a pretensão de mudar-se) têm influência na participação dela em outra onda, além do fator ter filhos. Características do setor censitário em que a participante reside e da relação entre entrevistada e entrevistadora também são explorados. Sabendo da existência do atrito amostral, é possível que seja necessário substituir algumas mulheres durante o estudo longitudinal. O segundo capítulo visa, então, verificar se o protocolo de substituição adotado pela PCSVDF-Mulher foi cumprido pela empresa contratada e se a amostra de mulheres que são classificadas como reposição tem o mesmo perfil das que deixaram de participar da pesquisa (atritadas), tendo em vista que é preciso manter a representatividade estatística da amostra. Para isso, são utilizadas técnicas espaciais e estatísticas com o objetivo de verificar se a empresa cumpriu o protocolo no sentido de repor a amostra dentro do setor censitário ou em setores mais próximos e para comparar as amostras de reposição e atritadas. Os achados mostram que a empresa apresentou um comportamento otimizador em relação a reposição espacial. Em setores censitários que registraram déficit de domicílios de uma onda para outra estão, espacialmente, mais próximos de setores censitários que obtiveram superávit de domicílios, com evidências de que as reposições tiveram dependência espacial. Além disso, a maior parte das variáveis comparadas entre as amostras, atritadas e reposição, tiveram a distribuição estatisticamente iguais, concluindo, assim, que a reposição foi cumprida de forma satisfatória. Por fim, o terceiro capítulo analisa outra problemática em pesquisas longitudinais, que é a inconsistência lógica na resposta, que pode ser explicada por diversas áreas, sejam elas psicológicas, cognitivas, por tipos de importâncias de eventos, entre outros. Em especial, na temática da violência doméstica, relatos inconsistentes de violência por parceiro íntimo (VPI) levam potencialmente a estimativas imprecisas da prevalência de tais comportamentos. Para a inconsistência sobre a violência geral, na PCSVDF-Mulher, entre as ondas 1 e 2, foi encontrada uma taxa de 18,08%, e, quando desagregado por tipo de violência, a inconsistência emocional, física e sexual, atingia percentuais iguais a 17,17%, 12,57% e 6,54%, respectivamente, refletindo um perfil diferente. Os resultados encontrados indicam que variáveis de conhecimento, seja da escolaridade da mulher ou acerca do conhecimento sobre a Lei Maria da Penha, têm relação negativa com o relato inconsistente. Em contrapartida, caso a mulher tenha filhos ou foi vítima recente de violência, tem relação positiva com a inconsistência. |
Abstract: | This thesis presents three essays on the theme of domestic violence, using data from the Survey on Socioeconomic Conditions and Domestic and Family Violence against Women (PCSVDFMulher). The first chapter seeks to analyze the occurrence of loss of sampling units, that is, sampling attrition, in PCSVDF-Mulher. During the first two waves of the research, which took place between 2016 and 2017, a percentage of attrition of 55.13% was found. To better understand the phenomenon, machine learning techniques and a discrete choice model were used, capable of identifying variables and their importance in the occurrence of friction. The results showed that characteristics of the woman’s housing (type of home - owned or not - and whether she intends to move) have an influence on her participation in another wave, in addition to the factor of having children. Characteristics of the census sector in which the participant resides and the relationship between interviewee and interviewer are also explored. Knowing the existence of sample attrition, it is possible that it will be necessary to replace some women during the study longitudinal. The second chapter then aims to verify whether the replacement protocol adopted by PCSVDF-Mulher was complied with by the contracted company and whether the sample of women who are classified as replacement has the same profile as those who stopped participating in the research (attrited), considering that it is necessary to maintain the statistical representativeness of the sample. For this, spatial and statistical techniques are used with the aim of verifying whether the company complied with the protocol in order to replace the sample within the sector census or in closer sectors and to compare replacement and attrited samples. The findings show that the company presented an optimizing behavior in relation to spatial replacement. In census tracts that recorded a deficit of households from one wave to the next, they are spatially closer to census tracts that had a surplus of households, with evidence that the replacements were spatially dependent. Furthermore, most of the variables compared between the samples, rubbed and replacement, had statistically equal distribution, thus concluding that the replacement was carried out satisfactorily. Finally, the third chapter analyzes another problem in longitudinal research, which is the logical inconsistency in the response, which can be explained by several areas, whether psychological, cognitive, types of importance of events, among others. In particular, on the topic of domestic violence, inconsistent reports of intimate partner violence (IPV) potentially lead to inaccurate estimates of the prevalence of such behaviors. For inconsistency regarding general violence, in PCSVDF-Mulher, between waves 1 and 2, a rate of 18.08% was found, and, when disaggregated by type of violence, emotional, physical and sexual inconsistency reached percentages equal to 17.17%, 12.57% and 6.54%, respectively, reflecting a different profile. The results found indicate that knowledge variables, whether regarding the woman’s education or knowledge about the Maria da Penha Law, have negative relationship with inconsistent reporting. On the other hand, if the woman has children or has been a recent victim of violence, it has a positive relationship with inconsistency. |
