Use este identificador para citar ou linkar para este item:
http://repositorio.ufc.br/handle/riufc/55717
Tipo: | TCC |
Título: | Aprendizado profundo para reconhecimento de entidades nomeadas em narrativas de roubos |
Autor(es): | Oliveira, Bárbara Stéphanie Neves |
Orientador: | Magalhães, Regis Pires |
Coorientador: | Silva, Ticiana Linhares Coelho da |
Palavras-chave: | Criminologia;Reconhecimento de entidade nomeada;Aprendizagem profunda;Mineração de dados;Semântica distribucional |
Data do documento: | 2020 |
Citação: | OLIVEIRA, Bárbara Stéphanie Neves. Aprendizado profundo para reconhecimento de entidades nomeadas em narrativas de roubos. 2020. 99 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)-Universidade Federal do Ceará, Campus de Quixadá, Quixadá, 2020. |
Resumo: | Diferentes modalidades de violência têm revelado espiral acentuada de crescimento no mundo inteiro. Desde a primeira década do século XXI, o governo federal brasileiro e alguns governos estaduais vêm promovendo novas políticas públicas no combate à criminalidade violenta. Com o objetivo de acompanhar a evolução dos crimes e da violência, bem como promover o acesso da população às informações da segurança pública no estado do Ceará, a Secretaria da Segurança Pública e Defesa Social apresenta mensalmente suas estatísticas. Os dados utilizados para construção desses levantamentos são separados em diferentes indicadores de desempenho para análise criminal. Um dos indicadores-chave, chamado de Crimes Violentos Contra o Patrimônio (CVP), engloba todos os crimes classificados como roubo, exceto o roubo seguido de morte. As taxas de ocorrências para esse indicador são bastante altas e não vem diminuindo ao longo do tempo. Encontrar e divulgar informações relevantes e oportunas em narrativas CVP é crucial para a população, e pode desempenhar um papel central nas capacidades de combate aos tipos de roubos. No entanto, analisar esse grande volume de dados requer um trabalho manual e extenso. Uma forma de automatizar esse processo é utilizar a tarefa de Reconhecimento de Entidade Nomeada (NER) para extração da informação. Nos últimos anos, o Aprendizado Profundo, potencializado por representações vetoriais, tem sido amplamente empregado em sistemas NER. Este trabalho propõe a criação de um modelo NER com técnicas de Aprendizado Profundo capaz de reconhecer entidades nomeadas em textos de roubos, seguindo três questões de pesquisa principais. As questões de pesquisa definem um protocolo experimental abrangente, e exploram aspectos problemáticos presentes no domínio, como o desbalanceamento de dados, quantidade de entidades nomeadas, e representação vetorial eficiente do vocabulário (CVP2Vec). Os resultados demonstram alto desempenho, com a métrica Acurácia Balanceada alcançando 88,1% e o F1-score com 82,9% para os melhores modelos, todos superando o baseline. |
Abstract: | Different forms of violence have shown a marked growth spiral worldwide. Since the first decade of the 21st century, the Brazilian federal government and some state governments have been promoting new policies to combat violent crime. To monitor the evolution of crimes and violence, as well as promote the population’s access to public security information in the state of Ceará (Brazil), the Secretariat of Public Security and Social Defense presents its statistics monthly. The data used to collect these statistics have different performance indicators for criminal analysis. One of the key-indicators, called Violent Crimes Against Patrimony (CVP in the Portuguese acronym), encompasses all crimes classified as theft, except robbery-homicide. The occurrence rates for this indicator are high and have not been decreasing over time. Finding and disseminating relevant and timely information in CVP Police reports is crucial for the population and play a central role in the capabilities to combat types of theft. However, analyzing this large volume of data requires manual and extensive work. One way to automate this process is to use the Named Entity Recognition (NER) task for information extraction. In recent years, Deep Learning, empowered by continuous real-valued vector representations, has been widely employed in NER systems. This work proposes the creation of a Deep Learning based NER model capable of recognizing named entities in CVP Police reports, following three main research questions. The research questions define a broad experimental protocol and explore problematic aspects present in the domain, such as data imbalance, number of named entities, and embedding representation (CVP2Vec). The results show high performance, with the Balanced Accuracy metric reaching 88.1% and the F1-score with 82.9% for the best models, outperforming the baseline. |
URI: | http://www.repositorio.ufc.br/handle/riufc/55717 |
Aparece nas coleções: | CIÊNCIA DA COMPUTAÇÃO-QUIXADÁ - Monografias |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
2020_tcc_bsnoliveira.pdf | 5,22 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.