Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/49711
Type: TCC
Title: Reconhecimento de entidades nomeadas em textos de boletins de ocorrências
Authors: Araújo, Natanael da Silva
Advisor: Silva, Ticiana Linhares Coelho da
Keywords: Processamento de linguagem natural;Reconhecimento de entidade nomeada;Aprendizagem profunda
Issue Date: 2019
Citation: ARAÚJO, Natanael da Silva. Reconhecimento de entidades nomeadas em textos de boletins de ocorrências 2019. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)- Universidade Federal do Ceará, Campus de Quixadá, Quixadá, 2019.
Abstract in Brazilian Portuguese: Classificar entidades em um determinado texto é um problema desafiador no Processamento de Linguagem Natural. Uma técnica comum que lida com esse problema é o Reconhecimento de Entidades Nomeadas, em inglês é chamado de Named Entity Recognition (NER). As técnicas de Deep Learning são amplamente aplicadas nas tarefas NER, porque requerem pouca engenharia de recursos e estão livres de recursos específicos do idioma, aprendendo recursos importantes a partir de combinações de palavras ou caracteres treinadas em grandes quantidades de dados. No entanto, essas técnicas exigem uma enorme quantidade de dados para treinamento. Este trabalho propõe o Human Named Entity Recognition with Deep learning (Human NERD), que aborda esse problema incluindo o humano no ciclo. O Human NERD é uma ferramenta interativa para ajudar o usuário nas tarefas de classificação NER, desde a criação de um conjunto de dados massivo até a criação / manutenção de um modelo NER de Deep Learning. A estrutura Human NERD permite a verificação rápida do reconhecimento automático de entidades nomeadas e a correção de erros. Ele leva em consideração as correções do usuário, e o modelo de Deep Learning aprende e desenvolve essas ações. Sua interface gráfica (GUI) permite uma correção rápida usando ações de arrastar e soltar do usuário. O presente trabalho também propõe dois modelos NER, um utilizando o framework Spacy e o outro a biblioteca Keras, em que as predições realizadas por ambos se complementam.
Abstract: Classifying entities in a given text is a challenging problem in Natural Language Processing (NLP). A common technique that deals with this problem is Named Entity Recognition (NER). Deep Learning techniques have been widely applied to NER tasks because they require little resource engineering and are free of language-specific resources, learning important resources from combinations of words or characters trained in large amounts of data. However, these techniques require a huge amount of data for training. However, these techniques require a huge amount of data for training. This work proposes Human NERD (stands for Human Named Entity Recognition with Deep learning) which addresses this problem by including humans in the loop. Human NERD is an interactive framework to assist the user in NER classification tasks from creating a massive dataset to building/maintaining a deep learning NER model. Human NERD framework allows the rapid verification of automatic named entity recognition and the correction of errors. It takes into account user corrections, and the deep learning model learns and builds upon these actions. The interface allows for rapid correction using drag and drop user actions. The present work also proposes two NER models, one using the Spacy framework and the other the Keras library, both complement each other.
URI: http://www.repositorio.ufc.br/handle/riufc/49711
Appears in Collections:CIÊNCIA DA COMPUTAÇÃO-QUIXADÁ - Monografias

Files in This Item:
File Description SizeFormat 
2019_tcc_nsaraujo.pdf961,92 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.