Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.ufc.br/handle/riufc/49711
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.contributor.advisorSilva, Ticiana Linhares Coelho da-
dc.contributor.authorAraújo, Natanael da Silva-
dc.date.accessioned2020-01-29T19:15:01Z-
dc.date.available2020-01-29T19:15:01Z-
dc.date.issued2019-
dc.identifier.citationARAÚJO, Natanael da Silva. Reconhecimento de entidades nomeadas em textos de boletins de ocorrências 2019. 41 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)- Universidade Federal do Ceará, Campus de Quixadá, Quixadá, 2019.pt_BR
dc.identifier.urihttp://www.repositorio.ufc.br/handle/riufc/49711-
dc.description.abstractClassifying entities in a given text is a challenging problem in Natural Language Processing (NLP). A common technique that deals with this problem is Named Entity Recognition (NER). Deep Learning techniques have been widely applied to NER tasks because they require little resource engineering and are free of language-specific resources, learning important resources from combinations of words or characters trained in large amounts of data. However, these techniques require a huge amount of data for training. However, these techniques require a huge amount of data for training. This work proposes Human NERD (stands for Human Named Entity Recognition with Deep learning) which addresses this problem by including humans in the loop. Human NERD is an interactive framework to assist the user in NER classification tasks from creating a massive dataset to building/maintaining a deep learning NER model. Human NERD framework allows the rapid verification of automatic named entity recognition and the correction of errors. It takes into account user corrections, and the deep learning model learns and builds upon these actions. The interface allows for rapid correction using drag and drop user actions. The present work also proposes two NER models, one using the Spacy framework and the other the Keras library, both complement each other.pt_BR
dc.language.isopt_BRpt_BR
dc.subjectProcessamento de linguagem naturalpt_BR
dc.subjectReconhecimento de entidade nomeadapt_BR
dc.subjectAprendizagem profundapt_BR
dc.titleReconhecimento de entidades nomeadas em textos de boletins de ocorrênciaspt_BR
dc.typeTCCpt_BR
dc.description.abstract-ptbrClassificar entidades em um determinado texto é um problema desafiador no Processamento de Linguagem Natural. Uma técnica comum que lida com esse problema é o Reconhecimento de Entidades Nomeadas, em inglês é chamado de Named Entity Recognition (NER). As técnicas de Deep Learning são amplamente aplicadas nas tarefas NER, porque requerem pouca engenharia de recursos e estão livres de recursos específicos do idioma, aprendendo recursos importantes a partir de combinações de palavras ou caracteres treinadas em grandes quantidades de dados. No entanto, essas técnicas exigem uma enorme quantidade de dados para treinamento. Este trabalho propõe o Human Named Entity Recognition with Deep learning (Human NERD), que aborda esse problema incluindo o humano no ciclo. O Human NERD é uma ferramenta interativa para ajudar o usuário nas tarefas de classificação NER, desde a criação de um conjunto de dados massivo até a criação / manutenção de um modelo NER de Deep Learning. A estrutura Human NERD permite a verificação rápida do reconhecimento automático de entidades nomeadas e a correção de erros. Ele leva em consideração as correções do usuário, e o modelo de Deep Learning aprende e desenvolve essas ações. Sua interface gráfica (GUI) permite uma correção rápida usando ações de arrastar e soltar do usuário. O presente trabalho também propõe dois modelos NER, um utilizando o framework Spacy e o outro a biblioteca Keras, em que as predições realizadas por ambos se complementam.pt_BR
Aparece en las colecciones: CIÊNCIA DA COMPUTAÇÃO-QUIXADÁ - Monografias

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
2019_tcc_nsaraujo.pdf961,92 kBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.