Please use this identifier to cite or link to this item: http://www.repositorio.ufc.br/handle/riufc/65403
Title in Portuguese: Utilização de bases de conhecimento e word embeddings para enriquecimento dos dados de treinamento de chatbots conversacionais
Author: Botelho, Gabriel de Sousa
Advisor(s): Cruz, Lívia Almada
Keywords: Chatbot
Word embedding
Sinônimos
Issue Date: 2022
Citation: BOTELHO, Gabriel de Sousa. Utilização de bases de conhecimento e word embeddings para enriquecimento dos dados de treinamento de chatbots conversacionais . 2022. 44 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)-Universidade Federal do Ceará, Campus de Quixadá, Quixadá, 2022.
Abstract in Portuguese: Os sistemas de diálogos ou chatbots são programas de computador que utilizam dados para compreender e responder as perguntas feitas pelos usuários. No entanto, nem sempre o chatbot possui este conjunto de dados prontos para serem usados em suas fases iniciais. Desta forma, a falta de dados iniciais se torna uma questão recorrente na criação de chatbots. Este trabalho tem como objetivo realizar o aumento dos dados de entrada do chatbot ao incorporar palavras similares e/ou sinônimos através do uso de Word Embeddings e base de conhecimente léxico WordNet. Este aumento de dados é alcançado através do desenvolvimento de uma API (do ingês, Application Programming Interface). Os passos seguidos na metodologia inicia com a definição das tecnologias, seguido pela modelagem e implementação do modelo gerador de dados, após é realizada é a implementação do módulo de compreensão da linguagem natural. O quarto passo é o estudo de caso e por fim, é realizada a avaliação dos resultados dos experimentos realizados.
Abstract: Dialog systems or chatbots are computer programs that use data to understand and answer questions asked by users. However, the chatbot does not always have this set of data ready to be used in its initial phases. In this way, the lack of initial data becomes a recurring issue in the creation of chatbots. This work aims to increase the chatbot input data by incorporating similar words and/or synonyms through the use of Word Embeddings and WordNet lexical knowledge base. This data augmentation is achieved through the development of an Application Programming Interface. The steps followed in the methodology begin with the definition of technologies, followed by the modeling and implementation of the data generator model, after which the implementation of the Natural Language Understanding is carried out. The fourth step is the case study and finally, the evaluation of the results of the experiments performed.
URI: http://www.repositorio.ufc.br/handle/riufc/65403
metadata.dc.type: TCC
Appears in Collections:CIÊNCIA DA COMPUTAÇÃO-QUIXADÁ - Monografias

Files in This Item:
File Description SizeFormat 
2022_tcc_gsbotelho.pdf697,52 kBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.