Utilização de bases de conhecimento e word embeddings para enriquecimento dos dados de treinamento de chatbots conversacionais

Botelho, Gabriel de Sousa

Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/65403

Tipo:	TCC
Título:	Utilização de bases de conhecimento e word embeddings para enriquecimento dos dados de treinamento de chatbots conversacionais
Autor(es):	Botelho, Gabriel de Sousa
Orientador:	Cruz, Lívia Almada
Palavras-chave:	Chatbot;Word embedding;Sinônimos
Data do documento:	2022
Citação:	BOTELHO, Gabriel de Sousa. Utilização de bases de conhecimento e word embeddings para enriquecimento dos dados de treinamento de chatbots conversacionais . 2022. 44 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)-Universidade Federal do Ceará, Campus de Quixadá, Quixadá, 2022.
Resumo:	Os sistemas de diálogos ou chatbots são programas de computador que utilizam dados para compreender e responder as perguntas feitas pelos usuários. No entanto, nem sempre o chatbot possui este conjunto de dados prontos para serem usados em suas fases iniciais. Desta forma, a falta de dados iniciais se torna uma questão recorrente na criação de chatbots. Este trabalho tem como objetivo realizar o aumento dos dados de entrada do chatbot ao incorporar palavras similares e/ou sinônimos através do uso de Word Embeddings e base de conhecimente léxico WordNet. Este aumento de dados é alcançado através do desenvolvimento de uma API (do ingês, Application Programming Interface). Os passos seguidos na metodologia inicia com a definição das tecnologias, seguido pela modelagem e implementação do modelo gerador de dados, após é realizada é a implementação do módulo de compreensão da linguagem natural. O quarto passo é o estudo de caso e por fim, é realizada a avaliação dos resultados dos experimentos realizados.
Abstract:	Dialog systems or chatbots are computer programs that use data to understand and answer questions asked by users. However, the chatbot does not always have this set of data ready to be used in its initial phases. In this way, the lack of initial data becomes a recurring issue in the creation of chatbots. This work aims to increase the chatbot input data by incorporating similar words and/or synonyms through the use of Word Embeddings and WordNet lexical knowledge base. This data augmentation is achieved through the development of an Application Programming Interface. The steps followed in the methodology begin with the definition of technologies, followed by the modeling and implementation of the data generator model, after which the implementation of the Natural Language Understanding is carried out. The fourth step is the case study and finally, the evaluation of the results of the experiments performed.
URI:	http://www.repositorio.ufc.br/handle/riufc/65403
Aparece nas coleções:	CIÊNCIA DA COMPUTAÇÃO-QUIXADÁ - Monografias

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2022_tcc_gsbotelho.pdf		697,52 kB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas