Please use this identifier to cite or link to this item: http://www.repositorio.ufc.br/handle/riufc/61222
Title in Portuguese: Geração de dados sintéticos para treinamento de chatbots baseados na carta de serviços do Governo do Ceará
Author: Paula, Robson Teixeira
Advisor(s): Oliveira, Paulo de Tarso Guerra
Co-advisor(s): Aguiar Neto, Décio Gonçalves de
Keywords: Chatterbot
Processamento de linguagem natural (Computação)
Ceará - Governo do Estado
Issue Date: 2021
Citation: PAULA, Robson Teixeira. Geração de dados sintéticos para treinamento de chatbots baseados na carta de serviços do Governo do Ceará. 2021. 75 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)-Universidade Federal do Ceará, Campus de Quixadá, Quixadá, 2021.
Abstract in Portuguese: A carta de serviços do Governo do Ceará é um conjunto de informações sobre os serviços ofertados pelo Estado. Formas de facilitar o acesso a essas informações é um dos objetivos do projeto Governo Digital. Considerando esse objetivo, o presente trabalho realiza uma análise sobre formas de gerar bases de dados textuais para um domínio ainda não explorado, utilizando a carta de serviços como domínio. Utilizando técnicas de geração de dados baseado em modelos de textos e geração de texto automática utilizando o modelo de aprendizagem profunda PTT5, são geradas bases de dados considerando a aplicação dessas bases em um chatbot desenvolvido com o Rasa, tendo como foco a tarefa de classificação de intenções. O desempenho da tarefa de classificação é avaliada através de modelos baseados em transformers, explorando casos mais restritos e menos restritos. Os resultados obtidos utilizando o chatbot e os modelos de classificação de intenções desenvolvido nesse trabalho são promissores e mostram que as técnicas de geração artificial de dados podem ser bem exploradas a fim de gerar uma base de dados de qualidade.
Abstract: The list of services of the Government of Ceará is a set of information about the services offered by the Government. Finding ways to facilitate access to this information is one of the objectives of the Digital Government project. Considering this objective, the present work is an analysis of methods to generate databases for a domain not yet explored, using the list of services as a domain. Using data generation techniques based on text models and automatic text generation using the PTT5 deep learning model, databases are generated considering the application in these databases in a chatbot developed in Rasa, focusing on the task classification of intentions. The classification task is performed through models based on transformers, exploring more restricted and less restricted cases. The results obtained using the chatbot and the intention classification models developed in this work are promising and show that the data generation techniques can be well explored in order to generate a quality database.
URI: http://www.repositorio.ufc.br/handle/riufc/61222
metadata.dc.type: TCC
Appears in Collections:CIÊNCIA DA COMPUTAÇÃO-QUIXADÁ - Monografias

Files in This Item:
File Description SizeFormat 
2021_tcc_rtpaula.pdf3,57 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.