Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.ufc.br/handle/riufc/61222
Tipo: TCC
Título : Geração de dados sintéticos para treinamento de chatbots baseados na carta de serviços do Governo do Ceará
Autor : Paula, Robson Teixeira
Tutor: Oliveira, Paulo de Tarso Guerra
Co-asesor: Aguiar Neto, Décio Gonçalves de
Palabras clave : Chatterbot;Processamento de linguagem natural (Computação);Ceará - Governo do Estado
Fecha de publicación : 2021
Citación : PAULA, Robson Teixeira. Geração de dados sintéticos para treinamento de chatbots baseados na carta de serviços do Governo do Ceará. 2021. 75 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)-Universidade Federal do Ceará, Campus de Quixadá, Quixadá, 2021.
Resumen en portugués brasileño: A carta de serviços do Governo do Ceará é um conjunto de informações sobre os serviços ofertados pelo Estado. Formas de facilitar o acesso a essas informações é um dos objetivos do projeto Governo Digital. Considerando esse objetivo, o presente trabalho realiza uma análise sobre formas de gerar bases de dados textuais para um domínio ainda não explorado, utilizando a carta de serviços como domínio. Utilizando técnicas de geração de dados baseado em modelos de textos e geração de texto automática utilizando o modelo de aprendizagem profunda PTT5, são geradas bases de dados considerando a aplicação dessas bases em um chatbot desenvolvido com o Rasa, tendo como foco a tarefa de classificação de intenções. O desempenho da tarefa de classificação é avaliada através de modelos baseados em transformers, explorando casos mais restritos e menos restritos. Os resultados obtidos utilizando o chatbot e os modelos de classificação de intenções desenvolvido nesse trabalho são promissores e mostram que as técnicas de geração artificial de dados podem ser bem exploradas a fim de gerar uma base de dados de qualidade.
Abstract: The list of services of the Government of Ceará is a set of information about the services offered by the Government. Finding ways to facilitate access to this information is one of the objectives of the Digital Government project. Considering this objective, the present work is an analysis of methods to generate databases for a domain not yet explored, using the list of services as a domain. Using data generation techniques based on text models and automatic text generation using the PTT5 deep learning model, databases are generated considering the application in these databases in a chatbot developed in Rasa, focusing on the task classification of intentions. The classification task is performed through models based on transformers, exploring more restricted and less restricted cases. The results obtained using the chatbot and the intention classification models developed in this work are promising and show that the data generation techniques can be well explored in order to generate a quality database.
URI : http://www.repositorio.ufc.br/handle/riufc/61222
Aparece en las colecciones: CIÊNCIA DA COMPUTAÇÃO-QUIXADÁ - Monografias

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
2021_tcc_rtpaula.pdf3,57 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.