Please use this identifier to cite or link to this item:
http://repositorio.ufc.br/handle/riufc/61222
Type: | TCC |
Title: | Geração de dados sintéticos para treinamento de chatbots baseados na carta de serviços do Governo do Ceará |
Authors: | Paula, Robson Teixeira |
Advisor: | Oliveira, Paulo de Tarso Guerra |
Co-advisor: | Aguiar Neto, Décio Gonçalves de |
Keywords: | Chatterbot;Processamento de linguagem natural (Computação);Ceará - Governo do Estado |
Issue Date: | 2021 |
Citation: | PAULA, Robson Teixeira. Geração de dados sintéticos para treinamento de chatbots baseados na carta de serviços do Governo do Ceará. 2021. 75 f. Trabalho de Conclusão de Curso (Graduação em Ciência da Computação)-Universidade Federal do Ceará, Campus de Quixadá, Quixadá, 2021. |
Abstract in Brazilian Portuguese: | A carta de serviços do Governo do Ceará é um conjunto de informações sobre os serviços ofertados pelo Estado. Formas de facilitar o acesso a essas informações é um dos objetivos do projeto Governo Digital. Considerando esse objetivo, o presente trabalho realiza uma análise sobre formas de gerar bases de dados textuais para um domínio ainda não explorado, utilizando a carta de serviços como domínio. Utilizando técnicas de geração de dados baseado em modelos de textos e geração de texto automática utilizando o modelo de aprendizagem profunda PTT5, são geradas bases de dados considerando a aplicação dessas bases em um chatbot desenvolvido com o Rasa, tendo como foco a tarefa de classificação de intenções. O desempenho da tarefa de classificação é avaliada através de modelos baseados em transformers, explorando casos mais restritos e menos restritos. Os resultados obtidos utilizando o chatbot e os modelos de classificação de intenções desenvolvido nesse trabalho são promissores e mostram que as técnicas de geração artificial de dados podem ser bem exploradas a fim de gerar uma base de dados de qualidade. |
Abstract: | The list of services of the Government of Ceará is a set of information about the services offered by the Government. Finding ways to facilitate access to this information is one of the objectives of the Digital Government project. Considering this objective, the present work is an analysis of methods to generate databases for a domain not yet explored, using the list of services as a domain. Using data generation techniques based on text models and automatic text generation using the PTT5 deep learning model, databases are generated considering the application in these databases in a chatbot developed in Rasa, focusing on the task classification of intentions. The classification task is performed through models based on transformers, exploring more restricted and less restricted cases. The results obtained using the chatbot and the intention classification models developed in this work are promising and show that the data generation techniques can be well explored in order to generate a quality database. |
URI: | http://www.repositorio.ufc.br/handle/riufc/61222 |
Appears in Collections: | CIÊNCIA DA COMPUTAÇÃO-QUIXADÁ - Monografias |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
2021_tcc_rtpaula.pdf | 3,57 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.