Please use this identifier to cite or link to this item:
http://repositorio.ufc.br/handle/riufc/77011
Type: | Dissertação |
Title: | Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN) |
Authors: | Araújo, Francisca Luzia Nogueira |
Advisor: | Paillard, Gabriel Antoine Louis |
Co-advisor: | Moreira, Leonardo Oliveira |
Keywords in Brazilian Portuguese : | Banco de dados;Arquitetura híbrida;Processamento de linguagem natural |
Knowledge Areas - CNPq: | CNPQ: CIÊNCIAS EXATAS E DA TERRA: CIÊNCIA DA COMPUTAÇÃO |
Issue Date: | 2024 |
Citation: | ARAÚJO, Francisca Luzia Nogueira. Modelo de arquitetura para uso de banco de dados híbridos adaptável a ferramentas de Processamento de Linguagem Natural (PLN). 2024. 66 f. Dissertação (mestrado) – Universidade Federal do Ceará, Campus de Quixadá, Programa de Pós-Graduação em Computação, Quixadá, 2024. |
Abstract in Brazilian Portuguese: | Atualmente, os bancos de dados se tornaram onipresentes. Quase todos os aplicativos de Tecnologia da Informação (TI) estão armazenando e recuperando informações de Banco de Dados (BD). O armazenamento de dados de tipos diferentes é um grande desafio, podendo ser necessário utilizar mais de um tipo de banco de dados, tornando mais complexa a obtenção de informações sobre esses dados. Além disso, a dinâmica das organizações modernas frequentemente lida com a necessidade de conciliar requisitos opostos, fornecidos por bancos de dados de diferentes tipos, como, por exemplo, bancos de dados relacionais (ou SQL) e não-relacionais (ou NoSQL). Portanto, usuários não especialistas que necessitem interagir com dados heterogêneos carecem de um meio pelo qual possam acessar os bancos de dados de maneira transparente. Por outro lado, o Processamento de Linguagem Natural ou PLN permite a comunicação entre pessoas e máquinas através de técnicas que possibilitam a interpretação da linguagem natural empregada pelo homem por meio de um dispositivo computacional. Este trabalho apresenta um modelo de arquitetura de sistema adaptável a ferramentas de PLN capazes de traduzir consultas em linguagem natural para linguagem formal de bancos de dados, e após a tradução, permitir executar as consultas em bases de dados armazenados em bancos de dados híbridos, locais ou distribuídos. Visando permitir adequações a arquitetura aqui proposta, em decorrência da evolução do estado da arte atual, foi projetada para possibilitar adições de novos bancos de dados, novos algoritmos e/ou novas ferramentas de tradução de linguagem natural para linguagem formal de consulta de bancos de dados, além de permitir adaptações para reconhecer novos idiomas nas consultas de entrada. A estratégia utilizada foi a criação de módulos com funcionalidades bem definidas e separadas dos demais, onde para adicionar uma nova ferramenta de tradução à proposta, será necessário que apenas um módulo seja modificado, por exemplo. Para assegurar a adaptabilidade da proposta, o código-fonte foi disponibilizado e testes foram conduzidos em um cluster de computadores, com a possibilidade de implementação também em uma infraestrutura de serviços de computação em nuvem, além disso, os usuários podem realizar ajustes, para também suportar dados do tipo big data. |
Abstract: | Currently, databases have become omnipresent. Almost all IT applications are storing and retrieving information from databases. Storing data of different types is a significant challenge, and it may be necessary to use more than one type of database, making it more complex to obtain information about this data. In addition, the dynamics of modern organizations often deal with the need to reconcile opposing requirements provided by databases of different types, such as relational databases (or SQL) and non-relational databases (or NoSQL). Therefore, non-expert users who need to interact with heterogeneous data lack a means by which they can access databases transparently. On the other hand, Natural Language Processing or NLP enables communication between people and machines through techniques that allow the interpretation of natural language used by humans through a computational device. This paper presents an architecture model of a system adaptable to NLP tools capable of translating queries in natural language to formal database query language and, after translation, allowing the execution of queries on databases stored in hybrid, local, or distributed databases. Aimed at enabling adjustments to the proposed architecture, due to the evolution of the current state of the art, it was designed to enable additions of new databases, new algorithms, and/or new natural language translation tools to formal query language of databases, as well as allowing adaptations to recognize new languages in input queries. The strategy used was the creation of modules with well-defined and separated functionalities from others, where to add a new translation tool to the proposal, only one module needs to be modified, for example. To ensure the adaptability of the proposal, the source code was made available and tests were conducted on a cluster of computers, with the possibility of implementation also in a cloud computing services infrastructure; moreover, users can make adjustments to also support big data |
URI: | http://repositorio.ufc.br/handle/riufc/77011 |
Advisor's Lattes: | http://lattes.cnpq.br/4427578264303416 |
Co-advisor's ORCID: | https://orcid.org/0000-0003-3276-8893 |
Co-advisor's Lattes: | http://lattes.cnpq.br/2880668102587861 |
Access Rights: | Acesso Aberto |
Appears in Collections: | PCOMP - Dissertações defendidas na UFC |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
2024_dis_flnaraujo.pdf | 1,04 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.