Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/54406
Type: Dissertação
Title: Refinamento das estimativas de cardinalidade no processamento de consultas
Title in English: Refining cardinality estimates in query processing
Authors: Praciano, Francisco Daniel Bezerra de Souza
Advisor: Machado, Javam de Castro
Keywords: SGBD;Processamento de consultas;Otimização de consultas;Estimação de cardinalidade;Aprendizagem de máquina
Issue Date: 2020
Citation: PRACIANO, Francisco Daniel Bezerra de Souza. Refinamento das estimativas de cardinalidade no processamento de consultas. 2020. 107 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Ceará, Fortaleza, 2020.
Abstract in Brazilian Portuguese: Os Sistemas de Gerenciamento de Bancos de Dados (SGBDs) fazem uso de uma linguagem declarativa de modo a permitir que consultas aos dados armazenados sejam realizadas. Nessa abordagem, os usuários descrevem por meio de uma consulta textual aquilo que eles desejam obter dos SGBDs, deixando para estes a definição da maneira pela qual os dados serão processados e, por fim, recuperados. Por conseguinte, os SGBDs precisam escolher, dentre as diferentes possibilidades de executar uma dada consulta, aquela que, baseado em um processo de estimação, seja a de melhor desempenho. Denomina-se de cardinalidade o número de tuplas que resultam da aplicação de um operador relacional sobre uma relação. Essa informação é estimada pelos SGBDs para calcular o número de tuplas que resultam de uma operação e servem de entrada para uma outra no processamento de uma consulta. O processo de otimização, que procura gerar a melhor forma de processar uma consulta, faz uso dessas cardinalidades estimadas para tomar decisões de otimização, tais como escolher a ordenação de predicados. Isto posto, por meio desta dissertação, propomos uma nova abordagem para o cálculo das estimativas de cardinalidade das operações de uma consulta a fim de orientar o motor de execução dos SGBDs a realizar a escolha correta da maneira que a consulta será executada, isto é, escolher a melhor forma possível ou pelo menos aquela que não seja a pior. Acreditamos que acrescentar o uso de modelos de Aprendizagem de Máquina no processo de estimar a cardinalidade das consultas deve levar a execução mais eficiente das consultas. Para assegurar essa hipótese, foram realizados testes experimentais usando o SGBD PostgreSQL. Por fim, depreende-se dos experimentos preliminares apresentados neste trabalho que essa nova abordagem pode resultar em melhorias no âmbito do processamento de consultas em SGBDs, especialmente na geração de estimativas de cardinalidade.
Abstract: Database Management Systems (DBMSs) make use of a declarative language in order to allow queries to stored data to be performed. In this approach, users describe through a textual query what they want to get from DBMSs, leaving them to define how data will be processed and ultimately retrieved. Therefore, DBMSs must choose from the different possibilities of executing a given query which one, based on an estimation process, is the one with the best performance. Cardinality is the number of tuples that result from applying a relational operator to a relation. This information is estimated by the DBMSs to calculate the number of tuples that result from one operation and serve as input to another in the processing of a query. The optimization process, which seeks to generate the best way to process a query, makes use of these estimated cardinalities to make optimization decisions, such as choosing predicate ordering. That said, through this dissertation, we propose a new approach to calculate the cardinality estimates of query operations in order to guide the execution engine of the DBMSs to make the correct choice of the way the query will be executed, that is, choose the best possible form or at least avoid the worst one. We believe that adding the use of Machine Learning models in the process of estimating query cardinality should lead to more efficient query execution. To ensure this hypothesis, experimental tests were performed using the PostgreSQL. Finally, it is possible to conclude from the preliminary experiments presented in this work that this new approach may result in improvements in query processing in DBMSs, especially in the generation of cardinality estimates.
URI: http://www.repositorio.ufc.br/handle/riufc/54406
Appears in Collections:DCOMP - Dissertações defendidas na UFC

Files in This Item:
File Description SizeFormat 
2020_dis_fdbspraciano.pdf3,62 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.