Please use this identifier to cite or link to this item: http://repositorio.ufc.br/handle/riufc/34308
Type: Dissertação
Title: MetisIDX: Indexação de dados preditiva
Title in English: MetisIDX: Predictive data indexing
Authors: Teixeira, Elvis Marques
Advisor: Machado, Javam de Castro
Keywords: Indexação de dados;Indexação preditiva;Adaptive merging
Issue Date: 2018
Citation: TEIXEIRA, Elvis Marques. MetisIDX: Indexação de dados preditiva. 2018. 80 f. Dissertação (Mestrado em Ciência da Computação)-Universidade Federal do Ceará, Fortaleza, 2018.
Abstract in Brazilian Portuguese: A análise exploratória de dados caracterizada por cargas de trabalho OLAP é atualmente uma tarefa rotineira tanto na academia quanto nos ambientes corporativos. Nestes cenários, a velocidade com que os dados são produzidos e os padrões de acesso desconhecidos e dinâmicos fazem da escolha de métodos de acesso uma tarefa desafiadora. Técnicas de indexação adaptativa propõe o uso de índices parciais construídos de forma incremental, em resposta à carga de trabalho e como um efeito colateral do processamento de consultas, otimizando o acesso preferencialmente para os intervalos de chave já requisitados. Este trabalho apresenta um desenvolvimento adicional destes princípios utilizando a história recente de acessos para predizer os intervalos de chave e indexá-los antecipadamente. Deste modo, as consultas seguintes encontram os dados em sua posição final na estrutura de dados, equivalente a um índice completo, e possivelmente localizados em uma camada mais alta da hierarquia de memória. Adaptive Merging, um dos principais modelos de indexação adaptativa, é usado como ponto de partida para a arquitetura em termos de estruturas de dados e algoritmos de busca e construção de índices. Também é utilizado como referencial para comparação de performance. Uma máquina de aprendizado extremo é utilizada para a predição dos intervalos de chave e é continuamente treinada com as novas consultas processadas. Os experimentos mostram ganho de cerca de um terço em tempos de resposta depois de 1000 consultas. As ações de indexação são feitas em paralelo, portanto nenhuma complexidade extra é adicionada ao mecanismo de processamento de consultas.
Abstract: Exploratory data analysis characterized by OLAP query workloads over large databases are now commonplace on both academia and industry. In these scenarios, data production velocity and unknown and drifting access patterns make the choice of access methods a challenging task. In this context, adaptive indexing techniques propose the use of partial indexes that are incrementally built in response to the actual query sequence and as a byproduct of query processing to optimize the access only to the key ranges of interest. This work presents a further development to this principle by leveraging the recent query history to predict the next key ranges and index them in advance, so the queries arriving in the near future find data in its final representation and placed higher in the storage hierarchy, since data must be loaded into main memory in order to be indexed. Adaptive Merging is used as base architecture for the data structures and merge operations are executed in parallel with query execution instead of being the same operation. An extreme learning machine is used to perform key range forecasting and undergo continuous training by the indexing thread. The experiments show approximately one third gain in query response times after 1000 queries. The result is lower overall response times and the fact that the select operator does not incur the costs of indexing.
URI: http://www.repositorio.ufc.br/handle/riufc/34308
Appears in Collections:DCOMP - Dissertações defendidas na UFC

Files in This Item:
File Description SizeFormat 
2018_dis_emteixeira.pdf1,68 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.