MetisIDX: Indexação de dados preditiva

Teixeira, Elvis Marques

Use este identificador para citar ou linkar para este item: http://repositorio.ufc.br/handle/riufc/34308

Tipo:	Dissertação
Título:	MetisIDX: Indexação de dados preditiva
Título em inglês:	MetisIDX: Predictive data indexing
Autor(es):	Teixeira, Elvis Marques
Orientador:	Machado, Javam de Castro
Palavras-chave:	Indexação de dados;Indexação preditiva;Adaptive merging
Data do documento:	2018
Citação:	TEIXEIRA, Elvis Marques. MetisIDX: Indexação de dados preditiva. 2018. 80 f. Dissertação (Mestrado em Ciência da Computação)-Universidade Federal do Ceará, Fortaleza, 2018.
Resumo:	A análise exploratória de dados caracterizada por cargas de trabalho OLAP é atualmente uma tarefa rotineira tanto na academia quanto nos ambientes corporativos. Nestes cenários, a velocidade com que os dados são produzidos e os padrões de acesso desconhecidos e dinâmicos fazem da escolha de métodos de acesso uma tarefa desafiadora. Técnicas de indexação adaptativa propõe o uso de índices parciais construídos de forma incremental, em resposta à carga de trabalho e como um efeito colateral do processamento de consultas, otimizando o acesso preferencialmente para os intervalos de chave já requisitados. Este trabalho apresenta um desenvolvimento adicional destes princípios utilizando a história recente de acessos para predizer os intervalos de chave e indexá-los antecipadamente. Deste modo, as consultas seguintes encontram os dados em sua posição final na estrutura de dados, equivalente a um índice completo, e possivelmente localizados em uma camada mais alta da hierarquia de memória. Adaptive Merging, um dos principais modelos de indexação adaptativa, é usado como ponto de partida para a arquitetura em termos de estruturas de dados e algoritmos de busca e construção de índices. Também é utilizado como referencial para comparação de performance. Uma máquina de aprendizado extremo é utilizada para a predição dos intervalos de chave e é continuamente treinada com as novas consultas processadas. Os experimentos mostram ganho de cerca de um terço em tempos de resposta depois de 1000 consultas. As ações de indexação são feitas em paralelo, portanto nenhuma complexidade extra é adicionada ao mecanismo de processamento de consultas.
Abstract:	Exploratory data analysis characterized by OLAP query workloads over large databases are now commonplace on both academia and industry. In these scenarios, data production velocity and unknown and drifting access patterns make the choice of access methods a challenging task. In this context, adaptive indexing techniques propose the use of partial indexes that are incrementally built in response to the actual query sequence and as a byproduct of query processing to optimize the access only to the key ranges of interest. This work presents a further development to this principle by leveraging the recent query history to predict the next key ranges and index them in advance, so the queries arriving in the near future find data in its final representation and placed higher in the storage hierarchy, since data must be loaded into main memory in order to be indexed. Adaptive Merging is used as base architecture for the data structures and merge operations are executed in parallel with query execution instead of being the same operation. An extreme learning machine is used to perform key range forecasting and undergo continuous training by the indexing thread. The experiments show approximately one third gain in query response times after 1000 queries. The result is lower overall response times and the fact that the select operator does not incur the costs of indexing.
URI:	http://www.repositorio.ufc.br/handle/riufc/34308
Aparece nas coleções:	DCOMP - Dissertações defendidas na UFC

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
2018_dis_emteixeira.pdf		1,68 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas