Por favor, use este identificador para citar o enlazar este ítem: http://repositorio.ufc.br/handle/riufc/34308
Tipo: Dissertação
Título : MetisIDX: Indexação de dados preditiva
Título en inglés: MetisIDX: Predictive data indexing
Autor : Teixeira, Elvis Marques
Tutor: Machado, Javam de Castro
Palabras clave : Indexação de dados;Indexação preditiva;Adaptive merging
Fecha de publicación : 2018
Citación : TEIXEIRA, Elvis Marques. MetisIDX: Indexação de dados preditiva. 2018. 80 f. Dissertação (Mestrado em Ciência da Computação)-Universidade Federal do Ceará, Fortaleza, 2018.
Resumen en portugués brasileño: A análise exploratória de dados caracterizada por cargas de trabalho OLAP é atualmente uma tarefa rotineira tanto na academia quanto nos ambientes corporativos. Nestes cenários, a velocidade com que os dados são produzidos e os padrões de acesso desconhecidos e dinâmicos fazem da escolha de métodos de acesso uma tarefa desafiadora. Técnicas de indexação adaptativa propõe o uso de índices parciais construídos de forma incremental, em resposta à carga de trabalho e como um efeito colateral do processamento de consultas, otimizando o acesso preferencialmente para os intervalos de chave já requisitados. Este trabalho apresenta um desenvolvimento adicional destes princípios utilizando a história recente de acessos para predizer os intervalos de chave e indexá-los antecipadamente. Deste modo, as consultas seguintes encontram os dados em sua posição final na estrutura de dados, equivalente a um índice completo, e possivelmente localizados em uma camada mais alta da hierarquia de memória. Adaptive Merging, um dos principais modelos de indexação adaptativa, é usado como ponto de partida para a arquitetura em termos de estruturas de dados e algoritmos de busca e construção de índices. Também é utilizado como referencial para comparação de performance. Uma máquina de aprendizado extremo é utilizada para a predição dos intervalos de chave e é continuamente treinada com as novas consultas processadas. Os experimentos mostram ganho de cerca de um terço em tempos de resposta depois de 1000 consultas. As ações de indexação são feitas em paralelo, portanto nenhuma complexidade extra é adicionada ao mecanismo de processamento de consultas.
Abstract: Exploratory data analysis characterized by OLAP query workloads over large databases are now commonplace on both academia and industry. In these scenarios, data production velocity and unknown and drifting access patterns make the choice of access methods a challenging task. In this context, adaptive indexing techniques propose the use of partial indexes that are incrementally built in response to the actual query sequence and as a byproduct of query processing to optimize the access only to the key ranges of interest. This work presents a further development to this principle by leveraging the recent query history to predict the next key ranges and index them in advance, so the queries arriving in the near future find data in its final representation and placed higher in the storage hierarchy, since data must be loaded into main memory in order to be indexed. Adaptive Merging is used as base architecture for the data structures and merge operations are executed in parallel with query execution instead of being the same operation. An extreme learning machine is used to perform key range forecasting and undergo continuous training by the indexing thread. The experiments show approximately one third gain in query response times after 1000 queries. The result is lower overall response times and the fact that the select operator does not incur the costs of indexing.
URI : http://www.repositorio.ufc.br/handle/riufc/34308
Aparece en las colecciones: DCOMP - Dissertações defendidas na UFC

Ficheros en este ítem:
Fichero Descripción Tamaño Formato  
2018_dis_emteixeira.pdf1,68 MBAdobe PDFVisualizar/Abrir


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.