Informações:

Publicações do PESC

Título
Processamento de Alto Desempenho em Consultas Analíticas Sobre Base de Dados Geoestatísticos
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
29/9/2008
Resumo

As consultas analíticas apresentam alto custo de processamento e podem ser de longa duração, pois realizam operações complexas sobre massas de dados de tamanho significativo. O tempo gasto na obtenção de uma informação é imperativo para o processo de tomada de decisão. O ParGRIES é uma solução de código aberto, desenvolvida para ser uma camada intermediária entre o banco de dados e uma aplicação cliente em um agrupamento de banco de dados, provendo paralelismo intraconsulta no processamento de consultas. Através de experimentos utilizando a base de dados sintética do benchmark TPC-H, o ParGRES apresentou grande eficiência no desempenho de processamento de consultas, motivando a sua avaliação com uma base de dados real. Utilizou-se uma base de dados geoestatísticos produzida pelo IBGE, na qual são realizadas consultas analíticas específicas e complexas. Os experimentos foram realizados em base total e parcialmente replicada. Excelentes resultados foram obtidos no que tange a redução do tempo de processamento das consultas, as quais obtiveram, na maioria das vezes, aceleração super-linear em todas as configurações do agrupamento. Os resultados obtidos mostram que o ParGRES é uma boa alternativa, com baixo custo de implementação, para aumento de desempenho no processamento de consultas analíticas em cenários reais, tanto com bases totalmente replicadas quanto com bases parcialmente replicadas.

Abstract

Analytical queries typically have high processing costs and can take long time to be processed, due to the complex pesfosmed on huge amounts of data. So, speeding up the execution of each single query is imperative to decision making. ParGRES is an open-source database cluster middleware for high perfosmance OLAP query processing, exploiting inter and intra-query parallelism. Through experiments using the synthetic database of the TPC-H benchmark, ParGRES showed excellent pesformance dusing query processing, motivating its evaluation on a real-world OLAP database. The Geoestatistic Database, in which complex analytical quesies are processed, is provided by IBGE. Experiments were pesformed using fully and pastially replicated databases, and excellent results were obtained, yielding linear and very ofen super-linear speedup for different expesiment setups. The results obtained show that ParGRES is a very costeffective solution for OLA query processing in real settings with fully os partially replicates databases.

Arquivo
Topo