Autores

5149
Carla Amaral de Santanna
2323,51,2320
5154
2323,51,2320
5155
2323,51,2320

Informações:

Publicações do PESC

Título
Processamento Paralelo de Consultas sobre Fragmentos Virtuais de Documentos XML
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
2/12/2011
Resumo
A era interativa da internet implicou o aumento no volume de transações e informações sobre produtos, clientes, parceiros e fornecedores. A interoperabilidade e a facilidade de integração providas pela XML (eXtensible Markup Language) promoveram o aumento substancial de dados expressos nesta linguagem. Considerando o aumento da concorrência e as práticas de fidelização de clientes, a análise informacional de dados XML tornou-se necessária para auxiliar no processo de tomada de decisão. No entanto, o crescimento dos bancos de dados XML implicou a busca por soluções que propiciassem melhor desempenho ao processar consultas XML analíticas. Em geral, técnicas de fragmentação física são aplicadas sobre a base de dados para prover o processamento paralelo das consultas, visando a diminuir o tempo total de resposta. Considerando um cenário típico de sistemas de suporte à decisão, onde as consultas são ad-hoc, a fragmentação física de dados não pode ser aplicada, uma vez que esta técnica analisa as consultas de entrada mais frequentes para definir o projeto de fragmentação. Desta maneira, adotamos uma solução independente do conhecimento prévio das consultas de entrada: a fragmentação virtual de dados. Esta técnica realiza a fragmentação dinâmica da base de dados, por meio da reescrita da consulta de entrada, onde a quantidade e o tamanho dos fragmentos virtuais são definidos em tempo de execução. Tal estratégia tem sido aplicada apenas no modelo relacional. Esta dissertação apresenta uma adaptação da fragmentação virtual de dados para o modelo XML. Nossa avaliação experimental mostra ganhos de desempenho de até 90%.
Abstract
The interactive internet era has caused a significant increase in the volume of data about products, customers, partners, suppliers and transactions to manipulate such data. The interoperability and easy integration provided by XML (eXtensible Markup Language) promoted a substantial increase in data expressed in this language. Considering the increased competition and customer retention practices, informational analysis of XML data has become necessary to assist in any decision-making process. However, the growth of XML databases resulted in the search for solutions to improve the performance of analytical XML queries. In general, physical fragmentation techniques are applied to the database to provide parallel query processing in order to reduce the total query response time. Considering a typical scenario of decision support systems, where queries are ad-hoc, physical fragmentation techniques cannot be applied, since it analyzes the more frequent input queries to define the fragmentation design. Thus, we adopt a solution that does not depend on prior knowledge of the input queries: the virtual partitioning. This technique performs the dynamic partitioning of the database, through query rewriting, where the number and size of the virtual fragments are defined at runtime. This strategy has been applied only in the relational model. This dissertation presents an adaptation of the virtual partitioning to the XML model. Our experimental evaluation shows performance gains of up to 90%.
Arquivo
Topo