Informações:

Publicações do PESC

Título
Processamento de Consultas Sobre Bases XML Distribuídas
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
16/3/2007
Resumo

O constante aumento do volume de dados armazenados na forma de documentos XML nativos faz com que a aplicação de técnicas de fragmentação de bases XML se torne uma alternativa importante para o problema de desempenho no processamento de consultas sobre estas bases de dados. Para que uma base XML possa ser fragmentada, é fundamental que exista uma forma de se consultar esta base distribuída de maneira transparente ao usuário. Esta dissertação apresenta a nossa metodologia para o processamento de consultas Xquery sobre bases de dados XML distribuídas e fragmentadas, que consiste nas etapas de decomposição da consulta, incluindo a representação da consulta em sua forma algébrica TLC; localização dos dados; otimização global; execução e consolidação dos resultados. Essa metodologia pode ser aplicada tanto em um banco de dados que permita a fragmentação de bases XML, quanto em um sistema que proporcione uma visão integrada de bancos de dados XML semi-autônomos homogêneos. Propomos o uso de uma arquitetura baseada em um Mediador com Adaptadores acoplados aos bancos de dados remotos. O Mediador fornece uma visão XML global dos dados distribuídos, que pode ser consultada pelos usuários de forma transparente. Um protótipo do Mediador e de Adaptadores para dois processadores de consulta XQuery diferentes foram implementados, e possibilitaram a execução de experimentos que mostraram os ganhos de desempenho e os impactos de diferentes consultas executadas sobre bases XML distribuídas.

Abstract

The constant increase of the volume of data stored as native XML documents makes fragmentation techniques an important alternative to the performance issues in query processing over these data. Fragmented databases are feasible only if there is a transparent way to query the distributed database, without the need of knowing the fragmentation details and where each fragment is located. This document presents our methodology for XQuery query processing over distributed XML databases, which consists on the steps of query decomposition, including the query’s TLC algebra representation; data localization; global optimization; global query execution and final result assembly. This methodology can be used in an XML database that allows fragmentation and also in a system that publishes an integrated view of semi-autonomous and homogeneous XML databases. We propose an architecture based on a Mediator with Adaptors (wrappers) attached to remote databases. The Mediator publishes a global XML view of the distributed data, which can be queried by users in a transparent way. A Mediator and two Adapters prototypes have been implemented and experiments were executed, where we could analyze the performance improvements and impacts of different queries over distributed XML databases.

Arquivo
Topo