Informações:

Publicações do PESC

Título
Um Otimizador Dinâmico para a Materialização de Documentos XML Ativos
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Tese de Doutorado
Número de registro
Data da defesa
22/10/2007
Resumo

Da combinação da linguagem XML e dos serviços Web, surgiu uma nova classe de documentos ditos XML ativos (ou AXML, de “Active XML”), os quais possuem elementos que correspondem a chamadas de serviços Web. Para materializar o conteúdo completo de um documento AXML, é necessário executar todas as suas chamadas de serviços Web, cuja otimização constitui um problema difícil. Técnicas atuais para agendamento da execução de tarefas de workflows e processamento distribuído de consultas são insuficientes para resolver esse problema, pois na materialização AXML: (i) a especificação completa de um documento AXML não é necessariamente conhecida a priori; (ii) o resultado de uma chamada de serviço Web pode conter outras chamadas de serviços, exigindo re-planejamento; e (iii) devido à volatilidade dos sítios na rede, um plano gerado pelo otimizador pode se tornar inválido no momento de sua execução. A grande maioria dos otimizadores existentes é baseada em coordenação centralizada.
Esta tese propõe uma estratégia de otimização dinâmica baseada em custos para a materialização eficiente de documentos AXML, considerando a volatilidade de um cenário P2P. A estratégia permite que o otimizador reduza o tamanho do espaço de busca, obtenha informações atualizadas sobre os participantes do sistema e construa resultados parciais incrementalmente. A estratégia é capaz de tratar documentos AXML complexos e explora descentralização em vários níveis. Esta tese apresenta ainda uma arquitetura orientada a serviços, chamada XCraft, para apoiar as técnicas de otimização propostas. Por intermédio de um protótipo do XCraft, foram obtidos resultados que mostram ganhos significativos de desempenho em relação às estratégias tradicionais (i.e., estáticas e centralizadas).

Abstract

An active XML (AXML) document contains special tags that represent calls to Web services. Retrieving its contents consists in materializing its data elements by invoking all its embedded service calls in a P2P network. This implies many equivalent materialization alternatives, with different performance, which represents a hard optimization problem. Current techniques for workflow scheduling and distributed query processing are insufficient for this problem, since in AXML materialization: (i) the set of participating peers is not necessarily known in advance; (ii) service calls in the result of other calls forbid a simple “optimize-then-execute'” strategy; and (iii) due to the peer volatility in the network, a plan computed by the optimizer may become invalid at the moment of its execution. Moreover, most of the current optimizers are based on centralized coordination.
We propose a dynamic, cost-based optimization strategy to efficiently materialize AXML documents considering the volatility of a P2P scenario. This strategy enables the optimizer to reduce the size of the search space, get more up-to-date information on the status of the peers, and deliver partial results in advance. The strategy can handle arbitrarily complex AXML documents, and exploits decentralization in many levels. Furthermore, we propose a service-oriented optimization architecture, called XCraft, to support the proposed techniques. We evaluated our approach in an XCraft prototype for the ActiveXML system, an open-source P2P platform. Empirical results show important performance gains compared to centralized, static materialization strategies.

Arquivo
Topo