Informações:

Publicações do PESC

Título
XCraft: A Dynamic Optimizer for the Materialization of Active XML Documents
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Relatório Técnico
Número de registro
ES-709/7
Data
5/2007
Resumo

Da combinação da linguagem XML e dos serviços Web, atuais padrões para a interoperabilidade de programas e dados, surgiu uma nova classe de documentos ditos XML ativos (ou AXML, de “Active XML”). Um documento AXML possui elementos que correspondem a chamadas de serviços Web, as quais consistem em dados intencionais. Ou seja, tais elementos representam dados resultantes da execução de serviços Web. Portanto, para materializar o conteúdo completo de um documento AXML, é necessário executar todas as suas chamadas de serviços Web. Otimizar a materialização de documentos AXML é um problema difícil. Técnicas atuais para agendamento da execução de tarefas de workflows e processamento distribuído de consultas são insuficientes para resolver esse problema, pois na materialização AXML: (i) a especificação completa de um documento AXML não é necessariamente conhecida a priori; (ii) o resultado de uma chamada de serviço Web pode conter outras chamadas de serviços, exigindo re-planejamento; e (iii) devido à volatilidade dos sítios na rede, um plano gerado pelo otimizador pode se tornar inválido no momento de sua execução. Além disso, a grande maioria dos otimizadores existentes é baseada em coordenação centralizada.

Este trabalho propõe uma estratégia de otimização dinâmica baseada em custos para a materialização eficiente de documentos AXML, considerando a volatilidade de um cenário P2P. A estratégia permite que o otimizador reduza o tamanho do espaço de busca, obtenha informações atualizadas sobre os participantes do sistema e construa resultados parciais incrementalmente. A estratégia é capaz de tratar documentos AXML complexos e explora descentralização em vários níveis. É apresentada ainda uma arquitetura orientada a serviços, chamada XCraft, para apoiar as técnicas de otimização propostas. Foi construído um protótipo do XCraft para validação empírica, através do qual foram obtidos resultados que mostram ganhos de desempenho promissores em relação às estratégias tradicionais (i.e., estáticas e centralizadas).

Abstract

An active XML (AXML) document contains special tags that represent calls to Web services. Retrieving its contents consists in materializing its data elements by invoking all its embedded service calls in a P2P network. In this process, the results of some service calls are often used as inputs to other calls. Also, usually several peers provide each requested Web service, and peers can collaborate to invoke these services. This implies many equivalent materialization alternatives, with different performance.

Optimizing the AXML materialization process is a hard problem, which often involves searching a huge space of solutions. Current techniques for workflow scheduling and distributed query processing are insufficient for this problem, since in AXML materialization: (i) the set of participating peers is not known in advance; (ii) service calls in the result of other calls forbid a simple "optimize-then-execute" strategy; and (iii) due to the peer volatility in the network, a plan computed by the optimizer may become invalid at the moment of its execution. Moreover, most of the current optimizers are based on centralized coordination.

We propose a dynamic, cost-based optimization strategy to efficiently materialize AXML documents considering the volatility of a P2P scenario. We formalize the problem from a performance-oriented perspective, and present an optimization strategy that incrementally generates and executes materialization plans. This enables the optimizer to reduce the size of the search space, get more up-to-date information on the status of the peers, and deliver partial results earlier. Our strategy can handle arbitrarily complex AXML documents, and exploits decentralization in many levels.

Furthermore, we present a service-oriented optimization architecture, called XCraft, to support the proposed techniques. We evaluated our approach in an XCraft prototype for the ActiveXML system, an open-source P2P platform. Our results show important performance gains compared to centralized static materialization strategies.

Topo