Informações:

Publicações do PESC

Título
Controle Distribuido de Workflows em Malhas Computacionais
Linha de pesquisa
Arquitetura e Sistemas Operacionais
Tipo de publicação
Tese de Doutorado
Número de registro
Data da defesa
29/3/2010
Resumo

Diversos sistemas surgiram na literatura para efetuar o gerenciamento do fluxo
de processos em malhas computacionais, contudo, com a evoluca?o e o aumento da adoca?o das malhas computacionais, novas dificuldades foram acrescentadas, criando a necessidade de novas soluco?es para o problema do gerenciamento de fluxo de pro- cessos. Este trabalho apresenta uma revisa?o das e-Infrastructures de servico em produc?a?o, do middleware que e? empregado na construca?o mas mesmas, do estado da arte do uso de fluxos de processos na e-Science e faz uma apresentaca?o dos problemas relacionados a?s falhas que ocorrem nessas infraestruturas, junto com as imperfeico?es existentes nos sistemas de informaca?o que mantem o estado da malha. Ale?m disso, esse trabalho apresenta o WAS (Workflow Agile Scheduler ), um Sistema de Gerenciamento de Fluxo de Processos (SGFP) que tem por ob jetivo principal enderecar os problemas de falhas e imperfeica?o da informaca?o sobre o estado da malha computacional. O WAS apresentou um speed up de 1,6 quando comparado com uma soluca?o de plena aceitaca?o na comunidade de grid. A sua principal contribuica?o e? o uso do conceito de infraestrutura virtual, construi?da com pilot jobs, pois o seu uso impacta diretamente nos problemas de imperfeica?o da informaca?o existentes no momento do sequenciamento. Apesar de na?o atacar o problema de falhas direta- mente, e? mostrado os potenciais de se contornar o problema, tirando proveito de maneira mais eficiente da malha, na?o importando qual o seu estado corrente. Outro fato relevante e? que uma infraestrutura virtual esconde os atrasos gerados pela a in- fluencia do sistemas de gerenciamento de recursos existentes nos RCs constituintes da malha. Isso pode ser visto como uma movimentaca?o do momento de tomada de decisa?o do escalonamento, que e? levado do momento da submissa?o da tarefa para o momento em que o recurso esta? realmente disponi?vel para se usado pelo SGFP.

Abstract

Several systems have appeared in literature to control scientific workflows in computational grids. However, with the evolution and the increase adoption of grids or e-Infrastructures, new challenges have emerged, creating the need of new solutions for the scientific workflow scheduling problem. This work presents a revision of service e-Infrastructures currently in production around the globe and related middlewares. Moreover, it reviews the scheduling of workflows in computational grids and introduces a list of problems related to the imperfections that affect the qual- ity of the grid state information available on the information systems. Besides, we introduce the WAS (Workflow Agile Scheduler), a workflow control system that addresses these problems related to the quality of the state information. On a real e-Infrastructure, the WAS scheduler achieved a speed up of 1.6, when compared with a competitor well accepted in the grid community. It makes use of the concept of virtual infrastructure (VI) built using pilot jobs. The VI allows one to manage all information imperfections created by the existence of the local resource management system on every grid site, moving the job dispatch decision time from the job submission time to the time when the resource is really available.

Topo