Autores

5655
Vítor Silva Sousa
2600,51,2375
5656
2600,51,2375
5657
2600,51,2375

Informações:

Publicações do PESC

Título
Uma Estratégia de Execução Paralela Adaptável de Workflows Científicos
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
28/8/2014
Resumo

Muitos experimentos científicos de larga escala são modelados como workflows científicos e executados por meio de Sistemas de Gerência de Workflows Científicos (SGWfC). Em virtude do volume de dados a serem processados, alguns SGWfC têm utilizado técnicas de paralelismo em ambientes de processamento de alto desempenho para produzir seus resultados. A ocorrência de falhas também tornou-se uma certeza com o significativo crescimento no número de núcleos computacionais e o volume de dados processados nesses ambientes. Nesse sentido, alguns SGWfC apresentam estratégias adaptativas dos nós computacionais em tempo de execução de acordo com a disponibilidade dos mesmos ou a ocorrência de falhas. Contudo, tais soluções são normalmente baseadas em um escalonamento estático dos workflows e não apoiam a gerência das transformações de dados envolvidas na execução desses workflows. Somando-se a isso, tais adaptações precisam garantir a eficiência desses nós computacionais, evitando altos custos para eventuais atualizações na alocação de ativações. Logo, esta dissertação propõe uma estratégia de execução paralela adaptável de workflows científicos, garantindo a eficiência dos nós computacionais utilizados.

Abstract

Many large-scale scientific experiments are modeled as scientific workflows and executed through the Scientific Workflow Management Systems (SWfMS). Due to the volume of data to be processed, some SWfMS are using techniques of parallelism in high performance computing environments to produce theirs results. Failures also become a certainty with the significant increase in number of computational cores and the volume of data processed in these environments. This way, some SWfMS propose an adaptive strategy of computational nodes at runtime according to the their availability and failure occurrences. However, these solutions are normally based on a static scheduling and they do not support the management of the data transformations involved in execution of these workflows. Moreover, these adaptations have to guarantee the efficiency of these computational nodes, avoiding high costs for eventual tasks allocation. Thus, this dissertation proposes a strategy for adaptive parallel execution of scientific workflows, in order to guarantee efficiency of the used computational nodes.

Topo