Informações:

Publicações do PESC

Título
Hydra: Componentes para o Paralelismo de Dados em Experimentos Científicos
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
8/6/2010
Resumo
Experimentos científicos lidam com uma grande quantidade de dados a ser processada por um encadeamento de atividades. Workflows científicos são utilizados como uma abstração para modelar esse encadeamento. Nesse contexto, essas atividades são candidatas a serem processadas de modo paralelo. Desta maneira, a execução do workflow científico pode se beneficiar do grande poder de processamento de máquinas paralelas. Com o intuito de diminuir a complexidade da especificação dessa paralelização, esta dissertação apresenta um conjunto de componentes num arcabouço, chamado Hydra. O objetivo do Hydra é facilitar a modelagem da paralelização de dados em atividades de workflows, integradas a um Sistema de Gerência de Workflows Científicos (SGWfC). Hydra foi avaliado e seus resultados experimentais mostram que ele permite a distribuição de atividades em computadores de alto desempenho, com ganho de desempenho próximo ao linear, de maneira transparente e sem nenhuma programação adicional.
Abstract
Scientific experiments deal with a large datasets to be processed and analyzed. Scientific workflows are used as processing model abstraction. In this context, these activities are candidates to be done as parallel tasks. Thus, the execution of scientific workflow can benefit from the large processing power of parallel machines and clusters. In order to reduce the complexity to specify this parallelization, this work presents a set of components in a framework, named Hydra. The Hydra's goal is to enable model parallel activities in workflows, integrated to Scientific Workflow Management Systems (SWfMS). Hydra was tested and its experimental results show that it allows the distribution of activities in high-performance computers, with almost linear acceleration, transparently and without any additional programming.
Topo