Autores

4954
2221,51
4955
2221,51

Informações:

Publicações do PESC

Título
Paralelismo de Dados Científicos Utilizando Técnicas P2P
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
16/2/2011
Resumo
A complexidade e o tempo de processamento dos modelos de simulao computacional em experimentos cientficos trouxe desafios na conduo destes experimentos. Os workflows cientficos vm sendo adotados para a cincia em larga-escala. A utilizao intensa e os grandes volumes de dados nestes workflows demandam por paralelismo. Entretanto, paralelizar um workflow requer ferramentas especficas e domnio de programao para execut-lo paralelamente em clusters. Buscando tornar a paralelizao de workflows mais transparente para o cientista, esta dissertao prope a abordagem Heracles. O Heracles proporciona um mecanismo de tolerncia a falhas e gerncia dinmica de recursos utilizando tcnicas P2P. O intuito do Heracles executar atividades em paralelo sem que o cientista precise estipular o nmero de ns da execuo bem como redistribuir automaticamente as tarefas em caso de falhas no ambiente computacional. Desta forma, o cientista s precisa definir um prazo para a atividade. O Heracles foi avaliado por meio de simulao e neste ambiente mostrou ser capaz de cumprir os prazos definidos para a execuo de atividades e de se recuperar de falhas eficientemente. Portanto, pode ser interessante incorporar a abordagem Heracles em escalonadores reais para realizar avaliaes mais profundas.
Abstract
The complexity and the processing time of computational simulation models of scientific experiments bring challenges on the conduction of these experiments. Scientific workflows have being adopted on large-scale science. The intense utilization of great volumes of data on these workflows demands parallelism. However, parallelize a workflow requires specific tools and programming skills to run it in parallel in clusters. Trying to turn workflow parallelization more transparent to the scientist, this dissertation proposes the Heracles approach. Heracles proposes a fault tolerant and dynamic resource management mechanism using P2P techniques. The purpose of Heracles is to execute activities in parallel without asking the scientists to specify the number of nodes involved in the execution and to automatically reschedule failed tasks. This way, the scientists only need to define the deadline for the activity. Heracles was evaluated through simulation and showed that it is capable of fulfilling the deadlines of the activities and to recover from failures efficiently. Thus, it may be interesting to integrate Heracles approach on real schedulers to realize deeper evaluations.
Topo