Autores

1616
Alberto de Fontes Tavares Neto
679,163
1617
679,163

Informações:

Publicações do PESC

Título
Reexecução Determinística de Programas Distribuídos em MPI
Linha de pesquisa
Arquitetura e Sistemas Operacionais
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
26/3/1998
Resumo
PESC: Resumo de Dissertação de Mestrado Resumo da Tese apresentada à COPPE/UFRJ como parte dos requisitos necessários para a obtenção do grau de Mestre em Ciências (M.Sc.)

Reexecução Determinística de Programas Distribuídos em MPI

Alberto de Fontes Tavares Neto

Março/1998
Orientadores: Valmir Carneiro Barbosa
Lúcia Maria A. Drummond
 

 
Programa: Engenharia de Sistemas e Computação

      Esta tese consiste na implementação e comparação de duas estratégias que permitem a reexecução determinística de programas distribuídos, que se utilizam da biblioteca de comunicação MPI (message-passing interface).
      Um programa distribuído apresenta um comportamento não determínistico, ou seja, reexecuções do mesmo podem produzir computações distintas. Este comportamento faz com que as técnicas de depuração tradicionais usadas em programas sequenciais não funcionem para eles. Um depurador para programas distribuídos precisa prover um mecanismo que garanta a reexecução determinística dos mesmos.
      As duas estratégias implementadas tiveram seus desempenhos comparados para um conjunto de três aplicações gerais. A primeira estratégia grava informações sobre todas as mensagens que podem causar não determinismo. Já a segunda, faz uma seleção prévia sobre quais mensagens devem realmente ser gravadas, através da anexação de informações de controle nas mensagens do usuário.

Abstract
PESC: Master Degree Abstracts Abstract of Thesis presented at COPPE/UFRJ as a partial fulfillment of the requirements for the degree of Master of Science (M.Sc.)

Deterministic Reexecution of MPI Distribuited Programs

Alberto de Fontes Tavares Neto

March/1998
Advisores:Valmir Carneiro Barbosa
Lucia Maria A. Drummond
 
Department: Systems Engineering and Computer Science

      In this thesis two techniques for tracing and replaying MPT message passing programs were implemented and analyzed. A distributed program may present a nondeterministic behavior. Thus, two executions of the same program mav produce different results. This behavior makes impossible the use of traditional sequential debugging techniques. A debugger for distributed programs shall provide a mechanism that allows the deterministic reexecution of them. Experiments were performed with three parallel aplications in order to compare the implemented techniques. The first technique traces all the messages that can cause nondeterminism. The second one selects only messages which really need to be traced, by appending control information onto user messages.

Arquivo
Topo