Autores

3978
Rafael Leonardo Siqueira da Silva
652,10,299
4760
652,10,299
4761
652,10,299

Informações:

Publicações do PESC

Título
Modelo de Sinais para Busca e Recuperação de Informação Textual
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
30/3/2007
Resumo
Esta dissertação propõe uma nova abordagem, baseada em técnicas de processamento de sinais, para lidar com a Busca e Recuperação de Informação (BRI) de tipo texto. Propomos a utilização da Transformada Wavelet para manipular o índice usado pelos sistemas de BRI. De fato propomos que é possível transpor um documento do domínio espacial para o domínio wavelet, bem como se faz para um sinal físico qualquer. As principais vantagens dessa nova abordagem são: a redução da dimensão do índice empregado no sistema de BRI, bem como a possibilidade de execução de consultas em diversos níveis de detalhe, devido à propriedade de multiresolução da Transformada Wavelet. Esta propriedade também pode ser usada em ambientes distribuídos como um mecanismo de distribuição da informação. Nossa proposta não se limita apenas à Transformada Wavelet, mas fornece uma estrutura básica, onde outras técnicas de processamento de sinais podem ser usadas. A escolha da Transformada Wavelet como demonstrativo dessa estrutura foi devido a suas características singulares de multiresolução, simplicidade de implementação e baixa complexidade algorítmica, O(N).
Abstract
This dissertation proposes a novel approach, based on signal processing techniques, to deal with text Information Retrieval (IR). We propose the usage of Wavelet Transform to manipulate the IR systems index. Indeed, we propose that is possible to transpose a document from space domain to wavelet domain, exactly as done with physical signals. The main advantages of this approach are: the reduction of IR systems index dimension, the possibility to make queries in different levels of details, because of the multiresolution property of Wavelet Transform. This property also can be used in distributed environments to disseminate information. Our proposal are not limited to Wavelet Transform, it is actually a more general framework that allow us to apply other signal processing techniques. The Wavelet Transform was chose as demonstration due to its singular features such as: multiresolution, implementation simplicity and low algorithm complexity, O(N).
Topo