Autores

6232
2835,200
6233
2835,200

Informações:

Publicações do PESC

Título
MAGDOC: Um Sistema de Classificação de Documentos de Hipertexto Baseado em Análise de Conteúdo
Linha de pesquisa
Inteligência Artificial
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
21/2/2005
Resumo

Este trabalho apresenta um sistema para auxílio a pesquisa de informações na Internet. Os resultados apresentados pelas ferramentas de busca disponíveis são, quase sempre, insatisfatórios. A quantidade de documentos é excessiva e a miríade de assuntos das páginas recuperadas faz com que temas diversos sejam misturados no índice proposto pelos sites. Desenvolvemos o sistema MAGDOC - Máquina de Agrupamento de Documentos por Conteúdo - que dispõe os documentos HTML em um mapa de tal forma que assuntos semelhantes são representados por objetos geograficamente próximos. Dessa forma, a partir de um documento selecionado é possível acessar os documentos correlatos já que esses se encontram na vizinhança. Analogamente, é possível descartar documentos indesejados já que eles estão nas proximidades de um documento impropriamente recuperado pelo site de busca.

Abstract

This work presents a system for aid to the research of information in the Internet. The results presented for the available search engines are, almost always, unsatisfactory. The amount of documents is extreme and the myriad of subjects of the recovered pages makes that diverse subjects are mixed in the index proposed for these sites. We develop a system called MAGDOC which is a "Machine for Grouping Documents based in its Content" that makes use documents HTML in a map of such form that similar subjects are represented by objects geographically next among them. By this way, from a selected document it is possible to access correlated ones since they are in the neighborhood. Similarly, it is possible to discard undesired documents since they are in the neighborhoods of a document improperly recovered by the search engines.

Arquivo
Topo