Autores

6198
2825,299
6199
2825,299

Informações:

Publicações do PESC

Título
Atribuição de Grau de Sigilo: Uma Abordagem de Categorização de Documentos
Linha de pesquisa
Engenharia de Dados e Conhecimento
Tipo de publicação
Dissertação de Mestrado
Número de registro
Data da defesa
25/9/2008
Resumo

A partir da necessidade da redução de atribuições de sigilo excessiva em documentos, este trabalho aborda o reconhecimento de padrões utilizando classificação automática de textos para categorizar documentos em português.

Para isso foi utilizada uma coleção de texto real, da Marinha do Brasil (MI3), do ano de 2002, sendo composta de um tipo de documento denominado mensagem, específico da MI3 .

Os categorizadores utilizados foram o k-vizinhos próximos, o Naive Bayes e a Máquina de Vetor Suporte. Embora apenas a utilização dos categorizadores muitas vezes apresente bons resultados, os mesmos são extremamente dependentes dos documentos da amostra. Os resultados obtidos comprovam que a combinação de medidas na seleção de características apresenta ótimos resultados em quaisquer dos subconjuntos separados para teste.

Abstract

From necessity to reduce document allocation high degree of secrecy, this work presents the pattern recognition using automatic text classification to categorize Portuguese texts.

This collection is composed with a specific kind of documents used by the Brazilian Navy. It has been used a real text collection fiom 2002 year.

The classifiers used were the K-nearest neighbor, the Naive Bayes and the Support Vector Machine. Although only applied a cornmon classifier results in good responses, they are extremely dependent fiom the document samples. The results prove that the feature selection ensemble offer excellent results in any subsets selection for tests.

Arquivo
Topo