

Person role Person


Pesc publication

Uma Ferramenta de Apoio na Identificação de Novos Elementos Geográficos de Baixa Granularidade em Notícias para a Atualização de Dicionários Geográficos
Research area
Data and Knowledge Engineering
Publication type
Master's thesis
Identification Number

O Brasil é um país vasto e dinâmico. Identificar os novos elementos inaugurados ou atualizados é uma tarefa que envolve grande esforço financeiro, político e informacional. A necessidade por informações precisas sob o espaço geográfico que vivemos, criou uma demanda por serviços automatizados de reconhecimento de endereços geográficos de baixa granularidade e alto grau de especificidade. Como a internet disponibiliza e integra diversas fontes de informações, principalmente em notícias dos mais diversos meios, sobre elementos inaugurados em nosso país, estado, cidade e rua torna-se necessário recuperar e estruturar essas informações de forma a poder relacioná-las com o contexto e realidade dos locais em que vivemos através de métodos e sistemas automatizados. Órgãos públicos também possuem a necessidade de identificar os novos elementos geográficos, contudo, para que a informação seja útil deve possuir elementos geográficos mais precisos, para apoiar em atividades como a tarefa de reambulação.  Para isso uma das necessidades é possibilitar o georreferenciamento de notícias, ou seja, identificar as entidades geográficas presentes e associá-las com sua correta localização espacial. O presente trabalho propõe uma abordagem para criar regras gramaticais que possibilitem a identificação de elementos geográficos de baixa granularidade que apoie na criação e atualização de dicionários geográficos baseado em notícias. Os resultados apresentam a utilidade da abordagem para a criação de uma ferramenta de apoio à identificação de endereços geográficos que apoie ao enriquecimento de dicionários geográficos e às atividades relacionas as tarefas de reambulação.


Brazil is a vast, dynamic country. Identifying new updated or opened elements is a task that involves great financial, political and informational effort. The need for accurate information about the geographical space we live in has created a demand for automated services of recognition of geographical addresses of low granularity and high degree of specificity. As the internet provides and integrates various sources of information, especially in the news from a variety of means on opened elements in our country, state, city and street, it becomes necessary to recover and structure this information in order to relate them with the context and the reality of the places in which we live through automated methods and systems. Public bodies also have the need to identify new geographic elements. However, in order for the information to be useful, it needs to have more precise geographic features to support activities such as the task of collecting geographical names.  For that, one of the needs is to enable the news georeferencing, i.e., to identify the present geographical entities and associate them with their correct spatial location. This paper proposes an approach to create grammatical rules that allow the identification of geographic features of low granularity which support the creation and update of geographical dictionaries based on news. The results demonstrate the usefulness of the approach in creating a tool to support the identification of spatial addresses that supports the enrichment of geographical dictionaries and the activities related to the task of collecting geographical names.