É preciso que se desnvolvam ferramentas de busca especializadas em dados geográficos

O conhecimento que a humanidade tem sobre a superfície da Terra começou a ser coletado há milhares de anos. Logo que começou a pensar, ou seja, criar modelos do mundo a sua volta usando símbolos, o ser humano começou a tentar entender o ambiente que o cerca. Uma das maneiras de interagir melhor é começar a ter controle sobre a natureza e tentar documentar o que existe e o que se sabe. Desta maneira não só você mesmo tem acesso a estas informações mas elas podem ser repassadas para outras pessoas e outras gerações. Assim, usando a linguagem dos sinais gráficos, o homem deixou por exemplo desenhos elaborados nas famosas cavernas Lascaux e Chavet na França. Isto foi há 40.000 anos. Esta geografia pensada pelo homem comum em oposição a geografia pensada pelos cientistas é conhecida como a geografia do cotidiano, a geografia do dia a dia.

Em 1995 Max Egenhofer e David Mark escreveram um artigo chamado "Naïve Geography" (http://www.spatial.maine.edu/~max/RC20.html), a geografia do cotidiano. Neste artigo eles definem a geografia do cotidiano como a disciplina que documenta os modelos formais que o senso comum tem sobre o mundo. Ou seja, como eu e você pensamos sobre o espaço da Terra quando estamos dando as direções para se chegar ao sítio do churrasco do fim de semana ou como você pensa na localização de sua nova casa em relação ao lugar onde você trabalha. Egenhofer e Mark consideram que esta geografia deve ser a base de novos sistemas de informação geográficos. Assim estes sistemas seriam muito mais intuitivos e mais fáceis de usar. Isto aumentaria em muito a base de usuários potenciais de SIGs.

Assim chegamos aonde eu queria. Eu estou trabalhando em um novo projeto sobre a procura de informações geográficas na Internet. Uma das áreas quentes de pesquisa atualmente são as chamadas ferramentas de busca especializadas ("niche search engines"). Com o aumento do número de informações disponíveis na Internet a necessidade de uma pesquisa mais direcionada ao assunto procurado é cada vez mais necessária. É aí que entram estas novas ferramentas de busca. É preciso que se desenvolvam ferramentas de busca especializadas em dados geográficos. Naturalmente existem diversas formas (não apenas diversos formatos) de informação geográfica. Eu estou interessado em usar as informações geográficas do cotidiano como um substrato que vai enriquecer as outras informações geográficas mais profissionais. Mas onde estão estas informações?

Uma coisa que sempre me deixou admirado na Internet é o oferecimento voluntário de informações. Neste meio maravilhoso cada um pode publicar o que quer. Você pode falar de seu dia, pode publicar suas poesias, ou as suas opiniões sobre determinado comerciante que não te tratou como devia. Você também pode escrever sobre sua cidade, seu bairro, sua rua. Você pode dar dicas de como chegar àquele restaurante que você gosta ou como evitar o tráfego pesado em um determinado dia em uma determinada hora. Pois é, é isto que as pessoas estão fazendo cada vez mais. A Internet é uma tribuna aberta onde publicar é muito mais barato que em meios convencionais como papel.

As principais questões de pesquisa são então:

1. Como encontrar estas informações?

2.Como identificar que esta página específica está falando sobre geografia e não sobre outras coisas?

3. Como entender o que está na página e como ligar esta informação a outras informações geográficas e desta forma aumentar o nosso conhecimento sobre uma determinada região?

A primeira pergunta pertence ao domínio das ferramentas de busca. Este tipo de software está cada vez mais desenvolvido e eficiente e numa pesquisa como esta é melhor se basear no uso de ferramentas de busca já existentes. Uma estratégia adotada por algumas ferramentas (meta search engines) é a chamada meta-busca. Este tipo de software faz a sua pesquisa em cima de outras ferramentas de busca e compila os resultados. Alguns mais evoluídos processam estes resultados por exemplo indo às páginas recuperadas e verificando a sua relevância para a pergunta que foi feita.

Isto nos leva a segunda é talvez mais importante pergunta: como identificar que uma página tem informações geográficas? Uma vez identificada de forma genérica uma página geográfica como saber que ela está falando sobre a determinada região que você procura? Bem este é o núcleo desta pesquisa. Uma das soluções pode ser a compilação de uma serie de palavras-chave que identificariam uma página como geográfica. Isto pode incluir tanto uma lista de lugares tirada de uma enciclopédia ou uma lista de palavras que denotam relações espaciais como onde, para, em, etc.

Uma vez estabelecido que a página é sobre geografia temos que encontrar nela elementos que ajudem a estabelecer uma identidade. O que identifica um lugar? Uma resposta óbvia são as coordenadas geográficas mas talvez uma das coisas não muito prováveis de se encontrar em uma página sobre geografia do cotidiano. O uso de aparelhos GPS está ficando cada vez mais comum e o resultado dado por estes aparelhos geralmente é um arquivo com uma série de coordenadas. Então talvez alguém decida publicar o roteiro de sua última caminhada à Serra da Canastra. Um relato completo vai incluir inclusive os arquivos com os pontos GPS que você pode recuperar na página e ler em sua máquina.

Além disto temos também o texto com nomes de lugares e nomes associados a localização espacial, como por exemplo "estive na serra da Canastra no sudoeste de Minas Gerais".

A terceira pergunta se relaciona a como entender as informações recuperadas e como exibi-las para o usuário. A maneira como as ferramentas de busca dão os resultados hoje é pouco satisfatória. Primeiro a quantidade é demais e fica difícil de se manipular um número tão grande de páginas. É preciso que se faça a busca de maneira mais eficiente e que se exiba os resultados de maneira mais coerente. Eu tenho trabalhado com formalização dos modelos mentais das pessoas. Estas estruturas formais em computadores representando a maneira que as pessoas entendem o mundo a sua volta é chamada de ontologia. Usando estas ontologias em computador nós podemos melhorar a maneira como a pesquisa é feita e como ela é exibida. Por exemplo a Serra da Canastra é uma feição geográfica, é uma serra, é um lugar de lazer e uma reserva ecológica. Então quando trabalhamos com o conceito Serra da Canastra ele carrega muitos significados. Se a pesquisa é feita e seu resultado exibido é apenas baseado em palavras-chave nós perdemos muita informação. Desta forma é preciso que a exibição dos resultados seja também baseada em conceitos. Esta é a terceira parte desta pesquisa, como usar os conceitos nas ontologias para ajudar o usuário a entender e manipular os resultados das pesquisas na Internet.

O uso de conceitos para melhorar o uso da Internet é a abordagem escolhida por um comunidade chamada "The Semantic Web", a Internet semântica (www.semanticweb.org). Nesta página existem diversos textos e links sobre as pesquisas correntes nesta área. É um sítio que vale a pena visitar.

Frederico Fonseca é doutor em Ciência da Informação Espacial pela Universidade do Maine e atualmente é professor na Escola da Ciência da Informação e Tecnologia da Penn State University nos Estados Unidos. fredfonseca@ist.psu.edu